AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
5月12日周二
21:52Artificial Intelligence News(RSS)47Hugging Face 托管伪装成 OpenAI 发布的恶意软件
19:49公众号:智谱(GLM)63同事件精选GLM-5.1获AA全新Coding Agent基准开源第一同一事件,精选展示《GLM-5.1开源:一个独立工作8小时的模型》
13:36IT之家(RSS)65小米 MiMo Orbit 100T Token 计划进展公布:截至今日上午,已累计送出近 80 万亿 Token
12:42SenseTime46SenseNova U1助力儿童福利可视化沟通
12:36IT之家(RSS)71精选npm 生态遭大范围投毒:TanStack、Mistral AI、UiPath 等受波及,可窃取云密钥与 GitHub 令牌
11:25Deedy61AI初创公司三大防御性说辞真伪辨析
08:35meng shao66OpenAI发布网络安全战略"Daybreak":以AI赋能防御者
08:00HuggingFace Daily Papers(社区热门论文)45地理空间基础模型缺乏统一评估标准
07:49Berryxia.AI65CJ Zafir 为开源模型微调新手提供实用入门建议
07:43Hugging Face:Blog(RSS)58精选在AWS上进行基础模型训练与推理的核心构建模块
02:01Rohan Paul62OpenClaw创始人谈中国全力投入AI智能体发展的文化差异
02:01Rohan Paul53Sigma推出开源私有AI浏览器,内置网页智能体与本地LLM
5月11日周一
23:50向阳乔木31博客集成AI对话侧边栏,辅助内容创作
23:30MiniMax (official)64MiniMax组建"10x团队",邀请领域专家共推AI跨越式发展
21:31凡人小北75精选AI工具批量生成知识产权申请材料引关注
20:50向阳乔木713.3万星AI论文学习库,收录精选视频教程
15:48Berryxia.AI53开源开发板CardPuter ADV中文教程稀缺,博主整合资源撰写指南
15:34IT之家(RSS)58Linux 7.1-rc3 发布:AI 驱动内核开发补丁量激增成新常态
14:34IT之家(RSS)56PS3 开源模拟器 RPCS3 代码提交新规:禁止自主 AI 智能体,强调开发者需对代码完全负责
13:34阿绎 AYi65大神用Claude Code复刻完整游戏开发工作室,48个AI智能体覆盖全岗位
12:34IT之家(RSS)42畅网微控公布三款英特尔处理器 NAS 硬件与跨平台开源 NAS 系统
11:53Hacker News 热门(buzzing.cc 中文翻译)54PS3模拟器开发者礼貌地请求大家停止大量提交AI相关的PR
11:48Berryxia.AI68AI助力AR 3D拆解教学,低成本方案推动科普变革
11:34阿绎 AYi58GBrain升级客户端-服务器架构,MCP协议推动个人AI向基础设施演进
10:55Alibaba Cloud55AI包容性愿景:用开源模型支持1200多种语言
10:48歸藏(guizang.ai)78精选开源PPT工具"鬼藏PPT技能"迎重大更新,新增瑞士风格与AI配图功能
09:45Berryxia.AI56利用开源3D库与工具快速创建3D展示与互动应用
08:44向阳乔木70OpenCLI打通微信等私域信息流,聚合个人数据
08:00HuggingFace Daily Papers(社区热门论文)47M2Retinexformer:用于低光图像增强的多模态Retinexformer
04:52Hacker News 热门(buzzing.cc 中文翻译)61本地人工智能应成为常态
01:33Ant Ling44Ant Ling 2.6 1T架构获业界关注,欢迎反馈讨论
01:29SemiAnalysis62速度即护城河:AMD ROCm软件栈性能在14天内提升超75倍
01:14Yuchen Jin47美国为何缺乏顶尖开源模型实验室
5月10日周日
23:14向阳乔木59HuggingFace CLI工具便捷阅读AI论文
21:59MiniMax (official)46英伟达支持开源模型生态,MiniMax稀疏方案即将发布
15:32swyx 🌉66新加坡外长公开AI技术栈并将在AI工程师会议发表主题演讲
12:32阿绎 AYi66纪录片揭示AlphaFold决策瞬间:Demis Hassabis一句"Do it"如何改变世界
08:00HuggingFace Daily Papers(社区热门论文)49TacoMAS:基于LLM的多智能体系统中拓扑与能力的测试时协同进化
08:00HuggingFace Daily Papers(社区热门论文)64TD3B:用于变构配体生成的过渡导向离散扩散模型
06:21Chubby♨️66Hermes Agent登顶OpenRouter排行榜
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月12日
21:52
Artificial Intelligence News(RSS)
47
Hugging Face 托管伪装成 OpenAI 发布的恶意软件

一个伪装成OpenAI发布的Hugging Face仓库被发现传播信息窃取恶意软件,该仓库针对Windows系统,在被移除前记录了约24.4万次下载。AI安全公司HiddenLayer的研究指出,实际下载量可能被攻击者人为夸大以制造流行假象,目前无法确定真实受害范围。该事件暴露了主流AI模型分发平台面临的安全风险。

Hugging Face安全/对齐开源生态
19:49
公众号:智谱(GLM)
同事件精选63
GLM-5.1获AA全新Coding Agent基准开源第一

全球权威评测机构Artificial Analysis发布全新Coding Agent Index,包含SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA三项基准,用于衡量模型与Agent harness组合的真实编程能力。闭源模型Opus 4.7(在Cursor CLI中运行)全球第一,智谱GLM-5.1(在Claude Code中运行)获开源第一,代表国产大模型在实际编程Agent场景达到SOTA水平。

开源生态编码评测/基准
同一事件,精选展示《GLM-5.1开源:一个独立工作8小时的模型》
推荐理由:GLM-5.1 在 AA 的新 Coding Agent 基准上拿了开源第一,时隔一个月回头看,这个成绩对国产开源模型在编程 Agent 赛道的位置是个重要注脚,做工具链选型的还是值得扫一眼。
13:36
IT之家(RSS)
65
小米 MiMo Orbit 100T Token 计划进展公布:截至今日上午,已累计送出近 80 万亿 Token

小米技术官方公布了MiMo Orbit 100T Token计划的最新进展。该计划旨在30天内面向全球AI用户免费发放100万亿Token,截至5月12日上午已累计送出近80万亿。同时,在OpenRouter平台的最新数据中,MiMo模型最近一个月的Token调用量达1.45万亿,排名第一;其Hermes Agent的日调用量高达2910亿,最近一周调用量超1.75万亿。

智能体开源生态行业动态
12:42
SenseTime@SenseTime_AI
46
这正是我们打造SenseNova U1的原因。✨ 感谢@feesyiam用它聚焦儿童福利议题。可视化让艰难对话更易进行--这正是AI真正发挥价值的时刻。 请持续创作。🥰

Nafees: I gave it a topic. It came back with a full magazine-style infographic. Charts. Layout. Icons. Colour coding. Dense stru...

图像生成开源生态行业动态
12:36
IT之家(RSS)
精选71
npm 生态遭大范围投毒:TanStack、Mistral AI、UiPath 等受波及,可窃取云密钥与 GitHub 令牌

网络安全机构Socket发现针对npm生态的大规模供应链攻击“Mini Shai-Hulud”。攻击者组合利用GitHub Actions的三种漏洞,绕过了双重身份验证等保护机制,向TanStack、Mistral AI、UiPath等知名项目的软件包中植入恶意版本。被篡改的包在安装时会自动执行恶意代码,窃取AWS、GCP、Kubernetes、GitHub令牌及SSH私钥等敏感凭证。此次攻击波及超过160个包名、近373个恶意版本,目前所有恶意版本已被清理。

安全/对齐开源生态行业动态

推荐理由:这轮 npm 投毒把 TanStack、Mistral AI 和 UiPath 全卷进去了,甚至能直接窃取云密钥和 GitHub 令牌,搞开发的建议立刻按文末应急措施检查自己的依赖树。
11:25
Deedy@deedydas
61
如今每家AI应用初创公司为证明自身防御性都会说: 1. 我们支持多模型。客户不想被单一供应商锁定。 2. 我们有数据护城河。通过对开源模型进行后期训练,效果比闭源更好且更便宜。 3. 我们深度集成,帮助用户利用"上下文图谱"构建定制工作流。 最佳情况下这些属实,但多数场景中其谬误令人捧腹。
开源生态现象/趋势
08:35
meng shao@shao__meng
66
OpenAI发布网络安全战略"Daybreak":以AI赋能防御者

OpenAI推出网络安全整体战略“Daybreak”,旨在将前沿AI能力优先、可控地赋予防御者,推动安全范式从“事后修补”转向“设计即内生韧性”。其基于GPT-5.5模型构建三层访问体系,通过“身份即权限”的信任访问机制,为已验证的防御任务放宽能力限制。该战略联合Intel、Cisco等生态伙伴形成“安全飞轮”,并通过Codex Security agent赋能开源软件供应链上游,加速防御闭环。

OpenAI: Introducing Daybreak: frontier AI for cyber defenders. Daybreak brings together the most capable OpenAI models, Codex, a...

OpenAI产品更新安全/对齐开源生态
08:00
HuggingFace Daily Papers(社区热门论文)
45
地理空间基础模型缺乏统一评估标准

当前地理空间基础模型研究缺乏统一评估标准、训练测试协议与预训练控制,导致模型难以公平比较。对152篇论文的审计发现,同一模型在相同基准上存在显著结果分歧;不同研究预训练配置几乎没有重复;且近四成论文未公开模型权重。为此,文章提出六项具体建议,包括发布带许可证权重、共享核心评估框架、明确基线来源、报告结果方差等,以推动社区建立协作标准,促进该领域健康发展。

开源生态数据/训练论文/研究评测/基准
07:49
Berryxia.AI@berryxia
65
CJ Zafir 为开源模型微调新手提供实用入门建议

CJ Zafir 为开源模型微调新手提供了系统建议。入门应从 1B、2B 等小参数模型开始,推荐使用 Google Colab Pro 等低成本云 GPU 服务。数据集构建可结合 Codex 5.5 与 DeepSeek v4 Pro,基础模型建议选用 Hugging Face 上的 Unsloth instruct 版本。关键学习内容包括 SFT、RL 训练、LoRA/QLoRA、量化及本地推理引擎等。未来技术趋势正转向 5B 至 15B 参数的专家模型,掌握微调技能市场价值高,企业常愿支付高额费用定制个性化模型。

CJ Zafir: If you love fine-tuning open-source models (like me), then listen. > Start with 1B, 2B, 4B, and 8B models. (Don't start ...

Hugging Face开源生态教程/实践数据/训练
07:43
Hugging Face:Blog(RSS)
精选58
在AWS上进行基础模型训练与推理的核心构建模块

本文面向使用开源框架的机器学习工程师,阐述了AWS如何为大规模基础模型的全生命周期提供核心基础设施。其核心是三大紧密集成的组件:配备多代NVIDIA GPU(如H100、H200及新一代Blackwell B200/B300)的大显存加速计算实例;用于集体通信的高带宽、低延迟网络(节点内NVLink与节点间EFA);以及可扩展的分布式存储。这些基础设施与Slurm/Kubernetes等资源编排系统、PyTorch/JAX等ML框架协同,共同支撑预训练、后训练和推理工作负载,并可通过Prometheus/Grafana实现全栈可观测性。

开源生态教程/实践数据/训练部署/工程

推荐理由:这篇把AWS上训大模型的全套基础设施串了一遍,从GPU选型到网络存储再到Slurm/K8s编排,是做云端大规模训练的工程师的必读参考。
02:01
Rohan Paul@rohanpaul_ai
62
OpenClaw创始人谈中国全力投入AI智能体发展的文化差异

OpenClaw创始人Peter Steinberger指出,中国正全力投入AI智能体发展。在深圳,人们曾排队在腾讯办公室安装OpenClaw,当地政府还为基于该平台开展业务提供补贴。与此形成鲜明对比的是,在世界其他许多地区,在工作设备上安装同类AI工具可能导致被解雇。然而在中国,有企业要求员工每日需用OpenClaw自动化一项任务,未达标者也会被解雇。这凸显了不同地区对AI工具截然不同的接受度与应用文化。

智能体大佬观点开源生态
02:01
Rohan Paul@rohanpaul_ai
53
Sigma推出开源私有AI浏览器,内置网页智能体与本地LLM

Sigma近日宣布推出一款开源私有AI浏览器,其核心创新在于将网页智能体和本地大型语言模型(LLM)直接集成到浏览器内部,无需将用户网页活动发送至远程服务器。这使得浏览器从单纯的显示层转变为智能体工作空间,AI能够实时感知并操作标签页、表单、登录会话和未完成任务等作为统一工作状态。该浏览器支持Qwen、Gemma、Nemotron等本地模型,可执行页面总结、表单自动填写、产品比价、跨标签页搜索以及自动化重复性网页工作流等任务,整个过程完全在本地处理,实现了真正的私有化与开源设计,保障用户数据隐私。

Sigma Browser: Hermes agent running in private browser on free local models Private by design. Local. Open-source

智能体产品更新开源生态端侧
5月11日
23:50
向阳乔木@vista8
31
博客集成AI对话侧边栏,辅助内容创作

作者为博客增加了AI对话侧边栏功能,旨在提升内容创作效率。该功能允许用户在写作过程中随时与AI对话,以辅助完成配图、生成标题等任务。例如,用户可指令AI“给第一节配信息图,科普风格”,生成的图片会自动插入文中;对于AI生成的多个标题选项,用户只需说“选第一个”即可自动替换。该功能完善后,将同步至开源版本。

产品更新图像生成开源生态
23:30
MiniMax (official)@MiniMax_AI
64
MiniMax组建"10x团队",邀请领域专家共推AI跨越式发展

MiniMax宣布成立“10x团队”,旨在邀请各领域深度专家共同推动人工智能实现十倍速进步。公司认为大模型已从演示阶段发展为真实生产力设施,而将顶尖领域人才引入模型研发能显著提升能力并产生实际影响。团队寻求的是坚信AI能加速自身领域发展的专家,他们将直接参与问题定义、评估构建及工作流设计,其成果将融入MiniMax模型并贡献于推动行业发展的开源基准。MiniMax提供全球竞争力的薪酬、股权及上海、北京、香港、旧金山、伦敦等多地办公选择,通过开放合作实现“智能普及”的使命。

开源生态行业动态
21:31
凡人小北@frxiaobei
精选75
知识产权全面沦陷。 发明专利生成 skill https://github.com/handsomestWei/patent-disclosure-skill 软著生成 skill https://github.com/Fokkyp/SoftwareCopyright-Skill 设计专利/实用新型更容易,claude desgin/ image2

scavin: 中国软件著作权申请材料 生成器 Skills https://meta.appinn.net/t/topic/85159

开源/仓库开源生态

推荐理由:发明和软著生成 skill 直接把知识产权的门槛打到地板,虽然质量可能粗糙,但这套自动化流水线会让审批系统面临海量申请,值得关注。
20:50
向阳乔木@vista8
71
3.3万星AI论文学习库,收录精选视频教程

一个在GitHub上获得3.3万星标的AI论文学习资源库,作者系统性地收集和整理了高质量的AI学习视频。资源主要来自YouTube和Bilibili平台,例如收录了李沐的论文精讲系列。所有内容已按时间和主题进行了详细分类,便于用户系统学习和收藏。该库旨在为学习者提供一个结构化的视频学习路径。

开源生态教程/实践
15:48
Berryxia.AI@berryxia
53
开源开发板CardPuter ADV中文教程稀缺,博主整合资源撰写指南

作者在入手CardPuter ADV开发板后,发现𝕏平台上相关的中文教程非常稀少。为此,他整合了YouTube上一位创作者的从零基础到入门的详细教程,并结合自身使用体验,撰写了一篇全面的中文指南。作者希望这篇教程能为其他开发者提供实用参考,并表示后续会持续分享自己基于该开发板的项目进展。文中引用的推文也印证了中文社区对该开发板学习资源的迫切需求。

Berryxia.AI: http://x.com/i/article/2053687145076797440

其他开源生态
15:34
IT之家(RSS)
58
Linux 7.1-rc3 发布:AI 驱动内核开发补丁量激增成新常态

Linus Torvalds 发布 Linux 7.1-rc3,指出 AI 工具大幅提升开发效率,导致补丁规模异常偏大并成为新常态。本次更新中网络相关补丁占比最高(达33%),修复了蓝牙和显卡驱动的安全漏洞,新增对苹果 Mac USB-C 网络及 AlphaTheta 专业音频设备的支持。同时,版本加强了对国产龙芯架构的 KVM 虚拟化优化,并显著增加了内存安全补丁和 Rust 语言应用比例,以提升内核安全性。Torvalds 预计大规模代码变更将持续成为后续开发模式。

开源生态编码行业动态
14:34
IT之家(RSS)
56
PS3 开源模拟器 RPCS3 代码提交新规:禁止自主 AI 智能体,强调开发者需对代码完全负责

PS3开源模拟器RPCS3颁布代码提交新规,明确禁止自主AI智能体提交代码,要求所有贡献者必须完全理解并真正拥有自己提交的代码内容。新规强调,所有代码、注释及GitHub评论均需由人类完成。若使用AI工具生成代码,必须在提交时明确披露AI参与范围及人工审查情况,否则相关请求可能被直接关闭。团队指出,近期项目中出现了大量未经测试的AI生成垃圾代码,甚至导致功能失效,屡犯者将被禁止访问代码库。

智能体开源生态行业动态
13:34
阿绎 AYi@AYi_AInotes
65
大神用Claude Code复刻完整游戏开发工作室,48个AI智能体覆盖全岗位

开源项目Claude Code Game Studios利用Claude Code构建了完整的虚拟游戏开发工作室。该项目包含48个AI智能体,1:1还原从创意总监到关卡设计师等全部岗位,覆盖游戏开发全流程。系统提供36条斜杠指令一键启动工作流,适配Godot、Unity、Unreal三大游戏引擎,并集成自动化校验钩子及28套行业标准文档模板。所有AI仅负责梳理方案,最终决策权由用户掌握。项目采用MIT开源协议,可免费商用,克隆仓库即可快速部署。

智能体Anthropic开源/仓库开源生态
12:34
IT之家(RSS)
42
畅网微控公布三款英特尔处理器 NAS 硬件与跨平台开源 NAS 系统

畅网微控在英特尔AI NAS与雷电解决方案峰会上发布三款NAS硬件及跨平台开源系统CWOS。口袋AI NAS基于第三代酷睿Wildcat Lake平台,提供4个M.2 PCIe Gen4盘位及高速接口。九盘位全闪AI NAS可选酷睿Ultra X9 378H处理器,配备9个M.2盘位。算力AI NAS则搭载酷睿Ultra X7 356H处理器,支持锐炫Arc Pro独立显卡,提供多盘位配置。CWOS系统内置多模态AI智能搜索,支持语音搜索,未来将拓展物体与人脸识别功能。

产品更新开源生态端侧
11:53
Hacker News 热门(buzzing.cc 中文翻译)
54
PS3模拟器开发者礼貌地请求大家停止大量提交AI相关的PR

PS3模拟器RPCS3的开发团队近日公开请求社区停止大量提交由AI生成的代码拉取请求。这些AI生成的PR数量激增,但质量普遍低下,包含大量错误、不相关代码甚至虚构的API,严重增加了开发者的审核与维护负担。团队强调,他们欢迎人工贡献,但AI自动提交的低质代码对项目无益,反而阻碍了开发进程。此举旨在维护开源项目的代码质量与协作效率。

开源生态现象/趋势
11:48
Berryxia.AI@berryxia
68
AI助力AR 3D拆解教学,低成本方案推动科普变革

AI技术正重新激活AR 3D拆解教学领域。利用Cursor中的Claude opus模型,可快速生成手表、冰箱等物体的AR拆解教学演示,实现部件3D可视化与步骤标注,流程已跑通且成本低。该方案未来可广泛应用于硬核设备拆解及生物细胞等科普教学。对于精度要求不高的展示,可直接利用Apple官方免费3D模型库或KhronosGroup等开源资源快速搭建,JigSpace则是成熟的教学互动应用范例。这预示着科普教学方式将迎来新的变革。

Berryxia.AI: 看大家昨天都因为这个项目卧槽了一天! 朋友们都开始整活儿,其实对于精度要求不高只是展示3D的就是可以直接使用开源的一些3D库就可以拿来使用。 我最早接触和了解这玩意还是Apple的 Reality Composer,官方也提供了对应的3D ...

多模态开源生态教程/实践
11:34
阿绎 AYi@AYi_AInotes
58
GBrain升级客户端-服务器架构,MCP协议推动个人AI向基础设施演进

YC CEO主导的GBrain发布v0.31.1版本,实现从本地单机到客户端-服务器架构的关键升级。通过MCP协议,用户可部署中央家庭服务器,让所有设备与AI Agent远程连接、共享记忆,解决了同步不一致与资源浪费问题。此次更新修复了瘦客户端在本地错误创建数据库的关键bug,该bug由CEO的个人AI在生产环境发现并记录,凸显AI参与调试的新范式。这标志着个人AI正从玩具转向可控、永久的本地智能基础设施。

Garry Tan: GBrain v0.31.1 just shipped real MCP thin client support. So basically you can run ONE "home GBrain server" and everythi...

智能体MCP/工具产品更新开源生态
10:55
Alibaba Cloud@alibaba_cloud
55
AI包容性愿景:用开源模型支持1200多种语言

通义实验室与YiXi联合举办的开发者会议中,AI Singapore的Jian Gang Ngui阐述了构建理解东南亚语言文化AI的使命。该地区拥有超7亿人口、1200多种语言,AISG正利用Qwen、Gemma等先进开源基础模型,与当地社区合作整合语言文化背景,开发真正普惠相关的LLM。通义实验室对此表示支持。

开源生态行业动态
10:48
歸藏(guizang.ai)@op7418
精选78
开源PPT工具"鬼藏PPT技能"迎重大更新,新增瑞士风格与AI配图功能

开源项目“鬼藏PPT技能”迎来重大更新,新增瑞士国际主义视觉风格,提供克莱因蓝等四套主题色。核心升级包括:通过接入GPT-Image 2.0,可根据PPT内容与风格自动生成胶片质感配图、流程图及UI截图美化;支持基于同一内容一键生成公众号、小红书、视频号等多种规格的封面图。更新旨在解决用户对多风格、自动配图及跨平台适配的需求,并通过预设22种版式和严格的视觉规则,确保设计的一致性与专业性。

智能体GitHub产品更新图像生成

推荐理由:藏师傅把做PPT的整条链闭环了,从大纲、配图到多平台封面一个对话走完。瑞士风的设计纪律直接写进skill,做出来的PPT终于甩掉AI模板味。
09:45
Berryxia.AI@berryxia
56
利用开源3D库与工具快速创建3D展示与互动应用

推文讨论了在精度要求不高的3D展示场景下,可直接利用开源3D库快速实现。作者提及Apple Reality Composer及其免费的USDZ/USDC格式官方3D模型库,适用于AR增强现实。对于需要自定义或教学互动的场景,推荐了JigSpace应用。同时,作者分享了使用GitHub上的glTF样本模型快速制作Demo的经验。引用的推文补充了关键应用:结合GPT-image-2和Gemini等AI工具生成3D生物结构,并开发可交互探索的应用,旨在为课堂教学等场景创造趣味互动体验。

Berryxia.AI: 从此告别无聊的课堂教学! 自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构,并开发了一款能交互探索这些结构的应用!

图像生成开源生态教程/实践
08:44
向阳乔木@vista8
70
OpenCLI项目实现了对微信、Telegram和Discord三大平台内容的命令行读取,通过wx-cli、tg-cli和discord-cli工具,用户可直接获取群消息、聊天记录、朋友圈及收藏夹等私域数据。这标志着个人信息流聚合的关键突破,使得AI Agent不仅能监控外部资讯网站,还能整合个人私密的社交聊天信息,构建真正统一的个人数据流。此举可能引发平台方如微信的关注或反应。

kabikabi: OpenCLI 现在可以读取微信、Telegram、Discord 的内容了!!! wx-cli / tg-cli / discord-cli 全部接入。 群消息、聊天记录、朋友圈、收藏夹--全部可以用 CLI 直接拿到。 以前 Agent...

智能体开源/仓库开源生态
08:00
HuggingFace Daily Papers(社区热门论文)
47
M2Retinexformer:用于低光图像增强的多模态Retinexformer

低光图像增强面临噪声、伪影和颜色失真等挑战。现有基于Retinex的深度学习方法主要依赖单模态RGB信息,性能有限。本文提出M2Retinexformer,一个新型多模态框架,在Retinexformer基础上扩展,融合深度线索、亮度先验和语义特征,采用渐进式细化流程。深度提供光照不变的几何上下文,亮度特征显式指导亮度分布,语义特征增强场景理解。多模态信息在多尺度提取,通过交叉注意力机制融合,自适应门控根据辅助线索可靠性动态平衡光照引导的自注意力和交叉注意力。在LOL、SID、SMID和SDSD基准测试上的评估表明,其性能整体优于Retinexformer及近期其他先进方法。代码与预训练权重已开源。

多模态开源生态论文/研究
04:52
Hacker News 热门(buzzing.cc 中文翻译)
61
本地人工智能应成为常态

文章主张本地人工智能应成为常态,而非依赖云端服务。当前AI工具大多基于云端,存在延迟、隐私、成本和网络依赖等问题。本地AI模型在个人设备上运行,能提供即时响应、更好保护隐私、降低长期成本并确保离线可用。随着硬件性能提升和模型优化,本地运行7B至13B参数级别的模型已具备可行性。这一转变将使用户真正掌控自己的AI助手,推动技术向更开放、可定制和以用户为中心的方向发展。

开源生态现象/趋势部署/工程
01:33
Ant Ling@AntLingAGI
44
Ant Ling 2.6 1T的架构设计被@rasbt在其最新更新中收录和推荐。团队对此表示欣喜,并邀请社区通过Hugging Face页面和Discord频道提供反馈与参与讨论。@rasbt在推文中提到,他计划深入探讨一些最有趣的架构组件,并询问是否遗漏了其他重要架构。团队表示将持续发布更多更新。

Sebastian Raschka: Back from a little family break! Lots has happened, and I'm planning to do a deeper dive into the most interesting archi...

Hugging Face开源生态行业动态
01:29
SemiAnalysis@SemiAnalysis_
62
速度即护城河:AMD ROCm软件栈性能在14天内提升超75倍

自DeepSeek-V4发布后14天内,AMD ROCm软件栈性能提升超过75倍。这一飞跃主要得益于融合mHC操作和RoPE哈达玛变换,有效降低了CPU开销并提高了HBM内存利用率。同时,团队使用TileLang和Triton快速开发了注意力索引器和KV缓存压缩器等核心组件。为追赶业界标杆,AMD仍需再提升5倍性能以匹配单节点聚合B200,并额外提升1.5倍以达到PD disaggregated B200水平,预计未来几周内有望实现这一目标。此快速进展离不开HaiShaw、Thomas、@roaner和@AnushElangovan等人的贡献。

产品更新开源生态部署/工程
01:14
Yuchen Jin@Yuchenj_UW
47
美国至今没有真正具备竞争力的开源模型实验室,这很奇怪。 显然不是资金问题。多家新兴实验室已筹集数十亿美元。 也不是算力问题。美国实验室比中国实验室更容易获得B200/B300芯片。 那么问题究竟出在哪里?
大佬观点开源生态
5月10日
23:14
向阳乔木@vista8
59
如果你喜欢到Huggingface读最新的AI论文。 可以安装官方的cli: curl -LsSf https://hf.co/cli/install.sh | bash 安装好以后,提示词: hf papers read 【论文编号或论文URL】 同时支持arxiv网站和Huggingface paper的URL。
Hugging Face开源生态教程/实践
21:59
MiniMax (official)@MiniMax_AI
46
感谢 @nvidia 对开源模型生态系统的支持🤝📝 BTW,快速预告:MiniMax 的最新稀疏解决方案即将推出。🥰

RyanLee: Really glad to meet the @NVIDIAAI team in China. Looking forward to deeper collaboration between @MiniMax_AI and @nvidia...

开源生态推理行业动态
15:32
swyx 🌉@swyx
66
新加坡外长公开AI技术栈并将在AI工程师会议发表主题演讲

新加坡外交部长维维安·巴拉克里希南将在@AIDOTENGINEER新加坡会议上发表主题演讲,分享他使用开源AI工具构建“第二大脑”工作流的经验。此前,他在GitHub上公开了个人AI技术栈的完整架构,涉及树莓派、Claude、本地嵌入和知识图谱等技术,这一举动受到全球AI社区关注,体现了政府高层对AI技术的直接、公开且务实的参与态度。继英国设立首席AI官后,新加坡内阁部长的深度参与标志着政府正积极拥抱AI。巴拉克里希南的实践表明,有意义的AI讨论应超越抽象层面,需通过实际技术参与来理解其参数,而新加坡正成为此类深度实践的发生地。

agrim singh: Where in the world can you find a senior government leader with a personal AI stack published on GitHub? How many would ...

开源生态行业动态部署/工程
12:32
阿绎 AYi@AYi_AInotes
66
纪录片揭示AlphaFold决策瞬间:Demis Hassabis一句"Do it"如何改变世界

DeepMind纪录片记录关键一幕:团队告知Demis Hassabis可在一个月内预测所有已知蛋白质序列时,他未纠结风险与回报,直接回应“Do it”。随后AlphaFold向世界免费开源,解决了生物学界50年难题。此举虽未直接盈利,却催生了估值数十亿美元的Isomorphic Labs,建立了信任与生态。推文借此批判当前AI圈空谈融资与参数却无实质成果的现象,强调真正改变世界在于解决难题并免费开放。Demis被赞为兼具远见与决断力的领导者。

Trung Phan: Still incredible that the DeepMind documentary has footage of exact moment Demis is told that AlphaFold can "easily" pre...

DeepMind开源生态现象/趋势
08:00
HuggingFace Daily Papers(社区热门论文)
49
TacoMAS:基于LLM的多智能体系统中拓扑与能力的测试时协同进化

TacoMAS是一个用于动态多智能体系统的测试时协同进化框架。针对现有方法在推理时固定拓扑或只适应单一维度的不足,该框架提出在测试时联合进化智能体能力和通信拓扑,但以不同时间尺度:能力通过快速循环利用轨迹反馈实时更新以处理子任务,拓扑通过慢速元LLM驱动循环执行代理增删和边编辑以维持协调稳定性。框架将系统推理建模为在线图适应任务,节点代表具角色能力的智能体,边定义通信拓扑。这种快慢协同设计驱动系统向任务条件稳定均衡演化。在四个基准测试上的实验表明,TacoMAS优于近20种多智能体基线,平均性能提升13.3%。代码已开源。

智能体开源生态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
64
TD3B:用于变构配体生成的过渡导向离散扩散模型

研究团队推出TD3B,一种基于序列的生成框架,专门设计具有指定激动剂或拮抗剂行为的蛋白质配体。该方法通过过渡导向控制目标,结合目标感知的方向预测器、软结合亲和力门控机制,并对预训练的离散扩散模型进行摊销微调。TD3B能够生成与结合亲和力解耦、且基于平衡或纯推理基线无法实现的定向配体,尤其针对临床相关的GPCRs,解决了现有基于静态结构的设计方法无法表征非可逆方向性效应的局限。代码与模型已开源。

arXivHugging Face开源生态论文/研究
06:21
Chubby♨️@kimmonismus
66
天啊。Hermes超越了OpenClaw。 看来我们有了新的社区宠儿。 得去试试看

Nous Research: Hermes Agent is now #1 on the Global @OpenRouter token rankings. While our journey together has just begun, we'd like to...

智能体开源生态行业动态
‹ 上一页
1…2324252627…37
下一页 ›