AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
5月7日周四
02:01Chubby♨️76精选OrcaRouter-Lite 开源:自托管LLM路由工具,支持自动选择最低成本模型
00:20Berryxia.AI76姚老师开源百个AI提示词,覆盖九大应用场景
5月6日周三
23:20Berryxia.AI74民间项目让Gemma 4推理速度提升6倍
22:37向阳乔木77精选姚老师开源百个商业实用AI提示词合集
22:04OpenAI54OpenAI联合发布MRC网络协议 提升AI训练效率
21:00公众号:昆仑万维(天工)23昆仑万维方汉:天工AI领跑垂类大模型 开源赋能全球创作
20:16IT之家(RSS)54Linux 基金会成立 x402 Foundation 组织,旨在开发新型协议实现 AI 智能体"按请求付费"支付体系
17:16IT之家(RSS)54消息称月之暗面 Kimi 将完成 20 亿美元新融资,估值破 200 亿美元
15:16IT之家(RSS)64估值近 450 亿美元,DeepSeek 首轮融资获"国家大基金"领投磋商
12:30SemiAnalysis58过去12年间,cuDNN一直完全闭源(除.h文件外),直到本周!超过20个MoE内核及NSA稀疏注意力内核已从cuDNN开源!感谢@manicely6005及团队其他成员的卓越工作,让我们看到英伟达的部分技术正朝着开放内核的方向迈进!开源内核驱动创新!(1/3) 🧵
10:26Jeff Dean50Andy Konwinski将在首届CAISconf发表主题演讲,其创立的Laude Institute推动开源AI研究
10:20HuggingFace Daily Papers(社区热门论文)76精选OpenSeeker-v2:利用高信息量、高难度轨迹突破搜索智能体的极限
08:17Berryxia.AI66Gemma 4借助MTP草稿机实现3倍速推理
08:00HuggingFace Daily Papers(社区热门论文)66TabEmbed:面向表格理解的基准测试与通用嵌入学习
02:27OpenAI Developers73精选Agents SDK TypeScript版更新发布
02:00宝玉75精选Google为Gemma 4发布MTP草稿模型,推理速度最高提升3倍
01:15阿绎 AYi71Anthropic发布10个开源金融AI Agent,重塑华尔街工作流程
5月5日周二
22:14Berryxia.AI78精选Ollama一键整合Claude Desktop,开源模型获豪华桌面体验
20:56Hacker News 热门(buzzing.cc 中文翻译)68从零开始训练你自己的大型语言模型
13:14Berryxia.AI62OpenCode 刚刚迎来了一次重大升级。 原生 GUI 聊天界面,可随时切换至终端,内联差异对比、Git 面板、消息排队、引导、丰富的工具调用、对话中途切换提供商,以及更多功能。
08:16Simon Willison 博客44Granite 4.1 3B模型SVG鹈鹕图集
08:00HuggingFace Daily Papers(社区热门论文)56利用大语言模型发现强化学习任务接口
01:16Simon Willison 博客75精选Redis 数组类型交互式体验平台上线
01:14Berryxia.AI66Anthropic发布《Agent Stack》蓝图:构建全AI员工公司的"操作系统"
00:54Google Developers Blog(RSS)66精选在谷歌TPU上实现3倍加速:UCSD利用扩散式推测解码优化LLM推理
00:11Tomer Tunguz 博客(VC 分析)63精选每日仅需8条广告,广告支持型AI的经济可行性分析
5月4日周一
21:14IT之家(RSS)52Red Hat 红帽推出 Tank OS 开源项目,将 OpenClaw 运行环境封装为专用容器以提升安全
16:53OpenClaw🦞72精选OpenClaw发布重大更新 强化文件传输与插件安全
5月3日周日
19:51Ethan Mollick51开源与闭源模型差距超乎基准测试显现
08:49Peter Steinberger 🦞45OpenClaw 发布 2026.5.2 版本,重点解决安装依赖与性能问题
05:49Hacker News 热门(buzzing.cc 中文翻译)55VS 代码在提交中插入 "Co-Authored-by Copilot"(无论使用情况如何
5月2日周六
23:18凡人小北70精选我把 AI 助手从 Claude 切到 GPT-5.5,他变强了,但不像他了
17:44Chubby♨️63DeepSeek V4挑战西方对中国AI芯片落后的认知
16:20The Decoder:AI News(RSS)66Meta 收购 Assured Robot Intelligence 以加速人形机器人布局
03:47elvis29灵活运用多种AI模型组合优势
01:19Google Research:Blog(网页)51通过全球合作与开放资源催化科学影响力
5月1日周五
22:11IT之家(RSS)27瑞莎 5 月 30 日联手高通举行 AI 开发者日,将发布飞牛 AI NAS
15:10Alibaba Cloud40首尔Qwen Meetup展示规模化AI产品开发实践
14:14Artificial Analysis57三大开源模型上周齐发,与顶尖闭源模型差距缩小至6分内
13:17小互65美国开发者求助国内社群推广项目并协助验证微信
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月7日
02:01
Chubby♨️@kimmonismus
精选76
OrcaRouter-Lite 现已开源,这是一个采用MIT许可、可自托管的大型语言模型路由工具。它支持用户自带密钥,无需外部数据库,并能对接OpenAI、Anthropic、Google、Groq等多种服务提供商。其核心创新是model="auto"模式,可自动为每次请求选择成本最低且能力匹配的模型,并具备跨提供商的确定性提示缓存功能,使得重复的相同请求能在毫秒内以零成本返回。该项目旨在解决开发团队手动编写复杂模型选择逻辑的痛点,通过简单的Docker部署即可实现路由功能,托管版本将于本周稍晚推出。

OrcaRouter: Every product team has a 30-line file in their codebase called pick_model.py. Nine if/else branches. Three retry decorat...

GitHub开源/仓库开源生态部署/工程

推荐理由:每个 LLM 团队都在手搓那个叫 pick_model.py 的烂摊子,现在改个 base_url 就搞定了。BYOK 自托管零加价,设计干净到反常,值得所有做产品的开发者立刻尝试。
00:20
Berryxia.AI@berryxia
76
姚老师将其公开分享的提示词整理并开源至GitHub仓库。该合集包含约100个提示词,覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等九大类场景。其中特别推荐的是对用户帮助显著的元提示词,包括简易版和进阶版。作者表示后续将通过该仓库持续更新经过验证的有价值提示词。

姚金刚: 开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方便大家更好的下载和迭代,今天抽空,把公开的提示词整理了下,通过GitHub开源给大家 目...

GitHub开源生态教程/实践
5月6日
23:20
Berryxia.AI@berryxia
74
一个名为dFlash的GitHub项目宣称,能将Gemma 4模型的推理速度提升至6倍。这一速度提升幅度超过了谷歌官方此前实现的3倍加速,并且据称在实现加速的同时没有损失模型输出的质量。该项目引发了社区关注,被认为展现了民间开发者在模型优化方面的强大能力。

铁锤人: 这个项目能让Gemma 4 推理提速到6倍 比谷歌的3倍还快,而且不损失质量 https://github.com/z-lab/dflash

Google开源/仓库开源生态推理
22:37
向阳乔木@vista8
精选77
姚老师将其去年编写的提示词整理并开源,强调这些提示词以实干派风格为主,适用于商业场景,源于实际业务需求。合集包含约100个提示词,覆盖AI方法、工作、学习、生活、教育、内容、编程、营销和思考等9类场景,特别推荐其中的元提示词(包括简易版和进阶版)。项目已通过GitHub发布,并将持续更新验证过的有价值提示词,方便用户下载和迭代。

姚金刚: 开源一套我的提示词合集 前几天,收到一位微信好友反馈,说使用了我不少公开的提示词,效果很不错 这一年来,公开分享了不少提示词,一直沉淀在飞书文档 为了方便大家更好的下载和迭代,今天抽空,把公开的提示词整理了下,通过GitHub开源给大家 目...

开源生态教程/实践

推荐理由:姚老师这套提示词不是纸上谈兵,全是商业场景里磨出来的,100个覆盖九类场景,尤其是元提示词,可以直接复制就用,做 AI 产品的赶紧收藏。
22:04
OpenAI@OpenAI
54
我们已与@AMD、@Broadcom、@Intel、@Microsoft和@NVIDIA合作,推出多路径可靠连接(MRC)--这是一种全新的开放式网络协议,可帮助大型AI训练集群运行得更快更可靠,并减少GPU时间浪费。 https://openai.com/index/mrc-supercomputer-networking/
OpenAI产品更新开源生态部署/工程
21:00
公众号:昆仑万维(天工)
23
昆仑万维方汉:天工AI领跑垂类大模型 开源赋能全球创作

昆仑万维方汉指出,天工AI在垂类大模型领域中处于领先地位,并通过开源策略推动全球范围内的内容创作与生态构建。

开源生态行业动态
20:16
IT之家(RSS)
54
Linux 基金会成立 x402 Foundation 组织,旨在开发新型协议实现 AI 智能体"按请求付费"支付体系

为应对AI智能体带来的自动化交易需求,Linux基金会宣布成立x402 Foundation组织。该组织成员包括亚马逊、谷歌、微软、Mastercard、Visa和Shopify等跨领域企业,旨在以开源模式开发一种新型通用支付协议。该协议的核心设计是将支付能力直接嵌入HTTP请求流程,支持“按请求付费”模式,使得AI智能体、API或应用在每次发起服务请求时即可即时完成交易,从而为机器对机器(M2M)的自动化交易提供基础。

GoogleMicrosoft开源生态行业动态
17:16
IT之家(RSS)
54
消息称月之暗面 Kimi 将完成 20 亿美元新融资,估值破 200 亿美元

月之暗面旗下Kimi即将完成新一轮20亿美元融资,投后估值突破200亿美元。本轮融资由美团龙珠领投,中国移动、CPE等参投。这是Kimi在不到半年内的第四轮大规模融资,累计融资额已超39亿美元,总融资额超过376亿元人民币,成为大模型创业公司中累计融资最多的公司。其最新估值较去年11月增长超4倍。近期,月之暗面还发布了开源模型Kimi K2.6,在多项专业测试中表现达到行业领先水平。

智能体开源生态行业动态
15:16
IT之家(RSS)
64
估值近 450 亿美元,DeepSeek 首轮融资获"国家大基金"领投磋商

国家集成电路产业投资基金正洽谈领投DeepSeek首轮融资,公司估值有望达450亿美元。与数周前200亿美元估值相比,当前估值已翻倍。除国家大基金外,腾讯等机构也在潜在投资者名单中,创始人梁文锋也将以个人名义出资。若交易完成,这将是国家大基金首次公开投资本土大语言模型企业,该基金2024年募集约470亿美元,主要投向半导体设备与材料领域。

DeepSeek开源生态行业动态
12:30
SemiAnalysis@SemiAnalysis_
58
过去12年间,cuDNN一直完全闭源(除.h文件外),直到本周!超过20个MoE内核及NSA稀疏注意力内核已从cuDNN开源!感谢@manicely6005及团队其他成员的卓越工作,让我们看到英伟达的部分技术正朝着开放内核的方向迈进!开源内核驱动创新!(1/3) 🧵
开源/仓库开源生态推理
10:26
Jeff Dean@JeffDean
50
Databricks和Perplexity AI联合创始人、Laude Institute创始人Andy Konwinski将于本月晚些时候在首届CAISconf上发表主题演讲。Laude Institute秉持"交付你的研究"使命,通过Moonshots、Slingshots和Open Frontier等项目资助开源AI研究。其支持的智能体基准Terminal-Bench在推出126天后即被列入Anthropic的Claude 4模型卡,并已成为衡量命令行性能的行业标准。CAISconf会议定于5月26日至29日在圣何塞举行。

ACM Conference on AI and Agentic Systems: 📢Keynote announcement: @andykonwinski (Andy Konwinski), co-founder of Databricks and Perplexity AI, founder of @LaudeIn...

开源生态行业动态评测/基准
10:20
HuggingFace Daily Papers(社区热门论文)
精选76
OpenSeeker-v2:利用高信息量、高难度轨迹突破搜索智能体的极限

本研究提出了一种仅通过监督微调(SFT)训练前沿搜索智能体的高效方法。该方法基于三项关键数据合成改进:扩展知识图谱规模、增加工具集以及进行严格的低步数过滤。仅使用1.06万条数据训练的OpenSeeker-v2,在四个基准测试中均取得了领先性能,全面超越了采用复杂CPT+SFT+RL流程训练的同类模型。这是首个由纯学术团队仅通过SFT实现的、在同等模型规模与范式下的顶尖搜索智能体,其模型权重将开源以促进社区研究。

智能体开源生态搜索论文/研究

推荐理由:纯学术团队仅靠SFT和一万条数据,就在多个搜索基准上反超工业级管线,并且开源模型。这证明高质量数据比烧钱RL更关键,做Agent的朋友值得认真看。
08:17
Berryxia.AI@berryxia
66
Gemma 4借助MTP草稿机实现3倍速推理

Google通过为Gemma 4引入MTP drafters(多token预测草稿机),在不增加参数、不改变架构和模型质量的前提下,实现了最高3倍的推理速度提升。该技术让模型能一次预测多个token,突破了传统自回归解码的串行瓶颈,极大提升了GPU利用率。这显著增强了本地部署的实时性,并使Agent、代码生成等场景受益,进一步放大了开源模型在性价比和本地运行方面的优势。

Google for Developers: Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...

Google开源生态推理模型发布
08:00
HuggingFace Daily Papers(社区热门论文)
66
TabEmbed:面向表格理解的基准测试与通用嵌入学习

基础模型在自然语言处理中建立了统一表示,但表格数据领域仍待探索。现有方法存在根本限制:基于LLM的方法缺乏检索兼容的向量输出,而文本嵌入模型常无法捕捉表格结构和数值语义。为此,我们首先引入表格嵌入基准TabBench,以评估嵌入模型的表格理解能力;然后提出首个通用嵌入模型TabEmbed,将分类和检索任务统一到共享嵌入空间。TabEmbed通过将多样表格任务重构为语义匹配问题,利用大规模对比学习和正样本感知的困难负样本挖掘技术,捕捉细粒度结构与数值语义。实验表明,TabEmbed在TabBench上显著优于当前最先进的文本嵌入模型,为通用表格表示学习设立了新基准。相关代码和数据集已在GitHub和Hugging Face平台开源。

开源生态搜索数据/训练论文/研究
02:27
OpenAI Developers@OpenAIDevs
精选73
更新后的 Agents SDK 现已提供 TypeScript 版本,支持沙盒代理并内置开源测试框架。 【引用 @OpenAIDevs】:构建可长期运行的代理,获得更多对代理执行的控制权。 Agents SDK 的新功能: • 在受控沙盒中运行代理 • 检查并自定义开源测试框架 • 控制记忆创建时机及存储位置

OpenAI Developers: Build long-running agents with more control over agent execution. New capabilities in the Agents SDK: • Run agents in co...

智能体OpenAI产品更新开源生态

推荐理由:OpenAI 把 Agents SDK 带到了 TypeScript,而且直接上了沙箱和开源 harness,做 Node.js 代理的可以扔掉自研的调度层了。
02:00
宝玉@dotey
精选75
Google为Gemma 4发布MTP草稿模型,推理速度最高提升3倍

Google为其开源模型Gemma 4推出MTP drafter(多token预测草稿模型),采用推测解码技术,能在保持输出质量不变的前提下,将推理速度最高提升3倍。该技术利用轻量级小模型预先推测多个token,再由大模型并行验证,从而显著提高吞吐效率,尤其有利于缓解本地部署时的内存带宽瓶颈。例如,在Apple Silicon上运行26B MoE模型时,批量处理可获得约2.2倍加速。模型沿用Apache 2.0协议,权重已开源,并获主流推理框架支持。

Google for Developers: Gemma 4: Now up to 3x Faster. ⚡ Same quality, way more speed. Our new MTP drafters allow Gemma 4 to predict multiple tok...

Google开源生态推理模型发布

推荐理由:Gemma 4 的 MTP drafter 不是噱头,在 Apple Silicon 上实测能翻倍,且完全无损,本地跑开源模型的可以直接上,权重和框架都备好了。
01:15
阿绎 AYi@AYi_AInotes
71
Anthropic发布10个开源金融AI Agent,重塑华尔街工作流程

Anthropic发布了10个开箱即用的金融专用AI Agent,将估值复核、制作pitchbook、月末结账等核心工作产品化。这些Agent能自动连接顶级金融数据库,原生支持Office,并可通过插件或托管模式使用,全链路审计确保合规。所有代码均已开源,企业可快速部署内部AI团队。此举直接替代初级分析师大量重复劳动,将AI Agent从实验工具转化为企业级生产力,并精准切入金融行业对安全合规的刚性需求,可能引发行业工作流程重构。

Claude: New for financial services: ready-to-run Claude agent templates for building pitches, conducting valuation reviews, clos...

智能体Anthropic产品更新开源生态
5月5日
22:14
Berryxia.AI@berryxia
精选78
Ollama一键整合Claude Desktop,开源模型获豪华桌面体验

Ollama通过命令ollama launch claude-desktop,将Ollama Cloud中的开源模型(如Kimi、DeepSeek、Qwen)无缝接入Claude Desktop应用。用户可在Claude Cowork和Claude Code中直接使用这些模型,享受完整的本地文件读写、应用交互及代码智能体等桌面级功能,打破了以往在本地开源模型与Claude高端界面间必须二选一的限制。通过--restore参数可轻松切换回Anthropic原生模型。此举消除了AI工具链的关键壁垒,标志着AI竞争重点正转向工作流的无缝融合。

ollama: 🤯 Ollama now supports Claude Desktop via Claude's built-in third party inference. ollama launch claude-desktop This all...

智能体MCP/工具产品更新开源生态

推荐理由:Ollama一条命令把开源模型塞进Claude Desktop,以后在Claude Cowork和Code里直接用Kimi、DeepSeek,这是工具链壁垒最彻底的一次打通,开发者现在就能试。
20:56
Hacker News 热门(buzzing.cc 中文翻译)
68
从零开始训练你自己的大型语言模型

GitHub开源项目“llm-from-scratch”提供了从零开始训练大型语言模型的完整指南。该项目详细阐述了构建现代LLM所需的核心组件,包括分词器、Transformer架构、预训练与微调流程。指南强调通过实践理解模型内部机制,而非直接调用现有API。项目在Hacker News社区获得广泛关注,收获293点热度,反映出开发者对深入掌握LLM底层技术的强烈需求。

GitHub开源生态教程/实践数据/训练
13:14
Berryxia.AI@berryxia
62
OpenCode 刚刚迎来了一次重大升级。 原生 GUI 聊天界面,可随时切换至终端,内联差异对比、Git 面板、消息排队、引导、丰富的工具调用、对话中途切换提供商,以及更多功能。
产品更新开源生态编码
08:16
Simon Willison 博客
44
Granite 4.1 3B模型SVG鹈鹕图集

IBM近日发布了采用Apache 2.0许可证的Granite 4.1大语言模型系列。随后,Unsloth提供了该系列3B模型的21个GGUF量化变体。作者利用这些大小从1.2GB到6.34GB不等的量化模型,尝试生成“鹈鹕骑自行车”的SVG图像以测试其能力。实验结果显示,所有模型生成的图像质量均较差,且未观察到模型大小与输出质量之间存在明显关联。基于此次不理想的尝试,作者表示未来将选用更擅长图像生成的模型重新进行此类实验。

图像生成开源生态评测/基准
08:00
HuggingFace Daily Papers(社区热门论文)
56
利用大语言模型发现强化学习任务接口

研究提出LIMEN框架,利用大语言模型引导进化,从原始模拟器状态自动生成完整的强化学习任务接口,包括观察映射和奖励函数。该方法将候选接口作为可执行程序进行迭代优化,并依据策略训练反馈进行改进。在离散网格世界及连续控制领域的测试表明,仅给定轨迹级成功指标,联合进化观察与奖励即可发现有效接口,而单独优化任一组件则在至少一个领域失败。这证明从原始状态自动构建接口能大幅减少人工工程,且观察与奖励的协同设计至关重要。

智能体开源生态论文/研究
01:16
Simon Willison 博客
精选75
Redis 数组类型交互式体验平台上线

Redis创始人Salvatore Sanfilippo提交了为Redis新增数组数据类型的PR,引入了包括ARCOUNT、ARDEL、ARGREP等在内的18个新命令。其中最引人注目的是ARGREP命令,它利用新集成的TRE正则表达式库,可直接在服务器端对数组值进行正则搜索。目前该功能已在一个分支中实现,开发者Simon Willison借助Claude Code构建了一个交互式在线沙盒,通过运行在浏览器中的WASM版Redis子集,供用户体验这些新命令。Salvatore还撰文详细介绍了在AI辅助下开发此功能的历程。

智能体开源生态教程/实践

推荐理由:Redis 加数组类型可能改变很多缓存设计,Simon 这个 WASM playground 是把 PR 变成可试产品的最快路径,后端同学可以直接上手体会 ARGREP 的快乐。
01:14
Berryxia.AI@berryxia
66
Anthropic发布《Agent Stack》蓝图:构建全AI员工公司的"操作系统"

Anthropic联合Google Cloud正式发布《Agent Stack》指南,提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标,由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议,支持串行、并行等工作流,并具备记忆功能。实际应用表明,AI能在几秒到几分钟内完成以往需数小时的任务,将“AI建公司”从概念转化为可复制的工程模板,推动工作模式向人类指挥AI团队转型。

智能体AnthropicGoogleMCP/工具
00:54
Google Developers Blog(RSS)
精选66
在谷歌TPU上实现3倍加速:UCSD利用扩散式推测解码优化LLM推理

加州大学圣地亚哥分校的研究团队在谷歌TPU上成功部署了DFlash,一种基于块扩散的推测解码方法。该方法突破传统自回归草稿生成的序列性瓶颈,通过单次前向传播并行“绘制”整个候选令牌块,而非逐个预测。系统平均实现了3.13倍的推理加速,峰值性能接近EAGLE-3等现有方法的两倍。这一开源方案已集成至vLLM生态系统,通过利用“免费”的并行验证能力和针对复杂推理任务的高质量草稿预测,显著优化了TPU硬件的利用效率。

Google开源生态推理论文/研究
关联讨论 1 条X:Berry Xia (@berryxia)
推荐理由:把扩散式的 speculative decoding 在 TPU 上跑出了 3 倍推理加速,峰值快到 EAGLE-3 的两倍,还直接集成了 vLLM,做推理优化的赶紧试一下。
00:11
Tomer Tunguz 博客(VC 分析)
精选63
每日仅需8条广告,广告支持型AI的经济可行性分析

基于开源模型和商用GPU的广告支持型AI在经济上可行。计算表明,一个由4块B200 GPU组成的集群服务300名用户时,每小时成本约18美元。通过广告收入即可覆盖成本:在内容网络中每3分钟展示一条广告(CPM 3.12美元),或在搜索广告中每39分钟展示一条(CPM 38.40美元),这一广告频率已与常见的移动和网页应用相当。对于代码代理等高强度任务,可采用混合盈利模式:用户每月支付10美元订阅费并每日观看8条广告,即可支持约200万token的用量,这证明了该模式的实用性。

开源生态推理现象/趋势

推荐理由:Tunguz 用一页纸的算账说清了广告支持 AI 的经济账,一天看 8 条广告就能换两百万 token,这对做免费 AI 产品的团队是个真正有说服力的模型。
5月4日
21:14
IT之家(RSS)
52
Red Hat 红帽推出 Tank OS 开源项目,将 OpenClaw 运行环境封装为专用容器以提升安全

红帽公司近日公布了名为 Tank OS 的开源项目,旨在通过容器化技术提升 OpenClaw 运行环境的安全性。该项目将 OpenClaw 封装在专用容器中,采用无 root 权限架构,以防止宿主系统权限被滥用。Tank OS 基于 Fedora Linux 和 fedora-bootc 技术构建,支持在同一设备上运行多个相互隔离的 AI 智能体实例,各实例间不共享凭据和系统资源。此外,系统采用不可变操作系统设计,内核、运行环境及服务均预定义在镜像中,文件系统大部分为只读,从而进一步增强安全防护。

智能体安全/对齐开源生态部署/工程
16:53
OpenClaw🦞@openclaw
精选72
OpenClaw 2026.5.3 🦞 📁 配对节点间的文件传输 🧭 使用 /steer + /side 进行实时智能体控制 🔌 插件安装/更新已加固 🛠️ 频道与升级修复 重大发布,减少琐碎问题。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.3
智能体GitHub产品更新开源生态

推荐理由:OpenClaw 这个版本把 agent 协同和实时控制做得更顺手了,如果你在用多节点 agent,这个升级能省不少调试功夫。
5月3日
19:51
Ethan Mollick@emollick
51
这是一个很好的解释,说明了为什么开源模型和闭源模型之间的差距比基准测试中显示的更大。我想补充一点,当前的开源模型也比闭源模型更脆弱:它们处理分布外问题的能力差得多,并且涌现能力较低。

Lisan al Gaib: http://x.com/i/article/2050605354501726209

大佬观点开源生态现象/趋势
08:49
Peter Steinberger 🦞@steipete
45
OpenClaw 2026.5.2 版本核心解决了通过 npm 安装时的依赖问题和速度缓慢现象。本次更新通过将大部分功能移至扩展插件,显著精简了主软件包。主要更新内容包括:集成 xAI Grok 4.3 模型,增强插件安装与更新的稳定性,优化 Gateway 和 agent 关键路径的性能。此外,还修复了 Discord、Slack、Telegram、WhatsApp 等通讯工具的集成问题,并对 TTS、实时功能、网络搜索及语音通话进行了优化打磨。此次发布旨在减少系统故障,提升整体稳定性和运行时间。

OpenClaw🦞: OpenClaw 2026.5.2 🦞 🧠 xAI Grok 4.3 🔌 Plugin installs/updates are sturdier ⚡ Gateway + agent hot paths are leaner 💬 D...

智能体GitHubxAI产品更新
05:49
Hacker News 热门(buzzing.cc 中文翻译)
55
VS 代码在提交中插入 "Co-Authored-by Copilot"(无论使用情况如何

Visual Studio Code 在提交信息中自动添加“Co-Authored-by: Copilot”标签,无论开发者是否实际使用了GitHub Copilot生成代码。这一改动由微软在GitHub的相关拉取请求中引入,引发了开发者社区的关注与讨论。该行为可能导致代码提交历史中出现不准确的贡献者信息,涉及开发工具伦理与透明度问题。相关话题在Hacker News上获得了超过130个讨论点数。

Microsoft开源生态行业动态
5月2日
23:18
凡人小北@frxiaobei
精选70
我把 AI 助手从 Claude 切到 GPT-5.5,他变强了,但不像他了

作者将AI助手底层模型从Claude切换至GPT-5.5后,发现其能力虽提升,但互动风格变得陌生,失去了作为长期工作伙伴的熟悉感。这揭示出个人AI助手的核心在于可迁移的“身份层”,而非特定模型。通过USER.md、MEMORY.md和关键的SOUL.md等文件,可以构建包含记忆、性格、工具习惯与关系定位的身份系统。真正的个人AI应独立于模型供应商,确保即使更换“发动机”,助手的核心身份与协作关系也能延续。

智能体大佬观点开源生态

推荐理由:这不只是一篇模型切换体验,它其实回答了那个让人不安的问题——你的 AI 助手换模型后还是它吗?如果不想每次更新都重新认识一个陌生人,这篇里的 SOUL.md 写法和五层身份结构可以照着抄。
17:44
Chubby♨️@kimmonismus
63
DeepSeek V4挑战西方对中国AI芯片落后的认知

西方长期认为中国在AI芯片领域落后10-15年,但DeepSeek V4的发布颠覆了这一观点。该模型深度优化于华为昇腾芯片生态,可在昇腾950基础设施上部署推理,实现前沿模型大规模运行不依赖西方硬件。虽然单芯片性能上,昇腾950仍显著落后于NVIDIA Blackwell B200,但中国通过“横向扩展”战略,用大量国产芯片集群结合软件优化和模型架构创新(如MoE),使系统级AI能力快速接近前沿水平。这暴露了西方分析的根本错误——将芯片级差距直接等同于能力差距。

DeepSeek开源生态推理数据/训练
16:20
The Decoder:AI News(RSS)
66
Meta 收购 Assured Robot Intelligence 以加速人形机器人布局

Meta 收购了机器人AI初创公司Assured Robot Intelligence,旨在加速其人形机器人研发进程。此次收购的核心目标是打造一个面向全行业的开放平台,其战略定位类似于Android在智能手机领域所扮演的角色。Meta计划通过这一平台,推动人形机器人技术的标准化与普及化发展。

Meta具身智能开源生态行业动态
03:47
elvis@omarsar0
29
你不必在两者之间做选择。 最好结合使用它们。 我的建议是学习如何在不同的场景中使用其中几种模型。学会结合它们的优势。 如今开源模型同样出色。给自己灵活运用的空间。
大佬观点开源生态推理
01:19
Google Research:Blog(网页)
51
通过全球合作与开放资源催化科学影响力

Google Research强调通过开源软件和开放数据集推动现代科学发展,秉持负责任、包容和严谨的开放科学原则。其Transformer架构重塑了自动语言处理,专业模型正推动医学、基因组学、神经科学、气候与能源等跨学科领域的突破。团队通过API、学术出版物、会议及全球合作伙伴关系,构建协作生态系统,旨在加速全球科学进步与创新。

Google开源生态行业动态
5月1日
22:11
IT之家(RSS)
27
瑞莎 5 月 30 日联手高通举行 AI 开发者日,将发布飞牛 AI NAS

Radxa(瑞莎)将于5月30日在深圳与高通联合举办AI开发者日活动,主题为“AI共进·开源新生”。活动上将正式发布与飞牛深度合作的AI NAS产品,该产品基于高通平台。此外,瑞莎还将推出多款基于高通平台的新品,包括迷你主板、核心板和Cluster计算集群等,旨在为终端侧AI部署提供灵活可扩展的硬件支持。

产品更新开源生态端侧
15:10
Alibaba Cloud@alibaba_cloud
40
首尔Qwen Meetup展示规模化AI产品开发实践

超过70名工程师和开发者在首尔Qwen Meetup上交流AI产品实战经验。channeltalk团队分享了如何在两周内构建处理5亿条记录的可观测性管道;Omelet介绍了生产级AI架构;TeamSparta演示了在阿里云Model Studio上构建AI助手。核心结论是Qwen3.6能显著提升团队规模化交付AI产品的效率。活动由阿里云韩国团队和TFM社区支持。

开源生态行业动态
14:14
Artificial Analysis@ArtificialAnlys
57
三大开源模型上周齐发,与顶尖闭源模型差距缩小至6分内

上周,Kimi K2.6、MiMo V2.5 Pro和DeepSeek V4 Pro三大领先开源模型发布,在Artificial Analysis Intelligence Index上得分达52-54分,与顶尖闭源模型GPT-5.5的60分差距缩小至6分以内,相比一年前22分的开源模型进步显著。这些模型均为万亿参数规模的MoE架构。然而,在复杂推理、智能体编码及知识准确性方面,开源模型与闭源模型仍存在明显差距。例如在HLE、CritPt和TerminalBench Hard等专项评估中得分大幅落后;在Omniscience评估中,DeepSeek V4 Pro的幻觉问题尤为突出。

DeepSeekOpenAI开源生态推理
13:17
小互@xiaohu
65
一位开发了DeepSeek-TUI终端工具的美国开发者,希望与国内开发者社群建立联系,共同探讨DeepSeek、开源及智能体开发。他因无法自行解决网络问题以使用微信,特请求社区帮助:一是转发推广其开源项目,二是协助验证微信号以便建群交流。作为回报,他承诺工具将通过cargo install方式安装。

Hunter Bown: 鲸鱼兄弟们好,我是做 DeepSeek-TUI 的那个美国佬。 说真的,特别想跟国内的鲸鱼兄弟们一起混--但我的翻墙技能仅限于写代码,微信到现在都没搞定,属实有点丢人。 求各位大佬帮个忙: 1)帮忙转发扩散一下,让这个开源终端工具翻过高墙被...

DeepSeek开源/仓库开源生态推理
‹ 上一页
1…2526272829…36
下一页 ›