AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「开源生态」清除
6月23日周二
21:20Hugging Face:Blog(RSS)73精选IBM 开源 CUGA:轻量级智能体框架,提供二十余个单文件示例应用
21:11AYi74EverOS 1.0.0:给AI Agent搭建持久记忆的开源本地记忆操作系统
20:27Chubby♨️26万亿参数开源模型即将到来
20:24The Decoder:AI News(RSS)39Cursor 发布自有 AI 模型、新 Git 平台和移动应用
20:11IT之家(RSS)40《历史模拟器:崇祯》6月25日起本体免费,创意工坊及MOD《罗马:塞维鲁》同步测试
19:10IT之家(RSS)59英国政府拨款6000万英镑建两所AI实验室,开发低硬件需求开源模型
18:10AYi55独立开发者用四款开源工具拼出有记忆性格的数字分身
18:07IT之家(RSS)51QQ邮箱推出Agently Mail,为AI智能体提供专属邮箱服务
16:12Hugging Face:Blog(RSS)59精选我们用免费本地模型对 OpenClaw 仓库进行实时分类
16:07IT之家(RSS)48欧洲自由软件基金会建议欧盟施压谷歌,阻止安卓静默重装AI行为
16:05SiliconFlow59GLM-5.2 在 Code Arena 前端测试中排名第二,成本优势显著
14:13HuggingFace Daily Papers(社区热门论文)55Tmax: 终端智能体的简单配方
14:10公众号:京东JoyAI73精选京东全栈开源JoyAI-VL-Interaction,从"一问一答"走向"边看边说"
10:07OpenRouter56GLM 5.2 vs DeepSeek V4 token份额
09:09AYi65Cline团队实测GLM-5.2 vs Claude Opus 4.8:修bug后构建稳定性差异
09:07IT之家(RSS)45OpenAI 推出"修补地球"计划,用 AI 助力开源社区提升网络安全
08:35TechCrunch:AI(RSS)45OpenAI 携手 Trail of Bits 推出"Patch the Planet"开源漏洞修复计划
08:14Hacker News 热门(buzzing.cc 中文翻译)84同事件精选GLM-5.2 开源模型发布:744B 参数,1M 上下文,可本地运行同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
04:26Chubby♨️57GLM-5.2 在真实世界智能体基准 GDPval-AA 排名第三,领先所有开源模型
03:56Chubby♨️59GLM 5.2 持续获胜
03:41OpenCode23opencode推出独立用户排名
02:40Artificial Analysis59GLM-5.2 在 GDPval-AA 基准排名第三,领先开源权重模型
01:14OpenAI:官网动态(RSS · 排除企业/客户案例)64同事件精选OpenAI 联合 Trail of Bits 发起 Patch the Planet 计划,AI 辅助开源项目漏洞修复同一事件,精选展示《OpenAI 扩展 Daybreak 计划:推出 GPT‑5.5‑Cyber 完整版与 Codex Security 更新》
01:12Emad67Reflection AI获SpaceX 63亿美元计算交易训练开源模型
00:10Rohan Paul73SpaceX与开源AI初创Reflection签署GPU计算租赁协议
00:05IT之家(RSS)49合约最高价值 63 亿美元,SpaceX 与开源 AI 初创企业 Reflection 签署算力合作协议
6月22日周一
23:40StepFun22阶跃星辰推出创业支持计划
23:12SenseTime16商汤SenseTime感谢@xCreate对SenseNova U1的深入解读
23:09Nathan Lambert56GLM-5.2:开放智能体的DeepSeek时刻
23:05Nathan Lambert:Interconnects(RSS)67同事件精选GLM-5.2:开放智能体的阶跃变化同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
22:40Hacker News 热门(buzzing.cc 中文翻译)58向 Zig 软件基金会再捐赠 40 万美元
22:09Nathan Lambert67TMax发布:开源终端智能体RL配方与数据
17:39Hacker News 热门(buzzing.cc 中文翻译)65GLM-5.2 与 Claude Opus 4.8 正面较量:构建3D WebGL平台游戏
16:05IT之家(RSS)58微软 CEO 纳德拉:不能任由 AI 巨头吞噬经济
14:06AYi57GLM-5.2 母公司智谱股价半年涨约16倍,因测评对比改变默认选项
14:04MiniMax (official)34MiniMax M3 缓存命中率高达95%
12:38Hacker News 热门(buzzing.cc 中文翻译)47转向开放式模型的弊端微乎其微
10:04IT之家(RSS)61智谱市值突破1万亿港元,GLM-5.2开源登顶Code Arena
09:06AYi57Hermes Bible 整合官方文档与社区工作流
08:00HuggingFace Daily Papers(社区热门论文)44RaysUp:基于几何感知射线表示的超轻量通用特征上采样框架
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月23日
21:20
Hugging Face:Blog(RSS)
精选73
IBM 开源 CUGA:轻量级智能体框架,提供二十余个单文件示例应用

IBM 开源了 CUGA(Configurable Generalist Agent),一个处理规划、执行循环、工具调用和状态管理的轻量级智能体框架。开发者只需提供工具列表和提示词即可构建 CugaAgent。内置计划-执行-反思循环,在 AppWorld(2025年7月–2026年2月)和 WebArena(2025年2月–9月)基准上排名第一。支持 Fast / Balanced / Accurate 三种推理模式,代码执行可在本地、Docker 或 E2B 沙箱中运行。可互换工具支持 OpenAPI、MCP 和 LangChain 函数,通过环境变量一键切换 OpenAI、watsonx、Ollama 等提供商。随框架发布二十余个单文件示例应用,涵盖电影推荐、IBM Cloud 架构顾问等场景,每个应用仅需一个 FastAPI 文件。

智能体GitHubMCP/工具产品更新

推荐理由:CUGA 把 agent 的规划、状态、策略等繁琐工程压缩成配置,开发者只写工具列表和 prompt 就能跑起 agent,配套的二十多个单文件应用是现成的模板库,对自建 agent 的团队来说省去了八成重复工作。
21:11
AYi@AYi_AInotes
74
EverOS 1.0.0:给AI Agent搭建持久记忆的开源本地记忆操作系统

EverOS 1.0.0是一款开源、本地优先的记忆操作系统,专为AI Agent提供跨会话持久记忆。其核心是将记忆存储为可直接cat、git、编辑的Markdown文件(唯一可信来源),配合SQLite管理状态、LanceDB处理向量/BM25索引及标量过滤,无需Docker或向量数据库集群。官方基准:LoCoMo 93.05%、LongMemEval‑S 83.00%、HaluMem约90%+。支持多模态摄取(PDF/图片/网页URL),任务可自我演化成可复用Skill,计划加入Knowledge Wiki和Reflection。用户通过CLI(everos init/server start)约30分钟上手。

智能体开源生态教程/实践部署/工程
20:27
Chubby♨️@kimmonismus
26
我听说其他万亿参数开源模型也即将推出。这对 token 定价和杰文斯悖论来说太棒了。我非常期待接下来的几周!

Aravind Srinivas: Also, other multi-trillion-parameter open-source models are landing soon, from what I hear. It's going to be awesome for...

开源生态行业动态
20:24
The Decoder:AI News(RSS)
39
Cursor 发布自有 AI 模型、新 Git 平台和移动应用

Cursor 公布了其首个完全内部训练的 AI 模型的详细信息,并同步推出了一款新 Git 平台和一款移动应用。

产品更新开源生态编码
20:11
IT之家(RSS)
40
《历史模拟器:崇祯》6月25日起本体免费,创意工坊及MOD《罗马:塞维鲁》同步测试

国产AI历史策略游戏《历史模拟器:崇祯》宣布2026年6月25日起本体转为免费游玩。此前首发价48元,因DeepSeek v4 pro、通义千问、智谱GLM等国产大模型能力提升与成本下降,AI游戏成本枷锁被冲开,故决定转免。新玩家可领1500免费模式专属积分,此前48元购入的玩家可额外领4800全模式积分回馈,总计6300积分。同日开启创意工坊及示例MOD《罗马:塞维鲁》测试,允许玩家自定义API接入其他大模型。

开源生态行业动态
19:10
IT之家(RSS)
59
英国政府拨款6000万英镑建两所AI实验室,开发低硬件需求开源模型

英国政府6月23日宣布拨款6000万英镑(约5.39亿元人民币),为牛津大学和伦敦大学学院(UCL)建立两座AI实验室。实验室将开发低硬件需求的开源AI模型,减少对美国闭源高算力方案的依赖。AI事务部长Kanishka Narayan表示此举将使AI更便宜、易部署、更实用,帮助更多企业和公共服务接入AI。两所大学另拨200万英镑(约1795.8万元)培养博士生并招聘至少10名研究人员,以扩大AI人才储备。

开源生态政策/监管
18:10
AYi@AYi_AInotes
55
独立开发者用四款开源工具拼出有记忆性格的数字分身

独立开发者用四款开源工具做出有记忆性格的数字分身,未依赖商业API。通过人格蒸馏将几百条笔记压缩成性格,搭配长期记忆和实时语音框架,延迟从8-20秒降至1秒内。换网红峰哥人格体验更佳,认为人格独特性而非万能温柔才是AI陪伴核心。

开源生态现象/趋势
18:07
IT之家(RSS)
51
QQ邮箱推出Agently Mail,为AI智能体提供专属邮箱服务

6月23日,腾讯QQ邮箱推出专为AI智能体打造的专属邮箱服务Agently Mail,并开启内测。该产品独立于个人邮箱运行,可为AI Agent提供安全、隔离且具备独立身份的数字通信空间。支持WorkBuddy、QClaw、Marvis、OpenClaw、Claude Code、Kimi Work、豆包超能模式、Codex、Hermes、Cursor等主流Agent。腾讯公关总监张军表示后续会开放更多平台。Agently Mail已上架腾讯SkillHub,代码仓库在GitHub以Apache-2.0协议开源。

智能体产品更新开源生态
16:12
Hugging Face:Blog(RSS)
精选59
我们用免费本地模型对 OpenClaw 仓库进行实时分类

Hugging Face 在 OpenClaw 仓库上测试用 Gemma 和 Qwen 等本地模型实时分类 issue 和 PR。他们使用 Pi agent harness 驱动模型,配合 reposhell 只允许读操作防止提示词注入。测试的模型包括 gemma-4-26b-a4b 和 qwen3.6-35b-a3b,经性能优化后均可在本地生成数百 token/s。该方案运行在 NVIDIA GB10(128 GB 统一内存)上,相比每月 200 美元的 ChatGPT Pro 订阅,可实现近乎实时的通知且仅消耗电费。

智能体Hugging Face开源生态教程/实践

推荐理由:Hugging Face 演示了用本地模型自动 triage GitHub issue 的完整方案,包括只读 shell 防注入、agent harness 等工程技巧。对想用本地模型替代 API 做分类任务的团队,这是一套可直接借鉴的 recipe。
16:07
IT之家(RSS)
48
欧洲自由软件基金会建议欧盟施压谷歌,阻止安卓静默重装AI行为

欧洲自由软件基金会(FSFE)于6月15日向欧盟委员会提交意见,要求依据《数字市场法》加强管控谷歌安卓系统。FSFE指出,谷歌在未明确告知用户的情况下悄然安装AI模型,用户卸载后仍会重装,违反法案。建议欧盟施压谷歌整改AOSP,让用户完整移除预载AI组件,禁止未经知情重新安装或激活。同时要求谷歌扩展安卓互操作性,不应以注册、授权或签订合同为前提。此外,谷歌拟于2026年9月上线的开发者验证计划要求开发者登记并付费才能发布应用到F-Droid等替代商店,FSFE认为这对自由软件开发者不利。

Google开源生态政策/监管
16:05
SiliconFlow@SiliconFlowAI
59
硅基流动测试了 GLM-5.2、GPT-5.5、Opus 4.8 和 GLM-5.1 的相同提示。据 @arena 引用,GLM-5.2 (Max) 在 Code Arena: Frontend 排名第 2,以 +29 分领先 Claude Opus 4.7 (Thinking),仅次于 Fable 5;是最好的开源模型,大幅超越 Kimi-K2.6 和 Minimax-M3,并在 React(第 2)、HTML(第 4)及品牌营销、参考设计、数据分析等多个子类别中位居第一。主推文指出,在 SiliconFlow 上使用 GLM-5.2 可获得 Opus 级前端生成能力,输入成本降低约 3.6 倍,输出成本降低约 5.7 倍。

Arena.ai: Exciting news: GLM-5.2 (Max) ranks #2 in Code Arena: Frontend, with +29pt over Claude Opus 4.7 (Thinking) and only behin...

开源生态编码评测/基准
14:13
HuggingFace Daily Papers(社区热门论文)
55
Tmax: 终端智能体的简单配方

Tmax是当前最强的开源终端智能体RL训练配方。仅9B参数即在下游基准Terminal-Bench 2.0上达到27%准确率,超越此前更大模型。研究团队利用难度控制、角色和验证器多样化策略生成数据,并开源了比此前任何已发布终端智能体数据集大2.5倍以上的数据集。基于该数据,使用简单的结果驱动RL训练开放权重模型。代码、数据和模型均已开源。

智能体开源生态数据/训练论文/研究
14:10
公众号:京东JoyAI
精选73
京东全栈开源JoyAI-VL-Interaction,从"一问一答"走向"边看边说"

京东近日开源全球首个全栈交互模型JoyAI-VL-Interaction,获vLLM-Omni原生支持。该模型能持续观察视频流、主动判断关键事件并实时响应,支持将复杂任务委托后台Agent处理。在58个真人盲评中,对比豆包视频通话助手胜率77.6%,对比Gemini视频通话助手胜率87.9%,监控预警场景达100%胜率。开源内容包括模型权重、交互数据集、训练方案及完整可部署系统,支持摄像头、直播流等视频输入及语音交互、长期记忆、vLLM部署,适用于安防监控、老人看护、直播讲解等实时场景。

多模态开源生态模型发布部署/工程
关联讨论 2 条HuggingFace Daily Papers(社区热门论文)IT之家(RSS)
推荐理由:京东这个实时交互模型不是又一个刷榜模型,它把「什么时候该说话」变成了模型自己的判断。全栈开源且对比豆包、Gemini 胜率惊人,做安防、看护、直播的开发者可以直接试了。
10:07
OpenRouter@OpenRouter
56
GLM 5.2 vs DeepSeek V4:OpenRouter上token份额 与大多数开源权重发布相比,GLM 5.2的采用速度非常快。
开源生态现象/趋势
09:09
AYi@AYi_AInotes
65
Cline团队实测GLM-5.2 vs Claude Opus 4.8:修bug后构建稳定性差异

Cline团队用自家仓库真实bug测试GLM-5.2和Claude Opus 4.8。Opus速度快3倍(1.6分钟vs 4.7分钟)、token少一半(660K vs 1.1M)、价格贵一倍($0.81 vs $0.41),修好bug但生产构建崩溃,留下类型错误。GLM多花67% token、多2.3倍工具调用(28次vs 12次)、价格便宜一半,不仅修好bug还主动清理死代码,构建干净通过。根本差异在于训练目标:GLM被强化学习训练出验证文化,多花token跑构建、查类型、防回归;Opus追求高效却忽略隐患。排行榜只测修bug能力,测不出是否破坏生产环境。开源模型GLM在长周期代码智能体上找到差异化优势。

Cline: We've kept hearing how GLM-5.2 beats Opus 4.8, and are skeptical of benchmarks - so we tested them on a real bug from th...

开源生态编码评测/基准
09:07
IT之家(RSS)
45
OpenAI 推出"修补地球"计划,用 AI 助力开源社区提升网络安全

6 月 23 日,OpenAI 宣布“修补地球”计划,与网络安全公司 Trail of Bits 合作,协助开源项目维护者加固代码安全。Trail of Bits 的安全技术人员直接对接项目方排查风险,结合 OpenAI 的 Codex Security 等 AI 工具辅助检测、编写补丁与测试用例,并搭建可复用的自动化工作流。该计划旨在缓解开源维护者人手与时间压力,但长期运行模式尚未明确。

OpenAI安全/对齐开源生态行业动态
08:35
TechCrunch:AI(RSS)
45
OpenAI 携手 Trail of Bits 推出"Patch the Planet"开源漏洞修复计划

OpenAI 联合安全公司 Trail of Bits 启动“Patch the Planet”计划,帮助开源项目修复安全漏洞。Trail of Bits 工程师将直接与维护者合作,利用 OpenAI 的 Codex Security 等工具审查代码、开发补丁和测试,旨在减少维护者的安全报告处理负担,而非增加工作量。开源软件是商业基础但常因分散化而存在漏洞,OpenAI 此举也被视为对 Anthropic 安全工具 Mythos 的竞争回应。

OpenAI安全/对齐开源生态行业动态
08:14
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选84
GLM-5.2 开源模型发布:744B 参数,1M 上下文,可本地运行

Z.ai 发布 GLM-5.2,开源 744B 参数(40B 活跃),1M 上下文窗口,性能与 Claude 4.8 Opus、GPT-5.5、Gemini 3.1 Pro 持平。通过 Unsloth 动态量化,2-bit GGUF 版本内存需求降至 239GB(-84%),1-bit 版降至 217GB(-86%),可运行于 256GB 统一内存 Mac 或 1×24GB GPU+256GB RAM。提供非思考、高、最大三种思考模式。评测显示动态 1-bit 准确率约 76.2%,2-bit 约 82%。

GitHub开源生态教程/实践部署/工程
同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
推荐理由:Unsloth 这篇操作指南把 GLM-5.2 从「只能仰望」变成了「可以在自家 256GB Mac 上跑」,动态量化让 744B 参数模型降到了 239GB 磁盘占用,对想上手本地最强开源模型的人,这一步正好踩在从 curiosity 到可用的临界点上。
04:26
Chubby♨️@kimmonismus
57
GLM-5.2 在真实世界智能体基准 GDPval-AA 排名第三,领先所有开源模型

GLM-5.2(max)在真实世界智能体工作基准 GDPval-AA 上获 1524 Elo,排名第三,仅次于 Claude Fable 5(1783)和 Claude Opus 4.8(1615),与 GPT-5.5(xhigh,1509)持平。该模型以约 31 轮次任务平均完成零售主管任务清单、紧急停止电路图等交付物,领先开源权重模型(下一名 MiniMax-M3 仅 1408),并超过 Google Gemini 3.5 Flash(1357)、Qwen 3.7 Max(1289)等闭源模型。GLM-5.2 同时在 Artificial Analysis Intelligence Index、Agentic Index 和 AA-Briefcase 上领跑开源榜单。

Artificial Analysis: GLM-5.2 leads open weights models and sits at #3 overall on GDPval-AA, a real-world agentic work benchmark GLM-5.2 from ...

智能体开源生态评测/基准
03:56
Chubby♨️@kimmonismus
59
Kim指出,GLM 5.2是首个能以开放权重处理真实自动研究任务的模型,包括调试设置、跨多节点H100集群运行并比较RL训练实验。其局限在于缺少图像理解能力,需程序化分析原始WandB数据而非可视化图表。引用介绍称,GLM 5.2是其自动研究pipeline上首个能胜任实际研究的开源模型,在Fable 5对研究设限的背景下意义重大。演示中,它基于SkyRL在两台8×H100节点上完成Harbour代码竞赛的完全异步vs同位置同步RL训练,自动解决设置问题并生成吞吐量与奖励稳定性对比。

alphaXiv: Introducing GLM 5.2 for autoresearch GLM 5.2 is the first open weights model we've tried on our autoresearch pipeline th...

智能体开源生态评测/基准
03:41
OpenCode@opencode
23
我们已添加独立用户排名 某些模型 token 消耗大,导致它们在排名中偏高--使用模型的独立用户数是更准确的排名 我们将围绕这一指标调整更多数据
产品更新开源生态
02:40
Artificial Analysis@ArtificialAnlys
59
GLM-5.2 在 GDPval-AA 基准排名第三,领先开源权重模型

智谱 AI 的 GLM-5.2 在真实世界智能体工作基准 GDPval-AA 上获得 1524 Elo,排名第三,仅次于 Claude Fable 5 和 Claude Opus 4.8,与 GPT-5.5 持平。它是开源权重模型中领先的,超越 Gemini 3.5 Flash、Qwen 3.7 Max 等专有模型。任务为智能体型,平均每任务约 31 轮。此外,GLM-5.2 在 Artificial Analysis Intelligence Index 上也领先开源权重,并在 Agentic Index 和 AA-Briefcase 上均排名第三。

智能体开源生态推理评测/基准
01:14
OpenAI:官网动态(RSS · 排除企业/客户案例)
同事件精选64
OpenAI 联合 Trail of Bits 发起 Patch the Planet 计划,AI 辅助开源项目漏洞修复

OpenAI 联合 Trail of Bits 推出 Patch the Planet 计划,利用 GPT‑5.5‑Cyber 和 Codex Security 等模型进行 AI 辅助安全研究,经人工专家审核后协助开源项目修复漏洞。初始参与项目包括 cURL、NATS Server、pyca/cryptography、Sigstore、aiohttp、Go、freenginx、Python 等。Trail of Bits 已在 19 个项目中识别数百个安全漏洞,合并数十个补丁,并开发出模糊测试、历史 CVE 变体分析、差分测试等可复用工作流。例如,通过 Codex 在一天内构建覆盖数十个入口点的模糊测试实验室,而人工通常需数周。参与项目可获得 ChatGPT Pro、Codex Security 访问权限及 API 额度。

OpenAI安全/对齐开源生态
同一事件,精选展示《OpenAI 扩展 Daybreak 计划:推出 GPT-5.5-Cyber 完整版与 Codex Security 更新》
推荐理由:OpenAI把最前沿的模型用来实打实地挖真实漏洞,还搭配专家验证,这比刷基准榜更有长期价值,对依赖开源的公司是个好信号。
01:12
Emad@EMostaque
67
SpaceX与Reflection AI签署63亿美元计算协议,Reflection将立即获得GB300芯片用于训练开源模型,并于2026年7月1日起每月支付1.5亿美元至2029年。Emad Mostaque(前Stability AI CEO)称该计算量可能相当于所有中国开源公司(使用更先进芯片)之和,并询问是否有市场预测Reflection AI何时发布首个模型。

Andrew Curran: SpaceX has signed a $6.3 billion dollar compute deal with Reflection. Reflection will gain immediate access to GB300s to...

开源生态行业动态
00:10
Rohan Paul@rohanpaul_ai
73
SpaceX与开源AI初创Reflection签署GPU计算租赁协议

SpaceX完成857亿美元IPO后,与开源AI初创Reflection签署GPU计算租赁协议。Reflection自2026年7月起每月支付1.5亿美元,使用SpaceX Colossus数据中心的Nvidia GB300集群,若延续至2029年总支付约63亿美元,协议可于3个月后提前90天取消。Reflection采用B2B/B2G开放权重模式,构建前沿模型并向政府、国家实验室和企业出售定制化部署。该集群用于训练基础模型并适配科学和国家安全场景。Anthropic切断Fable和Mythos服务后,Reflection强调关键AI客户不应依赖可被撤销或受限的闭源供应商。

Rohan Paul: SpaceX just announced its first investment-grade bond sale after its record $85.7B IPO last week. The company is issuing...

开源生态行业动态部署/工程
00:05
IT之家(RSS)
49
合约最高价值 63 亿美元,SpaceX 与开源 AI 初创企业 Reflection 签署算力合作协议

SpaceX 与开源 AI 初创企业 Reflection AI 签署算力合作协议,最高价值 63 亿美元。Reflection 将立即获得英伟达 GB300 AI 芯片使用权,自 2026 年 7 月 1 日至 2029 年底每月支付 1.5 亿美元。合约生效满三个月后任一方可提前 90 天终止。SpaceX 此前已与 Anthropic、谷歌和 Cursor 达成合作,马斯克旗下公司正收购 Cursor。Reflection 专注于开源模型,正与美国能源部“创世纪计划”合作并参与五角大楼 AI 计划。

开源生态数据/训练行业动态
6月22日
23:40
StepFun@StepFun_ai
22
推出 StepFun 创业计划。 我们正在支持使用 StepFun 模型构建真实产品的早期 AI 团队--从多模态应用到智能体系统。 入选的初创公司可能获得 API 额度、专属生态支持、联合营销机会、展示位,以及向特定合作伙伴的引荐。 我们很期待了解你在构建什么。 立即申请 👇 https://platform.stepfun.ai/startup-program
开源生态行业动态
23:12
SenseTime@SenseTime_AI
16
商汤SenseTime感谢@xCreate对SenseNova U1的深入解读

商汤SenseTime在推文中感谢@xCreate对SenseNova U1的深入解读,该模型具备强大的文本-图像交织推理与信息图生成能力。推文附有YouTube视频演示,并提供了SenseNova Studio在线试用链接、HuggingFace模型集合、GitHub本地运行指南及Discord社区入口,方便用户试用和部署。

开源生态行业动态
23:09
Nathan Lambert@natolambert
56
GLM-5.2 应该是智能体的"DeepSeek 时刻"。我们进入一个新世界,开放模型中拥有了顶尖智能体能力。 如果你关心开放,现在就是向监管者说明我们应该如何构建一个安全、前沿、开放智能世界的时候。

Interconnects: GLM-5.2 is the step change for open agents A capability threshold I've been carefully monitoring. https://www.interconne...

智能体开源生态模型发布
23:05
Nathan Lambert:Interconnects(RSS)
同事件精选67
GLM-5.2:开放智能体的阶跃变化

Z.ai 于 6 月 13 日向 GLM Coding Plan 成员发布 GLM-5.2,6 月 16 日开源 MIT 许可权重。该模型在 Arena 智能体排行榜上成为唯一与 OpenAI 和 Anthropic 最新模型匹敌的开放模型,匹配 Opus 4.8 无思考模式;在 Design Arena 中甚至超越 Claude Fable。作者认为这是自 DeepSeek R1 以来最受关注的开放模型发布,GLM-5.2 是首个在编码工具中作为通用智能体表现合格的开放权重模型。从 Claude Opus 4.5 发布(2025 年 11 月 24 日)到 GLM-5.2 发布(2026 年 6 月 16 日)间隔约 6.8 个月。

开源生态模型发布编码
同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
推荐理由:GLM-5.2是第一个真正能打的开放编码代理模型,社区反应堪比DeepSeek R1时刻,对依赖Claude Code的开发者是个好消息,开放模型的竞争力又前进了一大步。
22:40
Hacker News 热门(buzzing.cc 中文翻译)
58
向 Zig 软件基金会再捐赠 40 万美元

Mitchell Hashimoto 家庭宣布再向 Zig 软件基金会(ZSF)捐赠 40 万美元,分两年每年 20 万美元,加上 2024 年首次捐赠,累计捐赠总额达 70 万美元。Zig 项目在语言和编译器开发上稳步推进,其严格禁止 LLM 贡献的政策近期引发公开讨论。Hashimoto 表示自己大量使用 AI,但尊重 ZSF 的选择,认为开源项目有权保持独立文化和边界。Ghostty 终端模拟器的成功很大程度上得益于 Zig。

大佬观点开源生态
22:09
Nathan Lambert@natolambert
67
TMax发布:开源终端智能体RL配方与数据

TMax 是面向终端任务的开源 RL 配方,基于 Qwen 3.5 较小密集模型,在默认设置和 65k token 预算下超越此前开源工作。训练需 8 节点 H100(2 训练+6 推理)运行 2-3 天,配方经约 100 次训练才稳定。发布模型权重、数据及训练 rollouts。配方工作强调从零获得初始基线成本高昂(1 万至百万美元),需要明确决策阶梯和稳定性改进。

Hamish Ivison: Trained some terminal agents with friends! Introducing Tmax, open RL terminal agent models. Under default settings and s...

智能体开源生态论文/研究
17:39
Hacker News 热门(buzzing.cc 中文翻译)
65
GLM-5.2 与 Claude Opus 4.8 正面较量:构建3D WebGL平台游戏

最新开源 GLM-5.2(Z.ai,MIT 许可,1M token 上下文,输出定价 $4.4/百万 token)与 Claude Opus 4.8 在单次提示构建 3D WebGL 平台游戏任务上对比。Opus(Claude Code)用时 33 分 30 秒,成本约 $21.92;GLM-5.2(Pi/OpenRouter)用时 1 小时 10 分 40 秒,成本仅 $5.39。Opus 游戏更干净、能自检视觉输出(GLM-5.2 纯文本),但 GLM-5.2 价格低且开源权重可下载,始终可用。

Anthropic开源生态编码评测/基准
16:05
IT之家(RSS)
58
微软 CEO 纳德拉:不能任由 AI 巨头吞噬经济

微软CEO纳德拉向OpenAI、Anthropic等AI巨头发出警告,反对少数公司垄断AI价值并以此索取无限资源。他主张下一阶段AI应转向价格更低的模型,赋予用户更大选择权,并以更可信方式阐述AI社会价值。纳德拉批评前沿模型开发商一边渲染安全风险和失业,一边要求建设大量数据中心。他明确表示,微软不希望AI未来完全由这些公司决定,而应让AI成为企业的知识引擎,由企业灵活调用多种模型,在自有机器内实现持续改进。

Microsoft大佬观点开源生态
14:06
AYi@AYi_AInotes
57
GLM-5.2 母公司智谱股价半年涨约16倍,因测评对比改变默认选项

智谱年初上市,股价从约131.50 HKD涨至约2,094 HKD,YTD涨幅约1,492%。背后由GLM-5.2与Fable 5测评对比驱动:同一任务下GLM-5.2效果达Fable 5九成,但价格不到$0.10(Fable 5约$5),价差五十倍。该对比改变了设计探索默认选项——当开源模型做到“够好且便宜到可以随便用”,用户优先选择低成本方案。GLM-5.2此次正好踩上这条线。

AYi: 难怪今天智谱股票突突突疯长26%, 刚刷到一个GLM-5.2和Fable 5的测评, 同一个任务,同一句 prompt,同一张参考图, Fable 5 确实更精致,间距、质感、整体完成度, 一眼就能看出差距, 但 GLM-5.2 做出来的东...

图像生成大佬观点开源生态
14:04
MiniMax (official)@MiniMax_AI
34
M3 的 95% 缓存命中率讲述了一个更有趣的故事 提示:长时间跨度的编码循环 感谢 @opencode 让这一使用量可见。

Jay: The other open source models are clawing market share back from DeepSeek

开源生态编码行业动态
12:38
Hacker News 热门(buzzing.cc 中文翻译)
47
转向开放式模型的弊端微乎其微

2026年6月,Claude和GPT在Artificial Analysis智能排行榜上领先,但Claude推出ID验证促使作者重新评估。开放模型可通过本地或OpenRouter等第三方部署,虽存在隐私、成本与速度问题,但性能与顶级闭源模型仅差几个月,类似2008年Linux与Windows的差距但更小。作者认为转向开放模型的生产力损失是短期且可接受的,并非不可逾越的障碍。

开源生态现象/趋势
10:04
IT之家(RSS)
61
智谱市值突破1万亿港元,GLM-5.2开源登顶Code Arena

智谱港股总市值首次突破1万亿港元,年内涨超2000%,6月22日盘中涨超35%至1.27万亿港元。公司6月17日开源GLM-5.2,该模型在全球百万用户盲测的前端开发评估系统Code Arena上取得可用模型第一。特斯拉CEO马斯克6月19日预测中国大模型可能要到2027年第一季度达到Anthropic Fable水平,智谱联合创始人唐杰回应称“不需要那么久”。

开源生态模型发布行业动态
09:06
AYi@AYi_AInotes
57
Hermes Bible 整合官方文档与社区工作流

Hermes Bible 将 Hermes Agent 169 页官方文档整合一体,提炼出 24 个可直接抄的真实工作流(如 Jira 到 PR 自动过渡),支持 ⌘K 即时搜索定位章节,社区可分享工作流并展示个人资料页。解决官方文档分散、优质工作流沉没在 X 和 Discord 的问题。

AYi: http://x.com/i/article/2042547855865585664

智能体开源生态教程/实践
08:00
HuggingFace Daily Papers(社区热门论文)
44
RaysUp:基于几何感知射线表示的超轻量通用特征上采样框架

RaysUp是一个超轻量、任务无关且与视觉基础模型无关的特征上采样框架,通过将重建提升至几何感知光线域,在任意分辨率下重建高分辨率特征图。核心组件包括空间解耦引导编码器、任意分辨率交叉注意力机制、基于6D Plücker射线坐标的RayPE(射线位置编码)和几何感知邻域注意力模块。在多种密集预测任务中取得SOTA性能,参数量仅为AnyUp的16%,推理速度提升约7倍。代码已开源。

开源生态论文/研究部署/工程
‹ 上一页
1…45678…36
下一页 ›