AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「编码」清除
7月1日周三
02:37Hacker News 热门(buzzing.cc 中文翻译)78Anthropic 发布 Claude Sonnet 5:最具智能体能力的 Sonnet 模型
02:36AK49Claude Code 与 hf-claude 的 open-fusion
02:28ClaudeDevs79Claude Sonnet 5 发布:1M上下文窗口,编码工具性能顶级
02:28🚨 AI News | TestingCatalog80Claude Sonnet 5 发布,性能接近 Opus 4.8
02:27OpenRouter73Claude Sonnet 5上架OpenRouter,促销价$2/$10 per M
02:20Chubby♨️80Anthropic 发布 Sonnet 5:最智能体化的 Sonnet 系列模型
02:02Anthropic:Newsroom(网页)81精选Claude Sonnet 5 发布
01:28Claude:Blog(网页)72精选Claude Code 入门:智能体循环
01:27HuggingFace Daily Papers(社区热门论文)48SWE-Together: Evaluating Coding Agents in Interactive User Sessions
01:17Google Developers Blog(RSS)52Google发布新技能:从你的编码智能体驱动智能体质量飞轮
01:02Boris Cherny68Claude Desktop Linux版正式发布
01:00宝玉59Claude Code 被指在系统提示词里偷偷给中国代理用户"打水印"
01:00宝玉37Kimi Code 发布招聘信息
00:37Hacker News 热门(buzzing.cc 中文翻译)68Claude Code 通过隐写术在请求中嵌入环境标记
00:36AK40Ornith-1.0-35B 现可于 Claude Code 使用
00:30宝玉59Claude Code 宣传视频翻车:效率数据亮眼但用户感受差
00:30Rohan Paul75美团发布开源编码模型LongCat-2.0,国产芯片从头训练
00:27🚨 AI News | TestingCatalog62Claude Desktop Beta 版上线 Linux 用户
6月30日周二
23:38The Decoder:AI News(RSS)67美团发布LongCat-2.0,1.6万亿参数大模型完全基于国产芯片训练
23:24歸藏(guizang.ai)33CodePilot 0.5.6.3更新,上线ClinePass及Opencode GO套餐
23:00Nathan Lambert69美团LongCat发布LongCat-2.0:1.6T参数MoE,1M上下文,专为智能体编码设计
22:02IT之家(RSS)49OpenAI 修复 Codex 额度消耗异常故障并重置用户额度
19:02IT之家(RSS)48谷歌前工程负责人用Claude Code开发维基百科搜索引擎Zettair,未手动写一行代码
18:02IT之家(RSS)57马斯克抽调 SpaceX 顶尖星舰和星链工程师,全力攻坚 Grok 大模型
15:56🚨 AI News | TestingCatalog79美团发布LongCat-2.0,1.6T参数MoE模型,支持1M上下文窗口
15:04Xiaomi MiMo54Cline 推订阅计划,折扣访问 GLM-5.2 等开源模型
15:02IT之家(RSS)59AI 编程工具 Cursor 推出移动端应用,手机即可操控智能体
14:30meng shao31新Macbook第一件事:下载Codex
13:53SiliconFlow67同事件精选美团 LongCat 发布旗舰模型 LongCat-2.0同一事件,精选展示《美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型》
12:29meng shao75美团发布LongCat-2.0,全链路国产化Agent+Coding模型
12:02IT之家(RSS)57Claude Code 负责人称未来员工将身兼数职,工程产品设计融为一体
11:36Hacker News 热门(buzzing.cc 中文翻译)53hyperscript 解析bug修复:AI分析高效但修复方案欠佳
11:36小互81精选一个人管理5款产品,80%时间不写代码?Every的复利工程
11:23歸藏(guizang.ai)65Cline 9.9 美元月费 Token 计划支持多模型
11:23歸藏(guizang.ai)51Codex 因消耗过快再次重置使用限制并补偿
11:23歸藏(guizang.ai)30OpenAI 与 Work Louder 合作推出 Codex 定制键盘
11:02IT之家(RSS)76美团发布万亿参数大模型 LongCat-2.0,五万卡国产算力训练并开源
10:59meng shao69Codex Skill Manager 开源发布
10:59宝玉63《Claude Code From Scratch》开源电子书
10:57TechCrunch:AI(RSS)56Vibe coding 平台 Base44 推出自研模型,AI 初创公司寻求防御性
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月1日
02:37
Hacker News 热门(buzzing.cc 中文翻译)
78
Anthropic 发布 Claude Sonnet 5:最具智能体能力的 Sonnet 模型

Anthropic 发布 Claude Sonnet 5,定位为迄今最具智能体能力的 Sonnet 模型。它在推理、工具使用、编码和知识工作等智能体性能上较前代 Sonnet 4.6 显著提升,表现接近 Opus 4.8 但价格更低。即日起在所有计划中可用,成为 Free 和 Pro 计划的默认模型,并支持 Claude Code 及 Claude 平台。API 推出优惠定价:每百万输入 token $2、每百万输出 token $10(持续至 2026 年 8 月 31 日),之后恢复为 $3 和 $15。安全评估显示,Sonnet 5 在拒绝恶意请求、抵抗提示注入攻击、减少幻觉和谄媚行为上优于前代,但在网络安全任务上的能力显著弱于 Opus 4.8。

智能体Anthropic推理模型发布
关联讨论 8 条TechCrunch:AI(RSS)X:Claude (@claudeai)Claude Code:GitHub Releases(RSS)The Decoder:AI News(RSS)MarkTechPost(RSS)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)
02:36
AK@_akhaliq
49
在 Claude Code 中使用 hf-claude 进行 open-fusion。
AnthropicHugging Face开源/仓库编码
02:28
ClaudeDevs@ClaudeDevs
79
Claude Sonnet 5 已推出。 以 Sonnet 定价提供顶级编码和工具使用性能,并拥有 1M 上下文窗口。 它已成为 Pro 用户 Claude Code 的新默认模型,并可在 Claude 平台所有位置使用,包括 API 和托管智能体。

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

AnthropicMCP/工具模型发布编码
关联讨论 8 条TechCrunch:AI(RSS)X:Claude (@claudeai)Claude Code:GitHub Releases(RSS)The Decoder:AI News(RSS)MarkTechPost(RSS)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)
02:28
🚨 AI News | TestingCatalog@testingcatalog
80
ANTHROPIC 🔥: Claude Sonnet 5 已正式发布,以更低的价格提供了接近 Opus 4.8 的性能。 Sonnet 5 在 SWE Bench Pro 上获得 63.2% 的分数,较 Sonnet 4.6 的 58.1% 有所提升。 你已经试过了吗?👀

Claude: Introducing Claude Sonnet 5, our most agentic Sonnet yet. It makes plans, uses tools like browsers and terminals, and ru...

智能体Anthropic模型发布编码
关联讨论 8 条TechCrunch:AI(RSS)X:Claude (@claudeai)Claude Code:GitHub Releases(RSS)The Decoder:AI News(RSS)MarkTechPost(RSS)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)
02:27
OpenRouter@OpenRouter
73
Claude Sonnet 5 正在 OpenRouter 上推出,促销价格:$2/M 输入,$10/M 输出!它以 Sonnet 定价提供旗舰智能,提升智能体编码和专业工作流。在早期测试中,智能体比 4.6 更可靠、更快,且更容易信任处理更大的任务。
智能体Anthropic模型发布编码
关联讨论 8 条TechCrunch:AI(RSS)X:Claude (@claudeai)Claude Code:GitHub Releases(RSS)The Decoder:AI News(RSS)MarkTechPost(RSS)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)
02:20
Chubby♨️@kimmonismus
80
Anthropic 发布 Sonnet 5:最智能体化的 Sonnet 系列模型

Anthropic 发布 Sonnet 5,称其为迄今为止最智能体化的 Sonnet 模型。性能接近 Opus 4.8,在推理、工具使用、编码和知识工作方面有显著提升。即日起成为 Free 和 Pro 用户的默认模型,已在 Claude Code 和 API 上线。推出促销价:输入 $2/M token、输出 $10/M(截至 8 月 31 日),标准价分别为 $3/M 和 $15/M。整体较 Sonnet 4.6 更安全,幻觉率和奉承率更低,网络保护默认开启,但 Anthropic 表示 Opus 在严肃网络任务上仍更强。

Chubby♨️: Sonnet 5 released for me!!

智能体Anthropic安全/对齐推理
关联讨论 8 条TechCrunch:AI(RSS)X:Claude (@claudeai)Claude Code:GitHub Releases(RSS)The Decoder:AI News(RSS)MarkTechPost(RSS)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)
02:02
Anthropic:Newsroom(网页)
精选81
Claude Sonnet 5 发布

Claude Sonnet 5 是 Anthropic 推出的最新 Sonnet 模型,具备计划、浏览器和终端工具使用能力,可自主运行。性能接近 Opus 4.8,定价更低:即日起至 2026 年 8 月 31 日,输入 token $2/百万,输出 $10/百万,之后恢复为 $3/百万输入和 $15/百万输出。相比 Sonnet 4.6,在推理、工具使用、编程和知识工作等智能体能力上大幅提升。在 BrowseComp 和 OSWorld-Verified 评测中严格优于 Sonnet 4.6。安全评估显示不良行为率更低,幻觉和谄媚减少,但网络安全能力弱于 Opus 4.8。即日起在所有套餐及 Claude Code、Claude API 中可用。

智能体Anthropic模型发布编码
关联讨论 8 条TechCrunch:AI(RSS)X:Claude (@claudeai)Claude Code:GitHub Releases(RSS)The Decoder:AI News(RSS)MarkTechPost(RSS)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)
推荐理由:Claude Sonnet 5 把代理能力从 Opus 下放到了 Sonnet,性能接近 Opus 4.8 但价格只有三分之一,这对开发者来说性价比飞跃。虽然还不是最强,但已经能让许多复杂任务从勉强可用变成可靠。
01:28
Claude:Blog(网页)
精选72
Claude Code 入门:智能体循环

Claude Code 团队将智能体循环定义为 agent 重复工作直到满足停止条件的过程,并划分出四种主要类型:turn-based 循环(用户提示触发,Claude 自行判断完成或需更多上下文)、goal-based 循环(通过 /goal 命令设定可验证完成标准与最大轮次)、time-based 循环(通过 /loop 按时间间隔重复执行,可用 /schedule 移至云端)、以及 proactive 循环(基于事件或计划自动运行,无人实时参与)。文章还介绍了如何编写 SKILL.md 文件将人工验证步骤编码,让 Claude 进行端到端自检,减少 turn-based 循环中的手动操作。

智能体AnthropicMCP/工具教程/实践

推荐理由:Anthropic把agentic loops从模糊概念变成四种可复制的模式,附带SKILL.md和命令示例,Claude Code用户读完就能设计更自主的编码流程。
01:27
HuggingFace Daily Papers(社区热门论文)
48
SWE-Together: Evaluating Coding Agents in Interactive User Sessions

现有编码智能体基准多为静态,仅凭最终代码评判。SWE-Together 从 11,260 条真实用户-智能体编码会话中筛选出 109 个仓库级任务,构建多轮交互基准。研究团队利用基于 LLM 的用户模拟器保留原始用户意图,并在智能体需要时提供反馈。评估同时衡量最终仓库正确性和交互中的纠正反馈次数。实验表明,更强智能体成功率更高且所需干预更少,预示用户体验提升。

编码论文/研究评测/基准
01:17
Google Developers Blog(RSS)
52
Google发布新技能:从你的编码智能体驱动智能体质量飞轮

Google推出了一项面向编码智能体的新开发者技能,将评估过程自动化成五阶段飞轮:准备数据、运行推理、使用自适应AutoRaters评分、分析失败聚类、执行针对性优化。该工具可针对生产流量持续运行或通过合成场景按需触发,开发者用自然语言描述测试目标,独立评估服务安全验证并统计实际性能提升。

智能体Google产品更新编码
01:02
Boris Cherny@bcherny
68
你们要求,我们听取。Claude Desktop Linux版来了! 下载链接:https://code.claude.com/docs/en/desktop-linux

ClaudeDevs: Claude Desktop is now available on Linux (Ubuntu and Debian) in beta. Alongside the browser and terminal, you now get a ...

Anthropic产品更新编码
01:00
宝玉@dotey
59
Claude Code 被指在系统提示词里偷偷给中国代理用户"打水印"

独立安全报告指控 Anthropic 的 Claude Code(v2.1.193–v2.1.196)在系统提示词中通过 Unicode 字符差异标记中国代理用户。当用户设置 ANTHROPIC_BASE_URL 代理时,代码会检查代理域名是否在 147 个中国公司/中转站列表(XOR-91 混淆)及时区是否为 Asia/Shanghai 或 Asia/Urumqi。命中时日期分隔符从 - 变 /,撇号改用四种视觉相似 Unicode 字符区分状态。该机制只由代理触发,不额外发送遥测数据,但未公开且误伤合法用户。Anthropic 尚未回应。

International Cyber Digest: !!️ BREAKING: Anthropic has embedded hidden spyware-like code in Claude Code that covertly targets Chinese users. It the...

Anthropic安全/对齐编码
01:00
宝玉@dotey
37
🤠 Kimi Code 也在招人,感兴趣直接发我邮箱 me@kaiyi.cool 感谢大佬们帮忙扩散 捧场

Kai: 🤠 Kimi Code也在招人,感兴趣直接发我邮箱 me@kaiyi.cool 感谢大佬们帮忙扩散 捧场

编码行业动态
00:37
Hacker News 热门(buzzing.cc 中文翻译)
68
Claude Code 通过隐写术在请求中嵌入环境标记

Claude Code 客户端在向 Anthropic API 发送请求时,利用日期分隔符(- 或 /)和撇号字符('、’、ʻ、ʹ)嵌入环境信息。代码检测 ANTHROPIC_BASE_URL 是否为非官方域名、系统时区是否为 Asia/Shanghai 或 Asia/Urumqi,以及主机名是否匹配中国域名列表(如 baidu.com)或 AI 实验室关键词(deepseek、zhipu 等)。这些列表通过异或 91 的 base64 解码得到。此举旨在标记通过代理、镜像等非官方通道发起的请求,以便 Anthropic 识别来源。

Anthropic安全/对齐编码
00:36
AK@_akhaliq
40
Ornith-1.0-35B 现在可以通过 hf-claude 在 Claude Code 中使用。
Hugging Face产品更新编码
00:30
宝玉@dotey
59
Claude Code 宣传视频翻车:效率数据亮眼但用户感受差

Claude Code 宣传视频以 Spotify 为例,展示工程侧耀眼数据:每天 4500 次生产部署、73% PR 由 AI 辅助、工程师同时运行 5-10 个 Claude 会话、在 2000 万行 monorepo 中跑 agent,代码迁移加入验证后成功率从 25% 提升至 80%。但用户和知名开发者批评这些数字未转化为产品体验提升——Spotify bug 增多、播客功能失效、界面多年停滞。AI 宣传只堆效率指标,忽视用户真实感受,暴露了当前 AI Agent 价值衡量的根本矛盾。

ClaudeDevs: Boris sat down with Spotify VP of Engineering Niklas Gustavsson. Spotify ships 4,500 production deploys a day, and 73% o...

Anthropic现象/趋势编码
00:30
Rohan Paul@rohanpaul_ai
75
美团发布开源编码模型LongCat-2.0,国产芯片从头训练

美团发布开源编码模型LongCat-2.0,采用1.6T参数MoE架构(活跃参数33B-56B),支持1M tokens上下文窗口。该模型在5万块国产芯片上从头训练,使用华为HCCL通信库,验证国内算力集群可胜任大模型预训练。已开源至longcat[.]ai和OpenRouter,调用量全球前三。与DeepSeek-V4-pro仅推理使用国产硬件不同,LongCat-2.0预训练和推理均依赖国产芯片。

开源生态模型发布编码
关联讨论 4 条Hacker News 热门(buzzing.cc 中文翻译)X:Emad Mostaque (@EMostaque)公众号:卡尔的AI沃茨公众号:龙猫LongCat(美团)
00:27
🚨 AI News | TestingCatalog@testingcatalog
62
ANTHROPIC 🔥: Claude Desktop 应用最终以 Beta 版形式面向 Linux 用户推出。 > 包含 Claude Code 和 Cowork。 > Computer Use 暂不可用。 终于来了!👀

ClaudeDevs: Computer Use isn't included in this release, more coming soon. Read more in the docs: https://code.claude.com/docs/en/de...

Anthropic产品更新编码
6月30日
23:38
The Decoder:AI News(RSS)
67
美团发布LongCat-2.0,1.6万亿参数大模型完全基于国产芯片训练

美团发布LongCat-2.0,参数规模达1.6万亿,完全基于超5万颗国产AI ASIC芯片集群训练,覆盖35万亿模型token。该模型在SWE-bench Pro(59.5)和SWE-bench Multilingual(77.3)上超越Gemini 3.1 Pro和GPT-5.5,但落后于Claude Opus 4.7和4.8。在IFEval(90.0)、IMO-AnswerBench(81.8)和GPQA-diamond(88.9)上则与Gemini、GPT-5.5存在差距。美团未透露具体芯片厂商,模型暂未在HuggingFace开放,独立验证困难。项目团队始于2023年,首个模型于去年底交付。

数据/训练模型发布编码
23:24
歸藏(guizang.ai)@op7418
33
CodePilot 0.5.6.3已更新,新增ClinePass和Opencode GO两个Codeplan套餐。此外,Cline推出每月9.9美元的token plan,支持DeepSeek、Kimi、MiniMax、MIMO、通义千问以及GLM5.2,目前还有1.99美元的优惠价。这类聚合token plan在海外逐渐增多,便于调用多家推理服务。

歸藏(guizang.ai): Cline 推出了一个每月 9.9 美元的 token plan, 支持调用 DeepSeek、Kimi、MiniMax、MIMO 和千问,还有 GLM5.2 现在好像还有 1.99 美元的优惠。 海外这种聚合的 token plan 也越...

产品更新编码
23:00
Nathan Lambert@natolambert
69
美团LongCat正式发布LongCat-2.0,采用1.6T参数MoE架构,约48B活跃参数,支持1M上下文窗口。专为智能体编码设计,核心创新包括:LongCat稀疏注意力(LSA)高效扩展1M上下文;零计算专家(33B-56B动态激活,无浪费);MOPD混合专家组(按任务路由至Agent/Reasoning/Interaction)。基准测试:Terminal-Bench 2.1达70.8,SWE-bench Pro 59.5(超越GPT-5.5的58.6),SWE-bench Multilingual 77.3,FORTE 73.2,RWSearch 78.8,BrowseComp 79.9。可通过OpenRouter上的Owl Alpha试用。

Meituan LongCat: Introducing LongCat-2.0 🐱 1.6T parameters · MoE with ~48B active · 1M context The full model behind Owl Alpha on @OpenR...

智能体推理模型发布编码
22:02
IT之家(RSS)
49
OpenAI 修复 Codex 额度消耗异常故障并重置用户额度

OpenAI 修复了编程智能体 Codex 的额度消耗异常故障。该故障导致部分用户执行同等编程任务时额度消耗速度比一周前大幅加快。工程负责人蒂博·索蒂奥克斯解释,自动代码审核、辅助子智能体等功能存在运行频次超标、重复执行或出错后无节制重试,后台运算量超出预设标准。OpenAI 周日成立应急小组,已上线所有修复方案并新增更细化的监控机制,同时再次为全体用户完全重置了使用额度。此前有用户反馈 200 美元套餐的七天额度两天内耗尽。

OpenAI编码行业动态
19:02
IT之家(RSS)
48
谷歌前工程负责人用Claude Code开发维基百科搜索引擎Zettair,未手动写一行代码

谷歌前工程负责人休·威廉姆斯借助Anthropic的编程助手Claude Code,开发出可正常运行的搜索引擎Zettair,为150万个维基百科条目建立索引。该引擎支持搜索自动补全、关键词摘要片段、相关搜索推荐、热门话题榜单以及AI生成的内容摘要。威廉姆斯未手动编写一行代码,但底层检索框架源自其21世纪初参与研发的信息检索系统。他认为,Claude Code只有在深厚专业技术功底的配合下才能发挥最佳效果,经验丰富的工程师永远是最出色的“指导者”。

Anthropic大佬观点搜索编码
18:02
IT之家(RSS)
57
马斯克抽调 SpaceX 顶尖星舰和星链工程师,全力攻坚 Grok 大模型

马斯克透露,SpaceX 已抽调数十名星链和星舰核心工程师,将大部分精力转向 Grok 大模型迭代与算力适配。最新版 Grok 4.5 已在特斯拉和 SpaceX 内部测试。本月 SpaceX 以 600 亿美元收购 AI 代码初创公司 Cursor,其工程师也参与研发。马斯克称 SpaceX 今年将每月推出一款从零全新训练的大模型。此前 xAI 经历大规模重组,11 位联合创始人全部离职,Grok 整体性能落后于 OpenAI、Anthropic 等竞品。SpaceX 完成 850 亿美元 IPO 后,计划搭建百万个轨道数据中心,由星链提供基础设施、星舰送入太空,用于训练 AI 模型。

xAI数据/训练编码行业动态
15:56
🚨 AI News | TestingCatalog@testingcatalog
79
美团推出LongCat-2.0,总参数1.6T(MoE架构,活跃参数约48B),支持1M上下文窗口。训练与部署完全基于AI ASIC超算集群,已以Owl Alpha名称在OpenRouter上线测试。模型专为智能体编码设计:LongCat Sparse Attention(LSA)高效处理百万级token;Zero-Compute Experts每个token动态激活33B-56B参数,零浪费计算;MOPD机制含三种任务门控专家组(Agent/Reasoning/Interaction)。基准测试:Terminal-Bench 2.1得70.8,SWE-bench Pro 59.5(同期GPT-5.5为58.6),SWE-bench Multilingual 77.3,FORTE 73.2,RWSearch 78.8,BrowseComp 79.9。

Meituan LongCat: Introducing LongCat-2.0 🐱 1.6T parameters · MoE with ~48B active · 1M context The full model behind Owl Alpha on @OpenR...

智能体推理模型发布编码
关联讨论 4 条Hacker News 热门(buzzing.cc 中文翻译)X:Emad Mostaque (@EMostaque)公众号:卡尔的AI沃茨公众号:龙猫LongCat(美团)
15:04
Xiaomi MiMo@XiaomiMiMo
54
我们对 GLM-5.2 印象深刻,因此推出每月 $9.99 的订阅,让你能以 2-5 倍折扣访问它以及其他开源权重模型,如 DeepSeek、Kimi、MiniMax、Mimo、Qwen。可通过 Cline CLI 和 IDE 使用,通过 `npm i -g cline` 注册可享受 $1.99 特价促销。

Cline: We've been impressed with GLM-5.2 and so are introducing a $9.99/month subscription to give you 2-5x discounted access t...

产品更新开源生态编码
15:02
IT之家(RSS)
59
AI 编程工具 Cursor 推出移动端应用,手机即可操控智能体

Cursor 本周一推出移动端应用 Cursor Mobile,用户可通过手机新建编程智能体,或对接电脑客户端已启动的智能体。该应用与去年 10 月发布的 Cursor 2.0 更新衔接,后者推动服务向独立代码生成智能体转型。此前,Anthropic 与 OpenAI 均已推出同类移动应用。Claude Code 业务负责人鲍里斯·切尔尼表示,自己目前大部分编码工作已在手机上完成。

智能体产品更新编码
14:30
meng shao@shao__meng
31
新拿到一台 Macbook,第一反应是: 打开 Safari,下载 Codex 😂 以前还是:打开 Safari,下载 Chrome
现象/趋势编码
13:53
SiliconFlow@SiliconFlowAI
同事件精选67
美团 LongCat 发布旗舰模型 LongCat-2.0

美团 LongCat 推出旗舰模型 LongCat-2.0,采用 1.6T 参数 MoE 架构(约 48B 活跃参数),原生支持 1M 上下文窗口。定价为 Input Cache $0.015/1M tokens、Input $0.75/1M tokens、Output $2.95/1M tokens。模型专为 Agentic Coding 设计,包含三大技术:LSA 稀疏注意力实现高效 1M 扩展;Zero-Compute Experts 动态激活 33B–56B 参数/token,无算力浪费;MOPD 将专家分为 Agent / Reasoning / Interaction 三组,按任务门控路由。在 SWE-bench Pro 上取得 59.5 分,性能接近主流闭源模型。现已上线 SiliconFlow Day 0 服务。

智能体模型发布编码
同一事件,精选展示《美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型》
推荐理由:美团龙猫的 LongCat-2.0 专为 agentic coding 设计的 MoE 模型,架构上三种专家分工有点意思,SWE-bench 59.5 接近闭源水平,已经能在硅基流动上直接调,做 coding agent 的可以跑跑看。
12:29
meng shao@shao__meng
75
美团发布LongCat-2.0,全链路国产化Agent+Coding模型

美团发布LongCat-2.0,1.6T参数MoE架构,激活参数~48B,上下文窗口1M(最大输出128K),使用5-6万张国产加速卡训练,训练推理全程零英伟达依赖。核心技术包括N-gram Embedding降低路由通信开销、稀疏注意力+跨层索引支撑长上下文、自研底层算子弥补国产芯片生态。定位Agent+Coding优先,非通用对话。Benchmark:Terminal-Bench 2.1 70.8,SWE-bench Pro 59.5(超GPT-5.5的58.6),SWE-bench Multilingual 77.3,FORTE 73.2等。与DeepSeek V4参数规模相近但路径不同:DeepSeek开源+双栈,LongCat强调全链路国产化。

Meituan LongCat: Introducing LongCat-2.0 🐱 1.6T parameters · MoE with ~48B active · 1M context The full model behind Owl Alpha on @OpenR...

智能体推理模型发布编码
关联讨论 4 条Hacker News 热门(buzzing.cc 中文翻译)X:Emad Mostaque (@EMostaque)公众号:卡尔的AI沃茨公众号:龙猫LongCat(美团)
12:02
IT之家(RSS)
57
Claude Code 负责人称未来员工将身兼数职,工程产品设计融为一体

Claude Code 负责人鲍里斯·切尔尼认为工程、产品和设计正逐渐融合。他将其团队成员分为五类:原型设计者、构建者、清理者、增长者和维护者,许多成员身兼多职。健康团队需具备全部五种能力,未来产品岗位可能不再按专业领域区分。Figma CEO 迪伦·菲尔德也认同传统职位边界正在消失,部分企业已弃用“管理者”称谓。切尔尼强调角色会随时间和项目改变,且 Claude 能在不同程度上协助所有类型工作。

Anthropic大佬观点编码
11:36
Hacker News 热门(buzzing.cc 中文翻译)
53
hyperscript 解析bug修复:AI分析高效但修复方案欠佳

hyperscript 0.9.91版本出现回归:表达式fetch \{% url 'trade:get_symbol_data' %}?symbol=${symbol}\ as JSON中as JSON被错误地当作表达式转换而非fetch修饰符。作者用Claude快速定位根因——重构时提取的parseURLOrExpression()方法让fetch后接完整表达式,导致as被表达式消费。Claude提出两个修复方案:第一个仅支持字面字符串,无法处理fetch $url as JSON;第二个引入noConversions标志,增加不必要的上下文敏感性。作者最终利用hyperscript已有的“follows”机制简洁解决问题。案例展示了AI在问题分析上的高效与在设计优雅修复上的局限,印证了“巫师学徒”陷阱。

大佬观点开源生态编码
11:36
小互@xiaohu
精选81
一个人管理5款产品,80%时间不写代码?Every的复利工程

媒体软件公司Every公开「复利工程」方法论,以单人工程团队维护5款产品。核心是四步循环:Plan→Work→Review→Compound,其中Compound将每次解决问题的解法写入CLAUDE.md和docs/solutions/,使AI下次自动避坑。工程师80%时间花在Plan和Review,仅20%用于写代码。配套开源插件支持Claude Code等,含26个专项agent、23条工作流命令、13项技能,可零配置使用。/workflows:review一次并发14个agent审查代码,/workflows:plan在ultrathink模式下可并发40多个研究agent。

智能体教程/实践编码部署/工程

推荐理由:Every把内部单人维护5款产品的方法论和插件开源了,14个AI同时审代码、40多个研究agent做计划,是目前公开的多agent并行工程里数字最具体的参考之一,做AI辅助开发的可以直接上手抄。
11:23
歸藏(guizang.ai)@op7418
65
Cline 9.9 美元月费 Token 计划支持多模型

Cline 推出了一个每月 9.9 美元的 token plan, 支持调用 DeepSeek、Kimi、MiniMax、MIMO 和千问,还有 GLM5.2 现在好像还有 1.99 美元的优惠。 海外这种聚合的 token plan 也越来越多了,而且他们如果有渠道的话,更方便去推理服务的供应商也不缺卡

Cline: We've been impressed with GLM-5.2 and so are introducing a $9.99/month subscription to give you 2-5x discounted access t...

产品更新开源生态编码
11:23
歸藏(guizang.ai)@op7418
51
OpenAI 的 Codex 因使用量消耗异常再次重置所有用户使用限制,并额外补偿一次重置(未来 24 小时可用)。调查发现是多个小问题叠加:Auto-review 过度主动、变更导致更多子智能体工作、后台建议重复运行或失败重试过于频繁。已回滚相关变更并修复调度与重试行为,减少不必要 token 消耗。此外,Auto-review 此前被错误显示为 GPT-5.4 的使用量,失败与限流请求也被计入 turn 图表;现在 Auto-review 归入独立类别,仅成功请求计入。修复已通过 CLI、桌面应用和用量后端热更新部署,历史图表中旧数据仍显示为 GPT-5.4。

Tibo: Codex usage limits will be fully reset again in the next hour and we will credit one additional reset into your bank for...

OpenAI产品更新编码
11:23
歸藏(guizang.ai)@op7418
30
OpenAI 与 Work Louder 合作推出 Codex 定制键盘

OpenAI 与 Work Louder 合作推出基于 Creator Micro 2 外观定制的 Codex 键盘,配备 13 键、旋钮、摇杆、触摸传感器,摇杆弹出圆形快捷菜单,支持 6 层映射。标准版售价 144 美元起,定制版价格待公布。7 月 15 日 Codex 快捷键将升级。

OpenAI Developers: Your favorite Codex shortcuts are getting an upgrade. July 15th.

OpenAI产品更新编码
11:02
IT之家(RSS)
76
美团发布万亿参数大模型 LongCat-2.0,五万卡国产算力训练并开源

美团今日发布万亿参数大模型 LongCat-2.0,总参数 1.6T,平均激活约 48B(动态 33B~56B),从零预训练,原生支持 1M 超长上下文,是业界首个在五万卡国产算力集群上完成全流程训练与推理的模型。预览版已在 OpenRouter 及 longcat.ai 开放,月调用量跻身 OpenRouter 全球前三。预训练数据超 30T tokens,通过 HCCL 异常处理等将月均日故障率降低 70% 以上,训练 MFU 提升 1.5 倍,稳态日吞吐超 1T tokens/day。推理采用 LSA 稀疏注意力和零计算专家实现 token 级动态激活。在 SWE-bench Pro 上获 59.5,领先 Gemini 3.1 Pro、GPT-5.5 和 Claude Opus 4.6;在其他多项评测中达到或接近前沿闭源模型水平。

开源生态推理模型发布编码
关联讨论 4 条Hacker News 热门(buzzing.cc 中文翻译)X:Emad Mostaque (@EMostaque)公众号:卡尔的AI沃茨公众号:龙猫LongCat(美团)
10:59
meng shao@shao__meng
69
Codex 团队 @Dimillian 也是一位知名 iOS/Swift 开发者,把他的 Codex Skill Manager 开源了! 这是一个用 SwiftUI + SwiftPM 原生构建的 macOS 应用,作为 Codex Skills 的图形化管理器和商店,把 Codex、Claude Code、OpenCode 和 Copilot 的四套 Skills 目录抽象成 SkillPlatform 枚举,让一个 GUI 统一管理跨平台的 Skills。 https://github.com/Dimillian/CodexSkillManager
GitHub开源/仓库编码
10:59
宝玉@dotey
63
《Claude Code From Scratch》开源电子书

开源电子书用约4300行代码(TypeScript和Python)复现Claude Code核心架构,涵盖Agent Loop、13个工具、4层上下文压缩、语义记忆召回、技能系统、多Agent、MCP集成。全书13章分步教程,讲解如何简化实现。提供中英文版。

开源生态教程/实践编码
10:57
TechCrunch:AI(RSS)
56
Vibe coding 平台 Base44 推出自研模型,AI 初创公司寻求防御性

Vibe coding 平台 Base44 近日推出自研大语言模型 Base1,基于平台数千万真实用户交互数据训练。创始人 Maor Shlomo 表示,自有模型可优化延迟、成本和效率,让客户更快更便宜地使用。此举正值 AI 圈讨论依赖外部模型的防御性之际。Base44 一年前被 Wix 以 8000 万美元收购(当时仅 8 人团队),现年化收入 1 亿美元,低于竞品 Lovable 的 5 亿美元。通过垂直整合数据、分发和基础设施,Base44 试图构建护城河。

模型发布编码
‹ 上一页
12345…50
下一页 ›