全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

6月25日周四

00:18Berryxia.AI66OpenAI发布首款自研AI芯片Jalapeño

00:15Hugging Face：Blog（RSS）66精选NVIDIA NeMo AutoModel：一行代码加速Transformer MoE模型微调

00:05向阳乔木57前SpaceX工程师洪力德深度访谈：猎鹰9号回收、星链物理优势与太空数据中心逻辑

00:05向阳乔木58字节火山引擎大会：洪定坤谈AI开发新范式

6月24日周三

23:52François Chollet28边缘案例与故障模式定义系统轮廓

23:49swyx 🔜 @aiDotEngineer19Karpathy 鼓励投身 AI 智能体开发

23:45Ethan Mollick64Anthropic 推出 Claude Tag：从工具到"同事"的企业 AI 体验与风险

23:34向阳乔木56Vista：连续追问AI三次可改善文章质量

23:13AYi61Notion 大规模招聘：AI 集成草莽时代结束

22:58IT之家（RSS）56汇丰调查：AI 目前仍无法取代人类财富顾问

22:58IT之家（RSS）52论文 AI 率改后反升，央视揭秘检测原理

22:48Nathan Lambert49Nathan Lambert 用 GLM 5.2 开讲 AI 基础

22:36Google DeepMind50DeepMind 播客探索 AI 智能体经济与群体思维

22:31公众号：火山引擎74精选字节跳动技术副总裁洪定坤：AI Coding 的实践与探索

22:29Hacker News 热门（buzzing.cc 中文翻译）78精选里德·霍夫曼称SpaceX"不是一家人工智能公司"，xAI则是"彻底的灾难"

22:20gabriel25Neuralink 年底尝试直接向 LLM 传递意图

21:29MarkTechPost（RSS）68Nous Research为Hermes Agent技能系统新增/learn命令，无需手写SKILL.md即可将工作流捕获为斜杠命令

21:05fofr13怀念2022年Stable Diffusion氛围

20:13AYi65Telegram创始人Durov劝学生别学编程？真相是断章取义

19:44PixVerse23PixVerse AI视频用于游戏过场动画

19:10公众号：卡尔的AI沃茨65快手KroWork：将AI Skill工作流打包成本地桌面App

19:03The Decoder：AI News（RSS）47Pangram CEO：语言模型会因论点雷同而暴露自己

18:50IT之家（RSS）55斯坦福毕业生对AI态度分化：乐观者视为探索工具，担忧者质疑伦理与环境

18:46meng shao19Zcode 接入 GLM-5.2 体验：快、好用、缺 Computer Use

18:00Chubby♨️71欧洲数字主权时代尚未开始已结束？欧盟等国加入美国主导的Pax Silica倡议

18:00公众号：小红书技术（dots.llm）51AICon 上海 2026|小红书质效：Agent 基建的规模化落地路径

17:44IT之家（RSS）58美团副总裁陶雪璇：大众点评反对和抵制 AI 评价

16:22MarkTechPost（RSS）432026年16大生成式AI编码工具对比：功能与适用场景

16:18Berryxia.AI50Anthropic内部演讲：99%工程师运行300+自改进agent swarm

16:15meng shao50邵猛用 TRAE Work 测试豆包2.1 Pro，视觉还原和前端设计能力超预期

16:11Elon Musk23Grok 作为搜索引擎表现优于 Google

15:42IT之家（RSS）43软银孙正义回应 AI 泡沫论：这是对 AI 的侮辱，人工智能仍处于发展初期

15:37eric zakariasson24Anthropic推Slack集成可切换模型避锁定

15:20公众号：蚂蚁百灵（Ling）49Ling-2.6-1T TPU 推理优化：用 Pallas Kernel 隐藏 MoE 数据搬运

15:14DogeDesigner19cb_doge：计算是新的石油

15:10OpenBMB65精选MiniCPM-V 4.6 在 Apple Core AI 上高速运行

15:04数字生命卡兹克63体验微信小微Agent：微信有史以来最大更新，但智能与便捷仍有不足

13:39MiniMax (official)39MiniMax M3与OpenCode构建仿人机器人目录

13:12AYi70用户丢截图给 StepFun step-3.7-flash，2分多钟生成可用的文章头图生成器

12:17宝玉72宝玉分享极客风 Skills 管理方式

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月25日

00:18

Berryxia.AI@berryxia

66

OpenAI发布首款自研AI芯片Jalapeño

OpenAI发布首款自研AI芯片Jalapeño，专为ChatGPT、Codex、API及未来Agent产品的LLM推理设计，由Broadcom生产。从设计到流片仅用9个月，借助AI模型辅助设计。首批样片实测性能功耗比显著优于当前顶级加速器，Broadcom CEO称性能媲美NVIDIA Blackwell与Google TPU，成本减半。若2026年底实现吉瓦级部署，推理成本有望降低约50%。Jalapeño仅针对推理，训练仍依赖NVIDIA。此举标志OpenAI从模型公司向全栈AI基础设施公司转型。

OpenAI: We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...

OpenAI 大佬观点推理部署/工程

00:15

Hugging Face：Blog（RSS）

精选66

NVIDIA NeMo AutoModel：一行代码加速Transformer MoE模型微调

NVIDIA NeMo AutoModel 是基于 Transformers v5 的开源库，添加 Expert Parallelism、DeepEP 融合 all-to-all 调度和 TransformerEngine 内核。在 MoE 模型微调中，相比原生 v5，训练吞吐量提升 3.4–3.7 倍，GPU 内存减少 29–32%，仅需改动一行 import。在 16 节点 128 张 H100 上全微调 Nemotron 3 Ultra 550B A55B 时，v5 因内存不足无法运行，而 AutoModel 凭借 EP=64 专家并行使训练可行。单节点 30B MoE 模型（如 Qwen3-30B-A3B）同样获得可量化的性能优势。

开源/仓库教程/实践数据/训练

推荐理由：英伟达的 NeMo AutoModel 把 MoE 模型微调速度提高了三倍多，内存省了近三分之一，代码只需改一行 import，做训练的可以立刻升级。

00:05

向阳乔木@vista8

57

前SpaceX工程师洪力德深度访谈：猎鹰9号回收、星链物理优势与太空数据中心逻辑

前SpaceX猎鹰9号首席制造工程师洪力德（Louis Hong）接受访谈，指出2015年12月21日猎鹰9号首次入轨回收是行业转折点，将每公斤发射成本从1-2万美元降至约3000美元（星舰目标100美元以下）。星链基于真空传输速度比光纤快一倍的物理优势于2015年启动。SpaceX与xAI合并的底层逻辑是太空数据中心：免审批、利用高转换效率太阳能，解决美国电网25%-40%缺电及AI算力需求。马斯克用人重成长速度而非经验，如曾用Mini Cooper团队创新火箭制造。

xAI 现象/趋势

00:05

向阳乔木@vista8

58

字节火山引擎大会：洪定坤谈AI开发新范式

字节火山引擎大会上，洪定坤分享了AI开发的三个核心方法论：1. 原型驱动开发——用AI生成可交互原型替代PRD，提前暴露分歧。2. AI Development系统化——AI写Spec→功能实现→Browser Use验证→自动提交上线。3. Harness基建——上下文工程、架构约束、团队知识Memory、技术债梳理，能将可交付性从40~60分提升至80分。

大佬观点编码部署/工程

6月24日

23:52

François Chollet@fchollet

28

理解复杂系统的最佳方式是通过边缘案例和故障模式，因为它们定义了系统的轮廓。

大佬观点推理

23:49

swyx 🔜 @aiDotEngineer@swyx

19

受 @karpathy 言论启发，阐述为什么你应该从事 AI 智能体工作。

swyx 🔜 @aiDotEngineer: Inspired by @karpathy's words on why you - yes YOU - should work on AI Agents

智能体大佬观点

23:45

Ethan Mollick@emollick

64

Anthropic 的 Claude Tag 让企业成员共享同一 Claude 实例，使其能异步自主行动、吸收隐性知识，从工具变为"同事"。这带来严重锁效应：团队无法查看或编辑 Claude 的独立记忆，解雇 Claude 会导致工作流和隐性知识丢失。定价按 token 计费，Claude 可无限制工作，企业难以像工具那样管控成本，token 预算耗尽将全员停工。此外，Claude 接入私有频道可能访问用户无权限的仓库和工具，引入新安全风险。AI 公司正从争夺 IT 预算转向争夺劳动力支出，Claude Tag 是这一转型的里程碑。

Arvind Narayanan: The new Claude Tag feature seems extremely useful, but at the same time, a dangerous bargain for enterprises because of ...

智能体 Anthropic 大佬观点安全/对齐

23:34

向阳乔木@vista8

56

Vista：连续追问AI三次可改善文章质量

Vista分享经验：将3小时播客访谈交由AI生成文章时，通过连续追问“还有什么细节需要补充？”（约三次）能有效补全遗漏细节，显著改善输出质量，使文章更具故事性。她建议将这一追问流程封装为Agent Skill，以便复用。

智能体教程/实践

23:13

AYi@AYi_AInotes

61

Notion 大规模招聘：AI 集成草莽时代结束

Notion 发布招聘帖，职位列表中找不到传统 Prompt Engineer，取而代之的是模型行为工程师、AI 评估师、AI 治理专员、客户体验知识架构师等工程化岗位，负责调优模型行为边界、评估输出质量、设计权限与审计体系。Notion 认为 AI 负责执行，人类负责定义价值，因此同步扩招销售、客户成功、知识架构师。实习生要求对艺术、历史、社会科学有兴趣，强调判断力。招聘帖采用 ASCII 艺术设计，获得高传播。

Notion: ______ | We're hiring | |______| \ (•◡•) / \ / -- | | |_ |_ Open roles: → AI Applications Engineer → AI Conversation Des...

现象/趋势部署/工程

22:58

IT之家（RSS）

56

汇丰调查：AI 目前仍无法取代人类财富顾问

汇丰控股调查约1万名富裕及高净值人士，62%受访者视专业人士为投资想法主要来源，仅12%认为AI最重要。客户用AI了解选项，但最终决策依赖人类顾问的判断与责任。麦肯锡称资产不足100万美元的客户或逐步被AI取代，花旗增聘顾问把握增长。年轻一代更倾向结合AI与顾问，但人类顾问的判断、验证和个性化解读最难替代。

现象/趋势行业动态

22:58

IT之家（RSS）

52

论文 AI 率改后反升，央视揭秘检测原理

毕业季高校毕业生论文面临 AIGC 检测新关卡。有学生论文 AI 率为 62%，远超学校 15% 红线，尝试用大模型改写后检测升至 94%。首都师范大学副院长蔡海龙指出，AI 检测本质是基于概率的分类，用 AI 查 AI 无法明确判定；中文语意丰富易致歧义误判。当前检测依赖困惑度与突发性等特征，准确性无法达 100%。专家建议建立透明可回溯的 AI 使用标注制度，实行“人工评议为主、AI 检测为辅”的人机共判模式。

22:48

Nathan Lambert@natolambert

49

Nathan Lambert 用 GLM 5.2 开讲 AI 基础

Nathan Lambert 发布了一期 AI 基础讲座视频，使用 GLM 5.2 模型生成。内容涵盖语言模型概述、LM Head、Softmax 与对数概率、训练样本结构、概率计算、后训练中的三种掩码、解码、交叉熵损失、优化与微调、预训练到 SFT 流程、KL 散度与熵、Sigmoid 与成对似然、强化学习 MDP 框架等。视频包含时间戳目录，并持续收集观众问题用于后续 Q&A。

安全/对齐教程/实践

22:36

Google DeepMind@GoogleDeepMind

50

DeepMind 播客探索 AI 智能体经济与群体思维

Google DeepMind 发布播客，由 @weballergy 与 @fryrsquared 共同探讨 AI 智能体经济的崛起。内容涵盖：AI 智能体的定义、在科研中的探索、智能体间的委托与协作、安全风险与陷阱、如何构建智能体经济、认知单一文化（群体思维）风险，以及分布式智能的解决方案。播客还设有详细时间戳分段，帮助听众聚焦不同话题。

智能体 DeepMind Google 现象/趋势

22:31

公众号：火山引擎

精选74

字节跳动技术副总裁洪定坤：AI Coding 的实践与探索

在火山引擎Force大会，字节跳动技术副总裁洪定坤分享AI Coding实践。过去一年，字节AI代码贡献率增长6倍，tokens消耗增长5倍，但过度关注单一指标可能失真——TRAE团队代码超90%由AI生成，人均需求吞吐率仅提升60%。900次实验显示，主流Coding模型组合代码正确率超80%，但可交付性仅40-60分；结合Harness基建后提升至80分。AI降低编程门槛但需优化指标、治理、协作。字节探索原型驱动开发，能力沉淀至TRAE（日均Token消耗5.6万亿，增长50倍），并推出TRAE Work。

大佬观点现象/趋势编码

推荐理由：洪定坤把字节用 AI Coding 一年踩的坑和实验数据摊开讲，尤其‘过度重视代码贡献率’的反思和 Harness 基建的实证，是所有推 AI 编程的团队必看的复盘。

22:29

Hacker News 热门（buzzing.cc 中文翻译）

精选78

里德·霍夫曼称SpaceX"不是一家人工智能公司"，xAI则是"彻底的灾难"

LinkedIn联合创始人、Anthropic和OpenAI投资者Reid Hoffman在播客中公开批评SpaceX和xAI。他指出SpaceX“不是一家人工智能公司”，6月12日上市后收购AI编程工具Cursor属于“花钱买相关性”；xAI则是“彻底的灾难”，所有11位联合创始人已离职，Grok模型在基准测试中落后于Anthropic和OpenAI。他还批评美国政府6月11日以出口管制为由强制Anthropic下架Fable和Mythos模型，理由仅为Amazon CEO报告Fable 5存在jailbreak漏洞，称此举“专断随意”。Hoffman认为Anthropic和OpenAI均有巨大发展空间，但Cursor可能已过巅峰。他建议年轻人不要抵制AI。

大佬观点安全/对齐现象/趋势

推荐理由：Reid Hoffman 对 xAI 和 SpaceX 的批评几乎不留情面，这种硅谷核心人物的公开呛声本身就值得一读，他对监管干预的担忧和对 Gen Z 的劝诫也很有现实感。

22:20

gabriel@gabriel1

25

词语是我们思考概念的极度简化的指针如果我们能直接向大语言模型给出原始意图，我们可以花少 90% 的时间与它们交谈不过有点不好的是，你需要一个大脑植入物才能高效工作，尽管它超酷

Elon Musk: @yunta_tsai Maybe first attempt at this for Neuralink later this year

xAI 大佬观点

21:29

MarkTechPost（RSS）

68

Nous Research为Hermes Agent技能系统新增/learn命令，无需手写SKILL.md即可将工作流捕获为斜杠命令

Nous Research为开源自改进智能体Hermes Agent的技能系统新增/learn命令。指向文档页面、本地SDK目录、历史对话或粘贴笔记后，Agent自动收集材料并按照标准格式编写SKILL.md。所有技能存放在~/.hermes/skills/，自动映射为斜杠命令（如/plan、/axolotl）。技能采用三级加载（Level 0返回名称与描述约3k tokens，Level 1加载全文，Level 2加载特定文件），避免大技能库撑满上下文窗口。除/learn外，还支持手动编写、skill_manage自动捕获、Skills Hub安装三种创建方式。/learn在CLI、消息网关、TUI和仪表板上均可使用，仪表板额外提供“Learn a skill”按钮。

智能体产品更新开源生态

21:05

fofr@fofrAI

13

我有时会怀念那些Stable Diffusion 2022的氛围。

其他图像生成

20:13

AYi@AYi_AInotes

65

Telegram创始人Durov劝学生别学编程？真相是断章取义

网上流传Telegram创始人Durov劝学生别学编程和AI、只学数学物理的说法是断章取义。真实对话中，Durov只建议优先打好数学基础，马斯克补充物理加数学，Durov还明确表示数学基础打好后计算机科学非常值得学。没人提出放弃编程或AI。谣言传播是踩中了AI时代的技能焦虑。实际上，AI能写基础代码后，核心壁垒是数学教的拆解问题逻辑和物理教的建模因果思维。最优路径应是数学物理打底、编程落地、AI加速迭代。

Abdullah AL-Khmais: مؤسس تليجرام، ينصح الطلاب: لا تضيعوا وقتكم في تعلم البرمجة والذكاء الاصطناعي.. أدرسوا الرياضيات و الفيزياء جيدا. و إيلون...

大佬观点现象/趋势

19:44

PixVerse@PixVerse_

23

使用AI为你的游戏制作过渡过场动画？太棒了。整个场景充满夏日清新感。期待新项目完成 @patata1216

美咲: ぜんざいのアトリエ開発迷走中😅 海エリアはやっぱり釣りでしょう、とかなんとか言うことで、釣りミニゲームを組み込み。 AI開発らしく、Pixverseで作ったAI動画を差し込んで作ってみたよ。やってみると、こういうバリエーション動画を作る...

图像生成教程/实践视频

19:10

公众号：卡尔的AI沃茨

65

快手KroWork：将AI Skill工作流打包成本地桌面App

快手新发布KroWork，能将多个AI Skill串成的工作流直接打包为本地桌面应用。用户安装后可在Launchpad中一键下载到本机，双击即可按预设流程运行，无需反复打开对话框或重新配置参数。KroWork支持定时任务（如每天9点自动执行），并允许从Kro Workshop复制他人工作流二次开发。作者用其复刻了Prompt Organizer提示词生成器和Daily Trend Brief（每日AI趋势简报）等日常工具。KroWork定位与Claude Cowork、Codex Site、Claude Code Artifacts相似，旨在将重复工作流沉淀为可分享的本地应用。

智能体 MCP/工具教程/实践

19:03

The Decoder：AI News（RSS）

47

Pangram CEO：语言模型会因论点雷同而暴露自己

AI文本检测器Pangram的CEO Max Spero表示，其深度学习分类器是一个黑箱，通过捕捉语言模型在组织文档时留下的结构模式来识别AI生成文本。Spero指出，语言模型在语法和逻辑上可能优于普通人，但论点高度同质化：若要求LLM就某个主题生成100个论点，它们会集中在狭窄范围内，而人类论点的空间则非常多样。这种雷同是AI文本的显著特征。

大佬观点现象/趋势

18:50

IT之家（RSS）

55

斯坦福毕业生对AI态度分化：乐观者视为探索工具，担忧者质疑伦理与环境

斯坦福大学毕业生对AI态度分化。计算机科学专业哈桑认为AI是探索宇宙的工具，鼓励乐观应对；地球系统专业海尔担忧开发不符合伦理，但认可AI可用于训练气候模型。AI已冲击就业，初入职场劳动者就业水平下降，计算机专业也面临求职困难。部分学生依赖AI完成作业导致考试成绩与作业差距扩大，课程恢复监考和口试。心理学专业哈兰反感AI对环境的破坏，认为数据中心消耗大量资源。

现象/趋势行业动态

18:46

meng shao@shao__meng

19

Zcode 接入 GLM-5.2 体验：快、好用、缺 Computer Use

邵猛分享其 AI 编程工具 Zcode 开始使用 GLM-5.2 模型，第一天体验感受：速度快、好用。但对比另一工具 Codex，Zcode 在能力全面性上仍有差距，尤其缺少 Computer Use 功能。最后感谢 @SeTriones 提供 GLM API Key。

编码评测/基准

18:00

Chubby♨️@kimmonismus

71

欧洲数字主权时代尚未开始已结束？欧盟等国加入美国主导的Pax Silica倡议

欧盟、德国、荷兰和希腊加入美国主导的Pax Silica倡议，该倡议旨在保障芯片、关键矿产、能源和算力的AI供应链安全。美国官员Jacob Helberg明确将Pax Silica定位为反对“数字主权”的工具，主张“创新主权”——即各国不应自建技术栈，而应融入美国体系。欧洲多年来高喊技术自主，但在AI成为现实时却选择与美国体系整合，其数字主权尚未开始便已结束。有评论称欧洲主动走入这扇“笼门”，放弃自建技术栈的机会。

Arnaud Bertrand: It's over, Europe has officially given up on its digital sovereignty: they just signed up to Pax Silica, the US initiati...

政策/监管行业动态

18:00

公众号：小红书技术（dots.llm）

51

AICon 上海 2026|小红书质效：Agent 基建的规模化落地路径

小红书质效研发团队在 AICon 上海 2026 公布两项 Agent 基础设施实践。Self-GC 系统通过 ContextObject 对象化建模与三阶段提交机制（Async Plan、Rehearsal、Delayed Commit），将上下文转为可索引的生命周期管理，生产环境实现 10%-20% 输入 Token 下降且保持 90%+ 无影响率。Seal 企业级 AI 个人助理依托 NEX 沙箱实现运行时隔离，结合 Self-GC 与 SealRouter（Auto 模型路由）达成成本减半，并采用 L0-L2 分层记忆体系构建可溯源知识闭环，从 3 天内测到两周完成全员覆盖。

智能体 MCP/工具教程/实践

17:44

IT之家（RSS）

58

美团副总裁陶雪璇：大众点评反对和抵制 AI 评价

6月24日，美团副总裁陶雪璇在大众点评必吃榜10周年盛典上表示，大众点评对AI评价持明确反对和抵制态度。她指出，AI生成的评价可能话术漂亮但未真实体验过餐厅，且AI在应用环节的模型幻觉问题依然严重，会影响评价的真实性。评价如同社区公告板，不属于商家、用户或平台任何一方。

16:22

MarkTechPost（RSS）

43

2026年16大生成式AI编码工具对比：功能与适用场景

生成式AI已重塑软件开发，从逐行自动补全扩展到全应用生成、多智能体构建管道和自然语言代码库交互。文章对比了16个最佳工具：Atoms*支持自然语言生成可部署应用并并行运行多模型；GitHub Copilot提供IDE内智能补全与代理模式；Tabnine主打本地化私密代码补全；Replit为云端IDE与AI代理；Warp增强终端AI；Hugging Face提供开源模型平台；Codacy自动化代码质量分析；Metabob基于图神经网络检测深层缺陷；aiXcoder可本地运行开源代码模型；Bloop将代码搜索转向AI智能体基础设施；Mintlify等覆盖IDE插件、云部署到代码质量管理多种场景。

编码评测/基准

16:18

Berryxia.AI@berryxia

50

Anthropic内部演讲：99%工程师运行300+自改进agent swarm

Anthropic内部透露，99%工程师运行300+自改进agent swarm。核心是“close the loop”——模型自验证输出，包含计划、动态工作流、自我检查并迭代。效果远超多数300美元agent课程，但token消耗更高。

智能体 Anthropic 大佬观点

16:15

meng shao@shao__meng

50

邵猛用 TRAE Work 测试豆包2.1 Pro，视觉还原和前端设计能力超预期

邵猛使用 TRAE Work 测试了字节跳动最新发布的豆包2.1 Pro 模型。官方称豆包2.1 系列在 Coding 和 Agent 能力上显著提升，VLM 能力保持领先，综合能力介于 Claude Opus 4.6 和 4.8 之间。实测中，模型先思考整体规划与实现过程，再读取设计图理解场景和细节，调用最合理的 Skill 规划网页逻辑，分步骤实现后通过本地预览和视觉验证确保效果。最终输出在视觉还原、交互和技术实现上非常细致，包括布局、字体选择、自适应布局，甚至为每个部分配上具有实际意义的图片而非占位符。

多模态编码评测/基准

16:11

Elon Musk@elonmusk

23

几个月前我开始用 Grok 作为搜索引擎，现在只用 Google 纠正拼写错误，因为做这类事用 Grok 较慢。Grok 在各方面都优于 Google。试试 Grok。

Cernovich: I switched the Grok as my search engine a few months ago. I only use Google now to correct typos / check spelling, as it...

xAI 大佬观点

15:42

IT之家（RSS）

43

软银孙正义回应 AI 泡沫论：这是对 AI 的侮辱，人工智能仍处于发展初期

软银创始人兼首席执行官孙正义在 6 月 24 日的年度股东大会上表示，人工智能仍处于发展初期，任何声称行业出现泡沫的言论都是“对人工智能的侮辱”。他将软银比作“下金蛋的鹅”，抱怨公司市值（约 37 万亿日元）与资产总额（约 74 万亿日元）之间的巨大落差。孙正义同时宣布软银已开始量产机器人，并推动旗下 Arm 从芯片设计者向芯片提供者转型。

大佬观点现象/趋势

15:37

eric zakariasson@ericzakariasson

24

有趣地观察到Anthropic从以最佳模型为护城河转向构建工具生态系统，与常见开发和非开发工作流进行恰当集成。如果我是CTO，我只会要一个Slack集成，可以在任何时候切换模型……以避免锁定。主推文：在Slack中与模型无关的智能体。

Gergely Orosz: Interesting to observe Anthropic going from the moat being the best model to building a tooling ecosystem with right int...

智能体 Anthropic 大佬观点

15:20

公众号：蚂蚁百灵（Ling）

49

Ling-2.6-1T TPU 推理优化：用 Pallas Kernel 隐藏 MoE 数据搬运

蚂蚁 ASystem Core 与 SGLang-JAX 团队在 TPU v7x 上优化了 1T 参数稀疏 MoE 模型 Ling-2.6-1T 的推理性能。核心是 Fused MoE V2 Pallas kernel，将 scatter、expert FFN 和 gather 合并，通过计算与数据搬运重叠降低延迟。相比 V1，MoE prefill latency 从 5.16 ms 降至 2.42 ms（降 53%），decode kernel latency 从 0.249 ms 降至 0.211 ms。仅替换 MoE kernel 即可使 prefill throughput 提升 24.8%，decode throughput 提升 18.5%–35.3%。在 SGLang decode benchmark 下，16 颗 TPU v7x 的 output throughput 达到 16 张 H200 的 1.29x–1.77x。该工作还完整支持 hybrid backbone，包括 hybrid KV/recurrent memory pools、GLA linear attention 及 single-controller data parallelism。

推理教程/实践部署/工程

15:14

DogeDesigner@cb_doge

19

config：计算是新的石油

15:10

OpenBMB@OpenBMB

精选65

🥳感谢分享，@MLBoy_DaisukeMajima 🚀 MiniCPM-V 4.6 在设备上以这样的速度运行，实在令人印象深刻--尤其是在 Apple Core AI 上以不到 2B 参数跑出。干得漂亮，推动高效多模态 AI 向前发展。🫡

MLBoy_DaisukeMajima: 📸 MiniCPM-V 4.6 - one of the strongest vision models under 2B params - now runs at ~51 tok/s on iPhone 17 Pro via Apple...

多模态开源/仓库端侧

推荐理由：社区把 MiniCPM-V 4.6 搬上 iPhone 17 Pro，跑出 51 tok/s，还给了代码和模型，做端侧多模态的可以直接跑起来了。

15:04

数字生命卡兹克@Khazix0918

63

体验微信小微Agent：微信有史以来最大更新，但智能与便捷仍有不足

微信小微Agent常驻左上角，支持语音/文本输入，基座模型为微信自研WeLM（WeLM-V4-80B MoE，激活3B）及DeepSeek。可发消息、红包、语音通话，但每一步需用户确认，且禁止批量发送、读取聊天记录、转发笔记等。已打通朋友圈（限最近2天）、公众号、视频号，支持通过小程序进行本地生活、出行、充值等操作。当前权限“只读不动”，不能删除好友或取消关注。作者认为这是微信最大更新，但在智能程度和便捷性上仍有不足。

智能体 MCP/工具评测/基准

13:39

MiniMax (official)@MiniMax_AI

39

用户@whosamberella为学习仿人机器人知识，利用MiniMax M3进行调研，并在OpenCode中搭建了一个仿人机器人目录网站（humanoid-index-one.vercel.app）。其SVG原型不仅能展示，还能帮助学习不同仿人机器人的特征。MiniMax将其过程概括为：研究→综合→构建。

Amber Shen: I wanted to learn about humanoid robots 🤖, then decided the most reasonable thing to do was build myself a humanoid cat...

智能体教程/实践

13:12

AYi@AYi_AInotes

70

用户丢截图给 StepFun step-3.7-flash，2分多钟生成可用的文章头图生成器

用户将截图丢给 StepFun 的 step-3.7-flash 模型（运行在 Codex 中），2 分多钟生成可用的网页版文章头图生成器，支持修改文案和导出 PNG，总成本仅 $0.06。模型能自行理解参考图并实现完整功能逻辑，但视觉还原度仅六七分，手绘涂鸦风需手动调整。StepFun 同步推出 Startup Program，早期团队可获 API 额度、生态支持及资源对接。

图像生成多模态教程/实践

12:17

宝玉@dotey

72

宝玉分享极客风 Skills 管理方式

为解决多 Agent 下 Skills 存放混乱问题，宝玉提出：Skills 只装在项目内以节省 LLM 上下文窗口；所有原件统一存放于 ~/GitHub，每个项目通过软链接指向原件，再为 Claude Code 创建 .claude/skills → .agents/skills 入口。更新只需拉取一次源码，所有项目自动同步；修复 bug 可直接反哺开源项目。用户可用自然语言让 Agent 自动创建软链接，无需记忆命令。

LinearUncle: 我快疯了。日常同时用 4个 coding agent,skills 各写各的: /.agents/skills、/.codex/skills、~/.claude/skills 已经一团浆糊,CC 里找不到 Codex 的 skill,反过来...

智能体 Anthropic 教程/实践编码

1…19 202122 23…50