18:18

向阳乔木@vista8

国产大模型助教，你点哪些？

其他

18:10

公众号：蚂蚁百灵（Ling）

如何优雅地给 MLA 加上 QK-Norm？

DeepSeek 的 MLA 通过只缓存低维潜向量压缩 KV Cache，但 QK-Norm 需归一化高维 Key，若缓存归一化结果则打破低维优势。文章提出数学等效变换：将 QK-Norm 中动态逆 RMS 标量和静态仿射权重合并到 Query 侧，推理时每个 token 只需额外缓存一个逆 RMS 标量，即可严格等价实现 QK-Norm，不牺牲显存效率。在 400M/1B 模型训练 100B tokens 实验中，QK-Normed MLA 相比 QK-clipping loss 更低（1B 模型 gap ~0.02），训练更稳定且收敛更快。

DeepSeek 推理教程/实践数据/训练

18:01

IT之家（RSS）

OpenAI Codex 负责人：人工智能仍无法做好创意设计

OpenAI Codex 项目负责人安布罗西诺称，设计比代码更难量化评判，训练模型区分优劣设计比验证代码编译更繁琐。Figma 首席执行官菲尔德指出，AI 模型基于数据分布训练，产出通常平庸。格莱美提名音乐人巴斯强调，引导 AI 创作离不开人类审美判断。目前 AI 在创意设计领域主要作为提速工具，无法独立产出成熟成品。

OpenAI 图像生成大佬观点

17:47

Chubby♨️@kimmonismus

美国AI最坏情形分析：中国开源战略与能源基建优势

Kim引用quxiaoyin观点指出，中国开源AI并非出于人文主义，而是抢占市场份额、压制美国模型的战略。模型在华为芯片（如DeepSeek 4）上训练和推理优化，使中国掌握模型层与芯片层。同时美国数据中心建设不足，能源和电网容量严重短缺；中国2025年一年新增太阳能装机量相当于美国10–15年，在建36座核电站。华为芯片虽仍落后NVIDIA，但以量取胜。出口管制无法解决问题，美国应投资开源模型、推动中国使用NVIDIA并加速核电建设。

Xiaoyin Qu: The worst case scenario for USA AI: 1. Chinese open sources keep gaining market share. China owns the model layer. 2. Th...

大佬观点开源生态政策/监管

17:30

gabriel@gabriel1

红牛来了，我给他们狠狠灌了一顿 AGI。

OpenAI 其他

17:30

gabriel@gabriel1

我放弃了LinkedIn，只是把我的帖子复制粘贴到ChatGPT，然后说"让它更垃圾"。品味是2026年第一季度的事，你落伍了。

OpenAI 现象/趋势

17:27

Rohan Paul@rohanpaul_ai

《华尔街日报》报道：AI对劳动力市场影响引发三种对立观点

《华尔街日报》指出，AI对劳动力市场的影响让经济学家产生三种对立看法。弗吉尼亚大学Korinek认为AI可能逆转工业革命，使脑力与体力劳动不再稀缺。MIT教授Autor反驳软件岗位崩塌论，指过去计算机浪潮创造了新专业，提升了判断力、专业知识和人际接触的价值。耶鲁大学Gimbel批评硅谷将整洁编码工作误当作经济模型，真实工作包含混乱目标、关怀、说服和人际关系。白领“笔记本电脑职业”（法律、金融、咨询等）因工作可拆解为重复信息任务面临最明显压力。

现象/趋势

17:19

MiniMax (official)@MiniMax_AI

MiniMax官方转发了Gradient、Parallax和GenericAgent团队的演示结果。他们在本地运行了MiniMax M3（428B参数模型），通过Parallax工具部署在3台Mac上，再由GenericAgent驱动一个约3000行代码的自主智能体，完成了创建5只股票投资组合并写入磁盘的任务。整个过程完全在本地进行，无云端调用、无API费用，数据未离开机器。MiniMax表示这是本地AI未来发展的一个缩影。

Gradient: A self-evolving agent + a 428B model + 3 Macs = ? Your own AI lab. We ran @MiniMax_AI M3 locally with @tryParallax, righ...

智能体教程/实践端侧

17:17

Artificial Intelligence News（RSS）

自然语言处理正在改变专业社交网络

自然语言处理技术正重塑专业社交网络的沟通方式，提升个性化与关联性。核心功能包括消息意图检测、语气风格适配、长篇资料摘要及多语言支持。语义匹配取代关键词匹配，基于共同目标与项目推荐更精准的连接。但AI生成消息可能引发隐私担忧，模型幻觉和语言偏见威胁信任。未来方向包括设备端小型语言模型、隐私保护推理及更严格评估指标，以在透明安全前提下维护真实人际关系。

搜索现象/趋势

17:01

Alibaba Cloud@alibaba_cloud

智能体云的转型已经开始。阿里云CTO兼国际业务总裁李飞飞博士分享了他对未来的看法：未来三年将由智能体云的崛起所定义，智能体可以利用产品和基础设施来执行复杂任务。 🔗： https://int.alibabacloud.com/m/1000407809/

智能体 MCP/工具大佬观点

16:58

meng shao@shao__meng

逗死我了，美国政府 BAN 了 Llama，是因为太强太危险了吗？当然不是，因为太烂了。。拿出来，丢人！

vas: BREAKING: US Government Bans Llama 4, citing concerns that it is "just really bad"

Meta 其他开源生态

16:27

Rohan Paul@rohanpaul_ai

AI投资周期加速，BIS警告股市调整风险扩大

FT图表显示AI发展速度远超正常科技繁荣周期，但其投资激进度使实际商业回报门槛迅速抬高。国际清算银行（BIS）最新报告指出，AI相关的股市大幅调整可能产生比以往更广泛的影响，因为当前家庭持股比例相对财富和收入更高。AI或成为数十年来最重要的平台转变，但激进的投资周期正快速推高对实际商业回报的要求。

现象/趋势

16:24

Berryxia.AI@berryxia

Berry Xia：小Vibe Coding产品营销与AI视频制作技能

看到Product Hunt日榜上一个产品后，联想到@xiaoerzhan小耳的一款5美元终生版工具。Berry Xia强调小Vibe Coding产品必须重视营销和客户挖掘，否则酒香也怕巷子深。此外，他自制了一个Skills，可输入产品内容或链接自动生成营销讲解视频，TTS音频使用了小米的模型，效果不错。

大佬观点现象/趋势

16:17

Chubby♨️@kimmonismus

AA-Briefcase评分显示AI智能指数级加速，开源差距约半年

基于Artificial Analysis的AA-Briefcase评分（模拟多周复杂咨询任务），@emollick 绘制前沿曲线发现：闭源AI模型发展呈指数级增长且加速，开源模型（尤其中国）仍落后约半年。但乐观预测，年底前可能出现“神话级”开源变体。

Ethan Mollick: I took the new AA-Briefcase scores from @ArtificialAnlys (basically having the AI do multi-week consulting gigs with a l...

开源生态现象/趋势评测/基准