15:14

DogeDesigner@cb_doge

config：计算是新的石油

大佬观点

15:10

OpenBMB@OpenBMB

精选65

🥳感谢分享，@MLBoy_DaisukeMajima 🚀 MiniCPM-V 4.6 在设备上以这样的速度运行，实在令人印象深刻--尤其是在 Apple Core AI 上以不到 2B 参数跑出。干得漂亮，推动高效多模态 AI 向前发展。🫡

MLBoy_DaisukeMajima: 📸 MiniCPM-V 4.6 - one of the strongest vision models under 2B params - now runs at ~51 tok/s on iPhone 17 Pro via Apple...

多模态开源/仓库端侧

推荐理由：社区把 MiniCPM-V 4.6 搬上 iPhone 17 Pro，跑出 51 tok/s，还给了代码和模型，做端侧多模态的可以直接跑起来了。

15:04

数字生命卡兹克@Khazix0918

体验微信小微Agent：微信有史以来最大更新，但智能与便捷仍有不足

微信小微Agent常驻左上角，支持语音/文本输入，基座模型为微信自研WeLM（WeLM-V4-80B MoE，激活3B）及DeepSeek。可发消息、红包、语音通话，但每一步需用户确认，且禁止批量发送、读取聊天记录、转发笔记等。已打通朋友圈（限最近2天）、公众号、视频号，支持通过小程序进行本地生活、出行、充值等操作。当前权限“只读不动”，不能删除好友或取消关注。作者认为这是微信最大更新，但在智能程度和便捷性上仍有不足。

智能体 MCP/工具评测/基准

13:39

MiniMax (official)@MiniMax_AI

用户@whosamberella为学习仿人机器人知识，利用MiniMax M3进行调研，并在OpenCode中搭建了一个仿人机器人目录网站（humanoid-index-one.vercel.app）。其SVG原型不仅能展示，还能帮助学习不同仿人机器人的特征。MiniMax将其过程概括为：研究→综合→构建。

Amber Shen: I wanted to learn about humanoid robots 🤖, then decided the most reasonable thing to do was build myself a humanoid cat...

智能体教程/实践

13:12

AYi@AYi_AInotes

用户丢截图给 StepFun step-3.7-flash，2分多钟生成可用的文章头图生成器

用户将截图丢给 StepFun 的 step-3.7-flash 模型（运行在 Codex 中），2 分多钟生成可用的网页版文章头图生成器，支持修改文案和导出 PNG，总成本仅 $0.06。模型能自行理解参考图并实现完整功能逻辑，但视觉还原度仅六七分，手绘涂鸦风需手动调整。StepFun 同步推出 Startup Program，早期团队可获 API 额度、生态支持及资源对接。

图像生成多模态教程/实践

12:17

宝玉@dotey

宝玉分享极客风 Skills 管理方式

为解决多 Agent 下 Skills 存放混乱问题，宝玉提出：Skills 只装在项目内以节省 LLM 上下文窗口；所有原件统一存放于 ~/GitHub，每个项目通过软链接指向原件，再为 Claude Code 创建 .claude/skills → .agents/skills 入口。更新只需拉取一次源码，所有项目自动同步；修复 bug 可直接反哺开源项目。用户可用自然语言让 Agent 自动创建软链接，无需记忆命令。

LinearUncle: 我快疯了。日常同时用 4个 coding agent,skills 各写各的: /.agents/skills、/.codex/skills、~/.claude/skills 已经一团浆糊,CC 里找不到 Codex 的 skill,反过来...

智能体 Anthropic 教程/实践编码

11:45

Tibo@thsottiaux

如果你在OpenAI，你就会知道这从未发生过。马上回来庆祝5分钟的安宁。

OpenAI 其他

11:39

OpenBMB@OpenBMB

面壁智能（OpenBMB）的扩散式 TTS 模型 VoxCPM-0.5B 已通过 Apple Core AI 完全部署至 iPhone 端侧，无需联网。该模型整合了 MiniCPM4 语言模型、LocDiT flow-matching 和 AudioVAE，每一层均运行于 Neural Engine 和 GPU 上。模型权重和部署代码已开源至 HuggingFace 与 GitHub。

MLBoy_DaisukeMajima: VoxCPM now runs FULLY on-device on iPhone - via Apple's Core AI. @OpenBMB's diffusion TTS (MiniCPM4 LM + LocDiT flow-mat...

开源/仓库开源生态端侧语音

11:20

公众号：卡尔的AI沃茨

实测Codex Record & Replay：把RPA自动化工作流重做了一遍

Codex新功能Record & Replay可将浏览器操作录制成可复用的Skill。实测解决两个痛点：定向信息搜索时自动打开X搜热点、统计高赞帖子、提取关键词重新查询，输出带互动指标的表格和短关键词库，满足60%-70%图文素材需求；视频剪辑上传能完成静音检测、加速、导出GIF等固定流程，但上传可能被网站安全策略拦截，建议先让Codex出Plan判断可行性。Codex能理解意图，例如自动在输入Grok前增加中文关键词组合。目前依赖Computer Use和图片理解，操作慢且偶有误判，但已能将人的操作转化为Agent下次可执行的上下文，替代传统RPA和Replay。

智能体 OpenAI 搜索教程/实践

10:17

Berryxia.AI@berryxia

出差途中用Bloome Agent自动做合同，体验"老板待遇"

用户出差在飞机上，通过Bloome Agent直接生成两份客户续费合同，无需打开电脑、无需多言。Agent还主动记忆并询问之前的报价信息，整体体验轻松愉快。用户感叹AI时代让“顶级牛马”也能享受老板般的待遇。

智能体大佬观点

10:17

宝玉@dotey

Codex 喜欢吞掉 bug。吃的 bug 多，拉的 bug 也多……

Tibo: Codex loves slurping up bugs

其他编码

10:10

公众号：数字生命卡兹克

同事件精选63

微信上线AI智能体"小微"内测

微信近日内测AI智能体“小微”，常驻左上角，支持语音或文本输入，调用WeLM-V4-80B（MoE激活3B）与DeepSeek模型。可向个人/群聊发消息、发起视频通话、发红包或转账，需用户逐项确认；可查询朋友圈（限最近2天）、公众号、视频号，支持创建提醒、笔记、小工具，并能操作奶茶咖啡、打车、电影票等小程序至最后一步后交给用户。小微具备记忆功能，可记录地址等。聊天记录上下文仅在特定入口可用且限最近2天。整体策略“只读不动”，禁止批量发送、定时、删除联系人等操作。微信以谨慎节奏接入AI，是国民级应用全面拥抱AI的重要信号。

智能体搜索教程/实践

同一事件，精选展示《微信Agent小微灰度内测：主入口发消息红包，子入口可读聊天记录》

推荐理由：微信Agent内测体验一手展示，功能上打通通讯录、朋友圈和小程序，却处处需确认且只读不动，是微信在AI时代极其谨慎的第一步。不过一句话生成小工具的能力，已经为小程序生态打开了AI分发的新可能。

09:48

swyx 🔜 @aiDotEngineer@swyx

智谱AI（Zai）1月以每股120港元在港IPO。其GLM-5.2模型击败DeepSeek，成为全球公认的最佳开源模型，并在部分基准上整体表现领先。团队首次现身硅谷，参加AI Engineer World's Fair，将分享最新工作进展。

Lou: Made it to SF! The love for GLM-5.2 has been incredible. We are bringing team out for the AI Engineer World's Fair, wher...

DeepSeek 大佬观点开源生态模型发布

09:47

Rohan Paul@rohanpaul_ai

Andrew Ng谈AI时代团队组织：1-10通才加速

Andrew Ng分享了AI时代如何组织工程团队以加速：1到10人的团队由高度授权的通才组成，保持高语境。当代码生成速度大幅提升后，组织反而成为瓶颈——功能从想法到原型只需一天，迫使产品、设计、营销、法务等所有环节同步加速。他的解决方案是让少数高语境通才团队独立决策，避免跨部门翻译带来的延迟。源自LangChain YouTube频道。

大佬观点部署/工程