4月29日
00:56
凡人小北@frxiaobei
59
我的AI搭档Finn:从直接使用Agent到智能工作流管理的转变

作者不再直接与多个AI Agent交互,而是通过核心AI搭档Finn来管理整个工作流。具体流程是:先在Codex中将单个Agent或技能调试稳定,然后交由OpenClaw平台运行,后续基本无需干预。用户只需向Finn提出需求,由其协调其他Agent执行,避免了与众多Agent直接对话导致的混乱。该系统已集成Obsidian、Google Workspace、飞书、GitHub等工具,并通过白名单、审计和能力边界限制确保安全。例如,处理年度烂账的流程被调试为固定技能后,Finn能自动填表、定时盘点并发送邮件,成为集私人助理、财务总监和技术总监于一身的角色。

智能体MCP/工具教程/实践
00:30
OpenRouter@OpenRouter
精选66
NVIDIA NemotronTM 3 Nano Omni 已在 OpenRouter 上线。 这是一个用于智能体工作流的开源 30B-A3B 多模态模型:文本、图像、视频和音频输入 → 文本输出,拥有 256k 上下文窗口和高效的 MoE 架构,适用于计算机使用、文档和音视频推理。
智能体产品更新多模态

推荐理由:Nemotron 3 Nano Omni 是 NVIDIA 在开源多模态模型上的新动作,30B 参数 MoE 架构、256k 上下文、四模态输入,做 Agent 工作流的开发者值得试一下,尤其文档和音视频推理场景。
00:26
Rohan Paul@rohanpaul_ai
47
日本机场测试人形机器人应对劳动力短缺

为应对因游客激增和年轻劳动力不足引发的航空业人力危机,日本在东京羽田机场测试人形机器人。测试机型包括Unitree G1和UBTECH Walker E,旨在承担装载货物、搬运行李等繁重体力劳动。日本航空希望借此减轻约4000名地勤人员的工作负担,并计划未来将机器人用于清洁客舱和操作其他辅助设备。

具身智能行业动态
00:23
宝玉@dotey
51
试用Open Claude Design:开源有潜力但交互存差距

作者试用Open Claude Design项目,肯定其作为开源项目的学习价值,项目宣称还原度超95%、代码量达18700+行。但当前产出仅为HTML雏形,在交互和完成度上与Claude Design原版的优美React组件相比仍有明显不足。

Tom Huang正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 …

MCP/工具开源/仓库教程/实践编码
00:19
向阳乔木@vista8
68
OpenAI研究员离职观点:后训练前沿与AI依赖风险

基础模型能力不断增强,后训练成为下一个关键前沿。创建正确的评估方法比开发高得分模型更具影响力。模型的人格反映了训练者的品格,后训练阶段中人类标注者、研究人员和团队的价值取向会渗透进模型行为。高度依赖AI可能导致三个问题:心理依赖使人们外包思考与决策;无力感源于AI强大后普通人的影响力下降;自主性丧失因长期依赖而萎缩。更强的模型可能更不容易出现对齐问题,提升模型能力本身就是解决对齐问题的途径。

大佬观点安全/对齐现象/趋势
00:00
Sundar Pichai@sundarpichai
46
谷歌翻译二十周年:从简单短语到实时对话的演进

谷歌翻译迎来二十周年,已从最初的简单模式匹配发展为每月服务超10亿用户的全球工具。其技术历经三个阶段:2006年依靠统计机器学习分析词簇,2016年转向神经网络实现超越字面的翻译,如今借助Gemini模型进一步提升能力。当前发展重点正从文本翻译转向流畅的实时对话,最新模型甚至能通过耳机充当口译器,并保留用户原有的语调和节奏。尽管AI翻译已支持近250种语言,人们却逐渐将其视为常态。谷歌对此表达感谢,并展望未来二十年的技术突破。

Google多模态大佬观点
4月28日
23:58
Rohan Paul@rohanpaul_ai
精选71
Claude推出原生连接器,可直接操作Blender、Fusion等创意软件

Anthropic为Claude推出了一系列针对创意软件的原生连接器,使其能直接接入Blender、Autodesk Fusion、Adobe Creative Cloud等专业工具内部工作流。这标志着Claude从问答助手转变为能在生产环境中直接操作的智能体。其核心突破在于通过自然语言桥接软件API,例如在Blender中调试场景、批量编辑对象,在Fusion中直接创建或修改3D CAD模型。此举旨在消除创意工作中大量的琐碎“翻译成本”,如寻找菜单、记忆语法、编写一次性脚本等,从而实现更少的上下文切换、更直接的操作和更高的自动化程度,提升工作效率。

AnthropicMCP/工具产品更新
关联讨论 2X:阿易 AI Notes (@AYi_AInotes)Anthropic:Newsroom(网页)
推荐理由:Claude 终于从聊天框走进了 Blender 和 Fusion 的生产现场,这对创意工作者来说是真正省时间的更新,做 3D 和设计的值得立刻试试 Blender connector。
23:53
23:52
23:41
Rohan Paul@rohanpaul_ai
23
Miniloop推出AI劳动力平台,将市场进入工作转化为自主代理

当前,各类AI产品正不断涌现,致力于消除日常商业工作中的摩擦。Miniloop最新推出的AI劳动力平台,能将市场进入工作转化为一系列具备记忆、可接入通信工具、连接现有技术栈的自主代理。这些代理可运行根据上下文调整的多步骤工作流,实现潜在客户挖掘、资质审核、内容创作和客户互动的高度自动化。其效果如同一位24小时不间断工作的初级营销人员,据用户反馈每周可节省超过20小时,而成本仅为雇佣真人团队的十分之一。

智能体产品更新
23:34
阿绎 AYi@AYi_AInotes
48
DeepSeek V4 Pro质量是Claude的85%,价格只有七分之一。

通过ZenMux平台的PK模式实测,DeepSeek V4 Pro在处理结构化任务(如马斯克思维模型分析)时,输出逻辑清晰、表达母语化,质量达到Claude的85%,但价格仅为其七分之一。作者建议将80%的日常工作(如写代码、调研)交由DeepSeek处理,20%需要顶级文笔的任务使用Claude,可节省70%以上API费用。ZenMux提供免费测试额度、PK对比模式、保险赔付和可观测性工具,帮助用户规避依赖单一API厂商的风险并提升选型效率。

阿绎 AYi兄弟们,DeepSeek V4 Pro在ZenMux上免费放开了,登录就能跑,实测能替掉你80%的Claude活。视频是我早上实测的和Claude opus 4…

DeepSeek现象/趋势编码评测/基准
23:19
Ant Ling@AntLingAGI
59
灵码2.6-flash模型正式开源,专为高效智能体工作流打造

灵码2.6-flash模型现已开源,这是一个专为现实世界智能体工作流构建的快速、高效的指令模型。该模型总参数量达1040亿,激活参数量为74亿,并提供BF16、FP8和INT4多种量化版本以适应不同部署需求。其核心优势包括:生成速度高达每秒215个token,在完整评估中仅消耗1500万token,效率突出;在代码、文档处理和轻量级智能体工作流等实际任务中表现强劲;同时,其中英文切换能力及与主流编程框架的兼容性也得到了进一步改善。

智能体开源/仓库模型发布编码
23:18
阿绎 AYi@AYi_AInotes
精选71
优化CLAUDE.md:聚焦关键规则以提升AI协作效率

多数人编写的CLAUDE.md冗长无效,常因添加过多人格指令导致Claude仍会猜错命令或重写文件。有效的CLAUDE.md应是精炼的项目技术简报,控制在60-80行内。核心在于认识到Claude的注意力是稀缺资源,系统提示已占用部分容量。正确结构应包含:明确的关键命令、简洁的架构地图、强调禁止事项的硬性规则、清晰的工作流偏好,并避免重复AI已记忆的内容。这本质上是LLM时代的注意力经济学,通过具体、负向的规则能显著提升输出精准度。一份好的CLAUDE.md能随项目积累价值,节省沟通成本并固化工程规范。

智能体教程/实践编码

推荐理由:CLAUDE.md 写法这事门槛低但坑极多,这篇把「注意力稀缺」当核心逻辑来讲,比大多数 prompt 教程都更接近工程真相,用 Claude Code 的人读完直接砍文件就行。
23:15
23:10
向阳乔木@vista8
56
Agent时代下的CLI复兴与编程范式转变

推文指出,大模型高效处理文本的特性将推动命令行界面在Agent时代复兴。当前,编程与构建已正交化,非程序员可能更擅长将Agent视为人类伙伴来使用。学习路径转为自顶向下,关键在于知道何时调用何种能力。多个Agent协作可超越线性增长,但需机制管理。不同用户培养的Agent会形成独特的“群体性格”,类似企业文化。核心挑战在于需同时理解人类视角的图形界面与Agent视角的线性事件流。

智能体大佬观点编码
23:07