作者不再直接与多个AI Agent交互,而是通过核心AI搭档Finn来管理整个工作流。具体流程是:先在Codex中将单个Agent或技能调试稳定,然后交由OpenClaw平台运行,后续基本无需干预。用户只需向Finn提出需求,由其协调其他Agent执行,避免了与众多Agent直接对话导致的混乱。该系统已集成Obsidian、Google Workspace、飞书、GitHub等工具,并通过白名单、审计和能力边界限制确保安全。例如,处理年度烂账的流程被调试为固定技能后,Finn能自动填表、定时盘点并发送邮件,成为集私人助理、财务总监和技术总监于一身的角色。
为应对因游客激增和年轻劳动力不足引发的航空业人力危机,日本在东京羽田机场测试人形机器人。测试机型包括Unitree G1和UBTECH Walker E,旨在承担装载货物、搬运行李等繁重体力劳动。日本航空希望借此减轻约4000名地勤人员的工作负担,并计划未来将机器人用于清洁客舱和操作其他辅助设备。
作者试用Open Claude Design项目,肯定其作为开源项目的学习价值,项目宣称还原度超95%、代码量达18700+行。但当前产出仅为HTML雏形,在交互和完成度上与Claude Design原版的优美React组件相比仍有明显不足。
正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 …
基础模型能力不断增强,后训练成为下一个关键前沿。创建正确的评估方法比开发高得分模型更具影响力。模型的人格反映了训练者的品格,后训练阶段中人类标注者、研究人员和团队的价值取向会渗透进模型行为。高度依赖AI可能导致三个问题:心理依赖使人们外包思考与决策;无力感源于AI强大后普通人的影响力下降;自主性丧失因长期依赖而萎缩。更强的模型可能更不容易出现对齐问题,提升模型能力本身就是解决对齐问题的途径。
@dotey 我想问一下宝玉老师,现在用 codex 多一点还是 Claude 多一点?
@dotey 宝玉老师能分享一下Opus 4.7 和Sonnet 4.6的使用体验吗?我在迭代项目文档的时候,发现Opus并不比Sonnet强。该忘的都忘,该犯…
听到一个字节面试官远程面试候选人, 如何抓对方用 ai 作弊的方法,朴素到离谱。 面试官突然说:你闭上眼睛回答这道题。
谷歌翻译迎来二十周年,已从最初的简单模式匹配发展为每月服务超10亿用户的全球工具。其技术历经三个阶段:2006年依靠统计机器学习分析词簇,2016年转向神经网络实现超越字面的翻译,如今借助Gemini模型进一步提升能力。当前发展重点正从文本翻译转向流畅的实时对话,最新模型甚至能通过耳机充当口译器,并保留用户原有的语调和节奏。尽管AI翻译已支持近250种语言,人们却逐渐将其视为常态。谷歌对此表达感谢,并展望未来二十年的技术突破。
Anthropic为Claude推出了一系列针对创意软件的原生连接器,使其能直接接入Blender、Autodesk Fusion、Adobe Creative Cloud等专业工具内部工作流。这标志着Claude从问答助手转变为能在生产环境中直接操作的智能体。其核心突破在于通过自然语言桥接软件API,例如在Blender中调试场景、批量编辑对象,在Fusion中直接创建或修改3D CAD模型。此举旨在消除创意工作中大量的琐碎“翻译成本”,如寻找菜单、记忆语法、编写一次性脚本等,从而实现更少的上下文切换、更直接的操作和更高的自动化程度,提升工作效率。
关联讨论 2 条X:阿易 AI Notes (@AYi_AInotes)Anthropic:Newsroom(网页)当前,各类AI产品正不断涌现,致力于消除日常商业工作中的摩擦。Miniloop最新推出的AI劳动力平台,能将市场进入工作转化为一系列具备记忆、可接入通信工具、连接现有技术栈的自主代理。这些代理可运行根据上下文调整的多步骤工作流,实现潜在客户挖掘、资质审核、内容创作和客户互动的高度自动化。其效果如同一位24小时不间断工作的初级营销人员,据用户反馈每周可节省超过20小时,而成本仅为雇佣真人团队的十分之一。
通过ZenMux平台的PK模式实测,DeepSeek V4 Pro在处理结构化任务(如马斯克思维模型分析)时,输出逻辑清晰、表达母语化,质量达到Claude的85%,但价格仅为其七分之一。作者建议将80%的日常工作(如写代码、调研)交由DeepSeek处理,20%需要顶级文笔的任务使用Claude,可节省70%以上API费用。ZenMux提供免费测试额度、PK对比模式、保险赔付和可观测性工具,帮助用户规避依赖单一API厂商的风险并提升选型效率。
兄弟们,DeepSeek V4 Pro在ZenMux上免费放开了,登录就能跑,实测能替掉你80%的Claude活。视频是我早上实测的和Claude opus 4…
灵码2.6-flash模型现已开源,这是一个专为现实世界智能体工作流构建的快速、高效的指令模型。该模型总参数量达1040亿,激活参数量为74亿,并提供BF16、FP8和INT4多种量化版本以适应不同部署需求。其核心优势包括:生成速度高达每秒215个token,在完整评估中仅消耗1500万token,效率突出;在代码、文档处理和轻量级智能体工作流等实际任务中表现强劲;同时,其中英文切换能力及与主流编程框架的兼容性也得到了进一步改善。
多数人编写的CLAUDE.md冗长无效,常因添加过多人格指令导致Claude仍会猜错命令或重写文件。有效的CLAUDE.md应是精炼的项目技术简报,控制在60-80行内。核心在于认识到Claude的注意力是稀缺资源,系统提示已占用部分容量。正确结构应包含:明确的关键命令、简洁的架构地图、强调禁止事项的硬性规则、清晰的工作流偏好,并避免重复AI已记忆的内容。这本质上是LLM时代的注意力经济学,通过具体、负向的规则能显著提升输出精准度。一份好的CLAUDE.md能随项目积累价值,节省沟通成本并固化工程规范。
推文指出,大模型高效处理文本的特性将推动命令行界面在Agent时代复兴。当前,编程与构建已正交化,非程序员可能更擅长将Agent视为人类伙伴来使用。学习路径转为自顶向下,关键在于知道何时调用何种能力。多个Agent协作可超越线性增长,但需机制管理。不同用户培养的Agent会形成独特的“群体性格”,类似企业文化。核心挑战在于需同时理解人类视角的图形界面与Agent视角的线性事件流。