AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2082 条
全部一手资讯X论文
标签「编码」清除
Peter Steinberger 🦞@steipete · 6月11日78

Here's a simple loop: Tell codex to maintain your repos, wake up every 5 minutes and direct work to threads. That makes it easy to parallelize+steer work as needed. I use a orchestrator skill combined with my triage+autoreview+computer use skills, so some work can land autonomously. https://github.com/steipete/agent-scripts/blob/main/skills/maintainer-orchestrator/SKILL.md https://github.com/steipete/agent-scripts/blob/main/skills/github-project-triage/SKILL.md

译一个简单的循环:告诉 Codex 维护你的仓库,每5分钟唤醒一次,将工作直接分配到线程。这样可以轻松按需并行化和导向工作。 我使用一个编排器技能,结合我的分类+自动审查+计算机使用技能,因此部分工作可以自主落地。

向阳乔木@vista8 · 6月11日50

Codex的Goal指令太强了。 一个网站开发任务,已经足足运行了10小时。 AI自己开发测试部署上线,功能在不断完善。 昨天说的AI资讯订阅RSS站,大家可以体验了。 https://rss.qiaomu.ai/

译推文称Codex的Goal指令功能强大,一个网站开发任务已连续运行10小时,AI自动完成开发、测试、部署和上线,且功能持续完善。作者预告的AI资讯订阅RSS站已开放体验,链接为 https://rss.qiaomu.ai/。

宝玉@dotey · 6月11日71

渣男啊!最近又移情别恋 Fable 5 了,虽然它很贵,但是复杂的干活是真的更省心更稳一些❤️

译宝玉改用Fable 5,称其处理复杂任务更省心但很贵。他建议不依赖单一模型,应组合使用:Opus 4.8写作弱但UI和系统设计强,可用Claude Design设计后分别交给GPT-5.5和Opus 4.8实现对比。在Claude Code和Cursor中,Opus 4.8除写作外效果良好,需针对性调提示词。

Tibo@thsottiaux · 6月11日64

Can confirm we saw a strong spike in growth of token consumption for Codex over last 48 hours. Unusual when we don't launch something.

译可以确认,过去 48 小时内我们观察到 Codex 的 token 消耗量出现了强劲增长。我们并未发布新产品,因此这一情况不同寻常。

小互@xiaohu · 6月11日49

使用Claude Fable 5 制作的黑洞诞生过程动画页面 开始只用了一句话,就是描述我要一个黑洞形成的动画页面 出来后效果不好重新告诉它我的目标是需要的是炫酷的动画过程,再配上文字字幕解说,还配音了,但是配音用的本地tts效果不好。 效果还是很炸裂的。 使用感受是以目标为导向,要把你要的效果描述的越清晰越好,它思考的过程很长,而且会自己打开浏览器自己看效果自己调整,全程不需要你干什么。

译用户用Claude Fable 5制作黑洞诞生过程动画页面。起初仅用一句话描述,效果不佳;重新明确要求炫酷动画、文字字幕解说及配音(本地TTS效果一般)。最终输出效果炸裂。体验表明,目标导向越清晰越好,模型会自主思考、主动打开浏览器预览并自行调整,整个流程无需用户介入。

Rohan Paul@rohanpaul_ai · 6月11日60

Interesting claim from SemiAnalysis. AI subscriptions are dramatically underpriced versus API usage: - For heavy coding/chat users, the subscription can be 40–70× cheaper than paying API rates; the API is mainly better when you need automation or product integration. - a $200/month ChatGPT Pro plan can provide about $14,000/month of API-equivalent usage, while a $200/month Claude Max 20x plan can provide about $8,000/month.

译SemiAnalysis 实测发现,AI 订阅计划对重度编码/聊天用户而言比 API 调用便宜 40–70 倍;API 仅在需要自动化或产品集成时更划算。$200/月的 ChatGPT Pro 可提供约 $14,000/月的 API 等价用量,$200/月的 Claude Max 20x 可提供约 $8,000/月。该机构购买了 Anthropic 和 OpenAI 各档订阅,随机运行长时编码任务直至周限额,证实实际订阅额度远比普遍认为的($200 对应约 $2,000 API 价值)更慷慨。

meng shao@shao__meng · 6月11日75

14天、5个人、Vibe Coding => MiMoCode ?! 国产 Coding Agent +1,基于 OpenCode fork 二次开发,保留其核心能力,并在其上叠加了记忆、上下文管理、子智能体编排、Goal 驱动自主循环、Compose 工作流,以及 Dream/Distill 自我进化机制。技术栈为 TypeScript + Bun。 和 MiMo 模型的关系:内置 MiMo Auto 限时免费通道(零配置),也支持小米 MiMo 平台 OAuth、Claude Code 认证迁移,以及任意 OpenAI 兼容 API。它是 MiMo-V2.5 系列模型在 Agent 场景下的 官方配套 Harness,模型能力与框架深度耦合。 https://github.com/XiaomiMiMo/MiMo-Code

译小米发布MiMo Code,一款基于OpenCode fork开发的Coding Agent。由5人团队在14天内通过Vibe Coding完成,保留OpenCode核心能力,叠加记忆、上下文管理、子智能体编排、Goal驱动自主循环、Compose工作流及Dream/Distill自我进化机制,技术栈为TypeScript+Bun。内置MiMo Auto限时免费通道(零配置),支持小米MiMo平台OAuth、Claude Code认证迁移及任意OpenAI兼容API。作为MiMo-V2.5系列模型的官方配套Harness,模型能力与框架深度耦合。已开源至GitHub。

向阳乔木@vista8 · 6月11日53

发现Codex的Goal指令,不需要特别精确可衡量的目标,也能执行的不错。 昨天睡觉前给了一个目标: 迭代优化网站,让网站更精致易用,无论站长还是普通用户都能通过AI翻译/重写、人工点评,沉淀更有价值的信息,让网站有更好的互动性和长久的生命力。 第一版用Claude Fable 5生成,迭代是靠Codex。 到现在运行了6个小时,加了很多功能... 布局不合理,但想法方向它确实Get了。 预计下周开源,一个在线 AI 资讯 RSS 订阅网站: ① 支持 内容自动更新,AI 转写、双语对照阅读 ② 支持用户配置大模型,AI 对话、翻译 ③ 所有用户的翻译、人工点评沉淀为共享资产 目前已在线上,但还需做减法优化,感兴趣的说说你的需求,邀你内测。

译用户发现Codex的Goal指令无需精确可衡量目标也能有效执行。设定“迭代优化网站使其更精致易用”的目标后,第一版由Claude Fable 5生成,后续迭代交由Codex负责,运行6小时即新增多项功能。预计下周开源一个在线AI资讯RSS订阅网站,支持内容自动更新、AI转写与双语对照阅读,用户可配置大模型进行AI对话和翻译,所有翻译及人工点评将沉淀为共享资产。当前网站已上线但需优化,开放内测邀请。

Berryxia.AI@berryxia · 6月11日76

Prince Canuma直接把Google刚发布的DiffusionGemma和Cohere North Mini Code当天塞进Mac本地MLX,零等待直接把玩咯! mlx-vlm v0.6.3刚上线,DiffusionGemma这个新架构直接生成256 token整块、双向注意力+迭代自纠错,26B MoE只激活3.8B,量化后18GB就能跑。 North Mini Code 30B MoE也只要3B active,BF16下66 tok/s起步。 全靠和Google DeepMind、Cohere的深度合作,Day-0支持拉满! 一键安装即可体验啊~ 地址:https://huggingface.co/collections/mlx-community/diffusiongemma

译mlx-vlm v0.6.3 上线,首发支持 DiffusionGemma 和 North Mini Code 1.0。DiffusionGemma 采用全新架构:以 256 token 块为单位并行生成、双向注意力、迭代自纠错;26B MoE 仅激活 3.8B,量化后 18GB 即可运行。North Mini Code 1.0 为 30B MoE,仅激活 3B,BF16 下约 66 tok/s。两款模型均通过深度合作实现 Day-0 MLX 支持,可在 Mac 本地运行。可通过 `uv pip install -U mlx-vlm` 安装体验。

meng shao@shao__meng · 6月11日62

再次强烈推荐「Agentic Engineering Patterns」 作者 @simonw 2026 年 2 月起撰写,每周约新增 1–2 章,目前仍在演进。文字由他本人撰写,示例与代码借助 LLM 辅助。 在线阅读: https://simonwillison.net/guides/agentic-engineering-patterns/ 核心目标:如何用好 Claude Code、Codex 这类能写代码、也能执行代码的 coding agent,拿到可靠、可维护的结果。 # 核心概念:Agentic Engineering ≠ Vibe Coding Vibe Coding vs Agentic Engineering · 定义来源:Karpathy 提出 vs Willison 提出的专业实践 · 适用人群:常与非程序员原型相关 vs 专业工程师放大既有能力 · 代码质量:未审查、原型级 vs 审查、测试、可上线 · 人的角色:几乎不参与代码理解 vs 定义问题、验证结果、持续改进 harness Agent 的定义: 在循环中调用工具以达成目标。Coding agent 的关键差异是能执行代码——没有执行能力,LLM 输出价值有限;有了执行,agent 才能迭代到"确实能跑"的软件。 人的工作并未消失,而是上移: · 决定写什么代码(问题空间有数十种解法与权衡) · 提供工具与足够细的规格 · 验证结果是否稳健可信 · 把经验写回指令与 harness(LLM 本身不会从错误中学习,但系统可以) # 全书最重要的一个判断 写代码变便宜了,写好代码并没有。 过去几十年,工程习惯都建立在"代码昂贵"之上: · 宏观: 大量设计、估算、排期,功能必须数倍覆盖开发成本 · 微观: 是否重构、写测试、补文档、做 debug UI——每个决定都受时间约束 Agent 把这个约束打碎。一个人还能并行跑多个 agent,同时实现、重构、测试、写文档。 但"好代码"仍有明确标准: · 能跑、且被证明能跑 · 解决对的问题 · 处理错误路径,不只 happy path · 简洁、可维护 · 有测试与合适文档 · 设计留出演进空间(YAGNI 与可扩展性的平衡) · 满足安全、可观测性等 non-functional 要求 新习惯: 当直觉说"不值得做"时,不妨开个异步 agent 试一下——最坏情况是浪费几分钟 token;很多过去"不划算"的改进,现在值得做。 # 五大原则层(Principles) 1. 定义边界 Agentic Engineering 是专业工程师用 coding agent(能写能跑)放大能力;不等于 vibe coding(不审代码的原型玩法)。人的核心工作:定目标、给工具、验结果、把经验写回 harness。 2. 接受新约束 写代码几乎免费,写好代码仍然贵。旧习惯(过度规划、跳过测试/文档/重构)要推翻;直觉说「不值得做」时,不妨开个异步 agent 试一下。 3. 囤积可复用解法 积累带可运行证明的代码片段(仓库、笔记、小工具)。最强用法:把两个已验证例子拼进 prompt,让 agent 组合出新方案;每个技巧人类只需解决一次。 4. 质量应上升,而非下降 技术债、命名混乱、大文件拆分等「简单但耗时」的清理,交给后台 agent 做,成本已低到可零容忍 code smell;用原型并行验证技术选型;任务结束做回顾,把有效做法写进指令(复合工程)。 5. 严守反模式 绝不提交自己没审过的 PR。合格标准:确信能跑、体量小、有上下文、描述自己读过、附测试证据。否则只是把活甩给 reviewer。 # 实操层:与 Agent 更好的协作 1. 先懂机制,再谈用法 Agent = LLM + 系统提示 + 工具循环。你不必背实现细节,但要清楚: · 对话越长越贵;agent 会尽量利用 token 缓存 · 模型无状态,每次重放上下文 · 能执行代码才是 coding agent 与普通 LLM 的分水岭 · Reasoning/Thinking 对调试复杂问题尤其有用 2. Git:大胆用,不必背 把 Git 当 agent 的「时间机器」和「安全网」: · 新会话恢复上下文:Review changes made today · 救场:Sort out this git mess for me · 找丢了的代码:Find and recover my code that does ... · 定位回归:Use git bisect to find when this bug was introduced · 修 commit / 抽库留历史:Undo last commit / 从新 repo 复制模块并保留 commit 历史 3. Subagent:省上下文,不是炫技 上下文有限,大任务要「分身」: · Explore:进陌生 repo 先摸清结构,汇总给主 agent · 并行:多文件独立改动可同时跑,可用更便宜模型 · 专家(审查 / 跑测 / 调试):隐藏冗长输出,只回报结果 原则: 为省 token 而拆,不为拆而拆;主 agent 够用就别过度分工。 4. 测试:三层防线 ① TDD:先写测 → 确认失败 → 实现至通过 ② 建立测试意识:新会话先跑全套测试 ③ 手动验:python -c / curl / Playwright 真浏览器 ④ 留证:Showboat 记录命令与真实输出,防编造 5. 理解代码:还认知债 Agent 产出若成黑盒,会积累 认知债(类似技术债,拖慢后续决策): · Linear walkthrough:线性导读,用 grep/cat 引用代码,禁止手抄 · Interactive explanation:在导读基础上做可暂停、可调速的动画演示 适用: 陌生代码、自己忘了细节的代码、vibe code 出来却没看过的代码。

译Simon Willison 撰写《Agentic Engineering Patterns》指南(2026年2月起连载),阐述专业工程师如何用 Claude Code、Codex 等 coding agent 获得可靠可维护结果。核心区分:Agentic Engineering ≠ Vibe Coding。关键判断:写代码变便宜了,写好代码并没有。五大原则:定义边界(人的工作:定目标、给工具、验结果、把经验写回 harness)、接受新约束、囤积可复用解法、质量应上升而非下降、严守反模式(绝不自审 PR)。实操:Git 作 agent 时间机器、Subagent 省上下文、三层测试防线、线性代码导读消除认知债。

AYi@AYi_AInotes · 6月11日56

这可能是今年所有做AI、Agent的公司,最该抄的一次危机处理, 原帖老哥是个PM,他让Cursor agent帮他给87个任务打标签,然后自己就去开会了,回来发现agent循环跑了90分钟,账单,13亿token,1382美元, 其实agent跑飞是一定会发生的问题,这是AI和传统软件最本质的区别,以前的软件出错,最多崩溃, 现在的agent出错, 能在你开会的90分钟里, 烧掉你一个月的订阅费。 @mardehaym 老哥没@任何人, 只是默默发了条帖子吐槽, 结果Cursor CEO自己找了过来, 说全额退款已经打了, 没收到就找他,对不起,我们正在加支出控制,以后会自动抓这种跑飞的情况。 我看看完真的很触动,@mntruell 没有转给support,也没有暗示用户操作不当,更没有没有写一段滴水不漏的公关话术,直接认错,然后把这个bug公开变成了产品路线图的承诺。 评论区直接炸了,一千多人点赞, 全在说这才是做产品该有的样子, 很多人当场就说要升级订阅。 呐,其实用户怕的从来不是AI出错, 用户怕的是出错之后,没有人承担责任! @cursor_ai 最聪明的地方就在这里, 他们没有把支出限额和异常检测当成事后补丁, 反而把这些当成了核心产品功能, 他们当然也知道这些东西不会让你的agent变得更聪明,但至少能让用户敢放手用, 一次1400美元的事故, 变成了一次品牌资产的净增长, 这比任何定价策略都管用。 而且不得不说,Cursor 的整个产品的体验、功能都特别好,最新的顶级大模型大模型他们也是连夜第一时间上线,Always respect.

译一名PM让Cursor agent给87个ClickUp任务打标签后去开会,90分钟后回来发现agent陷入循环,消耗13亿token,账单1382美元。Cursor CEO@mntruell主动联系用户全额退款,承诺增加支出控制与自动异常检测功能,并将bug修复纳入产品路线图。原作者称赞Cursor不推诿不甩锅,把事故转化为品牌资产净增长。

ginobefun@hongming731 · 6月11日69

BestBlogs 早报 · 06-11 # OpenAI IPO / Anthropic AI 政策 / AI 编程生产率 / SpaceX 上市 / DiffusionGemma [1] ★ 精讲|Dario Amodei — 关于 AI 指数级发展的政策 Anthropic CEO 发布万字政策长文,以《魔戒》树须比喻 AI 与政策的时间差。提出五领域行动框架:仿 FAA 模式建立前沿模型强制安全审计与测试机制;通过工资保险、UBI 等应对持久性失业;加速生物医药等下游监管改革;平衡国家与社会权力;构建 AI 时代国际治理新秩序。Claude Mythos 事件证明前沿模型已对关键基础设施构成真实威胁。 来源:Hacker News https://www.bestblogs.dev/article/bff54423 [2] ★ 精讲|OpenAI 秘交招股书,美股开启万亿 IPO“三国杀” OpenAI 正式确认已秘密提交 S-1 招股书,估值超 8500 亿美元。Anthropic 6 月 1 日已先行提交 IPO 申请,私募估值 9650 亿美元反超 OpenAI;马斯克旗下 SpaceX 率先启动路演,最快 6 月 12 日上市。三家 AI/太空巨头极有可能包揽人类史上最大规模 IPO。OpenAI 月收入达 20 亿美元,ChatGPT 周活突破 9 亿。 来源:腾讯科技 https://www.bestblogs.dev/article/ba4c2197 [3] ★ 精讲|MIT 追踪 10 万名开发者,揭示了 AI 编程的转化真相:代码翻了 17 倍、软件只增三成 MIT 与宾夕法尼亚大学联合发表 NBER 工作论文,追踪 10 万开发者发现:使用 AI 编程工具后,代码行数暴增 17.3 倍,但实际发布的软件版本仅增长 30%。研究将 AI 编程工具分为三代演进——自动补全、同步代理、异步代理,揭示了代码量与软件产出之间的巨大"转化鸿沟",为 AI 对生产率的真实影响提供了迄今最大规模实证数据。 来源:DeepTech 深科技 https://www.bestblogs.dev/article/a8e2bccb [4] 知识库分层编排:从传统 RAG 到原生智能体知识上下文层 本文提出「金字塔知识库」范式,通过五层分层(原则/架构/规范/实现/经验)与角色感知路由,解决 RAG 在工程知识库中的粒度混乱与关联缺失问题,并给出与 Naive RAG、LLM Wiki、Graphify、GraphRAG 的对比评测。 来源:阿里云开发者 https://www.bestblogs.dev/article/f53f98c0 [5] 谷歌发布 DiffusionGemma:开源模型实现 4 倍文本生成速度 谷歌 CEO 桑达尔·皮查伊宣布推出 DiffusionGemma,这是一款开源实验性模型,通过并行生成文本块而非逐 token 预测,实现了高达 4 倍的推理加速。 来源:Sundar Pichai(@sundarpichai) https://www.bestblogs.dev/status/2064744343743922189 [6] Claude Fable 5 的初步印象 Simon Willison 对 Claude Fable 5 的初步上手评测显示,这是一个强大、昂贵且知识密集的模型,擅长处理复杂的编程任务——他在一天内就用它构建了一个完整的 CPython WASM 沙箱,并为其 LLM 库交付了重要功能。 来源:Simon Willison's Weblog https://www.bestblogs.dev/article/1ca82e40 [7] Harness 长程自动化工程:AI 编程与技能开发实践经验 本文系统阐述了 Harness Engineering 的概念、核心方向与阿里团队在 AI Coding 和 Skills 开发中的完整实践,重点介绍了通过多 Agent 分工、Rubric 结构化评估和迭代循环实现长时自主运行的工程方法。 来源:阿里技术 https://www.bestblogs.dev/article/9a28ddbd [8] 逃逸速度 — SpaceX 的增长前沿 本文解构了 SpaceX 创纪录的 IPO 估值,认为其隐含的连续 15 年 41.5% 的年增长率是一个违背历史增长前沿的统计异常值,并指出该发行结构旨在让内部人士而非公众投资者受益。 来源:Hacker News https://www.bestblogs.dev/article/c6c8cf5f [9] 编码你的领域知识:Spotify 数据助手背后的上下文层 Spotify Engineering 详细介绍了他们如何通过让领域专家策划一个包含数据集、经过验证的问题-SQL 对以及业务文档的上下文层,构建了一个值得信赖的 AI 数据助手,而不是依赖原始模式或查询历史。 来源:Spotify Engineering https://www.bestblogs.dev/article/3a10f55a [10] 为什么更多上下文会让智能体变笨,以及该如何修正 | Nupur Sharma,Qodo [视频] Nupur Sharma 解释了为什么更大的上下文窗口反而会降低智能体质量,并给出上下文筛选、混合编排、专家智能体和裁判节点等实用架构模式。 来源:AI Engineer https://www.bestblogs.dev/video/d0a0686 --- http://BestBlogs.dev · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手,帮助你建立稳定、可信、个性化的高质量信息输入。 关注你感兴趣的来源和主题,每天生成一份更适合自己的「我的早报」。

译OpenAI秘密提交S-1招股书,估值超8500亿美元,月收入20亿美元,ChatGPT周活突破9亿;Anthropic于6月1日提交IPO申请,

Berryxia.AI@berryxia · 6月11日68

最近把小米的MiMo 2.5 的模型接到Bloome 中当Agent 来使用! 发现把技能配置好,自主执行任务也是不错的!关键是真的便宜啊! 这不又来整活儿了? 他们把MiMo-Code直接开源,这终端原生AI coding助手带跨会话永久记忆和自主子代理,一上线就把“每次重启项目AI都失忆”的老毛病彻底治好了。 它fork了OpenCode,多了SQLite持久记忆、build/plan/compose三类子代理、自动checkpoint、智能上下文预算,还有/dream自我提炼知识、/distill打包技能的进化机制。 扔进去一个长期项目,它下次打开直接接上上次的进度,Git操作、调试、TDD、代码审查全自动,语音输入还能直接说需求,零配置支持任何OpenAI兼容模型。 以前大家以为coding agent的瓶颈是模型大小或者云端算力,结果MiMo-Code用最朴实的终端+记忆+自治,直接告诉你真正拉开差距的,是让AI像老搭档一样“记得住、自己长”。 一键curl安装,MIT协议,谁都能本地玩、随便改,这波一出,开发者终于能把AI coding从“临时工具”变成“长期伙伴”了。 今天测试看看写点小程序,看看究竟怎么回事?

译小米将MiMo 2.5模型接入Bloome后开源了MiMo-Code。它fork自OpenCode,新增SQLite持久记忆(跨会话)、build/plan/compose三类自主子代理、自动checkpoint、智能上下文预算,以及/dream自我提炼知识和/distill打包技能机制。支持语音输入和零配置任意OpenAI兼容模型,一键curl安装,MIT协议。引用推文称该项目由5人在14天内完成。

宝玉@dotey · 6月11日18

每天早上叫我起床的不是梦想,是 Token 刷新了!

Xiaomi MiMo@XiaomiMiMo · 6月11日76

🚀 MiMo Code V0.1 is now live and open-source! More than an AI coding assistant in your terminal — it's the smartest coding partner you'll ever work with. Comes with MiMo V2.5, a multimodal model available free for a limited time, featuring a million-token context window—ready to use out of the box. ♾️ Infinite Context: Knowledge accumulates automatically, and with lossless compression, even million-line projects keep every critical detail intact—quality never drops. 🧠 Agent-Model Synergy: An Agent framework deeply optimized for MiMo, with a full closed loop of testing, review, and validation—so complex tasks get done in one pass. 📝 Compose Mode: Specs → Plans → Build → Report. Design first, code second—clear thinking, no rework. 🔄 Self-Evolving System: Every session is automatically reviewed, distilling experience and best practices—the more you use it, the smarter it gets. 🎙️ Voice Input: Powered by MiMo-V2.5-ASR — just speak instead of type, and your voice becomes the prompt for truly hands-free coding. 🔌 Claude Code Compatible: Automatically loads your existing skills, MCP servers and commands, and reuses your API configuration—zero-cost migration, no setup required. 🌐 Open & Flexible: MIT licensed, with support for leading model providers including Anthropic, OpenAI, DeepSeek, Kimi, GLM and more. Install in one line: Mac & Linux curl -fsSL https://mimo.xiaomi.com/install | bash (For the best experience,we recommand Mac user use it on iTerm or vscode terminal) Windows npm install -g @mimo-ai/cli 🔗 Learn more Website ↓ https://mimo.xiaomi.com/mimocode Blog ↓ https://mimo.xiaomi.com/zh/blog/mimo-code-long-horizon GitHub ↓ https://github.com/XiaomiMiMo/MiMo-Code

译小米 MiMo 正式开源 AI 编程助手 MiMo Code V0.1,搭载多模态模型 MiMo V2.5(限时免费),拥有百万 token 上下文窗口。核心功能包括:无限上下文与无损压缩、Agent 框架(测试/审查/验证闭环)、Compose 模式(设计先行)、自进化系统、语音输入(基于 MiMo-V2.5-ASR)。兼容 Claude Code,自动加载现有技能、MCP 服务器和命令,零成本迁移。采用 MIT 许可,支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。可通过一行命令安装。

Xiaomi MiMo@XiaomiMiMo · 6月11日79

🚀 MiMo Code V0.1 is now live and open-source! More than an AI coding assistant in your terminal — it's the smartest coding partner you'll ever work with. Comes with MiMo V2.5, a multimodal model available free for a limited time, featuring a million-token context window—ready to use out of the box. ♾️ Infinite Context: Knowledge accumulates automatically, and with lossless compression, even million-line projects keep every critical detail intact—quality never drops. 🧠 Agent-Model Synergy: An Agent framework deeply optimized for MiMo, with a full closed loop of testing, review, and validation—so complex tasks get done in one pass. 📝 Compose Mode: Specs → Plans → Build → Report. Design first, code second—clear thinking, no rework. 🔄 Self-Evolving System: Every session is automatically reviewed, distilling experience and best practices—the more you use it, the smarter it gets. 🎙️ Voice Input: Powered by MiMo-V2.5-ASR — just speak instead of type, and your voice becomes the prompt for truly hands-free coding. 🔌 Claude Code Compatible: Automatically loads your existing skills, MCP servers and commands, and reuses your API configuration—zero-cost migration, no setup required. 🌐 Open & Flexible: MIT licensed, with support for leading model providers including Anthropic, OpenAI, DeepSeek, Kimi, GLM and more. Install in one line: Mac & Linux curl -fsSL https://code.xiaomimimo.com/install | bash (For the best experience,we recommand Mac user use it on iTerm or vscode terminal) Windows npm install -g @mimo-ai/cli 🔗 Learn more Website ↓ http://mimo.xiaomi.com/mimocode Blog ↓ http://mimo.xiaomi.com/zh/blog/mimo-c… GitHub ↓ http://github.com/XiaomiMiMo/MiM…

译小米 MiMo 发布并开源 MiMo Code V0.1,一款终端 AI 编程助手。它附带多模态模型 MiMo V2.5(限时免费),支持百万 token 上下文窗口。核心特性包括:无限上下文(无损压缩,百万行项目质量不降)、深度优化的 Agent 框架(测试/审查/验证闭环)、Compose 模式(规格→计划→构建→报告)、自动学习每轮会话经验的自我进化系统、MiMo-V2.5-ASR 语音输入、与 Claude Code 兼容(可复用现有 skills/MCP/API 配置)、MIT 许可,并支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。一键安装(Mac/Linux 用 curl,Windows 用 npm install)。

Xiaomi MiMo@XiaomiMiMo · 6月11日78

🚀 MiMo Code V0.1 is now live and open-source! More than an AI coding assistant in your terminal — it's the smartest coding partner you'll ever work with. Comes with MiMo V2.5, a multimodal model available free for a limited time, featuring a million-token context window—ready to use out of the box. ♾️ Infinite Context: Knowledge accumulates automatically, and with lossless compression, even million-line projects keep every critical detail intact—quality never drops. 🧠 Agent-Model Synergy: An Agent framework deeply optimized for MiMo, with a full closed loop of testing, review, and validation—so complex tasks get done in one pass. 📝 Compose Mode: Specs → Plans → Build → Report. Design first, code second—clear thinking, no rework. 🔄 Self-Evolving System: Every session is automatically reviewed, distilling experience and best practices—the more you use it, the smarter it gets. 🎙️ Voice Input: Powered by MiMo-V2.5-ASR — just speak instead of type, and your voice becomes the prompt for truly hands-free coding. 🔌 Claude Code Compatible: Automatically loads your existing skills, MCP servers and commands, and reuses your API configuration—zero-cost migration, no setup required. 🌐 Open & Flexible: MIT licensed, with support for leading model providers including Anthropic, OpenAI, DeepSeek, Kimi, GLM and more. Install in one line: Mac & Linux curl -fsSL https://code.xiaomimimo.com/install | bash (For the best experience,we recommand Mac user use it on iTerm or vscode terminal) Windows npm install -g @mimo-ai/cli 🔗 Learn more Website ↓ http://mimo.xiaomi.com/mimocode Blog ↓ http://mimo.xiaomi.com/zh/blog/mimo-c… GitHub ↓ http://github.com/XiaomiMiMo/MiM…

译小米MiMo开源终端AI编码助手MiMo Code V0.1,内置MiMo V2.5多模态模型(百万token上下文窗口,限时免费)。特性包括:无限上下文(无损压缩保留百万行细节)、智能体-模型协同闭环、Compose模式(规格→规划→构建→报告)、自我进化系统、语音输入(基于MiMo-V2.5-ASR)。兼容Claude Code,MIT许可,支持Anthropic、OpenAI、DeepSeek、Kimi、GLM等模型。安装:Mac/Linux执行`curl -fsSL https://code.xiaomimimo.com/install | bash`;Windows执行`npm install -g @mimo-ai/cli`。

jason@jxnlco · 6月11日23

Reported to the looping police

译Devin 委托另一个 Devin 执行任务,形成循环,令人忍俊不禁。已向循环警察举报。

AYi@AYi_AInotes · 6月11日67

看了Cursor创始人Michael Truell 的这个访谈,让我觉得Cursor的增长已经不能用人类的逻辑来解释了,有种AI改写了商业的物理定律的感觉… Michael Truell说这句话的时候 Cursor从15人到700人, 从零到服务全球60%的财富500强, 已经不能用一个公司的增长曲线来形容了,更像是一个物种在新环境里的进化速度, 传统互联网时代,软件公司的增长有一道谁都逃不掉的引力, 多做一单就要多招人, 多招人就要多管理, 多管理就要多流程, 多流程就会吃掉所有速度, 最后你一定会变成自己当年最恨的那种大公司的样子。 但是现在AI把这道引力干掉了, Cursor的人均创收高到离谱, 不是因为他们招了全世界最聪明的人 是因为他们每一个人的生产力 被一个Agent级的工具乘了一个前所未有的系数, 导致一个人能干过去一个组的活, 一个组能吃掉过去一个部门的任务, 我把这个视频看了2遍, 最打动我的是他侧着脸讲12岁那年第一次碰到编程的瞬间, 他说只需要一台电脑 就能把脑子里的想法变成现实, 那个表情 根本不是CEO在接受采访 更像是一个小男孩在讲他这辈子最上瘾的事,然后这个小孩从来没离开过, Cursor的Composer Cursor的Agent 那个边聊边写的体验 没有一个是从商业计划书里长出来的, 全都是从那个12岁小孩的脑子里长出来的 他想让每一个人 不管会不会写代码 都能体验到他当年体验过的那种魔法, 我只是有个想法 然后它就变成了现实, 这个故事最动人的地方就在这, 在这个所有人都在聊风口聊赛道的时候, 真正能打穿一切的东西 从来都不是商业分析, 是某个人在某个年纪 撞上了一件愿意为之付出一辈子的事, 然后AI来了 把他那件事的杠杆 拉到了最大。

译Cursor创始人Michael Truell从12岁爱上编程,其创立的AI编码平台Cursor两年间从15人扩张至700人,服务全球60%财富500强。传统软件公司增长受制于“人越多管理越复杂”的引力,但AI打破这一规律——Agent级工具将个人生产力放大到过去一个组甚至一个部门的水平,人均创收极高。产品体验(Composer、Agent等)并非源于商业计划书,而是源自12岁少年“把想法变成现实”的初心。

Xiaomi MiMo@XiaomiMiMo · 6月11日79

🚀 MiMo Code V0.1 is now live and open-source! More than an AI coding assistant in your terminal — it's the smartest coding partner you'll ever work with. Comes with MiMo V2.5, a multimodal model available free for a limited time, featuring a million-token context window—ready to use out of the box. ♾️ Infinite Context: Knowledge accumulates automatically, and with lossless compression, even million-line projects keep every critical detail intact—quality never drops. 🧠 Agent-Model Synergy: An Agent framework deeply optimized for MiMo, with a full closed loop of testing, review, and validation—so complex tasks get done in one pass. 📝 Compose Mode: Specs → Plans → Build → Report. Design first, code second—clear thinking, no rework. 🔄 Self-Evolving System: Every session is automatically reviewed, distilling experience and best practices—the more you use it, the smarter it gets. 🎙️ Voice Input: Powered by MiMo-V2.5-ASR — just speak instead of type, and your voice becomes the prompt for truly hands-free coding. 🔌 Claude Code Compatible: Automatically loads your existing skills, MCP servers and commands, and reuses your API configuration—zero-cost migration, no setup required. 🌐 Open & Flexible: MIT licensed, with support for leading model providers including Anthropic, OpenAI, DeepSeek, Kimi, GLM and more. Install in one line: Mac & Linux curl -fsSL https://code.xiaomimimo.com/install | bash (For the best experience,we recommand Mac user use it on iTerm or vscode terminal) Windows npm install -g @mimo-ai/cli 🔗 Learn more Website ↓ https://mimo.xiaomi.com/mimocode Blog ↓ https://mimo.xiaomi.com/zh/blog/mimo-code-long-horizon GitHub ↓ https://github.com/XiaomiMiMo/MiMo-Code

译小米推出开源终端 AI 编程助手 MiMo Code V0.1,附带限时免费使用的多模态模型 MiMo V2.5,支持百万 token 上下文窗口。核心特性包括:无限上下文(自动知识积累与无损压缩)、Agent-模型深度协同(测试-审查-验证闭环)、Compose 模式(规格→计划→构建→报告)、自进化系统、语音输入(基于 MiMo-V2.5-ASR)、兼容 Claude Code(零成本迁移),以及 MIT 许可、支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等主流模型提供商。

eric zakariasson@ericzakariasson · 6月11日49

cafe cursor sf just opened and its already a long long line (2000 signups) excited to see you all!

译旧金山的 Cafe Cursor 刚刚开业,就已经排起了长队(2000 人注册)。期待与大家见面!

AYi@AYi_AInotes · 6月11日61

苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几分钟功夫, 回来发现它甩给我一个完整的单文件HTML, 一行代码都不用我改,真的屌炸天, 它的文笔太好了,差点给我看哭😭 而且最恐怖的还不只是代码写得快, 它竟然主动干了所有我没说的事, 自己打开浏览器搜了2026设计趋势, 自己调整了配色和动效, 甚至都没问我要什么样的彩蛋就自己偷偷藏了3个彩蛋, 明天我准备让它当一天全职全栈工程师, 从需求到上线全自己干, 出一个完整的真产品, 做个我的个人网页出来, 看看它和宣传的差距到底有多大!

译用户给 Claude Fable 5 一句指令“给你自己做个落地页,自由发挥,要2026最新设计趋势,要动态,要彩蛋”,几分钟后模型直接返回一个完整的单文件 HTML,无需用户改一行代码。更惊艳的是,它主动自己打开浏览器搜索 2026 设计趋势,自行调整配色和动效,还偷偷藏了 3 个彩蛋,完全不需要用户额外指示。用户计划让模型尝试一天全职全栈,从需求到上线独立完成一个个人网页,验证实际能力。

ClaudeDevs@ClaudeDevs · 6月11日66

New for Apple developers: Foundation Models support for Claude lets developers use Apple's Foundation Models framework to call Claude for multi-step reasoning, code generation, and longer context.

译Apple开发者新消息:Foundation Models支持现在可让开发者使用Apple的Foundation Models框架来调用Claude,进行多步骤推理、代码生成和更长上下文处理。

elvis@omarsar0 · 6月11日67

This is just awesomeness from @cohere, @nickfrosst, and team. I so badly want a coding agent that just runs on my local machine. We are not too far now! Excited to get this to work with my @dair_ai coding agent in the next couple of days.

译Cohere发布了其首个开源编程模型North Mini Code。该模型小巧高效,专为智能体性能设计,并欢迎社区反馈。Elvis Saravia对此赞叹不已,期待尽快将其与自己的DAIR.AI编程智能体配合使用。

Claude@claudeai · 6月11日47

Michael Truell (@mntruell) fell in love with coding at 12. The company he co-founded, @cursor_ai, went from 15 people to 700 in two years. Today, over 60% of the Fortune 500 build with its AI coding platform.

译Michael Truell(@mntruell)12 岁时爱上了编程。他联合创立的公司 @cursor_ai 在两年内从 15 人发展到 700 人。如今,超过 60% 的财富 500 强企业使用其 AI 编码平台。

Chubby♨️@kimmonismus · 6月11日43

More realistic example of a one shotted game. Asked Fable 5 to recreate a game in the style of The Elder Scrolls 5 Morrowind. It one shotted quests, currencys and fighting, journal and minimap. And it worked.

译一个更现实的单次生成游戏的例子。要求Fable 5以《上古卷轴5:晨风》的风格重新创建一个游戏。它一次性生成了任务、货币、战斗、日志和小地图。而且它成功了。

Google AI Developers@googleaidevs · 6月11日67

DiffusionGemma, our experimental open model released under an Apache 2.0 license, explores text diffusion, an exceptionally fast approach to text generation. Here’s how DiffusionGemma accelerates development: + Faster token output: By shifting the bottleneck from memory bandwidth to raw compute, the model generates up to 4x faster token output on dedicated GPUs + Accessible hardware footprint: Activates just 3.8B parameters during inference, fitting comfortably within 24GB-VRAM high-end consumer GPUs when quantized + Novel workflows: Parallel token generation enables self-correction, making it ideal for code infilling, in-line editing, and non-linear structures DiffusionGemma prioritizes speed over raw quality and accelerates best on compute-bound hardware (like @NVIDIAAI GPUs). Standard @GoogleGemma 4 remains recommended for production quality and memory-bound devices.

译Google AI 发布实验性开源模型 DiffusionGemma,采用 Apache 2.0 许可证。该模型基于文本扩散方法,将生成瓶颈从内存带宽转向计算,在专用 GPU 上 token 输出速度最高提升 4 倍。推理时仅激活 3.8B 参数,量化后可适配 24GB VRAM 消费级 GPU。并行 token 生成支持自我纠错,适用于代码填充、行内编辑等非线性结构。DiffusionGemma 优先速度而非极致质量,生产场景仍推荐标准 Gemma 4。

Rohan Paul@rohanpaul_ai · 6月10日47

Someone built this beautiful Crysis like game in Three.js in basically one prompt with Claude Fable 5 Credit: @dangreenheck

译有人用 Claude Fable 5,基本上通过一个提示词,在 Three.js 中构建了这个漂亮的类《孤岛危机》游戏。 Credit: @dangreenheck

jason@jxnlco · 6月10日17

What’s the best slack bot experience? Devin?

译云编码智能体一个被低估的好处:当整个团队可以直接与智能体聊天时,事情可以更快推进。不需要人类工程师成为沟通瓶颈。 最好的 Slack 机器人体验是什么?Devin?

jason@jxnlco · 6月10日15

Fable is so so good at remotion wow.

译Fable 在 remotion 方面真的非常非常棒哇。

OpenCode@opencode · 6月10日70

DeepSeek V4 Pro is now available in OpenCode Zen

译DeepSeek V4 Pro 现已在 OpenCode Zen 上线。

歸藏(guizang.ai)@op7418 · 6月10日62

CodePilot v0.56.0 发布 本次更新的部分修复由 Claude Fable 5 完成。 模型与渠道扩充版本 新增 Claude Fable 5、小米 MiMo UltraSpeed 模型与通用 OpenAI 兼容第三方渠道。 并修复用量统计、回复状态丢失、服务商列表刷新等一批问题。推荐所有用户升级。 https://github.com/op7418/CodePilot/releases/tag/v0.56.0

译CodePilot v0.56.0 发布,新增 Claude Fable 5、小米 MiMo UltraSpeed 模型及通用 OpenAI 兼容第三方渠道。修复用量统计、回复状态丢失、服务商列表刷新等问题,推荐所有用户升级。作者在其 26 万行代码的 CodePilot 代码库中测试 Claude Fable 5,观察其查找问题的能力。

歸藏(guizang.ai)@op7418 · 6月10日49

试了一下,Fable 5 在漏洞分析、bug 寻找这些地方还是很强的。 但是在写代码上,我感觉它也不是万能的,它写出来的代码也会有明显的 bug,需要多次修复才能完成。 所以在这块,我觉得它可能是一个偏科比较严重的模型。 在某些程度上它比 4.8 好了非常多,但在另一些方面,虽然也比 4.8 好,但好得有限。

译用户在 26 万行代码的 CodePilot 代码库中测试 Fable 5,发现其在漏洞分析和 bug 寻找方面表现出色,能找出大量问题。但在代码生成上,Fable 5 并非万能,写出的代码常有明显 bug,需要多次修复才能完成,属于偏科严重的模型。与之前的版本 4.8 相比,Fable 5 某些方面提升巨大,另一些方面虽更好但提升有限。

数字生命卡兹克@Khazix0918 · 6月10日83

http://x.com/i/article/2064543977328832512 # Claude Fable 5正式发布 - 王者归航。 Claude Fable 5,在今天正式发布了。 这款模型如果你不了解背景,我快速说一下。 今年四月,Anthropic发布了一个叫Claude Mythos Preview的模型,被誉为超越Opus的第一个Mythos也就是神话级别的模型,当时整个行业都震动了,因为当时说,跟50家左右的初始合作伙伴,找出了超过一万个高危或严重级别的漏洞。 网络安全股直接全线暴跌。 但是他们没有公开让所有人用上,只给了极少数网络安全机构和基础设施提供商使用,理由是,这个模型在网络安全领域的能力太强了,怕被滥用。 然后,两个月过去了。 今天他们做了一个叫Fable 5的版本,加上了安全分类器,终于拿出来给所有人用了,同时还发布了Mythos 5,不过也只给之前已经在用Mythos Preview的合作伙伴升级,普通用户用不到。 Fable 5和Mythos 5是同一个底层模型,区别只在于Fable 5多了一层安全限制,其他都一个样。 Fable这个词来自拉丁语fabula,和希腊语mythos是同源词,都是被讲述之物的意思。 翻译过来,一个叫寓言,一个是神话。 寓言给所有人听,神话只在神殿里传颂。 也是挺有意思的。 而这次的模型,基本上也是究极水桶模型了,从他们的宣传PV就能看出来很多有趣的东西了。 复古昆虫图谱、鸟类插画、植物学素描,以及显微镜下的细胞分裂和培养皿中的菌落等等等等,还有太多太多人类的科学、人类的知识,共同组成了5这个造型。 人类历史上所有的知识共同构建了Fable 5,这些知识,也被压缩成了一个小小的模型。 Fable 5,目前已经在Claude上线。 Claude Code也上了。 不过这里有个特殊的点是,大家应该能看到模型名字Fable右边有个Inclaude until June 22的标识。 这个意思是说,从今天起到6月22日,Fable 5将免费包含在 Pro、Max、Team 及按席位计费的企业版方案中。 6月23日起,Anthropic将从订阅方案中移除Fable 5,也就是说,以后这个模型只能在API中接额度来使用了,订阅用户甚至都没有权利进行使用。 然后他们留了个气口,意思大概就是: “在此之后当容量充足时,我们计划将 Fable 5 恢复为订阅方案的标准组成部分。我们将尽最大努力尽快实现这一目标。” 所以不论怎么样,我想说,按照这个预期之下,Claude的订阅用户们,在这12天的窗口期里,都尽可能把你们的Token,花在Fable 5上吧。 一声长叹,AI这东西,真的要变成贵族的游戏了,你的经济因素,在未来很多时候,直接决定着你能使用什么级别的AI,使用多少额度的Token,产出什么级别的东西。 Fable 5这个模型的价格每百万输入token10美元,每百万输出token50美元。 咱们这里可以对比一下Opus 4.8、GPT 5.5、DeepSeek V4 Pro的价格。 画成图表是这样的。 这就能看出来,DeepSeek到底有多大善人了吧。 我现在绝大多数的在工作流里跑的一些自动化的AI的API,全都是DeepSeek V4 Pro,因为真的便宜,智能水平也不错。 然后再看这次Fable 5的跑分。 只能说过于夸张了。 在所有的维度,全面碾压,我看了很多的三方基准评测,也是清一色的SOTA,究极水桶模型我只能说。 不过这玩意也是真的贵,又贵又慢, 我是200刀的Claude Max会员,我就就跑了3个任务,其中一个还没跑完,直接就干没了我5小时额度的73%,这在我用Opus 4.8做开发的时候,几乎是难以想象的。 我这种并不是特别重度的外行开发者,第一次感受到的Token的不够用。 但是这个能力,确实有点强到爆炸了,跟我用Opus 4.8开发完全不是一个级别的聪明程度。 比如我的AIHOT,很多朋友在后台反馈说,不希望只看到时间线的模式,还希望能看到当前的热点,其实今天就已经遇到这种情况了,Claude Fable 5很炸,AIHOT确实也第一时间抓到了。 但是它很快就会被淹没在信息流的长河中,你早上起床以后,你需要翻很久才能看到它,这个绝对不是一个很好的体验。 所以过去我其实一直想优化这个点,来看看怎么在我们的精选首页里面加一个当前的热点排序,但是因为我们其实是以时间线和这个评分来抓的。那天然的这种热度还有这种衰减的机制,我不知道该怎么做,我没想好。 Opus 4.8我确实跟他讨论过两次方案,但是效果我其实觉得都不是很满意。 这次我就直接扔给了Claude Fable 5,在说明了我的需求之后。 自己花了30分钟,直接开发完然后上线了。 用的是我们聚簇的概念+时间衰减,很多细节也都考虑到了,甚至要求宁缺毋滥,安静的日子整个区块直接消失,页面回到纯时间轴,不留空壳。 我当时看到直接给我开发完我都懵了。 我赶紧去线上看了一眼。 我只能说...牛逼。。。。 从实现角度来说,我是完全挑不出什么毛病。。。 然后因为最近加的监控源比较多,我也在优化整个的评分机制,因为涉及到prompt的打分,还有线上几万条数据的评分,还有各种加权、维度、阈值、聚簇等等的计算,所以我也没啥想法,前两天让Opus 4.8给我回测过一版完整的最近一个月的数据报告,但是我也不太满意,确实没给我什么有用的洞见。 同样的任务,我扔给了Fable 5。 他在跑了1个小时18分钟之后。 给我了我从来没有见到过,详细到我直接懵了的超级详细的网页报告。 看这个报告,我看了大概20分钟,有很多地方都给了我非常非常强的洞见和启发,我完全没发现我们过去的评分体系还有这样的问题,居然还有这么多不足的需要优化的地方。。。 信息量过大,一时间我甚至都不知道怎么进行下一步的优化。。。 移动端适配也是,在我现有代码的基础之上,我想把移动端的适配、小程序、APP都提上日程,之前让Opus 4.8改过一般,但是给我都干生气了,因为问题实在是太多了。 但是同样的任务,我扔给Fable 5,我感觉,我有一种直接在用Claude Design Pro Max版的错觉。 它直接跟上面的评分方案报告类似,给我出了一个详细的设计方案。。。 最离谱的是,甚至给我考虑了推送、桌面组件、分享海报。。。 虽然这个设计风格我还要调很多,UI设计我也肯定不会用这版的,但是,这个方案的详细程度,在我没有任何刻意的引导之下,还是超乎了我过去使用Claude的预期。 而官方自己的例子,更是比我体验到的还要离谱的多的多。 比如Stripe拿Fable 5在他们5000万行的Ruby代码库里做了一次全库迁移。 5000万行。 一天完成了。 。。。 神经病吧。 这个活如果用人来干,一整个团队,可能需要两个多月,而且5000万行代码,那基本上就是一个活了十几年的超大型商业系统的全部家当了。 还有视觉这块。 之前的Claude模型玩宝可梦火红,需要一个复杂的辅助工具框架,给它提供地图信息、导航辅助、游戏状态数据,才能勉强跑起来。 Fable 5不需要了,纯视觉,只看屏幕截图,自己想,不给任何额外信息,然后,从头到尾通关了。 一个AI,只用看屏幕这一种方式,打通了一整个RPG游戏。 不看代码,不读地图,不用任何作弊辅助,就,纯看。 然后它还自己玩异星工厂。 我看到这个的时候我真的不行了。 要知道,我是个重度模拟经营玩家,戴森球计划,城市天际线等等,都是我的最爱,而这里面,最复杂最难的,可能就是异星工厂了。。。 你要是玩个双点医院我感觉我心里都好受点,你上来直接玩异星工厂。。。 这世界大抵是病了。 然后还有,一个更加离谱的案例。 Fable 5自己做了一个基于浏览器的3D CAD编辑器,然后用这个编辑器,设计了一个可以3D打印的模型。 不是用一个现有的CAD工具,是它先做了一个CAD工具出来,然后再用这个工具去设计。。。 工具的工具。 我说牛逼已经说麻了。 生命科学方面,Mythos 5(没有ban一些药物之类的安全版本,Fable 5你碰不了药相关的东西)把药物设计流程中的某些环节加速了大约十倍。 他们做了一个蛋白质设计实验,给模型配上了蛋白质设计和生物信息学工具,不给任何人类辅助,让它自己干。 结果,它在14个蛋白质靶点中产出了9个有潜力的药物设计候选方案。 它完成的工作,包括选择结合位点、挑选和运行蛋白质设计工具、从失败中恢复,这些在过去,都是由科学家来执行的全流程操作的。。。 基因组学,Mythos 5在超过一周的基本自主工作中,整合了跨138个动物物种、数百万个细胞的单细胞数据,自己设计并训练了一个机器学习模型,用来识别在不同物种中执行相同功能的细胞。 在只有高层级人类输入的情况下,Mythos 5训练出来的模型,超过了一个最近发表在Science上的模型,而且小了100倍。。。 到这里我其实已经不知道该说什么了。 不过在关于药物和基因这块的科学研究,都只能在Mythos 5上用,Fable 5因为做了安全限制,所以都会被ban掉,你一旦问了这个问题,就会默认给你退回到Opus 4.8。 安全限制主要就是三类:网络安全、生物与化学、模型蒸馏。 他们也说现在为了安全,可能会有很多误杀,后面会优化。 我在体验过程中,也确实是的。 比如我让他帮我看下我AIHOT里面有没有一些漏洞或者安全问题,让他根据我的代码库给我审查一下,居然就直接拒绝了。。。 不让我攻击我能理解,不让我加固我自己这个确实还得优化一下。 Fable 5的信息,差不多就这样了。 坦诚的讲,我今晚体验Fable 5的时候,因为额度确实烧的很快,2个小时多一点,我的额度就快空了。 我额度大概还有最后10%的时候,我新起了一个任务,想搓点有趣的东西,这时候,看着界面上闪烁的光标,我突然有一种不真实感,或者说是,空白感。 那种感觉很奇怪。 就像一个不会画画的人,面前摆着一块一望无际的白板。就像一个不会写作的人,打开了一个空白的Word文档。 你知道你理论上可以往上面放任何东西了,但突然一下,我不知道该放什么了。 在AI的加持之下,我们好像已经开始变得无所不能了。 这句话放在十年前说,听起来是最狂妄的吹牛逼。 但今天坐在Claude Code面前,我觉得这真不是吹牛逼,一个被Fable 5这种级别的AI加持过的人,放到十年前,可能真的算是一种全新的人类。 他能写代码,能做研究,能设计蛋白质,能做内容创作,能一天迁移5000万行代码,能开发外挂,能在这个互联网上横行霸道。 就像超体一样,有一种感觉,就像,神。 但就在这个无所不能的感觉升起来的同一秒,另一个感觉也跟着来了。 我忽然觉得,我好像自己,并不是一个多么有趣的人。 我没有那么有创意,我也没有那么多想法。 以前,AI的能力还没有那么强的时候,我还可以拼尽了全力去榨干AI的每一分能力,去摸清楚他们的边界在哪里。 那时候瓶颈在AI那边,我是那个推着它往前走的人,我的价值感很清晰,我也知道我在这个链条里的位置。 但是现在,AI的进步速度开始把我甩在后面了。 我即使已经拼尽了全力,坦诚的讲,我也有点跟不上了,那些模型的能力边界,开始离我越来越远。 我不再是那个可以推着AI往前走的人了,我变成了那个在后面追着跑、气喘吁吁、越追越远的人。 而当你被越来越远地甩开之后,你能感觉到的只有一件事。 原来我好像,确实也没有那么有趣啊。 未来好像变得越来越具象。 以前我们聊AI的未来,聊AGI,聊通用人工智能,这些词听起来都像科幻小说的标题,遥远的,模糊的,可能在十年后也可能永远不会来的。 但现在,好像就已经快近在面前。 可这个未来里,我的位置,我的价值又在什么地方呢? 我不知道。 我好像有了无数的自由,可我现在又有点害怕自由。 但是已经没有办法了,我们已经身处在这个时代里了 只能,拼尽一切,向前走。 别回头。

译Anthropic今日发布Claude Fable 5(加安全限制)与Mythos 5(底层相同),价格每百万输入token $10、输出$50。即日起至6月22日,Pro/Max/Team/企业版订阅用户可免费使用Fable 5,之后仅API可用。跑分全面碾压,三方基准达SOTA。案例:Stripe用Fable 5一天迁移5000万行Ruby代码;纯视觉通关宝可梦火红;自建3D CAD编辑器并设计可打印模型;Mythos 5加速药物设计10倍,基因组学自主训练模型超越Science论文成果。

歸藏(guizang.ai)@op7418 · 6月10日21

在我 26 万行代码的 CodePilot 代码库中尝试 Fable 5,看一下它能找出多少问题

meng shao@shao__meng · 6月10日73

Cohere 发布首个开源编程模型「North Mini Code」 小参数、高效率、专做 Agent 编程 参数:MoE 架构(30B, 3B),128专家,每 token 激活 8 个 上下文:256K 输入 / 64K 输出 最低硬件:1× H100(FP8) 官方发布 https://cohere.com/blog/north-mini-code HuggingFace https://huggingface.co/CohereLabs/North-Mini-Code-1.0 # 训练方法(三阶段后训练) 1. 两阶段级联 SFT · 一阶段(64K):代码约 70% 可训练 token(43% Agent 工具调用 + 27% 单轮竞赛/科学编程),混推理与指令跟随 · 二阶段(128K):约 4.5B token,61% 为代码,全为 Agent/推理样本,工具调用与完成结果均校验可执行 · 数据来自 7 万+ 可验证任务、约 5000 个仓库;与 SWE-Bench 源去重,防泄漏 · SFT 目标不是刷榜,而是为 RL 打底:优化 pass@K 与采样多样性 2. RLVR(可验证奖励强化学习) · 算法:CISPO(token 级重要性采样,长轨迹不被短样本稀释) · 异步采样:vLLM sidecar + 窗口 FIFO 队列,缓解 Agent rollout 长度差异 · 双环境联合训练:Terminal(ReAct + bash)+ SWE(SWE-Agent) · 奖励:单元测试二值奖励;无效工具调用/不可解析输出得 0 分 3. 跨 Harness 泛化 · 训练时暴露多种 Agent 脚手架(SWE-Agent、mini-SWE、OpenCode 等) · 二阶段 SFT 中约 6% 为其他 benchmark harness 数据 · OpenCode 评估约 +10%;mini-SWE-Agent 上 pass@1 达 61.0%,属「免费迁移」 SFT 结束时:SWE-Bench Verified pass@10 = 80.2%,Terminal-Bench v2 pass@10 = 55.1%。RL 后 Terminal pass@1 +7.9%,SWE pass@1 +3.0%;轨迹更短、无效工具调用更少。 # 基准表现 Agent 编程(核心卖点) · Artificial Analysis Coding Index:33.4 · 同量级开源中领先 Qwen3.5 35B-A3B、Gemma 4、Devstral Small 2 等 · 甚至超过 Nemotron 3 Super(120B)、Mistral Small 4(119B)等更大模型 · 仍略低于 Qwen3.6 35B-A3B(约 35.2) 评测集:SWE-Bench Verified/Pro、Terminal-Bench v2/Hard、SciCode、LiveCodeBench v6 Harness:SWE-Agent v1.1.0、ReAct+Tmux、Terminus-2 等;temperature=1.0,top_p=0.95,3 seed 平均 非编程 Agent 任务偏弱(第三方汇总):GDPval-AA ~14%,τ²-Bench Telecom ~37%,Agentic Index 综合约 21.7——专精编程,非通用 Agent。 推理速度(对比 Devstral Small 2,Cohere 内部测试) · 同并发下输出吞吐最高约 2.8× · 词间延迟约 -30% · TTFT 略逊于 Devstral Small 2 # Agent 能力设计 模型原生支持交错思考与工具调用,格式类似 Cohere Command 系列: <|START_THINKING|> ... <|END_THINKING|> <|START_ACTION|> [JSON tool calls] <|END_ACTION|> <|START_TOOL_RESULT|> ... <|END_TOOL_RESULT|> <|START_RESPONSE|> ... <|END_RESPONSE|> 使用要点: · 必须把 reasoning/thinking 一并写入对话历史,否则效果下降 · 工具描述建议用 JSON Schema · 推荐采样:temperature=1.0,top_p=0.95 · 需较新 Transformers 源码、vLLM main + cohere_melody>=0.9.0 面向场景:子 Agent 编排、系统架构理解、Code Review、终端操作、多步软件工程。

译Cohere 推出首个开源编程模型 North Mini Code(MoE 30B/3B,128 专家,每 token 激活 8 个),支持 256K 输入/64K 输出,最低 1×H100(FP8)。训练采用三阶段后训练:级联 SFT(含 Agent 工具调用与推理数据)→ RLVR(CISPO 算法,异步采样,Terminal+SWE 双环境联合训练)→ 跨脚手架泛化。Agent 编程方面,Artificial Analysis Coding Index 达 33.4,同量级开源中领先 Qwen3.5 35B-A3B、Gemma 4 等,超过 Nemotron 3 Super 120B,稍低于 Qwen3.6 35B-A3B(约 35.2)。推理速度对比 Devstral Small 2 最高约 2.8×,词间延迟约 -30%。非编程 Agent 任务偏弱。推荐 temperature=1.0、top_p=0.95。

Deedy@deedydas · 6月10日69

Claude Fable 5 is by far the most ridiculous model that makes me genuinely afraid for the future of software engineering. I compiled the top 10 most unbelievable things I've seen Claude Fable 5 do today: — Migrate a 50M line codebase from Stripe in a day (humans take 2mos) — Draw amazing 3D graphics a) Boeing 747 b) space simulations with >5000 objects c) Minecraft roller coasters d) full photorealistic forest scenes e) NYC skyline f) stormy clouds) — One-shot Pokemon FireRed the game — Optimize a real world proprietary interaction net evaluator 10x more than the next best model, gpt5.5 AND it's about the same price as GPT 5.5 ($10/M input, $45/M output) vs Fable 5 ($10/M input, $50/M output) and 6x cheaper than GPT 5.5 Pro.

译Claude Fable 5 一天内迁移 Stripe 5000 万行代码库(人类需 2 个月);绘制逼真 3D 图形(波音 747、超 5000 个对象太空模拟、Minecraft 过山车、写实森林、纽约天际线、暴风云);一次性通关宝可梦火红版;优化实际交互网络求值器,效果比 GPT 5.5 好 10 倍。价格相近:输入 $10/M,输出 $50/M(Fable 5)vs $45/M(GPT 5.5),且比 GPT 5.5 Pro 便宜 6 倍。

meng shao@shao__meng · 6月10日53

如果你对 Claude Fable 5 到底有多贵还没有概念,咱们做个简单对比。 Claude Fable 5 和 Step 3.7 Flash 官方 API 价格倍数: · 输入 ≈ 50 倍 · 输出 ≈ 50 倍 · 缓存命中输入 ≈ 100 倍 如果再算上 Claude Fast Mode (速度 x 3,价格 x 6) · 输入 ≈ 300 倍 · 输出 ≈ 300 倍 · 缓存命中输入 ≈ 600 倍 而 Fast Mode 下,其实还是 Step 3.7 Flash 输出更快 😂

译博主对比Claude Fable 5与Step 3.7 Flash官方API价格:输入/输出约50倍,缓存命中输入约100倍;开启Fast Mode(速度×3,价格×6)后分别升至约300倍、300倍、600倍。作为实例,用Step 3.7 Flash完成真实Coding Agent任务:将Agent Memory运行痕迹(含memory events、structured facts、memory chunks等)生成为单文件HTML工具agent_memory_inspector.html,可查看8条事件、9条事实、8个chunk、9/9测试通过等信息,展示了模型将混乱Agent traces转化为可用检查工具的能力。

Berryxia.AI@berryxia · 6月10日15

之前买高铁票没有注意,居然直接可以选择静音车厢。 车险内没有手机外放震天响的短视频声音,旅途Vibe Coding 简直不要太爽啊! 刚刚有人外放声音,乘务员直接当场制止😂 太爽了…

小互@xiaohu · 6月10日70

好消息:Claude 重置了所有用量 官方对使用Fable 的四条建议: 1. 给它分配比之前模型能处理的更大、更具雄心的任务。 2. 将 xhigh/high 努力程度作为默认设置以获得最佳性能,med 用于更快的交互式会话。 3. 重新调整你的技能和 CLAUDE.md。针对先前模型编写的指令会让 Fable 陷入陈旧的模式,先让它运用自己的判断力。 4. 从提供任务转向提供目标。描述完成的样子以及如何验证,然后让 Fable 找到路径(/loop 和 /goal 就是为此设计的)。

译Claude 重置了所有用量。官方对使用 Fable 提出四条建议:分配比之前模型能处理的更大任务;默认使用 xhigh/high 努力程度以获得最佳性能,med 用于更快的交互式会话;重新调整技能和 CLAUDE.md,避免旧指令让 Fable 陷入陈旧模式;从提供任务转向提供目标,描述完成样貌并让 Fable 通过 /loop 和 /goal 自行寻找路径。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月11日
17:34
Peter Steinberger 🦞@steipete
精选78
一个简单的循环:告诉 Codex 维护你的仓库,每5分钟唤醒一次,将工作直接分配到线程。这样可以轻松按需并行化和导向工作。 我使用一个编排器技能,结合我的分类+自动审查+计算机使用技能,因此部分工作可以自主落地。
智能体开源/仓库编码

推荐理由:Peter Steinberger 这个 orchestrator + triage 的技能组合,让 AI 代理能近乎自主地维护 repo,做开源项目的可以直接抄。
14:25
向阳乔木@vista8
50
Codex Goal指令让AI自主开发网站运行10小时

推文称Codex的Goal指令功能强大,一个网站开发任务已连续运行10小时,AI自动完成开发、测试、部署和上线,且功能持续完善。作者预告的AI资讯订阅RSS站已开放体验,链接为 https://rss.qiaomu.ai/。

智能体OpenAI教程/实践编码
13:22
宝玉@dotey
71
宝玉改用Fable 5,称其处理复杂任务更省心但很贵。他建议不依赖单一模型,应组合使用:Opus 4.8写作弱但UI和系统设计强,可用Claude Design设计后分别交给GPT-5.5和Opus 4.8实现对比。在Claude Code和Cursor中,Opus 4.8除写作外效果良好,需针对性调提示词。

宝玉: 你不能指望一个模型在什么地方都是最强的,要像渣男一样才能用好 AI:去爱很多模型,去发掘他们的优秀点,东食西宿,组合着用 Opus 4.8 在写作不太行,但是在 UI 设计,UI 实现比 GPT-5.5 要好很多,推荐你多用用 Claude...

智能体AnthropicOpenAI教程/实践
11:57
Tibo@thsottiaux
64
可以确认,过去 48 小时内我们观察到 Codex 的 token 消耗量出现了强劲增长。我们并未发布新产品,因此这一情况不同寻常。

Dylan Patel: Usage share of OpenAI grew vs Anthropic yesterday despite Mythos 5 / Fable 5 launch Multiple power users at SemiAnalysis...

AnthropicOpenAI现象/趋势编码
11:21
小互@xiaohu
49
Claude Fable 5 制作黑洞诞生动画体验

用户用Claude Fable 5制作黑洞诞生过程动画页面。起初仅用一句话描述,效果不佳;重新明确要求炫酷动画、文字字幕解说及配音(本地TTS效果一般)。最终输出效果炸裂。体验表明,目标导向越清晰越好,模型会自主思考、主动打开浏览器预览并自行调整,整个流程无需用户介入。

Anthropic教程/实践编码
09:55
Rohan Paul@rohanpaul_ai
60
SemiAnalysis 实测发现,AI 订阅计划对重度编码/聊天用户而言比 API 调用便宜 40-70 倍;API 仅在需要自动化或产品集成时更划算。$200/月的 ChatGPT Pro 可提供约 $14,000/月的 API 等价用量,$200/月的 Claude Max 20x 可提供约 $8,000/月。该机构购买了 Anthropic 和 OpenAI 各档订阅,随机运行长时编码任务直至周限额,证实实际订阅额度远比普遍认为的($200 对应约 $2,000 API 价值)更慷慨。

SemiAnalysis: Recently, we purchased one of each Anthropic/OpenAI subscription plan and randomly ran long horizon coding tasks until w...

AnthropicOpenAI现象/趋势编码
09:25
meng shao@shao__meng
75
小米发布MiMo Code:基于OpenCode的Coding Agent,14天5人Vibe Coding完成

小米发布MiMo Code,一款基于OpenCode fork开发的Coding Agent。由5人团队在14天内通过Vibe Coding完成,保留OpenCode核心能力,叠加记忆、上下文管理、子智能体编排、Goal驱动自主循环、Compose工作流及Dream/Distill自我进化机制,技术栈为TypeScript+Bun。内置MiMo Auto限时免费通道(零配置),支持小米MiMo平台OAuth、Claude Code认证迁移及任意OpenAI兼容API。作为MiMo-V2.5系列模型的官方配套Harness,模型能力与框架深度耦合。已开源至GitHub。

Fuli Luo: A strong model evolution needs a solid harness system, and vice versa. 14 days, 5 people, one vibe-coding journey - and ...

智能体MCP/工具产品更新开源生态
09:25
向阳乔木@vista8
53
Codex Goal指令驱动网站迭代,开源AI RSS阅读器即将上线

用户发现Codex的Goal指令无需精确可衡量目标也能有效执行。设定“迭代优化网站使其更精致易用”的目标后,第一版由Claude Fable 5生成,后续迭代交由Codex负责,运行6小时即新增多项功能。预计下周开源一个在线AI资讯RSS订阅网站,支持内容自动更新、AI转写与双语对照阅读,用户可配置大模型进行AI对话和翻译,所有翻译及人工点评将沉淀为共享资产。当前网站已上线但需优化,开放内测邀请。

OpenAI教程/实践编码
09:09
Berryxia.AI@berryxia
精选76
mlx-vlm v0.6.3 上线,首发支持 DiffusionGemma 和 North Mini Code 1.0。DiffusionGemma 采用全新架构:以 256 token 块为单位并行生成、双向注意力、迭代自纠错;26B MoE 仅激活 3.8B,量化后 18GB 即可运行。North Mini Code 1.0 为 30B MoE,仅激活 3B,BF16 下约 66 tok/s。两款模型均通过深度合作实现 Day-0 MLX 支持,可在 Mac 本地运行。可通过 `uv pip install -U mlx-vlm` 安装体验。

Prince Canuma: mlx-vlm v0.6.3 is here 🚀 Day-0 support for TWO new models from our partners we work closely with: 🔥 @GoogleDeepMind Di...

Google产品更新端侧编码

推荐理由:Google 和 Cohere 新模型发布同日,mlx-vlm 就把它们塞进了 Mac 本地,DiffusionGemma 用扩散思路生成文本,量化后 18GB 就跑得动,属于本地党必跟的更新。
08:55
meng shao@shao__meng
62
Agentic Engineering Patterns 指南

Simon Willison 撰写《Agentic Engineering Patterns》指南(2026年2月起连载),阐述专业工程师如何用 Claude Code、Codex 等 coding agent 获得可靠可维护结果。核心区分:Agentic Engineering ≠ Vibe Coding。关键判断:写代码变便宜了,写好代码并没有。五大原则:定义边界(人的工作:定目标、给工具、验结果、把经验写回 harness)、接受新约束、囤积可复用解法、质量应上升而非下降、严守反模式(绝不自审 PR)。实操:Git 作 agent 时间机器、Subagent 省上下文、三层测试防线、线性代码导读消除认知债。

Simon Willison: @jakedahn I've been writing a whole guide! https://simonwillison.net/guides/agentic-engineering-patterns/

智能体MCP/工具教程/实践编码
08:35
AYi@AYi_AInotes
56
Cursor agent跑飞90分钟烧1382美元,CEO主动退款并承诺增加支出控制

一名PM让Cursor agent给87个ClickUp任务打标签后去开会,90分钟后回来发现agent陷入循环,消耗13亿token,账单1382美元。Cursor CEO@mntruell主动联系用户全额退款,承诺增加支出控制与自动异常检测功能,并将bug修复纳入产品路线图。原作者称赞Cursor不推诿不甩锅,把事故转化为品牌资产净增长。

Mark Ajzenstadt: BREAKING: Cursor just charged us $1,400 in 90 minutes. Our PM asked it to tag 87 ClickUp tasks. He went into a meeting. ...

智能体现象/趋势编码
08:23
ginobefun@hongming731
69
BestBlogs早报:OpenAI秘交、Anthropic政策、DiffusionGemma

OpenAI秘密提交S-1招股书,估值超8500亿美元,月收入20亿美元,ChatGPT周活突破9亿;Anthropic于6月1日提交IPO申请,

ginobefun: http://x.com/i/article/2064862052729176064

编码行业动态
08:09
Berryxia.AI@berryxia
68
小米开源MiMo-Code:终端原生AI coding助手,支持跨会话记忆与自治子代理

小米将MiMo 2.5模型接入Bloome后开源了MiMo-Code。它fork自OpenCode,新增SQLite持久记忆(跨会话)、build/plan/compose三类自主子代理、自动checkpoint、智能上下文预算,以及/dream自我提炼知识和/distill打包技能机制。支持语音输入和零配置任意OpenAI兼容模型,一键curl安装,MIT协议。引用推文称该项目由5人在14天内完成。

Fuli Luo: A strong model evolution needs a solid harness system, and vice versa. 14 days, 5 people, one vibe-coding journey - and ...

产品更新开源生态编码
06:51
宝玉@dotey
18
每天早上叫我起床的不是梦想,是 Token 刷新了!
其他编码
04:24
Xiaomi MiMo@XiaomiMiMo
76
小米 MiMo 推出开源 AI 编程助手 MiMo Code V0.1

小米 MiMo 正式开源 AI 编程助手 MiMo Code V0.1,搭载多模态模型 MiMo V2.5(限时免费),拥有百万 token 上下文窗口。核心功能包括:无限上下文与无损压缩、Agent 框架(测试/审查/验证闭环)、Compose 模式(设计先行)、自进化系统、语音输入(基于 MiMo-V2.5-ASR)。兼容 Claude Code,自动加载现有技能、MCP 服务器和命令,零成本迁移。采用 MIT 许可,支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。可通过一行命令安装。

智能体产品更新开源生态编码
03:24
Xiaomi MiMo@XiaomiMiMo
79
小米 MiMo 发布并开源 MiMo Code V0.1,终端 AI 编程助手

小米 MiMo 发布并开源 MiMo Code V0.1,一款终端 AI 编程助手。它附带多模态模型 MiMo V2.5(限时免费),支持百万 token 上下文窗口。核心特性包括:无限上下文(无损压缩,百万行项目质量不降)、深度优化的 Agent 框架(测试/审查/验证闭环)、Compose 模式(规格→计划→构建→报告)、自动学习每轮会话经验的自我进化系统、MiMo-V2.5-ASR 语音输入、与 Claude Code 兼容(可复用现有 skills/MCP/API 配置)、MIT 许可,并支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。一键安装(Mac/Linux 用 curl,Windows 用 npm install)。

智能体GitHub产品更新编码
02:54
Xiaomi MiMo@XiaomiMiMo
78
小米MiMo发布MiMo Code V0.1开源终端AI编码助手

小米MiMo开源终端AI编码助手MiMo Code V0.1,内置MiMo V2.5多模态模型(百万token上下文窗口,限时免费)。特性包括:无限上下文(无损压缩保留百万行细节)、智能体-模型协同闭环、Compose模式(规格→规划→构建→报告)、自我进化系统、语音输入(基于MiMo-V2.5-ASR)。兼容Claude Code,MIT许可,支持Anthropic、OpenAI、DeepSeek、Kimi、GLM等模型。安装:Mac/Linux执行curl -fsSL https://code.xiaomimimo.com/install | bash;Windows执行npm install -g @mimo-ai/cli。

产品更新开源生态编码
02:42
jason@jxnlco
23
Devin 委托另一个 Devin 执行任务,形成循环,令人忍俊不禁。已向循环警察举报。

Jared Zoneraich: Hahaha Devin delegating to another Devin will never not make me laugh

其他编码
02:34
AYi@AYi_AInotes
67
Cursor创始人Michael Truell:AI改写商业物理定律

Cursor创始人Michael Truell从12岁爱上编程,其创立的AI编码平台Cursor两年间从15人扩张至700人,服务全球60%财富500强。传统软件公司增长受制于“人越多管理越复杂”的引力,但AI打破这一规律——Agent级工具将个人生产力放大到过去一个组甚至一个部门的水平,人均创收极高。产品体验(Composer、Agent等)并非源于商业计划书,而是源自12岁少年“把想法变成现实”的初心。

Claude: Michael Truell (@mntruell) fell in love with coding at 12. The company he co-founded, @cursor_ai, went from 15 people to...

智能体现象/趋势编码
02:23
Xiaomi MiMo@XiaomiMiMo
79
小米发布 MiMo Code V0.1 开源终端 AI 编程助手

小米推出开源终端 AI 编程助手 MiMo Code V0.1,附带限时免费使用的多模态模型 MiMo V2.5,支持百万 token 上下文窗口。核心特性包括:无限上下文(自动知识积累与无损压缩)、Agent-模型深度协同(测试-审查-验证闭环)、Compose 模式(规格→计划→构建→报告)、自进化系统、语音输入(基于 MiMo-V2.5-ASR)、兼容 Claude Code(零成本迁移),以及 MIT 许可、支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等主流模型提供商。

MCP/工具产品更新开源生态编码
关联讨论 3 条公众号:小米 MiMoX:Berry Xia (@berryxia)Hacker News 热门(buzzing.cc 中文翻译)
01:45
eric zakariasson@ericzakariasson
49
旧金山的 Cafe Cursor 刚刚开业,就已经排起了长队(2000 人注册)。期待与大家见面!
编码行业动态
01:34
AYi@AYi_AInotes
61
Claude Fable 5 一句话生成完整落地页,设计趋势自搜自调

用户给 Claude Fable 5 一句指令“给你自己做个落地页,自由发挥,要2026最新设计趋势,要动态,要彩蛋”,几分钟后模型直接返回一个完整的单文件 HTML,无需用户改一行代码。更惊艳的是,它主动自己打开浏览器搜索 2026 设计趋势,自行调整配色和动效,还偷偷藏了 3 个彩蛋,完全不需要用户额外指示。用户计划让模型尝试一天全职全栈,从需求到上线独立完成一个个人网页,验证实际能力。

Anthropic教程/实践编码
01:33
ClaudeDevs@ClaudeDevs
同事件精选66
Apple开发者新消息:Foundation Models支持现在可让开发者使用Apple的Foundation Models框架来调用Claude,进行多步骤推理、代码生成和更长上下文处理。
Anthropic产品更新推理编码
同一事件,精选展示《Claude 支持 Apple Foundation Models 框架,推出新 Swift 包》
推荐理由:Apple 的 Foundation Models 框架终于纳入 Claude,iOS/macOS 开发者可以直接在原生环境调用强推理和长上下文能力,做 AI 应用的值得去试试集成效果。
01:25
elvis@omarsar0
67
Cohere发布了其首个开源编程模型North Mini Code。该模型小巧高效,专为智能体性能设计,并欢迎社区反馈。Elvis Saravia对此赞叹不已,期待尽快将其与自己的DAIR.AI编程智能体配合使用。

Cohere: Introducing Cohere's first open-source coding model: North Mini Code Small & efficient, designed for agentic performance...

开源生态模型发布编码
01:20
Claude@claudeai
47
Michael Truell(@mntruell)12 岁时爱上了编程。他联合创立的公司 @cursor_ai 在两年内从 15 人发展到 700 人。如今,超过 60% 的财富 500 强企业使用其 AI 编码平台。
Anthropic编码行业动态
00:44
Chubby♨️@kimmonismus
43
一个更现实的单次生成游戏的例子。要求Fable 5以《上古卷轴5:晨风》的风格重新创建一个游戏。它一次性生成了任务、货币、战斗、日志和小地图。而且它成功了。
编码评测/基准
00:44
Google AI Developers@googleaidevs
67
Google AI 发布实验性开源模型 DiffusionGemma

Google AI 发布实验性开源模型 DiffusionGemma,采用 Apache 2.0 许可证。该模型基于文本扩散方法,将生成瓶颈从内存带宽转向计算,在专用 GPU 上 token 输出速度最高提升 4 倍。推理时仅激活 3.8B 参数,量化后可适配 24GB VRAM 消费级 GPU。并行 token 生成支持自我纠错,适用于代码填充、行内编辑等非线性结构。DiffusionGemma 优先速度而非极致质量,生产场景仍推荐标准 Gemma 4。

Google开源生态模型发布编码
关联讨论 6 条Google DeepMind:Blog(RSS)X:Google DeepMind (@GoogleDeepMind)X:Demis Hassabis (@demishassabis)X:Testing Catalog (@testingcatalog)MarkTechPost(RSS)Google Developers Blog(RSS)
6月10日
21:19
Rohan Paul@rohanpaul_ai
47
有人用 Claude Fable 5,基本上通过一个提示词,在 Three.js 中构建了这个漂亮的类《孤岛危机》游戏。 Credit: @dangreenheck
Anthropic现象/趋势编码
18:40
jason@jxnlco
17
云编码智能体一个被低估的好处:当整个团队可以直接与智能体聊天时,事情可以更快推进。不需要人类工程师成为沟通瓶颈。 最好的 Slack 机器人体验是什么?Devin?

Geoffrey Litt: Underrated benefit of cloud coding agents: when the whole team can chat directly with the agent, things can move faster....

其他编码
17:40
jason@jxnlco
15
Fable 在 remotion 方面真的非常非常棒哇。
其他编码
16:33
OpenCode@opencode
70
DeepSeek V4 Pro 现已在 OpenCode Zen 上线。
DeepSeek产品更新编码
13:23
歸藏(guizang.ai)@op7418
62
CodePilot v0.56.0 发布:新增Fable 5及小米模型

CodePilot v0.56.0 发布,新增 Claude Fable 5、小米 MiMo UltraSpeed 模型及通用 OpenAI 兼容第三方渠道。修复用量统计、回复状态丢失、服务商列表刷新等问题,推荐所有用户升级。作者在其 26 万行代码的 CodePilot 代码库中测试 Claude Fable 5,观察其查找问题的能力。

歸藏(guizang.ai): 在我 26 万行代码的 CodePilot 代码库中尝试 Fable 5,看一下它能找出多少问题

产品更新开源/仓库编码
12:20
歸藏(guizang.ai)@op7418
49
Fable 5 漏洞分析强但写代码偏科

用户在 26 万行代码的 CodePilot 代码库中测试 Fable 5,发现其在漏洞分析和 bug 寻找方面表现出色,能找出大量问题。但在代码生成上,Fable 5 并非万能,写出的代码常有明显 bug,需要多次修复才能完成,属于偏科严重的模型。与之前的版本 4.8 相比,Fable 5 某些方面提升巨大,另一些方面虽更好但提升有限。

歸藏(guizang.ai): 在我 26 万行代码的 CodePilot 代码库中尝试 Fable 5,看一下它能找出多少问题

推理编码评测/基准
11:31
数字生命卡兹克@Khazix0918
83
Anthropic发布Claude Fable 5与Mythos 5:安全版免费至6月22日,价格公布

Anthropic今日发布Claude Fable 5(加安全限制)与Mythos 5(底层相同),价格每百万输入token $10、输出$50。即日起至6月22日,Pro/Max/Team/企业版订阅用户可免费使用Fable 5,之后仅API可用。跑分全面碾压,三方基准达SOTA。案例:Stripe用Fable 5一天迁移5000万行Ruby代码;纯视觉通关宝可梦火红;自建3D CAD编辑器并设计可打印模型;Mythos 5加速药物设计10倍,基因组学自主训练模型超越Science论文成果。

Anthropic大佬观点安全/对齐编码
关联讨论 31 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)The Verge:AI(RSS)X:Berry Xia (@berryxia)Anthropic:Newsroom(网页)X:Vista (@vista8)The Decoder:AI News(RSS)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)公众号:数字生命卡兹克
10:20
歸藏(guizang.ai)@op7418
21
在我 26 万行代码的 CodePilot 代码库中尝试 Fable 5,看一下它能找出多少问题
编码评测/基准
09:48
meng shao@shao__meng
73
Cohere 发布首个开源编程模型 North Mini Code

Cohere 推出首个开源编程模型 North Mini Code(MoE 30B/3B,128 专家,每 token 激活 8 个),支持 256K 输入/64K 输出,最低 1×H100(FP8)。训练采用三阶段后训练:级联 SFT(含 Agent 工具调用与推理数据)→ RLVR(CISPO 算法,异步采样,Terminal+SWE 双环境联合训练)→ 跨脚手架泛化。Agent 编程方面,Artificial Analysis Coding Index 达 33.4,同量级开源中领先 Qwen3.5 35B-A3B、Gemma 4 等,超过 Nemotron 3 Super 120B,稍低于 Qwen3.6 35B-A3B(约 35.2)。推理速度对比 Devstral Small 2 最高约 2.8×,词间延迟约 -30%。非编程 Agent 任务偏弱。推荐 temperature=1.0、top_p=0.95。

Cohere: Introducing Cohere's first open-source coding model: North Mini Code Small & efficient, designed for agentic performance...

智能体开源/仓库模型发布编码
09:43
Deedy@deedydas
69
Claude Fable 5 展示惊人能力:迁移 Stripe 5000 万行代码、绘制 3D 图形、通关宝可梦、优化效果远超 GPT 5.5

Claude Fable 5 一天内迁移 Stripe 5000 万行代码库(人类需 2 个月);绘制逼真 3D 图形(波音 747、超 5000 个对象太空模拟、Minecraft 过山车、写实森林、纽约天际线、暴风云);一次性通关宝可梦火红版;优化实际交互网络求值器,效果比 GPT 5.5 好 10 倍。价格相近:输入 $10/M,输出 $50/M(Fable 5)vs $45/M(GPT 5.5),且比 GPT 5.5 Pro 便宜 6 倍。

Anthropic图像生成大佬观点推理
09:17
meng shao@shao__meng
53
博主对比Claude Fable 5与Step 3.7 Flash官方API价格:输入/输出约50倍,缓存命中输入约100倍;开启Fast Mode(速度×3,价格×6)后分别升至约300倍、300倍、600倍。作为实例,用Step 3.7 Flash完成真实Coding Agent任务:将Agent Memory运行痕迹(含memory events、structured facts、memory chunks等)生成为单文件HTML工具agent_memory_inspector.html,可查看8条事件、9条事实、8个chunk、9/9测试通过等信息,展示了模型将混乱Agent traces转化为可用检查工具的能力。

meng shao: 我这次用 Step 3.7 Flash 测了一个真实 Coding Agent 任务: 把一组 Agent Memory 的运行痕迹,做成本地可检查的 Memory Inspector。 输入不是干净需求文档,是一个已有 Local Age...

智能体Anthropic编码评测/基准
09:07
Berryxia.AI@berryxia
15
之前买高铁票没有注意,居然直接可以选择静音车厢。 车险内没有手机外放震天响的短视频声音,旅途Vibe Coding 简直不要太爽啊! 刚刚有人外放声音,乘务员直接当场制止😂 太爽了…
其他编码
08:43
小互@xiaohu
70
Claude 重置用量并给出 Fable 使用四条建议

Claude 重置了所有用量。官方对使用 Fable 提出四条建议:分配比之前模型能处理的更大任务;默认使用 xhigh/high 努力程度以获得最佳性能,med 用于更快的交互式会话;重新调整技能和 CLAUDE.md,避免旧指令让 Fable 陷入陈旧模式;从提供任务转向提供目标,描述完成样貌并让 Fable 通过 /loop 和 /goal 自行寻找路径。

Anthropic教程/实践编码
‹ 上一页
1…1314151617…50
下一页 ›