AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「编码」清除
6月8日周一
15:20IT之家(RSS)52猎豹移动董事长傅盛谈组织改造:所有人都要用 AI 写代码,包括行政
10:04小互71Claude 写 Anthropic 超 80% 代码
09:49jason15cowork与codex功能期望互问
09:46Boris Cherny57Claude Opus 长时间运行工作最佳模型及自主运行技巧
09:37meng shao64AGENTS.md 在 Coding Agents 中真的有用吗?
09:07meng shao59不写 Prompt,写 Loops - Boris Cherny 谈 AI 编程范式转变
09:07meng shao44Warp调查:Codex App成最热门Coding Agent
08:33宝玉56谈"选HTML不选React"--宝玉的反对观点
08:28Sam Altman24Codex 百天挑战:10 倍使用限额
08:11ginobefun61BestBlogs早报:iPod之父、Codex、Coding Agent
08:11ginobefun63早报:Tony Fadell谈"知情直觉";OpenAI用Codex零人工写百万行代码;Coding Agent范式转移
07:59Berryxia.AI63OpenAI 发布 Codex 应用场景新页面,列出七大领域委托任务
07:31宝玉36Claude Code 移动端 remote control 需频繁确认
07:08Rohan Paul66MIT研究追踪超10万GitHub开发者:AI编码工具使代码量增300%,但发布仅增30%
06:48jason14Codex 几乎适用于一切任务
06:37elvis55超强AI模型即将发布:避免锁定单一供应商
06:32Tibo42Codex新按钮:每日选一人获10倍额度
05:10SemiAnalysis57NVIDIA Nemotron3 Ultra不敌Kimi K2.6和GLM5.1
04:58swyx43明天发布今年最大代码评测基准
03:50Hugging Face:Blog(RSS)27Amazing Digital Dentures(一个失败的项目)
03:45Greg Brockman68OpenAI 公布 Codex 数十个实际用例,涵盖软件工程到运维
03:11Peter Steinberger 🦞60月度提醒:设计循环提示编码智能体
01:58Hacker News 热门(buzzing.cc 中文翻译)68车床(Lathe):利用LLMs学习新领域,而非跳过
01:31宝玉74baoyu-design:在本地复现 Claude Design 的开发工作流
6月7日周日
21:58Hacker News 热门(buzzing.cc 中文翻译)54一位软件工程师发文称:LLM正在侵蚀我的职业生涯,我不知所措
21:37Rohan Paul63OpenAI 为 IPO 筹备 ChatGPT 最大规模改版,转向超级应用
21:28Hacker News 热门(buzzing.cc 中文翻译)67Symbolica 2.0:适用于 Python 和 Rust 的可编程符号系统
18:50Hugging Face:Blog(RSS)70精选Her · हेर - Claude Code 会话分析工具
17:57Hacker News 热门(buzzing.cc 中文翻译)48Tokenomics:量化模型token在智能体软件工程中的应用
16:27Hacker News 热门(buzzing.cc 中文翻译)61现在我用Claude进行设计的时间比用Figma还要多
15:19IT之家(RSS)67消息称 OpenAI 将对 ChatGPT 进行大升级,将其打造为超级应用
12:31小互69OpenAI计划将ChatGPT改版为超级应用
11:56Hacker News 热门(buzzing.cc 中文翻译)67Harness 工程:在智能体优先的世界中运用 Codex
11:00宝玉68Cursor 推出本地运行的设计模式
10:29宝玉76精选Cursor Design:浏览器元素标注变设计工作室
10:13Greg Brockman62Codex少用反思:多因自身原因非模型能力
08:20Elon Musk42最新Grok Build修复Grep超时问题
08:09ginobefun60BestBlogs 早报 · 06-07|多智能体编排、MCP 接口设计、缓存命中率
07:13MiniMax (official)60M3与Opus代码审计13个bug:$0.07 vs $1.30
06:04Rohan Paul62Claude Code创始人Boris Cherny:AI应赋予工具和自由
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月8日
15:20
IT之家(RSS)
52
猎豹移动董事长傅盛谈组织改造:所有人都要用 AI 写代码,包括行政

猎豹移动董事长兼CEO傅盛今日接受访谈,总结了用AI改造组织体系的四个步骤:一把手自己得懂;全员思想变革;所有人都要用AI写代码,包括行政;建立以年轻人为核心的“特区”。傅盛早在2019年就表示人工智能业务走在正确道路上,并相信未来10到20年AI会把人从繁重工作中解放出来,让人有时间阅读、提升、寻找自我。

现象/趋势编码
10:04
小互@xiaohu
71
Claude 写 Anthropic 超 80% 代码

Claude 现在写了 Anthropic 大部分代码 截至 2026 年 5 月,合并进 Anthropic 代码库的代码里,超过 80% 是 Claude 写的。 而在 2025 年 2 月 Claude Code 发布前,这个比例还只有个位数...

小互: http://x.com/i/article/2063076298592051200

Anthropic编码行业动态
09:49
jason@jxnlco
15
cowork 有哪些你希望 codex 也有的功能?反之亦然?
OpenAI其他编码
09:46
Boris Cherny@bcherny
57
Claude Opus 长时间运行工作最佳模型及自主运行技巧

多项基准显示 Claude Opus 是长时间运行工作的最佳模型。SWE-Marathon 基准评估编码智能体在 10 亿 token 预算下自主完成长期软件任务(如重写 JAX 代码为 PyTorch、用 Rust 构建 C 编译器)。Opus 在此类任务上领先。Boris Cherny 给出 5 个技巧:使用自动权限模式避免审批;用动态工作流协调数百/数千个智能体;用 /goal 或 /loop 推动持续执行;在云端使用 Claude Code(桌面/移动端)以便关闭笔记本;确保 Claude 能端到端自验证——Chrome 扩展验证网页、iOS/Android 模拟 MCP、启动完整后端服务。

Rishi Desai: Can coding agents stay coherent over a 1 billion token budget? Can they build Slack from scratch? Rewrite a JAX codebase...

智能体AnthropicMCP/工具教程/实践
09:37
meng shao@shao__meng
64
AGENTS.md 在 Coding Agents 中真的有用吗?

论文大规模实证检验 AGENTS.md 等仓库级上下文文件对编码 Agent 的影响。在 SWE-bench Lite(300 任务)和新建 AGENTBENCH(138 任务)上测试 Claude Code、Codex、Qwen Code 等组合。核心发现:LLM 自动生成的 context file 在 8 组设置中 5 组成功率下降,平均 -0.5%(SWE-bench)/-2%(AGENTBENCH),成本增加 +20%+;开发者手写仅平均 +4%。冗余假说:移除其他文档后,自动生成反而 +2.7%。建议避免自动生成,精简测试/lint 命令,优先写入仓库专用工具。

Sebastian Raschka: http://x.com/i/article/2063647807437705216

智能体arXiv编码论文/研究
09:07
meng shao@shao__meng
59
不写 Prompt,写 Loops - Boris Cherny 谈 AI 编程范式转变

Anthropic Claude Code 负责人 Boris Cherny 表示,他不再手动写提示词,而是编写 Loops 让 AI 自主决策和解决问题。伴随 Claude Opus 4.8 和 GPT-5.5 等高智能模型出现,手把手写 Prompt 的模式将被取代。但 Loops 方案消耗 Token 过快,一个 Goals 可能耗尽 5 小时用量,企业仍需严格审查 Token 消耗的 ROI,因此实践中会通过前置的 Spec、AGENTS.md 等约束让 AI 做确定性可控的部分。Boris 预测这一转变将在今年剩余时间持续。

Rohan Paul: "I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...

智能体Anthropic大佬观点编码
09:07
meng shao@shao__meng
44
你现在在用哪个 Coding Agent? Warp团队 @BHolmesDev 进行的调查得到了 2095 个投票,其中 Codex App 占到 51.1%、Warp CLI 占到 30.9%、Claude App 7.4% 没错,Claude App 只有 7.4%,因为投票中没有包含 Claude Code 😄

Ben Holmes: How do you use coding agents right now?

智能体现象/趋势编码
08:33
宝玉@dotey
56
谈"选HTML不选React"--宝玉的反对观点

宝玉不认同“选HTML而非React”的观点。首先,设计稿需要动态数据交互,HTML难以胜任,而Claude Design是UX交互工具。其次,复杂UI必须拆分为小组件,React能实现重用与低上下文修改,大型HTML则维护困难。再者,React天然形成结构化树形设计,方便coding agent开发,HTML结构割裂、难以与设计映射。至于文章说模型注意力需放在React运行准确率上,宝玉认为当前大模型能力已使此问题不复存在。

向阳乔木: http://x.com/i/article/2063275048157458432

大佬观点编码
08:28
Sam Altman@sama
24
Codex 推出了一个新的"大按钮"。在接下来的 100 天里,每天会选出一位用 Codex 做出了令人印象深刻或极其有用工作的人,给他们一个月的 10 倍使用限额,看看他们能做出什么。明天开始第一个。Sam Altman 评论称"这里可能有个有趣的递归循环"。

Tibo: I have a new kind of big button that I can press for Codex. Over the next 100 days, we will select one person per day wh...

OpenAI大佬观点编码
08:11
ginobefun@hongming731
61
BestBlogs早报:iPod之父、Codex、Coding Agent

BestBlogs早报06-08聚焦三篇AI工程实践精讲:iPod之父Tony Fadell系统阐述“知情直觉”与“三代法则”,警告AI时代的“认知投降”和“快时尚软件”;OpenAI工程团队分享使用Codex

智能体OpenAI现象/趋势编码
08:11
ginobefun@hongming731
63
早报:Tony Fadell谈"知情直觉";OpenAI用Codex零人工写百万行代码;Coding Agent范式转移

今日早报聚焦AI产品与工程前沿:iPod之父Tony Fadell提出创新依赖“知情直觉”而非数据,并总结“三代法则”;OpenAI内部用Codex全程零人工代码交付约100万行代码,合并1500个PR,效率为手写代码10倍;Thoughtworks专家梳理Coding Agent范式转移,指出Context Engineering是双向放大器,并强调Harness Engineering构建安全网;Anthropic首次公开内部Claude Code Skills经验;OpenAI计划将Codex并入ChatGPT打造超级应用。

ginobefun: http://x.com/i/article/2063761613795270656

智能体AnthropicOpenAI编码
07:59
Berryxia.AI@berryxia
63
OpenAI 发布 Codex 应用场景新页面,列出七大领域委托任务

OpenAI 发布 Codex 应用场景新页面,展示各团队已委托编码代理执行的七大类任务:工程开发、产品开发、质量测试、安全检查、数据分析、内部工具及生命科学工作流程。具体案例包括审查 GitHub PR 并理解大型代码库、将截图转为响应式 UI、模拟真实用户操作进行 QA 测试、重构老旧代码与数据迁移、修复安全漏洞、撰写 PRD、分析数据集、开发内部应用及辅助生命科学研究。页面表明编码代理正从演示阶段融入日常工作。

Mark Kretschmann: OpenAI just published a new Codex use-case page, and it's basically a catalog of what teams are already handing over to ...

智能体OpenAI产品更新编码
07:31
宝玉@dotey
36
Claude Code 虽然移动端可以 remote control,但是 plan 后不能 bypass permission,需要不停的确认,神烦
Anthropic大佬观点编码
07:08
Rohan Paul@rohanpaul_ai
66
MIT研究追踪超10万GitHub开发者:AI编码工具使代码量增300%,但发布仅增30%

麻省理工新研究追踪超10万GitHub开发者使用三代AI编码工具(自动补全、交互式agent、自主agent)的生产漏斗。自主AI agent使代码提交数提升180%,但实际发布仅增30%。代码量激增近300%,经人工审核后收益降至150%,最终发布仅增约30%。研究估算替代弹性为0.25,即AI能力大幅提升时仅能替代少量人类工作。应用市场同样显示新应用数量增加,但总使用量未升。瓶颈在于人类仍需负责审查、测试、打包和发布等环节,AI加速的局部任务并未转化为同等产出增长。

Rohan Paul: FT publisehd a piece. AI is raising software supply faster than demand. AI is producing far more work inside companies, ...

GitHub编码论文/研究
06:48
jason@jxnlco
14
但这……"Codex 几乎适用于一切"。
OpenAI大佬观点编码
06:37
elvis@omarsar0
55
超强AI模型即将发布:避免锁定单一供应商

未来几周将有超强AI模型发布,模型能力可能迎来阶段性提升。DAIR.AI创始人Elvis Saravia认为,当前最大的错误是从成本或工程角度锁定单一供应商,建议开始利用模型组合(包括开源模型),保持“模型无关”,以便随时切换模型以发挥其各自优势。对于编程智能体,开源模型表现已媲美前沿模型。他建议将“AI模型路由”作为核心策略,高效分配任务/工作给不同模型,这是一项高回报的AI工程投入。

智能体大佬观点编码
06:32
Tibo@thsottiaux
42
我有了一个新的巨型按钮,可以为 Codex 按下。在接下来的 100 天里,我们将每天挑选一位用 Codex 做出令人印象深刻或极其有用工作的人,给他们一个月的 10 倍使用额度,看看他们能做出什么。明天是第一个。
OpenAI编码行业动态
05:10
SemiAnalysis@SemiAnalysis_
57
NVIDIA的新Nemotron3 Ultra在TerminalBench等编码任务上被Kimi K2.6和GLM5.1击败。为了让全球Nemotron联盟训练委员会训练前沿开源模型,黄仁勋应邀请至少以下一家前沿AI实验室加入委员会:DeepSeek、MoonshotAI、MiniMax、Qwen、StepFun、zAI GLM。
开源生态编码评测/基准
04:58
swyx@swyx
43
swyx 宣布明天将发布"今年最大的代码评测基准"。他在引用推文中提到,已有第二家初创公司基于他的播客内容开展销售和评测,并感慨播客直接或间接影响了许多人的职业路线。

swyx: lol heard a 2nd startup today that has made sales and evals based on this podcast its fun to be "just an interviewer", b...

编码评测/基准
03:50
Hugging Face:Blog(RSS)
27
Amazing Digital Dentures(一个失败的项目)

受《神奇数字马戏团》启发,作者尝试用 Nemotron 30b 构建一个数字宠物,自动生成以 Three.js 实现的冒险游戏,起初作为过度工程化的待办列表,后转向纯冒险生成。长提示、技能卡及 RAG 方案均未产出可运行游戏(常出现空白屏幕)。项目最终转型为简单的 HTML 玩具制作器,能一次生成时钟、待办列表、贪吃蛇、打砖块,但俄罗斯方块等复杂项目仍会崩溃。作者正寻求新方向。

其他编码
03:45
Greg Brockman@gdb
68
OpenAI 公布了数十个 Codex 实际工作流程,展示团队如何用其自动化任务。用例包括:管理收件箱并草拟回复、审阅 GitHub PR、将 Figma 设计转为代码、理解大型代码库、自动分类 bug、用自然语言查询数据集、从提示词部署应用、构建 Mac/iOS 应用、自动创建幻灯片、将 Slack 对话转为编码任务、用 AI 动作操控电脑。Codex 正从 AI 助手演变为 AI 队友。

Suraj Sharma: OpenAI just published dozens of real-world workflows showing how teams are using it to automate work. > Manage your inbo...

智能体OpenAI教程/实践编码
03:11
Peter Steinberger 🦞@steipete
60
这是您的月度提醒:您不应再手动提示编码智能体了。 您应该设计循环来提示您的智能体。
智能体教程/实践编码
01:58
Hacker News 热门(buzzing.cc 中文翻译)
68
车床(Lathe):利用LLMs学习新领域,而非跳过

Lathe(车床)是一个基于大型语言模型(LLMs)的工具,核心理念是使用LLMs帮助用户逐步学习一个陌生领域,而非直接替代学习过程。项目托管在 GitHub 上。

GitHub产品更新开源生态编码
01:31
宝玉@dotey
74
baoyu-design:在本地复现 Claude Design 的开发工作流

宝玉分享开发模式:先用 Claude Design 设计 App UI/UX,生成 HTML+CSS+React+data.js(优于 Figma,利于 AI 理解和 Git 版本管理);再用 Claude Opus 4.8 实现 MVP(GPT 5.5 在 UI 实现上差距明显)。因反复在本地与网页间导出替换设计稿繁琐,他编写工具解析 HAR 文件、解密 Claude Design 二进制内容,分析其 Prompt 和内置组件,将核心逻辑本地化集成到 Cursor(利用网页标记功能),配合 Opus 4.8 即可本地运行。最终开源 GitHub 项目“baoyu-design”。

宝玉: 最近为了研究 Claude Design,专门写了一个工具,可以解析 HAR 文件,解密 Claude Design 传输的二进制内容,这样可以方便的看到请求的 Prompt

智能体AnthropicGitHubMCP/工具
6月7日
21:58
Hacker News 热门(buzzing.cc 中文翻译)
54
一位软件工程师发文称:LLM正在侵蚀我的职业生涯,我不知所措

一位软件工程师在个人博客中直言,大型语言模型(LLM)正逐步侵蚀其软件工程职业生涯,令其感到无所适从。文章标题为“LLMs are eroding my software engineering career and I don‘t know what to do”,在Hacker News上引发关注,获得125个点赞。作者通过亲身经历表达了对AI取代开发工作的忧虑,但未提出明确解决方案。

智能体现象/趋势编码
21:37
Rohan Paul@rohanpaul_ai
63
OpenAI 为 IPO 筹备 ChatGPT 最大规模改版,转向超级应用

OpenAI 正筹备其 ChatGPT 迄今最大规模的改版,目标将其打造成集编码、AI 智能体、图像生成和企业软件于一体的超级应用。改版将在未来几周内开始推出,重点加强编码工具 Codex,使 ChatGPT 成为企业软件、自动任务和编码工作的主要入口,以推动更高利润的企业收入,为潜在 IPO 做准备。此举显示 OpenAI 策略向 Anthropic 靠拢,后者凭借企业产品快速增长并将在今年 IPO 路演中突出这一方向。Codex 工程负责人 Thibault Sottiaux 表示:“它将超越当前界面……我们正在构建的是每个人都拥有自己的个人智能体,能在生活与工作中提供帮助。”

智能体OpenAI产品更新编码
21:28
Hacker News 热门(buzzing.cc 中文翻译)
67
Symbolica 2.0:适用于 Python 和 Rust 的可编程符号系统

Symbolica 2.0 发布,这是一款可编程符号系统,支持 Python 和 Rust 语言。该版本在 Hacker News 上获得 100 点热度。

产品更新开源/仓库编码
18:50
Hugging Face:Blog(RSS)
精选70
Her · हेर - Claude Code 会话分析工具

Her(हेर)是专为 Claude Code 设计的会话分析工具。用户上传 .jsonl 文件后,Her 用自然语言重建每轮交互,标记部署、配置变更、秘密等高风险操作并定位到具体轮次。它展示 token 消耗、所用工具、子智能体、技能和 MCP 服务器,并结合 Anthropic 与社区最佳实践给出改进建议(仅在有明确可修复模式时)。内置“Ask Her”问答功能,支持单会话与跨会话项目分析。工具不调用第三方 AI API,使用 Nemotron-Mini-4B-Instruct 模型在 Hugging Face ZeroGPU 上运行,评估引擎完全确定,模型仅负责文本生成与建议。Her 内置 Homebrew、npm、PyPI 主流 CLI 工具数据库,自动识别会话中使用的工具,并对部署工具、数据库客户端等执行活动进行标记提醒。

智能体Hugging Face产品更新编码

推荐理由:每次 Claude Code 跑完都留下一堆 JSON,没人看。Her 用一个本地小模型帮你分析会话,钱花在哪、有没有危险操作一目了然,还不把数据传出去,是个务实的小工具。
17:57
Hacker News 热门(buzzing.cc 中文翻译)
48
Tokenomics:量化模型token在智能体软件工程中的应用

一篇arXiv论文提出Tokenomics框架,量化分析模型token在智能体软件工程各环节的使用分布,揭示不同任务对token消耗的差异。

智能体OpenAI数据/训练编码
16:27
Hacker News 热门(buzzing.cc 中文翻译)
61
现在我用Claude进行设计的时间比用Figma还要多

Jane Street 博客上的一篇文章中,作者表示如今自己使用 Claude 进行设计的时间已经超过了使用 Figma。该观点引发了 Hacker News 上的讨论,原文标题即为“现在我用Claude进行设计的时间比用Figma还要多”。

大佬观点编码
15:19
IT之家(RSS)
67
消息称 OpenAI 将对 ChatGPT 进行大升级,将其打造为超级应用

据英国《金融时报》报道,OpenAI 计划对 ChatGPT 进行最大规模升级,打造超级应用,新增 Codex 代码工具和 AI 智能体功能。界面将重新设计并搭配新提示词,引导用户使用代码、图像生成及 Canva、Booking.com 等第三方服务。Codex 功能未来数周在网页端和移动端上线。目前有 200 万企业客户贡献四成营收,预计年底升至 50%。ChatGPT 周活跃用户超 9 亿,付费用户超 5000 万。OpenAI 计划数周内向美监管机构秘密提交 IPO 申请。

智能体OpenAI编码行业动态
12:31
小互@xiaohu
69
OpenAI计划将ChatGPT改版为超级应用

据英国金融时报报道,OpenAI正在准备对ChatGPT进行推出以来最大规模的一次改版。该公司计划将ChatGPT转型为结合编码工具和AI智能体的“超级应用”,并添加高管们认为能够创造更多收入的产品。

智能体OpenAI产品更新编码
11:56
Hacker News 热门(buzzing.cc 中文翻译)
67
Harness 工程:在智能体优先的世界中运用 Codex

Harness 工程在智能体优先的世界中利用 OpenAI Codex 的实践文章,6月6日发布于 openai.com,在 Hacker News 上获得 102 点热度。

智能体OpenAI教程/实践编码
11:00
宝玉@dotey
68
Cursor 的新浏览器 + 元素注释将其变成了一个设计工作室。 认识一下 Cursor Design 🎨 - Claude Design,本地运行。描述一个屏幕 → 获得精美的 HTML → 在预览中点击任何元素并说出要改什么。与 Opus 4.8 配合效果最佳。 npx skills add JimLiu/baoyu-design https://github.com/JimLiu/baoyu-design

Cursor: With Design Mode, you can now point, draw, or talk to update your UI.

教程/实践编码
10:29
宝玉@dotey
精选76
Cursor 的新浏览器和元素标注功能,使其变成了一个设计工作室。 认识一下 Cursor Design 🎨 - 在本地运行的 Claude Design。描述一个屏幕 → 获得精美的 HTML → 点击预览中的任意元素并说出要修改的内容。最佳搭配 Opus 4.8。 npx skills add JimLiu/baoyu-design https://github.com/jimliu/baoyu-skills

Cursor: With Design Mode, you can now point, draw, or talk to update your UI.

MCP/工具教程/实践编码

推荐理由:Cursor 把预览和元素注释打通,几乎是在 IDE 里塞了个 Figma,宝玉这个 skill 更让它做到张张嘴就能改界面,前端和产品经理可以马上装一个试试。
10:13
Greg Brockman@gdb
62
每当我某个任务没有用 codex 时,我都会问自己为什么,通常会发现是缺少某些上下文、需要写一条技能、或者只是没想到用它。 很少是因为任务超出了模型的能力范围。现在的过剩感觉很大。
OpenAI大佬观点编码
08:20
Elon Musk@elonmusk
42
最新Grok Build中已修复Grep超时问题

X Freeze: Grok Build update just released v0.2.31 Release Notes: Bug Fixes: • Marketplace skills without proper descriptions are n...

xAI产品更新编码
08:09
ginobefun@hongming731
60
BestBlogs 早报 · 06-07|多智能体编排、MCP 接口设计、缓存命中率

本期聚焦三大Agent工程议题:1)Emergent通过多智能体编排+定制容器,6个月实现1亿美元ARR,覆盖190国850万无编程背景用户;2)Chrome DevTools团队为MCP设计Agent接口,提出Token燃油效率、错误自愈、工具Schema设计和三层信任边界;3)OpenClacky创始人指出每个Agent功能都是一个缓存失效面,第一代RAG架构因90%召回率不足和嵌入成本高而失效。

智能体MCP/工具现象/趋势编码
07:13
MiniMax (official)@MiniMax_AI
60
对 Claude Opus 4.8 和 MiniMax M3 进行相同的代码审计:同一代码库、同一提示词,预先植入 17 个已知 bug。MiniMax M3 以 $0.07 抓到 13 个;最便宜的 Claude 运行同样抓到 13 个,花费 $1.30。MiniMax 表示这一对比非常有趣,绝对值得一读。

Kilo: We gave the same code audit to Claude Opus 4.8 and MiniMax M3. Same codebase. Same prompt. 17 known bugs planted in adva...

Anthropic编码评测/基准
06:04
Rohan Paul@rohanpaul_ai
62
Claude Code创建者Boris Cherny认为,给予AI工具和自由度比强迫其遵循固定手工工作流效果更好,因为通用学习系统扩展性更强。他透露自己已不再手动编写提示词,而是运行自动循环让Claude自行决定任务,他的主要工作是编写这些循环。他预测这种从手动提示到自动循环的转变将在今年剩余时间中成为趋势。

Rohan Paul: "I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...

智能体Anthropic大佬观点编码
‹ 上一页
1…2324252627…50
下一页 ›