BestBlogs第100期特刊:两年里,答案变便宜,判断变贵 · AI HOT
‹ 返回
ginobefun @hongming731 67
2026-06-21 15:07 ·21小时前
AI 摘要 BestBlogs周刊第100期特刊回顾两年AI发展,核心洞察:答案变便宜,判断变贵。模型层:DeepSeek-V3(6700亿参数、每次激活370亿、训练成本约557万美元)和R1(纯强化学习推理开源)将效率与开源变成新范式。AI编程层:Codex案例中模型7小时迭代200轮测试仅改动500行代码,验证成为新瓶颈;Claude Code内部编写约80%代码。工程范式从提示词转向上下文工程。两年间模型从问答知识库长成独立执行器,人从写代码退到判断、验证和为结果负责的位置。
智能体 现象/趋势 编码
← 返回
ginobefun @hongming731 · X 67
2026-06-21 15:07 · 21小时前
AI 摘要 BestBlogs周刊第100期特刊回顾两年AI发展,核心洞察:答案变便宜,判断变贵。模型层:DeepSeek-V3(6700亿参数、每次激活370亿、训练成本约557万美元)和R1(纯强化学习推理开源)将效率与开源变成新范式。AI编程层:Codex案例中模型7小时迭代200轮测试仅改动500行代码,验证成为新瓶颈;Claude Code内部编写约80%代码。工程范式从提示词转向上下文工程。两年间模型从问答知识库长成独立执行器,人从写代码退到判断、验证和为结果负责的位置。
留下来的是效率与开源这条路,它后来基本成了国产大模型的范式,一路延续到今年的 V4。而当时满屏「英伟达完了、算力不再重要」的恐慌,现在反倒没人提了,算力需求一点没少,只是光靠堆资源就能领先的时代结束了。
→ 阅读原文(DeepSeek-V3):https://www.bestblogs.dev/article/ec521c
→ 阅读原文(DeepSeek-R1):https://www.bestblogs.dev/article/0be315
如果说 DeepSeek 讲的是模型变便宜,那另一条同样重要的暗线,是模型开始真能干活。给个刻度:2025 年 5 月的 Claude Opus 4,亮点是能在持续数小时的长任务上稳定运行,日本的乐天用它独立跑了 7 小时做代码重构;一年后,2026 年 6 月的 Claude Fable 5,据 Stripe 早期测试披露,用一天时间给一个 5000 万行的代码库做了全库迁移,而这原本是一个团队两个多月的活。从持续数小时到一天干完团队两个月的活,这个刻度一年就翻了好几番。需要说明,这个数字来自 Stripe 自己的报告。
→ 阅读原文(Claude Fable 5 与 Mythos 5):https://www.bestblogs.dev/article/11f30fed
BestBlogs 注脚:模型能力是上游,我们这种小项目在下游,水变了最先冲刷到我们。早期处理一篇长文,得先切段再逐段总结,翻译还要走「初译 → 反思 → 改进」三段式,全是为绕开模型短板搭的脚手架。换到更新更便宜的快速模型后,整篇丢进去就能稳稳读完,脚手架一层层删掉,提示词反而越写越短。模型每强一代,所有人为迁就它而堆起的复杂度,就消失一层。
## 二、AI Coding:实现变便宜,证明代码有效变贵
AI 编程这两年走得很快,从代码补全,到能自己干活的智能体,再到规约驱动。但与其按工具一个个数,我们更想从一个反直觉的故事讲起,因为它正好接着上一章那句话:能力变便宜,意味着什么变贵了。
你可能听过「编程智能体能连续干 7 小时」,容易脑补成它一口气写了十万行。但真实情况几乎相反。OpenAI 的 Codex 上有个例子:一位工程师让它跑了 7 小时,期间迭代 200 多轮测试,最后交出的代码改动只有大约 500 行,而且被合并进了主干。那 7 小时绝大部分不是在写代码,是在反复验证这 500 行到底对不对。
一句话就能讲透整个时代的切换:代码变得越来越便宜,但证明代码有效这件事,变贵了。OpenAI 的工程师提了个「新的进度单位」:衡量进展不再看写了多少行,而是看错误更少了、代码审查更顺了、对这段代码的信心更足了,哪怕改动很小。这个判断在 Claude Code、Codex、Cursor 三家身上都成立。
→ 阅读原文(GPT-5-Codex 发布全解):https://www.bestblogs.dev/article/6048ef
这一波最早是谁趟出来的?说说 Claude Code 的起源,它有点反差。它不是被规划出来的产品。Anthropic 的工程师 Boris Cherny 最早只是为搞懂自家 API,随手写了个调 API 的小聊天终端,自己都没料到终端会是终点而非起点。还有个细节:他刚加入时第一个代码请求被拒,不是写得差,而是因为那是纯手写的。到今天,据 Anthropic 内部披露,Claude Code 写了内部平均约 80% 的代码,Boris 说自己从去年 11 月起没再手写过一行。它好用的秘密不在模型多强,而在那条朴素到极致的主循环,有团队第一时间逆向它,结论就四个字:大道至简。Boris 还有句话值得记:我们不为今天的模型构建产品,而是为六个月后的模型构建产品。
→ 阅读原文(Claude Code 逆向拆解):https://www.bestblogs.dev/article/2ffaa4
→ 阅读原文(Boris Cherny 访谈):https://www.bestblogs.dev/article/f884575
把这两个故事放一起,它们说的是同一件事:实现一段代码正变成最不值钱的部分,而判断要做什么、验证做得对不对、为结果负责,成了人真正该待的位置。所以这一章留下来的,是验证闭环成了新瓶颈,人正从写代码的人往审代码的人挪;退潮的,是把「能干 7 小时」理解成「能自动写十万行」的神话。顺带提醒,上面那些 80%、90% 多的数字都是各家内部披露,参考可以,别当成行业普遍水平。
BestBlogs 注脚:我们也吃到了这波红利。上一期周刊提过一个彩蛋,我们的世界杯特刊页面,从设计到开发基本是 Claude Fable 5 做的,我们主要是提需求和验收。看着模型给你干活、自己退到审核位置上,那种感觉正好就是这一章讲的事。
这一章稍微抽象,讲的是我们和模型协作的方法这两年怎么进化。粗线条说,是从调「模型说什么」(提示词),到调「模型看什么」(上下文工程),再到调「模型在什么环境里跑、被什么约束」(Harness),最后到让模型在闭环里自己迭代(循环)。名字不重要,用两个有人物的小故事来讲。
第一个故事,是一个词怎么火的。「上下文工程」今天听着像门正经手艺,但它的走红其实是一场命名接力赛。最早把它作为正式术语讲清楚的,是 Cognition 团队的 Walden Yan;真正出圈靠两条推文,先是 Shopify 的 CEO 公开说喜欢这个说法,一周后 Andrej Karpathy 转发加码,说他更喜欢「上下文工程」而非「提示词工程」。Karpathy 给了个好懂的比喻:大模型像中央处理器,上下文窗口是内存,上下文工程就是操作系统级的内存调度。火的是一个词,但真正站住的是它背后那句话:模型已经够聪明,它做不成事,往往不是不够聪明,是你没把对的信息在对的时候喂到它面前。所以「提示工程已死」那种口号很外行,提示工程没死,只是退到了幕后。
→ 阅读原文(上下文工程命名史):https://www.bestblogs.dev/article/9edea5
第二个故事更有画面感,是一次失败。2025 年 5 月,Anthropic 想让 Claude 不是改个 bug,而是从零搭一整个 Web 应用、连续跑好几个小时。他们按当时最好的上下文工程实践搭了第一版,结果全面溃败,暴露出几个典型的坑:想一步到位、编译没过就宣布干完、没做端到端测试就标记完成。这次溃败逼出一个认知:上下文工程管的是信息往哪存、怎么取,但它不管流程,而流程得有人专门管,这一层就是 Harness。HashiCorp 创始人有句话最实在:每次发现 Agent 犯了一个错,你就工程化一个解法,让它永远不可能再犯同样的错。
→ 阅读原文(Harness 十五个月进化史):https://www.bestblogs.dev/article/5b7ab5d5
这条线推到极致,是让模型在循环里自己迭代。OpenAI 一个前沿团队做过相当激进的实验:5 个月、全程零行人工编写的代码、连合并前的人工评审都没有,交付了一个超过 100 万行的内部产品,团队里有人甚至说,一天用不到 10 亿 token 差不多就算失职了。但越是这种数字,越要记住一个词:认知投降。当你把循环当拐杖,不再理解系统在干什么,工程质量会被悄悄侵蚀(这个词我们在最后一章还会再碰到)。
所以这一章真正沉淀下来的,不是某个提示技巧,而是一个动作:人被逼着,第一次把过去藏在资深工程师脑子里的隐性判断(什么叫好、什么算对)一条条写成模型和人都能读的文字。演进的其实不是工具,是人对自己那点隐性知识的认知。
## 四、Agent:真正站住的是一套冷静的工程常识
2024 到 2025 年,Agent 这个词被用到烂大街,套壳聊天机器人也敢叫 Agent。收住这场混乱的,不是某篇雄文,而是一份冷静的官方指南。OpenAI 的《构建 Agent 实用指南》开门见山把界线画死:真正的 Agent 是能让模型自己控制工作流的系统,单步翻译、情感分类都被挡在门外。它最该被记住的是一句反直觉的话:能用确定性的流程图解决的,就别强行上 Agent。一家卖 Agent 工具的公司在劝你少上它卖的东西,分量就在这。后来连衡量方式都变了,吴恩达分享过一组数字:同一个模型直接写代码正确率约 48%,套上能自己迭代、自检的 Agent 流程,能冲到 95%,比换个更强的模型还猛。
→ 阅读原文(OpenAI 构建 Agent 实用指南):https://www.bestblogs.dev/article/551c99
Agent 之间怎么配合,行业里吵过一架。几乎同时,两家很有发言权的公司甩出标题完全相反的两篇文章,一篇《别构建多智能体》,另一篇《我们如何构建多智能体研究系统》。看着像要打起来,却被读出同一个结论:这不是立场之争,是任务形态之争。判据简单到能记一辈子:读的活适合拆开并行,写的活必须留给单体,因为多个 Agent 一起写就会互相打架、产出没法合并。Anthropic 有数据印证,广撒网做调研的任务上,多智能体比单体高了九成多,但代价是一次普通聊天用一份 token,单个 Agent 用四份,多智能体能用到十五份,只有任务足够值钱才划算。
→ 阅读原文(何时构建多智能体系统):https://www.bestblogs.dev/article/cdd786
这一章还有一条线离我们最近,就是 Skills。2025 上半年大家抢着搭 Agent,下半年关键词变成写 Skills。一句话讲明白:Skill 就是 Agent 的一份「入职培训手册」。把领域知识一次写下来,它需要时自己翻、用完就放下,物理形态朴素到一个文件夹加一个说明文件。最巧妙的是渐进式加载:平时只让模型记住技能的名字和一句简介(约 100 token),判断相关了才读完整手册,所以你能装一大堆而不撑爆上下文。它和工具调用协议不冲突,分工很清楚:协议负责让 Agent 连到外部工具,Skill 负责指挥它该怎么调、什么时候调,一个管能力,一个管知识。
→ 阅读原文(Datawhale 拆 skill-creator):https://www.bestblogs.dev/article/352c89c1
→ 阅读原文(Skill 与 MCP 的关系):https://www.bestblogs.dev/article/f02d2b60
所以这一章站住的不是某个炫酷框架,而是一套冷静常识:先问需不需要、能拆就拆、把判断和执行分开;退潮的是「万物皆 Agent、套个壳就叫智能体」的概念膨胀。
BestBlogs 注脚:为什么说 Skills 离我们最近,因为 BestBlogs 整套日常运营,从内容分析、打标、生成早报到做这期播客,背后就是几十个这样的 Skill 在驱动。我们对那句话体会很深:你不是在给人写文档,你是在给模型写指令,读者搞错了,整篇就废了。
先从一个被烧穿的套餐讲起。Anthropic 把 Claude Code 做成 200 美元/月、不限量的套餐,这已是抵御成本相当高明的设计:价格提了十倍,按负载自动把任务从最贵的模型降级到便宜的,还把一部分计算卸到用户机器上跑。结果还是被一个用户用一行简单的循环代码烧穿,那个月这人烧掉约 100 亿 token,相当于一个月读了 12500 本《战争与和平》。这件事说明一个反直觉的道理:任何订阅模式下都不存在一个行得通的固定无限价格,这不是没定够高,是物理规律。推理成本确实每年大幅下降,但降的是过期的旧模型,你真正想用的最强能力,永远不便宜。
→ 阅读原文(Token 正变得越来越贵):https://www.bestblogs.dev/article/083769
成本之外,企业把 AI 用起来最难的一步,可能和 AI 本身没关系。讲企业落地最实在的一篇,是阿里云一位 CIO 的复盘:三年里在内部落地 28 个数字人项目,它们在 HR 系统里有工号(以 AI 开头,AI001、AI002),汇报给业务部门,和正式员工一样被对待。但他用两年血泪换来的方法论里,最致命的第一步不是模型,而是重组生产关系,他甚至发现连团队对模型能力边界的认知都对不齐,得先「书同文车同轨」让全员考个 AI 认证。他还有个反焦虑的原则:别拿 AI 跟「神」比、要求 100% 正确,要拿它跟「人」比,只要比人做得更好更准就有意义。类似的话从 Block 的 CTO 嘴里也讲了出来,他管着 4000 名工程师,那句反共识的话是:最有用的改变和 AI 无关,而且很无聊,说的是把按事业部切的架构改成统一职能型,这种组织变革带来的提升超过任何单个 AI 工具。还有美图,一家 17 年的公司逼自己反惯性,据创始人内部分享,整体 AI 编码普及率已达 86%。这几家讲的是同一件事:最大的阻力从来不在模型,在组织和认知。
→ 阅读原文(阿里云 28 数字人 · RIDE 方法论):https://www.bestblogs.dev/article/80981c
把这些串起来,软件的卖法正发生根本挪动,从卖席位、卖工具,挪向卖结果。这一点在第三届红杉 AI 峰会上说得最直白:150 位顶级创始人闭门 6 小时,白板上留下一句话,下一轮 AI,卖的不是工具,而是收益。演进链很清楚:卖工具(你用它)→ 卖协作(它陪你干)→ 卖成果(它替你交付)。红杉由此判断,AI 应用的价值会超越模型本身,赢家不是谁参数多、跑得快,而是谁能把结果交付闭环做完。他们有个形象的说法:你以为 AI 在抢软件那点预算,其实它在进入工资单。峰会也有更激进的预言,比如会出现第一家只有一个人的独角兽,这些更像对未来的展望,听个方向就好,别当成已发生的事实。
→ 阅读原文(红杉:卖的不是工具,是收益):https://www.bestblogs.dev/article/1e3156
BestBlogs 注脚:我们是个特别小的团队,但这两年能把内容分析、早报、周刊、播客这一整套做下来,靠的正是把一件件事交给模型完成。卖结果我们没法替别人下结论,但模型让一个小团队能干以前一个团队才能干的活,这个变化我们实实在在踩在脚下。
这两年我们读了几十场和 AI 领袖的长访谈,他们吵的问题各不相同(AGI 还有几年、算力往哪堆、软件变成什么),但一旦落到「人该做什么」,答案出奇一致。
最有范式宣言气质的,是 OpenAI 科学家姚顺雨的《下半场》。他的判断不是哪年到 AGI,而是规则变了:AI 的下半场会从「解决问题」转向「定义问题」,在这个新阶段,怎么评估一件事做得好不好,比怎么把模型训出来更重要。他还有个扎心的观察,叫「效用问题」:AI 能拿 IMO、IOI 金牌,能力上超过大多数律师,但从整个社会的产出看,世界几乎没怎么变。配着 Karpathy 那句一起读特别有味道:编写代码已不再是一个准确的动词,他现在每天大部分时间是在向他的 Agent 表达自己的意图。写代码的门槛在塌,人的杠杆点整体往上挪了一层。
→ 阅读原文(姚顺雨《The Second Half》):https://www.bestblogs.dev/article/4e45fa
→ 阅读原文(Karpathy 谈软件 3.0):https://www.bestblogs.dev/article/c3b1e5
另一个故事更有戏剧性,主角是 Ilya。很多人把他当成扩展路线的奠基者之一,可现在他反过来给这条路踩了刹车。他给行业断代:2012 到 2020 是研究的时代,2020 到 2025 是扩展的时代,而现在「我们又回到了一个拥有巨型计算机的研究时代」。他有句话特别适合接住这一整期的主题:想法是廉价的,执行就是一切,但如果想法这么廉价,为什么没人有想法呢?把他和那些坚信「瓶颈永远是算力」的产业领袖放一起,你会发现,争的已不是要不要算力,而是该往哪个方向投,而这个判断恰恰是机器最替不了的,人的判断。
→ 阅读原文(Ilya:从扩展时代到研究时代):https://www.bestblogs.dev/article/cf49760
最后落到一个更切身的问题:当机器越来越能干,人会不会在把思考外包出去的过程里,把自己也交出去。发出提醒的全是最懂技术的人。微软研究院的实证研究说,过度依赖 AI 会带来认知退化,他们用了个很刺的比喻:我们正在变成自己思想的「中层管理者」,只负责审批,不再亲自思考。iPod 之父 Tony Fadell 也提醒,仅靠几句提示词得到的东西是「软件界的快时尚,用过即溶解」,这其实就是前面工程那章说的认知投降,只是换了个更扎心的说法。还有李继刚那句中文的:工业革命拿走了人的体力,AI 正在拿走人的脑力,而留给人的,是心力。
→ 阅读原文(如何避免 AI 扼杀批判性思维):https://www.bestblogs.dev/article/75cded7
→ 阅读原文(孟岩对话李继刚:人何以自处):https://www.bestblogs.dev/article/17ad4f7
这些话听着有点重,但我们想说清楚,这不是在贩卖焦虑。跑得更快没有错,错的是连方向都一起交出去。
一百期一口气看下来,挑几个关键词的话:模型从会回答到能干活,编程里实现变便宜、验证变贵,工程上人把隐性判断写成了文字,Agent 收敛成一套冷静的工程常识,商业从卖工具挪向卖结果,最后,人从给答案转向提问题。
这六条线各讲各的,却落到同一句话上:机器越来越会回答,而越是站在最前线的人,越在提醒同一件事,答案正在变得廉价,提对的问题、守住自己的判断、为最后的结果负责,第一次比答案本身更值钱。
往前看,有三个悬念我们会接着追:Scaling 这一轮算力该往哪个方向投,Agent 经济里「卖结果」这笔账谁能第一个真正算平,以及人和机器的分工边界到底划在哪。这三个问题这一期都没有答案,因为现在也确实没有人有答案。我们能做的,是把这件还没有答案的事,老老实实交还给你自己去掂量。而这件事本身,可能就是机器暂时还替不了的那一部分。
感谢这两年,每一期都在的你。我们下一个 100 期,再见。
## 附录 · 第 100 期推荐清单(100 篇)
> 按六个主题分组,点击「阅读原文」直达 BestBlogs 详情页。带 ⭐ 的是正文重点聊到的篇目。
1. ⭐ Claude 4:AI 模型的全新突破 → https://www.bestblogs.dev/article/657929
1. Claude Sonnet 4.5 正式推出 → https://www.bestblogs.dev/article/c5766e97
1. ⭐ Claude Fable 5 与 Claude Mythos 5 → https://www.bestblogs.dev/article/11f30fed
1. 满血版 o1 深夜震撼上线,奥特曼怼脸演示超强推理!终极 Pro 版每月 1450 元 → https://www.bestblogs.dev/article/5f1b01
1. GPT-5:主要特性、定价和模型卡 → https://www.bestblogs.dev/article/cf9e79
1. GPT-5.5 发布 → https://www.bestblogs.dev/article/a6d9083a
1. Gemini 2.5 Flash:应用构建新起点 → https://www.bestblogs.dev/article/45ad64
1. Genie 3:世界模型的突破 → https://www.bestblogs.dev/article/953d22
1. Gemini 3.5:具备行动能力的前沿智能 → https://www.bestblogs.dev/article/226d66a7
1. ⭐ DeepSeek-V3 正式发布 → https://www.bestblogs.dev/article/ec521c
1. ⭐ DeepSeek-R1 发布,性能对标 OpenAI o1 正式版 → https://www.bestblogs.dev/article/0be315
1. DeepSeek-V4 预览版:迈入百万上下文普惠时代 → https://www.bestblogs.dev/article/95d5e07c
1. Qwen3 重磅开源! → https://www.bestblogs.dev/article/2601db
1. Qwen3-Coder:480B 参数的超强"代码特工" → https://www.bestblogs.dev/article/f28bb0
1. AIME'25 满分炸场!Qwen 一波七连发,全家桶大更新 → https://www.bestblogs.dev/article/76065c
1. GLM-4.5 发布:面向推理、代码与智能体的开源 SOTA 模型 → https://www.bestblogs.dev/article/704b17
1. GLM-5.1 开源:支持 8 小时独立工作的长程任务模型 → https://www.bestblogs.dev/article/a799716e
1. ⭐ MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你 → https://www.bestblogs.dev/article/46b80e9f
1. ⭐ Claude Code 究竟牛在哪里?(以及如何在你的 AI 智能体中复刻它的魔法!) → https://www.bestblogs.dev/article/2ffaa4
1. ⭐ Boris Cherny:我们如何打造 Claude Code → https://www.bestblogs.dev/article/f884575
1. Claude Code 自动模式:一种更安全的跳过权限确认方式 → https://www.bestblogs.dev/article/bf9ab35c
1. ⭐ 2 万行 App 代码,Claude 写了 95%!老开发者:每月只花 200 美元,就像一天多出 5 小时,IDE 要"变天"了! → https://www.bestblogs.dev/article/0ad934
1. ⭐ 刚刚,OpenAI 发布 GPT-5-Codex:可独立工作超 7 小时,还能审查、重构大型项目 | 机器之心 → https://www.bestblogs.dev/article/6048ef
1. Codex 与人工智能驱动的编程未来 - OpenAI 播客 Ep. 6 → https://www.bestblogs.dev/article/7a65159
1. ⭐ 下一场革命:Vibe Engineering|OpenAI 内部分享 → https://www.bestblogs.dev/article/12a291a9
1. OpenAI 内部揭秘:我们如何使用 Codex → https://www.bestblogs.dev/article/767e0b
1. Cursor 如何将编程智能体推向生产环境 → https://www.bestblogs.dev/article/f0bf0131
1. 动态上下文发现 (Dynamic Context Discovery) → https://www.bestblogs.dev/article/d20bf738
1. 与 Cursor 结对编程的四个月,我大彻大悟了! → https://www.bestblogs.dev/article/59ced7
1. 遇见全新的 Cursor · Cursor → https://www.bestblogs.dev/article/63cbae4c
1. GitHub Copilot:日处理 4 亿代码补全请求的技术解析 → https://www.bestblogs.dev/article/932b3c
1. Devin 教你做 Agent:把 AI 当做需要指导的初级开发者 → https://www.bestblogs.dev/article/abcfa6
1. 当阿里入局全球 AI Coding,战场里的 60 天 | 对话叔同:Qoder 创始人 → https://www.bestblogs.dev/article/67cc9cc
1. 当整个团队开始 0 人工 Coding:一份万字 AI Native 研发实战手册 → https://www.bestblogs.dev/article/3be156a2
1. 【第 3592 期】揭秘 Bolt.new 背后的技术 → https://www.bestblogs.dev/article/547820
1. 自主性就是你需要的一切--米歇尔·卡塔斯塔,Replit → https://www.bestblogs.dev/article/705dec8
1. Claude 工程师聊 prompt:不要把模型当小孩子、不需要角色扮演、实话实说 → https://www.bestblogs.dev/article/13fc2f
1. 程序员的提示工程实战手册 → https://www.bestblogs.dev/article/539020
1. 这篇超有用!手把手教你搭建 AI 产品 Evals → https://www.bestblogs.dev/article/5133ea
1. ⭐ 从上下文工程到 AI Memory,本质上都是在「拟合」人类的认知方式 → https://www.bestblogs.dev/article/9edea5
1. ⭐ 上下文工程(Context Engineering) → https://www.bestblogs.dev/article/195239
1. 深度解读《AI 智能体的上下文工程》:构建高效 Agent 的七个宝贵教训 → https://www.bestblogs.dev/article/db0a4d
1. 从"数据拼凑"到"精准断案":深度剖析 RAG 系统中信息完整性的关键作用 → https://www.bestblogs.dev/article/8a3ca6
1. ⭐ Harness Engineering:耗时一周,我是如何将应用的 AI Coding 率提升至 90%的 → https://www.bestblogs.dev/article/70e2f298
1. 我们如何在多个产品中约束 Claude → https://www.bestblogs.dev/article/ccb45878
1. Harness Engineering:AI 能在真正"出事会炸"的后端系统里写代码吗? → https://www.bestblogs.dev/article/e32a066c
1. 挑战 Claude Code?OpenAI Codex 发布月将至,今先揭秘智能体循环 → https://www.bestblogs.dev/article/37e72b64
1. 从 ReAct 到 Ralph Loop:AI Agent 的持续迭代范式 → https://www.bestblogs.dev/article/743dcdf3
1. ⭐ 4 亿 token 买来 5 个教训:让 6 个 AI Agent 连写 4 天代码发生了什么? → https://www.bestblogs.dev/article/2cbb4f88
1. OpenAI: 构建 AI 智能体实用指南 → https://www.bestblogs.dev/article/551c99
1. 什么是代理? → https://www.bestblogs.dev/article/a33256
1. 吴恩达:AI 智能体工作流引领人工智能新趋势 【译】 → https://www.bestblogs.dev/article/055e79
1. ⭐ 深度解析:Anthropic MCP 协议 → https://www.bestblogs.dev/article/3ae082
1. ⭐ 别再误会 MCP 了!一篇写给 AI 工程师的硬核"辟谣"指南 → https://www.bestblogs.dev/article/a5b7a0
1. 七大 MCP 支持的主流 AI 框架大盘点 → https://www.bestblogs.dev/article/371d34
1. ⭐ MCP 不止工具调用!MCP 联合创建者:绝大多数人用法都太初级!曝 MCP 五大原语、高阶玩法:丰富人机交互体验;MCP 的未来在 Web → https://www.bestblogs.dev/article/b6e256
1. 我的研发实践:高准确率 AICoding 工作流设计 → https://www.bestblogs.dev/article/dfd18b8d
1. 当 AI 智能体学会"欺骗",我们如何自保?来自火山的 MCP 安全答卷 → https://www.bestblogs.dev/article/4368dd
1. 构建安全可扩展远程 MCP 服务器指南 → https://www.bestblogs.dev/article/667606
1. ⭐ 如何以及何时构建多智能体系统 → https://www.bestblogs.dev/article/cdd786
1. ⭐ 多智能体在「燃烧」Token!Anthropic 公开发现的一切 | 机器之心 → https://www.bestblogs.dev/article/153f9e
1. 阿里云客服 Agent 业务提效实践:灵活可控的落地方法论 → https://www.bestblogs.dev/article/3e3764
1. ⭐ LangChain CEO 再聊 Agent:chat 模式只是起点,Ambient Agents 才是未来 → https://www.bestblogs.dev/article/2f1cdf
1. Agent 框架思考指南 → https://www.bestblogs.dev/article/811b52
1. ⭐ 重塑记忆架构:LLM 正在安装「操作系统」 | 机器之心 → https://www.bestblogs.dev/article/eca51a
1. ⭐ 用于自学习自主 Agents 的 Memory 与 Dreaming → https://www.bestblogs.dev/article/8bc3725
1. Notion CEO Ivan Zhao:好的 AI 产品,做到 7.5 分就够了 → https://www.bestblogs.dev/article/f8231b
1. AI Agent 的「GPT 时刻」,Manus 炸醒整个 AI 圈! → https://www.bestblogs.dev/article/031f46
1. #204. Perplexity CEO 揭秘智能体浏览器 Comet 如何重塑未来 → https://www.bestblogs.dev/article/a838722
1. OpenAI 第三期播客上线:从 ChatGPT 到智能体,AI 如何重新定义职场与科研 → https://www.bestblogs.dev/article/360922
1. 消费级 AI 应用百强榜 | a16z Show → https://www.bestblogs.dev/article/d15471b
1. Gamma 创始人最新分享:30 人即可服务 5000 万用户,AI 时代如何重构新的团队范式? → https://www.bestblogs.dev/article/f7a69b
1. ⭐ Token 成本下降,订阅费却飞涨,AI 公司怎么了? | 机器之心 → https://www.bestblogs.dev/article/083769
1. ⭐ DeepSeek 复盘:128 天后,为什么用户流量一直在下跌? → https://www.bestblogs.dev/article/25d067
1. 一年成爆款,狂斩 49.1k Star、200 万下载:Cline 不是开源 Cursor,却更胜一筹?! → https://www.bestblogs.dev/article/9955ed
1. 比女皇报告还炸裂!67 页 AI 深度调研刷屏,全球 LLM 大决战真正开始 → https://www.bestblogs.dev/article/b94eb3
1. 动态计算:我们如何构建无服务器服务器 - Vercel → https://www.bestblogs.dev/article/28372b
1. 复盘 2024,大模型的商业化主线是什么? → https://www.bestblogs.dev/article/600fc9
1. ⭐ 阿里云 CIO 首次系统复盘:大模型落地的 RIDE 方法论与 RaaS 实践突破 → https://www.bestblogs.dev/article/80981c
1. ⭐ Block 如何成为全球领先的人工智能驱动型企业 | Dhanji R. Prasanna → https://www.bestblogs.dev/article/7fd3a66
1. ⭐ AI Native 时代 -- 研发组织何去何从 → https://www.bestblogs.dev/article/8c2c877a
1. ⭐ 脉搏:前场部署工程师再度火热 → https://www.bestblogs.dev/article/2e174723
1. ⭐ 红杉 AI 峰会闭门 6 小时,150 位创始人共识浮现:AI 不再卖工具,而是卖收益 → https://www.bestblogs.dev/article/1e3156
1. 奥特曼万字访谈:揭秘 GPT-5 幕后艰辛,宣告超级智能前夜已至 → https://www.bestblogs.dev/article/d1dc03
1. Sam、Jakub 和 Wojciech 谈 OpenAI 的未来,附观众问答 → https://www.bestblogs.dev/article/cc040a9
1. 关注 AI 必读!Anthropic CEO 万字长文-预测强人工智能的积极未来 → https://www.bestblogs.dev/article/94f850
1. 智能的未来 | 戴密斯·哈萨比斯(DeepMind 联合创始人兼首席执行官) → https://www.bestblogs.dev/article/7d57e33
1. 和杨植麟时隔一年的独家对话:"站在无限的开端" → https://www.bestblogs.dev/article/e08d9b
1. 张宏江:我对于 AI 和大模型八点观察和看法 | AI 光年 → https://www.bestblogs.dev/article/e1362f
1. 李沐重返母校上海交大,从 LLM 聊到个人生涯,这里是演讲全文 → https://www.bestblogs.dev/article/ae87ad
1. 王小川评 OpenAI o1: 找到一条从快思考走向慢思考的路 → https://www.bestblogs.dev/article/881364
1. ⭐ 黄仁勋深度访谈:十年时间,我是怎么带领 2.8 万人超越苹果的? → https://www.bestblogs.dev/article/11eea2
1. ⭐ Ilya Sutskever - 我们正从扩展时代迈向研究时代 → https://www.bestblogs.dev/article/cf49760
1. ⭐ GPT-5 被批过度炒作、性能落后,OpenAI 联创揭秘其中原因:我们把它关在 "象牙塔",和现实世界接触不够 → https://www.bestblogs.dev/article/c88ed7
1. ⭐ Andrej Karpathy 谈软件 3.0:AI 时代的软件 → https://www.bestblogs.dev/article/c3b1e5
1. ⭐ The Second Half:一位 OpenAI 科学家的 AI 下半场启示录 → https://www.bestblogs.dev/article/4e45fa
1. ⭐ 汤道生姚顺雨对谈:腾讯 AI 的下半场 → https://www.bestblogs.dev/article/1fa6207b
1. ⭐ 如何避免 AI 扼杀你的批判性思维 | 阿德韦特·萨卡尔 → https://www.bestblogs.dev/article/75cded7
1. ⭐ iPod 与 iPhone 之父 Tony Fadell:AI 时代如何建立品味、判断力与创造力 → https://www.bestblogs.dev/article/18391e3
1. ⭐ E45 孟岩对话李继刚:人何以自处 → https://www.bestblogs.dev/article/17ad4f7
BestBlogs.dev | 发现真正适合你的高质量内容