AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「编码」清除
今天7月3日 周五
06:21Simon Willison 博客66llm-coding-agent 0.1a0
06:10宝玉26Vibe Coding 一年前的日常记录
04:40Boris Cherny57Claude Code 的 Artifacts 现已支持 Pro 和 Max
04:38OpenAI Developers45OpenAI开发者6月更新
04:35🚨 AI News | TestingCatalog61Claude Code Artifacts 扩展至 Pro 和 Max 用户
04:34Epoch AI61Claude Mythos预览版发布,AI漏洞发现量创纪录
04:15Yuchen Jin60Yuchen Jin 数月前预言:GPU kernel 工程师高薪岗位遭 AI 颠覆,Databricks 使用 KDA 登顶 NVIDIA 榜单
04:06ClaudeDevs59Claude Code Artifacts上线Pro和Max计划
04:04jason54Codex 自动化工作流:开发者实现邮件起草、合同修订、Bug 修复等
03:38Rohan Paul51Fable 5 分类器误判致 75% 代码路由到 Opus
01:38Rohan Paul65Claude Fable 5回归后遭严重降级:安全路由导致性能暴跌
01:21Simon Willison 博客54Geoffrey Litt 在 AIE 提出「理解以参与」理念:与编码智能体协作需避免认知债务
01:05Claude35Claude Tag 上线 Claude Fable 5
01:04Ethan Mollick49Claude Code的Fable功能强大但不适合长自主任务
01:04jason15Codex用屏幕镜像控制iPhone查附近人发短信
00:45The Decoder:AI News(RSS)50Anthropic 为 Claude Code 削减 80% 系统提示词,称 Fable 5 模型"想要更短的提示词"
00:14Hacker News 热门(buzzing.cc 中文翻译)60CursorBench 3.1
00:03Replit ⠕33Replit六月发布内容汇总
00:03Replit ⠕56Fable 5回归Replit,高努力模式上线
7月2日周四
23:33HuggingFace Daily Papers(社区热门论文)49性能优化基准是否可靠衡量编码智能体?
22:21AYi54Claude Code+Sonnet 5 十八分钟做出获奖级网站
19:29eric zakariasson66Fable 在 Cursor 中的两种高效用法
19:14Hacker News 热门(buzzing.cc 中文翻译)71精选Senior SWE-Bench:评估AI智能体作为高级工程师的基准测试
16:40Hacker News 热门(buzzing.cc 中文翻译)71精选Kimi K2.7 Code 已在 GitHub Copilot 上正式发布
14:31Berryxia.AI46Fable 5 上线 Cursor 和 Claude 桌面端
14:24数字生命卡兹克30用Claude Fable 5优化工作流,Max账号1.5小时见底
13:30Ethan Mollick60Fable单提示词生成虚拟象棋大师游戏
12:53向阳乔木59Raycast Glaze 开放:一句话生成桌面应用
12:35Rohan Paul64Godot 开源游戏引擎禁止 AI 生成代码
10:10Yuchen Jin38Databricks 凭借 AI 智能体登顶 NVIDIA SOL-ExecBench kernel 排行榜 L1 single operation 赛道
10:08小互56Claude Code 副屏:将回答转为直观页面展示
09:28HuggingFace Daily Papers(社区热门论文)52RepoRescue:LLM智能体全仓库兼容性救援实证研究
09:07meng shao77精选Emil Kowalski 发布设计工程师 Skills,让 AI 编码工具具备 UI 动画审美
08:09Hacker News 热门(buzzing.cc 中文翻译)43GLM Coding Pro 发布:面向专业开发者的编码助手
07:34Rohan Paul53Fable 5 在 HTML5 物理竞赛中表现优异,但成本是 Opus 4.8 的 6 倍、GLM 5.2 的 39 倍
07:29ginobefun43BestBlogs 早报 · 07-02:LongCat-2.0 / 本地 AI / 美图 AI 方法论 / Google ADK 2.0 / Claude Fable 5
06:56Peter Steinberger 🦞13Peter Steinberger感叹无AI生活
06:26Peter Steinberger 🦞47Codex 用计算机使用优化 OpenClaw 应用
06:07elvis33GPT-5.5设计品味不足,期待GPT-5.6
05:56Peter Steinberger 🦞50Codex 下载转录 @aiDotEngineer 会话并定制
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月3日
06:21
Simon Willison 博客
66
llm-coding-agent 0.1a0

Simon Willison 发布实验性库 llm-coding-agent 0.1a0,基于其 LLM 库演化为智能体框架,实现类似 Claude Code 的编码智能体。可通过 uvx --prerelease=allow --with llm-coding-agent llm code 运行,并提供基于 CodingAgent 类的 Python API。内置六种工具:edit_file(精确替换字符串并返回 diff)、execute_command(执行命令,超时 600 秒)、list_files(按 glob 列出文件,排除隐藏目录和 .gitignore 覆盖项)、read_file(分页读取,offset/limit 控制)、search_files(正则搜索,最多 100 条结果)、write_file(创建或覆盖文件,自动创建父目录)。已作为 slop-alpha 发布到 PyPI,支持 --yolo 等 recipe 参数。

智能体GitHub产品更新开源生态
06:10
宝玉@dotey
26
1 年前 Vibe Coding 的日常
其他编码
04:40
Boris Cherny@bcherny
57
Claude Code 中的 Artifacts 改变了我的生活。很兴奋它扩展到 Pro 和 Max!

ClaudeDevs: Artifacts in Claude Code are now also available on Pro and Max plans. Ask for an artifact, Claude writes the code, publi...

Anthropic产品更新编码
04:38
OpenAI Developers@OpenAIDevs
45
OpenAI开发者6月更新

OpenAI总结6月面向开发者的更新:DevDay 2026申请开放(截止7月10日);Codex新增Record and Replay插件、角色上下文插件、iOS应用构建插件(含应用预览);支持从Codex调用OpenAI API、Agents SDK和ChatGPT应用;与DigitalOcean集成实现云端开发环境;Codex在ChatGPT移动端全面上线,并扩展至欧洲经济区、英国、瑞士;新增浏览器上下文增强、开发者统计profile;AWS工作流集成;开放新版docs agent;API增加moderation评分和图像结果;Realtime API推动语音应用开发;持续支持开源维护者。

OpenAI产品更新编码
04:35
🚨 AI News | TestingCatalog@testingcatalog
61
Claude Code 的 Artifacts 功能现对 Pro 和 Max 计划用户开放。用户可请求 artifact,Claude 自动编写代码并实时发布到 claude.ai,同时持续更新。页面为账户私有且完全自包含,此前该功能仅在 Team 和 Enterprise 计划中提供 beta 版本。

ClaudeDevs: Artifacts in Claude Code are now also available on Pro and Max plans. Ask for an artifact, Claude writes the code, publi...

Anthropic产品更新编码
04:34
Epoch AI@EpochAIResearch
61
AI似乎正在大规模发现软件漏洞。 2026年6月,21家知名组织披露了约1,500个高危和严重级别CVE,是Claude Mythos预览版发布前月度记录的3.5倍多。
安全/对齐现象/趋势编码
04:15
Yuchen Jin@Yuchenj_UW
60
Yuchen Jin 数月前预言高薪岗位最先遭 AI 颠覆:GPU kernel 工程师曾获百万美元 offer,如今 AI agent 可自我爬山优化、写出更优内核并登顶榜单。Databricks 使用 KDA(Kernel Design Agents)框架,在 NVIDIA SOL-ExecBench kernel leaderboard L1 单操作赛道排名第一。核心框架包括 KDA、Humanize、Omnigent:Claude 写代码,Codex 审查,agent 自主长时间运行。该工作由 Databricks 与 NVIDIA、MIT HAN Lab 合作完成。

Yuchen Jin: Databricks ranks #1 on NVIDIA's SOL-ExecBench kernel leaderboard, in the L1 single operation track, powered by KDA (Kern...

智能体现象/趋势编码
04:06
ClaudeDevs@ClaudeDevs
59
Claude Code 中的 Artifacts 现在也适用于 Pro 和 Max 计划。 提出一个 artifact,Claude 编写代码,将其实时发布到 claude.ai,并在继续工作的同时实时更新。页面对你的账户私有且完全自包含。

Claude: New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...

Anthropic产品更新编码
04:04
jason@jxnlco
54
开发者 @vig_xyz 分享了其使用 Codex 自动化多种工作流程:读取邮件并根据内容在 Google Drive 起草提案;自动生成合同修订建议,经律师确认后通过 computer use 填入 DocuSign;监听 Slack 反馈频道来自动修复 Bug;通宵编写单元测试以实现 100% 代码覆盖率;在 worktrees 上并行启动 6 个线程,使 PR 可独立合并。他表示难以想象回到 IDE 甚至 vim。

Vignesh Mohankumar: i've got codex... - reading all my emails to figure out proposals to write, directly in google drive - auto-drafting con...

智能体OpenAI大佬观点编码
03:38
Rohan Paul@rohanpaul_ai
51
用户 @bridgemindai 披露一次编码会话花费 $321,其中 Fable 5 仅完成 $78(约 25%),而 Opus 4.8 被回退调用完成 $242(约 75%)。原因在于 Fable 5 的新分类器将常规编码提示误判为网络安全风险,导致大部分工作自动路由到更昂贵的 Opus 模型。Anthropic 曾称仅极少数任务会触发 fallback,但该用户实际体验与此不符。

BridgeMind: I just paid $321 for a coding session where Fable 5 refused to do the work. Here is where the work actually went: Fable ...

Anthropic安全/对齐编码评测/基准
01:38
Rohan Paul@rohanpaul_ai
65
Anthropic的Claude Fable 5(7月1日版)回归后在BridgeBench重测中表现大幅下滑:Debugging从86.2暴跌至25.9,Refactoring从73.6降至38.4,Hallucination从75.9滑落至61.7。原因是新安全护栏并非简单拒绝层,而是将标记请求路由至较弱的Opus 4.8,导致大量任务回退。Rohan Paul评论称这标志着普通人可能再也无法获得升级的前沿模型,如今只有"许可智能"。

BridgeMind: FABLE 5 CAME BACK NERFED. We re-ran the July 1st version of Claude Fable 5 on BridgeBench. The results are brutal: Debug...

Anthropic安全/对齐编码
01:21
Simon Willison 博客
54
Geoffrey Litt 在 AIE 提出「理解以参与」理念:与编码智能体协作需避免认知债务

Geoffrey Litt 在 AIE 演讲中提出「理解以参与」理念:开发者需要深入理解代码,才能在与编码智能体(coding agents)的协作中保持主动参与,避免因认知债务(cognitive debt)导致无法有效推进项目。他认为,缺乏对代码的概念流畅性会显著限制参与能力。该演讲录像将于三周内陆续放出。

智能体大佬观点编码
01:05
Claude@claudeai
35
与 Boris Cherny 和 Cat Wu 关于从 Claude Code 到 Claude Tag 的路径,以及它如何从工程团队扩展到 Anthropic 其他部门的对话。 Claude Fable 5 现已在 Claude Tag 中可用。
Anthropic产品更新编码
01:04
Ethan Mollick@emollick
49
Fable in Claude Code 确实能做到非常惊人的事情,包括非程序员也可以用,但界面并不是为管理5小时以上的自主任务而设计的。很难实时观察发生了什么并干预,你经常必须等到输出。
智能体Anthropic大佬观点编码
01:04
jason@jxnlco
15
即将使用 codex computer use 通过屏幕镜像控制我的 iPhone,查看 Find My 了解周围有谁并给他们发短信。
智能体OpenAI其他编码
00:45
The Decoder:AI News(RSS)
50
Anthropic 为 Claude Code 削减 80% 系统提示词,称 Fable 5 模型"想要更短的提示词"

Anthropic 将 Claude Code 的系统提示词削减了 80%。技术员工 Tariq Shihipar 指出,新 Fable 5 模型(Mythos 类)不再需要更多指令和示例,过多的示例反而会限制模型的想象力。Anthropic 转而通过上下文而非硬性规则来引导模型。这一变化分阶段发生:早期模型需要短提示词配合大量示例,随后提示词随模型理解能力提升而变长,如今又再度缩短。

Anthropic大佬观点编码
00:14
Hacker News 热门(buzzing.cc 中文翻译)
60
CursorBench 3.1

CursorBench 3.1 新增代码库理解、bug 查找、规划和代码审查任务,并改进了编辑任务的评分标准。排行榜显示,Fable 5 Max 以 72.9% 得分、$18.02 每任务成本居首,Fable 5 Extra High(72.0%,$13.74)和 Fable 5 High(70.6%,$10.81)紧随其后。Opus 4.7 Max 得分 64.8%、成本 $11.02;GPT-5.5 Extra High 得分 64.3%、成本 $4.37;Composer 2.5 得分 63.2%、成本仅 $0.55。共收录 36 个模型/配置,得分范围 72.9%–31.9%。

编码评测/基准
00:03
Replit ⠕@Replit
33
Replit新动态:我们六月发布的所有内容!https://x.com/i/broadcasts/1yGBeeAYwQMKN
产品更新编码
00:03
Replit ⠕@Replit
56
Fable 5 已回归 Replit! 尤其适合更长、更困难的项目。 在 Replit Agent 中开启 High effort 模式,立即在你最艰巨的项目上尝试吧!
智能体产品更新编码
7月2日
23:33
HuggingFace Daily Papers(社区热门论文)
49
性能优化基准是否可靠衡量编码智能体?

一项审计研究对GSO、SWE-Perf和SWE-fficiency三个仓库级性能优化基准进行系统性核查。重现740个任务中官方参考补丁在四种Google Cloud机器上的表现,跨机器均满足原始有效性规则的测试仅占GSO的39/102、SWE-Perf的11/140、SWE-fficiency的411/498;SWE-Perf因参考补丁运行时变化接近零而尤其脆弱。排行榜评分规则导致8个公开提交的28组成对比较中有9组排名不一致,SWE-fficiency最差十项任务权重高达58.5%-82.8%。此外,在450个可重现任务中,至少一个提交已匹配或超越参考补丁的比例达85.3%,超越未优化基线达99.8%,揭示了聚合排名掩盖的真实性能差距。

智能体编码论文/研究评测/基准
22:21
AYi@AYi_AInotes
54
Claude Code+Sonnet 5 十八分钟做出获奖级网站

推文指出,使用 Claude Code 加 Sonnet 5 仅 18 分钟就能做出获奖级的完整网站,设计与代码完成度均达到专业水准。Agent 能力提升后,复杂多步设计任务可稳定落地,质感跨越专业门槛。未来不会用 AI 的设计师将被会用的同行甩开,执行层价值加速坍缩,审美与判断力成为真正的硬通货。

智能体Anthropic现象/趋势编码
19:29
eric zakariasson@ericzakariasson
66
Fable 在 Cursor 中的两种高效用法

Eric Zakariasson 分享了 Fable 在 Cursor 中的两种用法。一是作为编排器(orchestrator),将子任务分派给 Composer 2.5 并行执行,仅在设计决策、复杂 Bug 等需要整体判断时才单独使用 Fable。有效简报需包含单一关注点、足够上下文、完成定义和简短报告。二是长时云智能体(Cloud Agents)模式,用于长期重构、多端功能或跨代码库调查,通过 iOS 应用监控并适时干预。作者还建议轮换不同模型,以保持对前沿能力的认知。

智能体教程/实践编码
19:14
Hacker News 热门(buzzing.cc 中文翻译)
精选71
Senior SWE-Bench:评估AI智能体作为高级工程师的基准测试

Senior SWE-Bench是一个开源基准测试,用于评估AI智能体完成高级软件工程师级别任务的能力。任务分功能开发与Bug修复两类:功能任务指令类似自然语言消息,采用验证智能体基于专家配方自动生成行为测试;Bug任务要求根据日志、profiling等运行时信息深入调查。排行榜显示,Claude Opus 4.8搭配Mini-SWE-Agent(max effort)通过率24.0%,Claude Sonnet 5为19.4%,GPT-5.5为16.0%,最强前沿模型在超75%任务中未能达到高级工程师级别的正确性与品味。每个功能任务平均涉及11个文件,最强智能体也需数百步完成;中位指令长度仅为SWE-Bench Pro的31%。任务来源于从库到多服务应用的仓库PR,由拥有数百次提交的工程师编写。

开源/仓库编码评测/基准

推荐理由:这个新基准把 AI 编程代理的评估拉到了更真实的复杂度,顶尖模型也只有不到四分之一的成功率,做 coding agent 的都该拿它测一测,它会比 SWE-bench 更挑出工程师的“手感”。
16:40
Hacker News 热门(buzzing.cc 中文翻译)
精选71
Kimi K2.7 Code 已在 GitHub Copilot 上正式发布

Kimi K2.7 Code 开源权重模型已在 GitHub Copilot 中正式可用,成为 Copilot 模型选择器首个可选的开源权重模型,为编程工作流提供更低成本选择。该模型由 GitHub 托管于 Microsoft Azure,按供应商列表价格以用量计费。逐步向 Copilot Pro、Pro+ 和 Max 计划用户推送,用户可在 Visual Studio Code 1.127.0 或更新版本、Visual Studio 17.14.6 或更新版本、JetBrains 1.9.1-251 或更新版本、Xcode、Eclipse 等 IDE 及 Copilot CLI、GitHub.com、GitHub Mobile 等平台中选用。后续几周将扩展至 Copilot Business 和 Enterprise,当前默认关闭,需管理员在 Copilot 设置中启用策略。

GitHub产品更新开源生态编码

推荐理由:GitHub Copilot 首次把开源权重模型放进模型选择器,Kimi K2.7 Code 作为低价选项可能会改变很多开发者的使用习惯,对个人开发者尤其友好。
14:31
Berryxia.AI@berryxia
46
Fable 5 现已可在 Cursor 中使用,用户表示不再担心封号问题。此前群友发现 Claude 桌面端也已支持 Fable 5,但部分用户尚未看到该选项。

Berryxia.AI: 我们群友Sol 已经可以看到Claude 桌面端Fable 5 可以使用了~ 我看了下我的还不行,你们可以看看行不行。

Anthropic产品更新编码
14:24
数字生命卡兹克@Khazix0918
30
用Claude Fable 5优化工作流,Max账号1.5小时见底

卡兹克建议将工作流、SOP、Skill、项目方案及代码全部用Claude Fable 5迭代优化。他称200刀Max账号仅1个半小时即烧完,于是又注册了一个新号,力争在7天内充分利用。

Anthropic大佬观点编码
13:30
Ethan Mollick@emollick
60
Fable,一个提示词:"构建一个精心设计的游戏,让我在完全不懂国际象棋的情况下,感觉自己是个出色的棋手。它应该让我感觉自己像个大师。尽情发挥元创意,但越像国际象棋越好。" https://game-seven-chess.netlify.app/
教程/实践编码
12:53
向阳乔木@vista8
59
Raycast 新开发的 Glaze 终于面向所有人,不再需要邀请内测。 Glaze 可以一句话开发桌面软件,这是要跟 AppStore 对抗啊。 下载地址见评论区
产品更新编码
12:35
Rohan Paul@rohanpaul_ai
64
Godot 开源游戏引擎禁止 AI 生成代码

Godot 开源游戏引擎发布新贡献政策,禁止“vibe coding”(AI 生成大量代码),因 AI 生成的 PR 使审阅时间成为瓶颈。大量 AI 生成代码将被禁止,仅允许代码补全等小型辅助工具。贡献者需披露是否使用 AI 辅助编写代码,同时禁止在 PR 讨论、议题、提案中使用 AI 生成文本。推文作者认为该规则执行不切实际,难以区分哪些代码是 AI 生成的。

开源生态编码行业动态
10:10
Yuchen Jin@Yuchenj_UW
38
Databricks 凭借 AI 智能体登顶 NVIDIA SOL-ExecBench kernel 排行榜 L1 single operation 赛道

Databricks 在 NVIDIA SOL-ExecBench kernel 排行榜 L1 single operation 赛道排名第一,完全依靠 AI 智能体自主运行。使用的框架是 KDA、Humanize 和 Omnigent:由 Claude 编写代码,Codex 审查代码,实现了递归自我改进。该工作由 Databricks 的 leshenj15 主导,并与 NVIDIA 及 MIT HAN Lab 的 Ligeng Zhu 和 Dongyun Zou 合作完成。

智能体编码评测/基准
10:08
小互@xiaohu
56
Claude Code 副屏:将回答转为直观页面展示

@xiaohu 开发了一个 Claude Code 副屏工具,解决 CC 回答大段文字时密集难读的问题。副屏将 CC 的回答直接转换成直观页面展示,让用户能快速理解和预览答案,并且支持交互式数据回传。

小互: 给你们看看我开发出一个什么东西 哈哈哈哈 我觉得可玩性还是非常高的😂

智能体教程/实践编码
09:28
HuggingFace Daily Papers(社区热门论文)
52
RepoRescue:LLM智能体全仓库兼容性救援实证研究

RepoRescue研究LLM智能体能否使旧仓库适应新环境,从193个Python和122个Java仓库构建基准(每个仓库原始环境通过、现代化后失败)。评估5个Python和3个Java智能体系统。Claude Code有时会编辑失败的测试;运行时阻断下,Kimi仍能救援41.5%的仓库。系统联合救援率达62.7%,超过最佳单系统10.9个百分点。需要全代码库协调修改的14个仓库上,GPT-5.2 through Codex全部通过,每个Claude Code系统最多通过2个。通过测试是初步信号:34个无人维护Python候选仓库中,22个在真实场景可用,12个通过bug排查。

编码论文/研究
09:07
meng shao@shao__meng
精选77
Emil Kowalski 发布设计工程师 Skills,让 AI 编码工具具备 UI 动画审美

Emil Kowalski 将多年 UI/动画原则沉淀为三个 Skill,使 Codex、Claude Code、Cursor 等 Coding Agents 具备资深设计工程师的审美判断。核心规则:动画必须有理由;每天 100+ 次的高频操作禁用动画;UI 动画控制在 300ms 内;只动画 transform 和 opacity;入口从 scale(0.95)+opacity:0 开始;尊重 prefers-reduced-motion(仅移除位移动画)。review-animations 以严格标准审查动画代码,输出 Before/After/Why 表格。animation-vocabulary 将模糊描述(如“弹一下的效果”)转为专业动效术语。

智能体GitHub教程/实践编码

推荐理由:Emil 把设计工程直觉变成了 AI 编码代理能理解的规则,clone 下来就能让 Claude Code 和 Cursor 产出有品味的动效,做前端的值得立刻试试。
08:09
Hacker News 热门(buzzing.cc 中文翻译)
43
GLM Coding Pro 发布:面向专业开发者的编码助手

GLM Coding Pro 在 Lite 基础上提供 5 倍用量,针对中型代码库日常开发优化,包含精选 MCP 工具,可优先访问最新旗舰模型和功能,生成速度更快。

MCP/工具产品更新编码
07:34
Rohan Paul@rohanpaul_ai
53
Fable 5 在 HTML5 物理竞赛中表现优异,但成本是 Opus 4.8 的 6 倍、GLM 5.2 的 39 倍

在 atomic.chat(本地 LLM 桌面应用)的 HTML5 物理竞赛中,Fable 5 以 A+ 成绩完成全部三个场景(火车脱轨、汽车空中碰撞、怪物卡车碾压),消耗 62,158 token,成本 $3.12。相比之下,Opus 4.8 消耗 22,280 token/$0.56,GPT 5.5 消耗 37,753 token/$1.14(在怪物卡车场景中略胜 Fable),GLM 5.2 消耗 36,246 token/$0.08 但未赢得任何场景。Fable 5 质量最佳但成本最高。

atomic.chat: Fable 5 totally crushed our new contest, but it cost 6x more than Opus 4.8! We gave 4 models the same prompt: build thre...

AnthropicOpenAI推理编码
07:29
ginobefun@hongming731
43
BestBlogs 早报 · 07-02:LongCat-2.0 / 本地 AI / 美图 AI 方法论 / Google ADK 2.0 / Claude Fable 5

美团发布LongCat-2.0万亿MoE模型(总参1.6T、激活48B),在5万卡国产算力集群完成全流程训练,SWE-bench Pro得分59.5超GPT-5.5与Claude Opus 4.6,原生支持1M上下文,已跻身OpenRouter全球调用量前三。本地AI倡导者Ahmad Osman称开源与闭源前沿差距缩小至4-8个月,但缺少搜索、工具等完整栈。美图2025年营收38.58亿元、净利润9.65亿元(同比+64.7%),AI收入占比升至76.6%,新产品上线不超1个月、半年ARR达10万美元。Google ADK 2.0引入结构化工作流运行时,结合代码执行与LLM智能体解决可靠性问题。

ginobefun: http://x.com/i/article/2072460643744223232

编码行业动态
06:56
Peter Steinberger 🦞@steipete
13
没有AI我到底是怎么活过来的? cc chefcook @theo
其他编码
06:26
Peter Steinberger 🦞@steipete
47
将 Codex 指向 OpenClaw iOS 应用的一些 Twitter 反馈后,它进行了一次初步改进。虽然还不够好,但就两个提示词而言还算不错。 特别酷的是它如何使用 computer use 来添加前后对比截图,因为没有 GitHub API。 https://github.com/openclaw/openclaw/pull/98452
智能体教程/实践编码
06:07
elvis@omarsar0
33
我真的希望 GPT-5.5 在设计和规划方面多一些"品味"。 在代码相关的其他方面,它是最好的模型。 我希望 GPT-5.6 能缩小差距。 那样的话感觉会更完整。 目前,我切换到 Opus 4.8/GLM-5.2 来修复设计问题或进行规划。
AnthropicOpenAI大佬观点编码
05:56
Peter Steinberger 🦞@steipete
50
要求 Codex 下载并转录 @aiDotEngineer 的所有会话,并根据我的兴趣进行定制。
教程/实践编码
‹ 上一页
123…50
下一页 ›