AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「编码」清除
6月26日周五
06:12Claude Code:GitHub Releases(RSS)61精选Claude Code v2.1.193 发布
05:51OpenAI Developers62Codex 插件一键启动持久云开发环境
05:21OpenAI Developers66精选Codex 在 ChatGPT 移动 App 正式可用
04:45Google AI Developers55Google AI Studio 超百万 Android 应用
03:13jason38Codex 将2小时语音备忘录转化为PR与视频脚本
02:43jason14Codex用户自己选模型还是让产品决定
01:47xAI48T3code现支持SuperGrok与X订阅
01:34MarkTechPost(RSS)66DeepReinforce 发布 Ornith-1.0 开源编码模型族
00:19Berryxia.AI76精选Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模
6月25日周四
23:58IT之家(RSS)62核心研究员接连离职后,消息称谷歌重组 AI 编程小组试图追赶 Anthropic
23:53Rohan Paul72DeepReinforce 发布开源智能体编码大模型家族 Ornith-1.0(MIT 许可)
23:35Chubby♨️58Google重组AI编码突击队为"midtraining"小组,缩小与Anthropic差距
22:44🚨 AI News | TestingCatalog74DeepReinforce 发布 Ornith-1.0 系列自改进开源模型,专为智能体编码设计
22:24François Chollet71智能体编程要求清晰接口与文档
22:24gabriel65AI模型擅构思不擅决策
22:08OpenRouter:Announcements(RSS)71精选OpenRouter MCP 服务器发布
22:01Hacker News 热门(buzzing.cc 中文翻译)50"Vibe coding"被指为从开源和企业授权代码中窃取
21:58IT之家(RSS)47百度千帆 Coding Plan 停止续费,已购用户可正常使用至服务到期
18:58IT之家(RSS)60Token 消耗激增,Gartner 预测到 2028 年 AI 编程成本将超过人类开发者平均薪资
18:53Rohan Paul55CRED创始人:90%代码已由AI编写,生产率差距拉大
15:58IT之家(RSS)51GitHub 调整 Copilot Free 与 Student 计划:自动模型选择成唯一方式
15:37向阳乔木82同事件精选豆包Seed-2.1实测:编程可用,识鱼封神!同一事件,精选展示《Seed2.1 正式发布,深入 AI 生产力》
15:19Orange AI64大模型的ROI定律:字节Seedance 2.0 4K视频模型日均收益超3000万
12:07向阳乔木59飞书Cli+Codex实现对话记账
11:47OpenClaw🦞14Clawcast 首集上线:技能与部署安全
11:12jason9Jason Liu 问:认识这些吗?
10:58IT之家(RSS)48GitHub Copilot切换按量计费后6月使用量激增,创史上最佳月度业绩
10:21宝玉73宝玉分享 decode-codex 项目:反编译 Codex App
08:51meng shao47开源 Skills 系列新增「loop-me」技能:通过拷问挖掘重复模式生成工作流规格
08:51meng shao65《The Coming Loop》:AI循环工程的两层困境
08:00HuggingFace Daily Papers(社区热门论文)58代码智能体需要多少静态结构?确定性锚定效应研究
08:00HuggingFace Daily Papers(社区热门论文)66LLM程序修复代理中代码执行成本效益的实证研究
07:59Hacker News 热门(buzzing.cc 中文翻译)51PostHog工程师用多个并行Claude Code会话重写SQL解析器,速度提升70倍
07:58IT之家(RSS)68数据推翻 AI 取代论:工程师岗位成科技行业抗风险最强工种
07:37TechCrunch:AI(RSS)58前Infosys CEO Vishal Sikka创立Hang Ten Systems,挑战IT服务行业
07:10MiniMax (official)40M3成为Kimchi Coding默认模型
06:57Claude Code:GitHub Releases(RSS)35Claude Code v2.1.191 发布
06:19Nathan Lambert53GLM 5.2 以 CursorBench 成本跻身 Opus 前沿
06:07Lee Robinson65GLM 5.2 现已可在 Cursor 中试用
06:06TechCrunch:AI(RSS)70精选AI被认为会取代工程岗位,但新数据显示工程是2025年最具韧性的岗位
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月26日
06:12
Claude Code:GitHub Releases(RSS)
精选61
Claude Code v2.1.193 发布

Claude Code v2.1.193 新增 autoMode.classifyAllShell 设置,将全部 Bash/PowerShell 命令经自动模式分类器处理。自动模式拒绝原因现加入转录、拒绝提示及 /permissions 页面。新增 claude_code.assistant_response OpenTelemetry 日志事件(默认不记录,需设置 OTEL_LOG_ASSISTANT_RESPONSES=1)。Bash 模式支持实时文件路径自动补全;MCP 服务器需认证时显示启动提示。新增空闲后台 shell 命令自动内存压力回收(可禁用)。修复 /model UI 状态滞后、后台任务误取消、子 agent 隐藏同级等问题,并改进了后台 agent 启动指令、MCP 认证重连、插件自动重命名等行为。

智能体产品更新编码

推荐理由:一次扎实的工具更新,自动模式覆盖所有 shell 命令和 MCP 认证重连是最实用的改进,后台任务内存回收也解决了长期痛点,Claude Code 用户值得更新。
05:51
OpenAI Developers@OpenAIDevs
62
你现在可以通过 @DigitalOcean 的 Codex 插件,在一个提示词内启动一个持久的云开发环境。 它在你的 DigitalOcean 账户中运行,当你离开时仍会持续工作。
OpenAI产品更新编码
05:21
OpenAI Developers@OpenAIDevs
精选66
OpenAI 宣布 Codex 在 ChatGPT 移动应用中正式开放(GA),并新增一对一设备配对实现更安全的手机与电脑连接。移动端新增通知、目标、侧边聊天、文件预览及内联审阅评论功能。此前预览版已明确,用户可通过 ChatGPT 移动 App 启动新工作、审查输出、引导执行和批准下一步,而 Codex 实际继续在笔记本、Mac mini 或开发机上后台运行。

OpenAI: You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...

OpenAI产品更新编码

推荐理由:Codex 移动端全面开放,终于可以在手机端管理编码任务了,对习惯远程操控的开发者是个实用里程碑。
04:45
Google AI Developers@googleaidevs
55
AI Studio 原生 Android 应用构建功能于 2026 年 5 月宣布,目前已有超过 100 万款 Android 应用在 AI Studio 中创建。主推文调侃:等达到 200 万时,是不是该建一座真雕像?

Google AI Studio: May 2026: we announced native Android app building in AI Studio Today: more than 1M Android apps have been created in AI...

Google产品更新端侧编码
03:13
jason@jxnlco
38
Jason Liu 用两小时语音备忘录替代键盘操作,将对话转录输入 Codex,后者直接生成了产品公告、发布视频脚本和公关材料。引用推文补充,此前他与 @guinnesschen 进行了两小时漫谈,涵盖功能想法、设计哲学、AI 未来等,原始转录交给 Codex 后产出的 PR 和创意作品几乎完美捕捉了对话意图。

Guinness Chen: Yesterday @jxnlco and I had a fantastic two-hour conversation that wandered through feature ideas, design philosophy, th...

OpenAI教程/实践编码语音
02:43
jason@jxnlco
14
当你使用 Codex 时,你是想自己选择模型和推理努力程度吗? 产品应该根据任务自动选择吗? 什么会让你信任那个选择? 你是那种总是使用 extra high 的人,还是在不需要太多思考时会考虑使用 low?
OpenAI大佬观点编码
01:47
xAI@xai
48
你现在可以在 T3code 中使用你的 SuperGrok 和 X 订阅。
xAI产品更新编码
01:34
MarkTechPost(RSS)
66
DeepReinforce 发布 Ornith-1.0 开源编码模型族

DeepReinforce 发布 Ornith-1.0 开源编码模型族,基于 Gemma 4 和 Qwen 3.5 后训练,提供 9B、31B、35B-MoE(每 token 激活约 3B 参数)和 397B-MoE 四个尺寸,均以 MIT 许可在 HuggingFace 开放。与固定人工设计框架的编码智能体不同,Ornith-1.0 在强化学习中联合优化框架与解决方案,并引入三层防御(固定信任边界、确定性监视器、冻结 LLM 裁判)防止奖励黑客。旗舰版 Ornith-1.0-397B 在 Terminal-Bench 2.1 上得分 77.5、在 SWE-Bench Verified 上得分 82.4,超越 Claude Opus 4.7(70.3)但低于 Claude Opus 4.8(85)和 GLM-5.2-744B(81.0)。支持 vLLM、SGLang 等推理框架,9B 模型(bf16 约 19GB)可部署在单张 80GB GPU 上。

智能体开源/仓库模型发布编码
00:19
Berryxia.AI@berryxia
精选76
Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模

Ornith-1.0 开源模型家族发布,专注智能体编程(Agentic Coding),覆盖 9B Dense、31B Dense、35B MoE 及 397B MoE 全参数规模。在 Agent Coding 基准上达开源顶尖:SWE-Bench Verified 82.4、SWE-Bench Pro 62.2、Terminal-Bench 2.1 77.5、NL2Repo 48.2、SWE Atlas 41.2 QnA、ClawEval 77.1。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架(scaffold)与最终解决方案,让模型自主改进执行框架。全系列 MIT 开源,提供 GGUF 版本,支持 Ollama、Unsloth 等本地运行。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

智能体开源生态模型发布编码
关联讨论 1 条X:Kim (@kimmonismus)
推荐理由:Ornith-1.0 不是又刷 benchmark,而是第一次把‘任务脚手架’的生成也纳入 RL 优化,这个思路可能改变 agent coding 的训练范式。MIT 开源加 GGUF,本地党可以立刻跑起来。
6月25日
23:58
IT之家(RSS)
62
核心研究员接连离职后,消息称谷歌重组 AI 编程小组试图追赶 Anthropic

知情人士透露,谷歌正对其主攻AI编程工具的专项攻坚小组进行重组,调整模型训练思路,既要提升代码能力,也要强化生成演示文稿等其他场景能力。重组发生在乔纳斯·阿德勒和亚历山大·普里策尔计划离职并转投Anthropic之后,两人均为Gemini模型关键贡献者。近期谷歌流失人才还包括诺贝尔奖得主约翰·詹珀(同样跳槽Anthropic)以及Gemini联席负责人诺姆·沙泽尔(将加盟OpenAI)。另据消息,谷歌下一代前沿模型Gemini 3.5 Pro发布时间已推迟至7月。

AnthropicGoogle编码行业动态
23:53
Rohan Paul@rohanpaul_ai
72
DeepReinforce 发布开源智能体编码大模型家族 Ornith-1.0(MIT 许可)

DeepReinforce 发布 Ornith-1.0,一个 MIT 许可的开源智能体编码大语言模型家族,涵盖 9B Dense、31B Dense、35B MoE 及旗舰 397B MoE(17B 活跃参数)。旗舰模型在 SWE-Bench Verified 上取得 82.4,Terminal-Bench 2.1 上取得 77.5,均超越 Claude Opus 4.7;并在 SWE-Bench Pro(62.2)、Multilingual(78.9)等基准上达到开源同尺寸最佳。模型基于 Gemma 4 和 Qwen 3.5 后训练,采用新型自我改进策略:强化学习不仅生成解决方案,还联合优化任务特定的 scaffold(包含计划、记忆模式、工具节奏、错误处理等)。最小的 9B 模型也在 SWE-Bench Verified 上达到 69.4。全部模型以 MIT 许可证发布,支持商用与研究。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

智能体开源生态模型发布编码
23:35
Chubby♨️@kimmonismus
58
Google重组AI编码突击队为"midtraining"小组,缩小与Anthropic差距

Google将数月前成立的AI编码突击队扩展为更正式的“midtraining”小组,位于预训练与后训练之间,旨在提升Gemini编码能力,并延伸至创建演示文稿等商业任务。此前,Noam Shazeer因计算资源变动转投OpenAI,Nobel奖得主John Jumper调至该团队后也加入Anthropic。Google承认,仅靠强大基座模型不够,编码已成为AI最明确的变现层,Anthropic借此获得收入增长。Google需专用训练、计算和更清晰的产品闭环来追赶。

AnthropicGoogleOpenAI编码
22:44
🚨 AI News | TestingCatalog@testingcatalog
74
DeepReinforce 发布 Ornith-1.0 系列开源模型,专为智能体编码设计。参数覆盖 9B Dense、31B Dense、35B MoE 和 397B MoE,基于 gemma4 和 qwen3.5 微调。采用自我改进训练策略:强化学习同时生成解决方案和任务脚手架。旗舰 397B MoE 在编码基准上匹配 Claude Opus 4.7,9B Dense 针对边缘设备优化。评测成绩包括 Terminal-Bench 2.1 77.5、SWE-Bench verified 82.4、SWE-Bench Pro 62.2、NL2Repo 48.2 等。全部模型以 MIT 许可证开源,可商用和研究使用。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

开源生态模型发布编码
22:24
François Chollet@fchollet
71
Agentic coding 迫使你设计出干净的接口,并为它们编写良好的文档。一个 AI 智能体无法读取你工程团队共享的隐性心智模型,它只能读取你的 API 合约和文档字符串。
大佬观点编码
22:24
gabriel@gabriel1
65
"嘿 Codex,给我这个页面做 20 个变体,每页一个按钮用来切换" "好,选变体 4" AI 模型很擅长头脑风暴,但不擅长做决定,所以这样用它们就好。
OpenAI教程/实践编码
22:08
OpenRouter:Announcements(RSS)
精选71
OpenRouter MCP 服务器发布

OpenRouter 推出 MCP 服务器,为编程智能体提供实时模型数据、基准排名、定价和文档查询。开发者通过一键安装(支持 Claude Code、Codex CLI、Cursor 等客户端),即可在编辑器内完成模型筛选、价格对比和测试推理,无需切换标签页。服务器整合 Artificial Analysis、Design Arena 及 OpenRouter 自身排名数据,例如推荐 GLM-5.2 作为性价比最佳的编码模型。工具集包括 models-list、model-get、model-endpoints、benchmarks 等,支持通过 chat-send 发送测试提示,比较不同模型(如 Claude Opus 4.8、GPT-5.5、DeepSeek V4 Pro)的响应、成本和延迟。API 密钥附带 7 天有效期和 10 美元消费上限,可随时撤销。

MCP/工具产品更新编码
关联讨论 1 条X:OpenRouter (@OpenRouter)
推荐理由:OpenRouter 这个 MCP 服务器让编码 agent 直接从编辑器里选模型、查价格、跑测试,省掉了切浏览器查资料的15分钟,做 AI 开发的值得立刻装上。它把模型选择变成了 agent 自己能完成的工作流,而不只是人工猜测。
22:01
Hacker News 热门(buzzing.cc 中文翻译)
50
"Vibe coding"被指为从开源和企业授权代码中窃取

Hacker News 热门讨论指出,所谓“vibe coding”并非凭直觉编写,而是窃取开源和企业授权代码。

GitHub现象/趋势编码
21:58
IT之家(RSS)
47
百度千帆 Coding Plan 停止续费,已购用户可正常使用至服务到期

百度千帆团队6月25日宣布,Coding Plan所有套餐即日起停止续费。该服务是2026年2月推出的AI编码订阅服务,集成GLM-4.7、DeepSeek-V3.2等多款代码模型,兼容Claude Code、Cursor等工具,Lite版首月9.9元后续40元/月,Pro版49.9元/月,上线约四个月。已购用户可正常使用至服务到期,自动续费30日后失效,到期后不再支持续费。

编码行业动态
18:58
IT之家(RSS)
60
Token 消耗激增,Gartner 预测到 2028 年 AI 编程成本将超过人类开发者平均薪资

Gartner 报告指出,到 2028 年 AI 编程成本将超普通开发者薪资。主要因计费模式从订阅转向按 Token 消耗量,导致支出不确定且透明度不足。开发者优先速度而非成本效率,AI 智能体自主操作、上下文膨胀及缺乏反馈机制进一步推高 Token 消耗。基础设施投资与盈利压力推高模型定价,轻度用户正加速转变为主流用户,推动总支出增长。

现象/趋势编码
18:53
Rohan Paul@rohanpaul_ai
55
CRED创始人:90%代码已由AI编写,生产率差距拉大

印度头部金融科技公司CRED创始人Kunal Shah表示,目前公司90%的代码由AI编写。他认为,每家人工智能创业公司中约10%的员工已因AI获得指数级生产率提升,与其余90%员工形成“完全不同物种”般的差距,感觉周围一切流程和人都变得缓慢。该言论来自“Thrive by Groww”YouTube频道访谈。

大佬观点编码
15:58
IT之家(RSS)
51
GitHub 调整 Copilot Free 与 Student 计划:自动模型选择成唯一方式

6月24日,GitHub宣布Copilot Free与Student计划将自动模型选择设为默认且唯一方式。系统根据任务复杂度动态分配模型:简单提示词用更快成本更低的模型,复杂编码任务用推理能力更强的模型。用户仍可通过悬停(Copilot Chat)或输出旁(Copilot CLI、Copilot Cloud Agent)查看所用模型。此前4月暂停相关订阅新注册,6月17日重新开放个人套餐注册,调整计费后6月用户使用量大幅激增。

GitHub产品更新编码
15:37
向阳乔木@vista8
同事件精选82
豆包Seed-2.1实测:编程可用,识鱼封神!

火山引擎发布豆包Seed-2.1系列(Pro、Turbo)。实测Seed-2.1 Pro显示:Agent和Coding能力达到生产级可用线,能完成SVG动画、网页开发、CMS系统等任务;配合开源Skill可生成标题、调研报告、信息卡片及电子书。多模态识别惊喜,拍照识鱼准确识别鱼种和数量,优于Gemini 3.1 Flash。价格实惠,API已通过火山方舟全量开放。

智能体多模态编码评测/基准
同一事件,精选展示《Seed2.1 正式发布,深入 AI 生产力》
推荐理由:乔木的实测很有说服力,Seed 2.1 Pro 在编程和 Agent 任务上已能用,多模态识鱼甚至反超 Gemini,对正在选模型的开发者是及时且扎实的参考。
15:19
Orange AI@oran_ge
64
大模型的ROI定律:字节Seedance 2.0 4K视频模型日均收益超3000万

字节Seedance 2.0推出4K视频模型,一条15秒4K视频约88元,一分钟广告片约700元,但官方API无折扣,代理商加价1.2-1.5倍仍供不应求,每天为字节带来超3000万元收益。红果短剧平台AI短剧已完全碾压真人短剧,ROI优势显著。大模型公司优先选择coding等高价值场景训练,遵循“资源有限时,算力和资本流向边际收益率最高处”的ROI定律。用户应关注价值而非价格:若能用AI创造超过成本的价值,再贵的模型也划算。找到自己比别人好10倍的场景,才能获得10倍ROI。

大佬观点编码
12:07
向阳乔木@vista8
59
飞书Cli+Codex实现对话记账

通过飞书Cli工具与Codex结合,实现自然语言记账:终端执行npx @larksuite/cli@latest install安装飞书Cli,再在Codex中创建“日常开销记录”项目,用对话指令生成多维表格,之后可直接在手机端查看和修改,无需额外记账软件。

MCP/工具教程/实践编码
11:47
OpenClaw🦞@openclaw
14
收看 The Clawcast 第一集,我们的官方 OpenClaw 播客,嘉宾 @hrudolph、@Pat_Erichsen 和 @GosuCoder! 围绕技能、Clawhub、保障 OpenClaw 部署等话题的精彩对话。 https://youtu.be/IfJJnR1LIE0?si=ruSYAHPE-QqYxoTR
编码行业动态
11:12
jason@jxnlco
9
认出这些了吗?
大佬观点编码
10:58
IT之家(RSS)
48
GitHub Copilot切换按量计费后6月使用量激增,创史上最佳月度业绩

GitHub自6月1日将Copilot从包月制改为按量计费后,用户使用量大幅激增,6月成为其成立以来业绩最佳月份。首席技术官费多罗夫在员工会议上透露上述信息,但未披露具体数据。GitHub正面临Cursor、OpenAI Codex、Anthropic Claude Code等竞品竞争。费多罗夫认为无需大幅涨价,但未确认调价方案。受使用量暴涨影响,GitHub在2026年已发生数十次大规模服务中断,微软正求助亚马逊解决算力承载问题。

GitHubMicrosoft编码行业动态
10:21
宝玉@dotey
73
宝玉分享 decode-codex 项目:反编译 Codex App

宝玉分享 GitHub 项目 decode-codex,用于反编译闭源 coding agent Codex App。项目含两个 Skills:codex-app-ref-refresh(解包 app.asar 并格式化)和 deobfuscate-javascript(反混淆 JS 为可读代码)。用法:先解包再反混淆,后者需配合 /goal。用户 @LinearUncle 此前询问反编译模型推荐,宝玉以此项目回应。项目地址:https://github.com/JimLiu/decode-codex

LinearUncle: @dotey @lovevfp 宝哥,反编译哪个模型最强?哪些模型不会拒绝,我正在搜索你的推特帖子呢,以前我看你写的是gemini,现在呢? 这个月token 实在太富裕了,闲来无事,想反编译一个闭源的coding agent

GitHub开源/仓库编码
08:51
meng shao@shao__meng
47
开源 Skills 系列新增「loop-me」技能:通过拷问挖掘重复模式生成工作流规格

开源 Skills 系列(165K stars)新增 in-progress 技能「loop-me」。该技能通过“拷问”采访用户,发现其工作、生活中的重复模式(Loop),并将这些模式打磨成 workflows/*.md 规格文件。核心原则包括:一次一问、附带推荐答案、走完整棵决策树、优先查代码库、状态持久化至文件从而支持跨会话和版本化。loop-me 与已有 grill-me 的区别在于:grill-me 对齐任意计划,loop-me 只产出 workflow 规格。设计哲学强调从重复模式出发,而非直接构建 Agent;规格是唯一交付物,实现留作后续步骤;人类时间最珍贵,将其角色压缩为“晚到的单次决策”。完成标准是 Agent 读取 spec 后无需再提问。

Matt Pocock: New in-progress skill: /loop-me Interviews you about your work and finds opportunities for delegating your day-to-day wo...

智能体开源/仓库编码
08:51
meng shao@shao__meng
65
《The Coming Loop》:AI循环工程的两层困境

文章将AI循环分为内层agent loop(模型说“完成”即止)和外层harness loop(外部判定是否真完成,可续接session)。循环放大LLM代码的过度防御、回避不变量等缺陷,每轮叠加局部防御使系统更难理解。有效领域(移植、性能探索)共性是不产生新代码或产出无需长寿。核心隐喻从“机器”转向“有机体”,人不再完全理解代码。深层隐忧是认知依赖:代码由循环产出、review,一旦失去同类系统访问权将无法维持。问题不再是“是否会loop”,而是如何在循环未来中保留判断力与工程规则。

智能体大佬观点编码
08:00
HuggingFace Daily Papers(社区热门论文)
58
代码智能体需要多少静态结构?确定性锚定效应研究

基于LLM的代码智能体依赖关键词搜索导航仓库,但缺失调用图、继承关系等结构信息,导致导航随机且难以复现。研究以OpenAI Codex为基线,向提示词注入不同粒度的轻量级静态结构注释,发现确定性锚定效应:函数级定位Func@5提升2.2个百分点,交互轮次减少1.6轮;链接跟随率从0.15–0.18升至0.21–0.24,单次运行Pass@1提升3.4个百分点,但输入token增加约10%。建议中等规模仓库默认使用轻量级拓扑,大型仓库剪枝前向边,密度高的语义注释仅用于隐式依赖场景。

智能体OpenAI编码论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
66
LLM程序修复代理中代码执行成本效益的实证研究

本研究分析了SWE-bench排行榜上7,745个代理轨迹,并在200个实例上评估Claude Code、Codex与开源OpenCode采用四种执行范式的3,000次修复尝试。结果显示:代码执行平均每任务8.8次测试运行,频率2-19,后期成功率更高;对商用SOTA代理,禁止执行与无限制执行间修复成功率差距仅1.25个百分点(无统计显著性),但禁止执行显著节省token与墙钟时间;执行收益集中而非均匀分布。研究表明当前代理不加区分地使用代码执行,应将其视为有明确成本收益权衡的资源。

智能体编码论文/研究
07:59
Hacker News 热门(buzzing.cc 中文翻译)
51
PostHog工程师用多个并行Claude Code会话重写SQL解析器,速度提升70倍

PostHog工程师使用多个并行的长时Claude Code会话重写了公司的SQL解析器,将解析速度提升约70倍。新解析器包含16K行解析器代码和5K行工具代码。原始解析器基于ANTLR生成,采用图遍历解释器,性能受限;新解析器采用手动编写的递归下降解析器配合Pratt表达式循环,仅在必要时引入前瞻与回溯。开发过程中通过属性测试(Hypothesis)确保与原始C++解析器在真实查询上的等价性。

教程/实践编码部署/工程
07:58
IT之家(RSS)
68
数据推翻 AI 取代论:工程师岗位成科技行业抗风险最强工种

Challenger 数据显示 5 月科技行业裁员创单月新高,AI 是主因。但 SignalFire 追踪 8000 万企业员工轨迹后发布报告称,大型科技企业整体招聘量较 2019 年下降 25%,工程岗位降幅仅 11%;2025 年新入职员工中工程师占比达 55%,高于 2019 年的 46%。初创企业工程师总人数较 2019 年增长 7%。Anthropic 首席执行官曾警示 AI 或淘汰半数入门级白领,但其首席经济学家表示尚未观测到显著冲击。英伟达 CEO 黄仁勋称工程师使用 AI 后更忙碌,印证杰文斯悖论。

数据/训练现象/趋势编码
07:37
TechCrunch:AI(RSS)
58
前Infosys CEO Vishal Sikka创立Hang Ten Systems,挑战IT服务行业

Hang Ten Systems是一家企业AI服务公司,由前Infosys CEO Vishal Sikka创立,旨在通过AI驱动的开发和自动化帮助企业持续构建、修改和运营软件。公司完成3200万美元种子轮融资,由Mayfield领投,Aramco Ventures战略投资,雅虎联合创始人Jerry Yang担任董事会成员。Hang Ten已与Siemens Gamesa Renewable Energy和Fresenius合作进行AI原生项目交付,围绕智能体代码生成、可复用AI技能和领域专业知识构建服务。公司总部位于湾区,正在全球多地招聘。

智能体编码行业动态
07:10
MiniMax (official)@MiniMax_AI
40
M3 现在已成为 @cast_ai 旗下 Kimchi Coding 的默认构建模型。 并非所有编码任务都应使用同一个模型。Kimchi 根据复杂度、成本及部署需求来路由任务。 这使得 M3 成为自然之选:开放权重、1M 上下文、更强的编码性能且更可控。 文章见评论。 #MiniMaxM3 #AICoding
开源/仓库编码行业动态
06:57
Claude Code:GitHub Releases(RSS)
35
Claude Code v2.1.191 发布

Claude Code v2.1.191 新增 /rewind 命令,支持从 /clear 前恢复对话。修复流式响应时滚动位置跳到底部、后台智能体停止后复活等问题。改进 MCP 服务器可靠性,对 tools/list 等请求增加短暂退避重试;优化 OAuth 流程,无头环境直接跳过浏览器弹窗。流式响应 CPU 使用率降低约 37%(通过合并文本更新间隔至 100ms),并减少终端输出缓存带来的内存增长。

Anthropic产品更新编码
06:19
Nathan Lambert@natolambert
53
GLM 5.2 在 CursorBench 上处于 Opus 前沿(在成本方面),这正是导致前沿实验室利润下降的原因。

Lee Robinson: You can now try GLM 5.2 in Cursor! Excited to see more useful open models, thank you to Fireworks for partnering here. R...

开源/仓库模型发布编码
06:07
Lee Robinson@leerob
65
你现在可以在 Cursor 中试用 GLM 5.2! 很高兴看到更多有用的开放模型,感谢 Fireworks 在此合作。我们的评估结果如下 ↓
开源/仓库模型发布编码
06:06
TechCrunch:AI(RSS)
精选70
AI被认为会取代工程岗位,但新数据显示工程是2025年最具韧性的岗位

风投机构SignalFire追踪8000万家公司数百万员工数据发现,工程是2025年最具韧性的岗位。大型科技公司总招聘较2019年下降25%,工程岗仅降11%;工程岗占Alphabet、Meta等12家“Tech Majors”新招员工的55%(2019年为46%)。早期初创公司2025年工程师招聘比2019年增长7%。Anthropic CEO警告AI可能消灭一半入门级白领,但该公司经济主管称尚未看到显著影响。NVIDIA CEO黄仁勋表示AI让工程师更忙碌,是杰文斯悖论的典型例证。

Anthropic现象/趋势编码

推荐理由:SignalFire 的报告用招聘数据讲了一个反直觉的故事:工程师不仅没被 AI 取代,反而成为科技公司招聘的主力,这比“AI 夺走一切”的恐慌论有说服力得多。Jevons 悖论在工程领域正在发生。
‹ 上一页
1…56789…50
下一页 ›