AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 876 条
全部一手资讯X论文
标签「编码」清除
5月20日周三
23:33The Decoder:AI News(RSS)63谷歌测试"应用市场冲击"
22:02Hacker News 热门(buzzing.cc 中文翻译)81同事件精选Qwen3.7-Max:智能代理的前沿同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
15:56IT之家(RSS)65消息称 DeepSeek 组建 Harness 团队主攻代码智能体,正面对决 Claude Code
15:12MarkTechPost(RSS)68Google发布Gemini 3.5 Flash:在2026年I/O大会上推出一款更快速、更经济的AI智能体与编码模型
10:55IT之家(RSS)74精选消息称微软内部示警:GitHub 面临生存级风险,AI 编程工具削弱托管必要性
10:49Qwen:Blog Retrieval(API)79精选Qwen3.7-Max:面向智能体时代的最新专有模型
07:55IT之家(RSS)67分手费 100 亿美元:消息称 SpaceX 将在 IPO 后收购 AI 编程公司 Cursor
05:45Claude:Blog(网页)73精选Claude Code的HTML输出:非凡的有效性
05:25Google Developers Blog(RSS)87Google I/O 2026:从辅助工具到独立智能体的战略转型
04:55IT之家(RSS)68谷歌升级 AI Studio:文本直出原生安卓应用,打通测试全流程
03:55IT之家(RSS)67谷歌发布 Antigravity 2.0:优化多智能体编程、新增定时任务
02:06Google Research:Blog(网页)65精选经验研究助手(ERA):从Nature发表到催化计算发现
5月19日周二
14:50Hacker News 热门(buzzing.cc 中文翻译)75Cursor 推出 Composer 2.5
10:45IT之家(RSS)60马斯克推广 Cursor Composer 2.5 AI 模型,基于 Kimi K2.5 构建
09:59Simon Willison 博客52五分钟概览大语言模型领域近六个月发展
08:59Claude Code:GitHub Releases(RSS)65精选Claude AI助手v2.1.144版本更新
08:04Hacker News 热门(buzzing.cc 中文翻译)52我不再使用 JetBrains 的产品了
02:06The Decoder:AI News(RSS)62Cursor 发布 Composer 2.5:性能比肩 Opus 4.7 与 GPT-5.5,成本大幅降低
01:26OpenAI:官网动态(RSS · 排除企业/客户案例)46OpenAI与Dell合作将Codex引入混合及本地企业环境
00:59GitHub Blog69精选将你的本地GitHub会话带到任何地方
00:51Cursor Blog74精选Composer 2.5 发布与技术解析
5月18日周一
20:45IT之家(RSS)65腾讯推出 AI 应用生成平台"吐司":定位"探索型氛围编程产品"、支持一键打造 App 原型预览
18:45IT之家(RSS)57阿里 QoderWork 上线设计工作台:语音描述就能交付专业设计
07:33Hacker News 热门(buzzing.cc 中文翻译)67Show HN: Semble--一款面向代理的代码搜索工具,其使用的令牌数量比 grep 少 98%
5月17日周日
19:44IT之家(RSS)63无预算约束,OpenClaw 团队一个月烧掉 130 万美元 API 费用
09:02Hacker News 热门(buzzing.cc 中文翻译)74精选Zerostack--一款采用纯Rust语言编写、受Unix启发的编程代理
08:00HuggingFace Daily Papers(社区热门论文)57SaaSBench:探索长周期企业SaaS工程中编码智能体的边界
08:00HuggingFace Daily Papers(社区热门论文)73精选从可运行到可交付:基于多智能体测试驱动的开发范式用于从需求生成全栈Web应用
5月16日周六
18:25The Decoder:AI News(RSS)61每月花费130万美元,OpenClaw创始人Peter Steinberger运行100个AI代理进行编码、审查PR和查找漏洞
10:42IT之家(RSS)52Win11 再次失守,Pwn2Own Berlin 2026 第 2 天发放 38.5 万美元奖金
10:42IT之家(RSS)47消息称微软取消 Claude Code 许可,6 月底前推动团队转向 Copilot CLI
08:42IT之家(RSS)61苹果 App Store 放行,AI 氛围编程应用 Replit 时隔 4 个月更新
08:00HuggingFace Daily Papers(社区热门论文)66AgentKernelArena: 一个用于评估GPU内核优化AI编程代理的开源基准平台
06:57Claude Code:GitHub Releases(RSS)61精选Claude Code v2.1.143 版本更新:插件管理与用户体验增强
06:50Google DeepMind:Blog(RSS)75精选Gemini 3.5:具备行动能力的前沿智能
5月15日周五
22:24The Decoder:AI News(RSS)63x.AI 推出首款终端编码助手 Grok Build,奋起直追
20:54The Decoder:AI News(RSS)51Microsoft 撤回 Claude Code 许可,推动开发者回归其自有 AI 工具
18:30Ars Technica:AI(RSS)60Claude Code 的产品负责人谈论使用限制、透明度和"精益约束"
16:54The Decoder:AI News(RSS)58OpenAI 在 iOS 和 Android 上推出 AI 编程助手 Codex
16:49HuggingFace Daily Papers(社区热门论文)54FrontierSmith:大规模合成开放式编码问题
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月20日
23:33
The Decoder:AI News(RSS)
63
谷歌测试"应用市场冲击"

谷歌在I/O大会宣布,其AI Studio现支持根据文本提示直接生成原生Android应用,这些应用采用Kotlin语言与Jetpack Compose框架构建,并可在浏览器模拟器中进行测试。对于追踪器、待办清单这类简单的工具型应用,此举使得开发和分发变得极为便捷,可能削弱谷歌Play Store作为核心分发渠道的传统地位。与此同时,苹果公司则采取相反策略,持续阻止这类基于AI生成的“氛围编程”应用上架App Store。

Google产品更新编码
22:02
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选81
Qwen3.7-Max:智能代理的前沿

智能代理领域迎来新突破,Qwen3.7-Max于2026年5月20日发布,标志着前沿技术的演进。该模型聚焦智能代理创新,具体细节可通过qwen.ai博客获取。发布消息在Hacker News上获得128个关注点,显示技术社区的广泛兴趣。尽管未披露详细性能指标,但Qwen3.7-Max的推出暗示了在自主代理架构或任务处理能力上的提升,推动AI向更高效、智能的方向发展。

智能体推理模型发布编码
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
推荐理由:Qwen3.7-Max 在多个 agent 基准上达到甚至超越 Opus 4.6 水平,长程自主优化 35 小时跑出 10 倍速度提升,证明 agent 长跑能力不是概念,做自动化工具的值得跟进。
15:56
IT之家(RSS)
65
消息称 DeepSeek 组建 Harness 团队主攻代码智能体,正面对决 Claude Code

DeepSeek在内部组建了全新的Harness团队,主攻代码智能体产品,内部对标Anthropic的Claude Code。该团队将负责研发DeepSeek Code Harness,并已开放Harness产品经理和研发工程师两个关键岗位,工作地点在北京。其核心目标是将前沿的模型能力转化为领先的Agent产品,并深度参与定义DeepSeek的桌面端Agent产品。

智能体AnthropicDeepSeek编码
15:12
MarkTechPost(RSS)
68
Google发布Gemini 3.5 Flash:在2026年I/O大会上推出一款更快速、更经济的AI智能体与编码模型

Google在2026年I/O大会上发布了新一代模型Gemini 3.5 Flash。该模型在代码生成和AI智能体任务等基准测试中性能超越了此前的旗舰版本,同时运行速度提升四倍,推理成本降低一半。这一更新显著增强了模型在实际应用中的效率与经济性,特别面向需要快速响应和复杂任务处理的开发者场景。

智能体Google推理模型发布
10:55
IT之家(RSS)
精选74
消息称微软内部示警:GitHub 面临生存级风险,AI 编程工具削弱托管必要性

微软内部发出警告,称其代码托管平台GitHub正面临“生存级风险”。主要原因是Cursor、Claude Code等AI编程助手兴起,改变了开发者工作流,削弱了持续将代码上传至GitHub的必要性。为统一工具链并控制成本,微软已要求部分团队在2026年6月底前停止试用Claude Code,转而使用自有工具GitHub Copilot CLI。同时,OpenAI曾考虑自建替代平台,也加剧了对GitHub地位的潜在威胁。

智能体GitHubMicrosoft编码

推荐理由:微软内部把 GitHub 风险定义为“生存级”,这不再是外部竞争猜测,AI 编程工具真的在动摇代码托管的根基。
10:49
Qwen:Blog Retrieval(API)
精选79
Qwen3.7-Max:面向智能体时代的最新专有模型

通义千问发布 Qwen3.7-Max,专为智能体时代设计。它具备从原型到复杂多文件工程的编码智能体能力,通过 MCP 和多智能体编排实现办公自动化,能自主执行超 1000 步工具调用(如 35 小时全自主内核优化)。兼容 Claude Code、OpenClaw、Qwen Code 等多框架。在多项基准测试中超越 Opus-4.6 Max 等模型:Terminal Bench 2.0 (69.7)、SWE-Verified (80.4)、GPQA Diamond (92.4)、HLE (41.4) 等。现已通过阿里云 Model Studio 提供 API 调用。

智能体推理模型发布编码
关联讨论 7 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)X:OpenRouter (@OpenRouter)IT之家(RSS)
推荐理由:Qwen3.7-Max 把 agent 能力拉到了新高度,35 小时自主内核优化证明长程执行有真实生产力,做 coding agent 的团队该认真测一下。
07:55
IT之家(RSS)
67
分手费 100 亿美元:消息称 SpaceX 将在 IPO 后收购 AI 编程公司 Cursor

SpaceX预计将在首次公开招股(IPO)完成30天后,推进对AI编程公司Cursor的收购。若交易失败,SpaceX需向Cursor支付高达100亿美元的现金分手费。该公司最早本周三公开招股书,计划6月12日上市,寻求融资高达750亿美元,估值或超2万亿美元。这笔交易将增强其AI编程能力。

编码行业动态
05:45
Claude:Blog(网页)
精选73
Claude Code的HTML输出:非凡的有效性

Claude Code团队正从Markdown转向HTML作为主要输出格式。Markdown虽简洁,但在信息密度、阅读性、分享和交互方面存在局限。HTML能支持表格、CSS样式、SVG图表和JavaScript交互,提供更清晰的视觉结构和高信息密度。由于HTML文件可通过浏览器直接打开和分享,便于团队协作审阅。Claude Code利用其广泛的上下文获取能力生成实用的HTML制品,适用于项目规划、文档编写和验证等多种场景,显著提升了AI生成内容的可读性与实用性。

智能体Anthropic教程/实践编码

推荐理由:Claude Code 团队的人亲自告诉你为什么用 HTML 而不是 Markdown,从设计原型到可交互报告全在一个文件里搞定。附带的模板和提示词,开发者可以直接抄。
05:25
Google Developers Blog(RSS)
87
Google I/O 2026:从辅助工具到独立智能体的战略转型

在2026年开发者大会上,Google宣布其AI战略核心从辅助工具转向开发独立智能体。大会重点发布了Gemini 3.5系列模型,并对“反重力”智能体优先平台进行了重大更新。面向移动开发者,推出了Android CLI工具、评估排行榜及能将多种框架代码快速迁移至原生Kotlin的智能体。Web开发领域也迎来变革,包括专为智能体设计的Chrome DevTools、HTML-in-Canvas API,以及旨在让浏览器内AI智能体执行复杂任务的开放标准WebMCP提案。

智能体Google模型发布编码
04:55
IT之家(RSS)
68
谷歌升级 AI Studio:文本直出原生安卓应用,打通测试全流程

谷歌在2026 I/O开发者大会上宣布,为Google AI Studio新增原生安卓应用生成功能。用户可通过浏览器输入文本提示,直接创建使用Kotlin与Jetpack Compose构建的完整、可安装安卓应用。该应用支持离线运行和硬件特性接入,并整合了开发、预览与测试发布流程。开发者能利用内置模拟器实时测试,也可一键发布至Google Play进行内部测试。当前版本主要适用于工具类、社交类应用及Gemini驱动项目。

Google产品更新端侧编码
03:55
IT之家(RSS)
67
谷歌发布 Antigravity 2.0:优化多智能体编程、新增定时任务

在2026年I/O开发者大会上,谷歌发布了Antigravity 2.0桌面应用及一系列配套工具。产品定位从智能体式IDE转变为通用智能体优先工作平台,支持开发者同时部署多个子智能体处理不同编程任务。新功能包括通过“/schedule”命令设置定时任务,以及多种斜杠命令以提升任务可控性。产品结构改为按“project”管理,取消了与代码仓库的强绑定。云端方面,Gemini API推出Managed Agents,一次API请求即可启动一个持久化的隔离Linux环境智能体。同时,Google AI Studio移动应用开放预注册,并新增Android原生应用生成与直接导出测试的能力。

智能体Google产品更新编码
02:06
Google Research:Blog(网页)
精选65
经验研究助手(ERA):从Nature发表到催化计算发现

Google Research开发的经验研究助手(ERA)现已在《Nature》期刊发表论文。这是一款基于Gemini的AI工具,旨在协助科学家编写专业级经验科学代码,其核心能力包括搜索文献、生成代码、探索方案并迭代优化,以加速耗时的计算实验过程。该工具已被用于构建“计算发现”原型,并已通过Google Labs的“可信赖测试者计划”向更广泛的科学家群体开放初步试用。

Google产品更新编码

推荐理由:谷歌把AI科学编码工具ERA发到了Nature,顺便在Google Labs推出了计算发现实验版,流行病预测和碳追踪的案例很扎实,科研圈的开发者和产品人可以关注下实际进展。
5月19日
14:50
Hacker News 热门(buzzing.cc 中文翻译)
75
Cursor 推出 Composer 2.5

Cursor 发布 Composer 2.5,这是其开发工具 Cursor 的更新版本,版本号从2.0迭代至2.5。此次更新提升了代码补全效率并引入协作功能,以优化开发体验。该发布在 Hacker News 上获得 100 个投票点,显示开发者社区对此次升级的关注。

智能体产品更新编码
10:45
IT之家(RSS)
60
马斯克推广 Cursor Composer 2.5 AI 模型,基于 Kimi K2.5 构建

5月19日,马斯克发推邀请用户测试Cursor最新发布的Composer 2.5 AI模型。该模型基于月之暗面的Kimi K2.5,并利用部分Colossus 2集群训练,官方称其为“最强”模型,重点提升了长任务稳定性和复杂指令遵循能力。技术上,它采用了基于文本反馈的定向强化学习,并将合成任务规模扩大至前代的25倍以优化编码能力。标准版定价为输入每百万token 0.50美元、输出2.50美元;另有速度更快的fast版本,输入3.00美元、输出15.00美元。

产品更新推理编码
09:59
Simon Willison 博客
52
五分钟概览大语言模型领域近六个月发展

过去六个月,大语言模型领域发生了显著变化,尤其以2025年11月为关键转折点。在该月,被称为“最佳”的模型主导权在Anthropic、OpenAI和Google之间五次易手,先后经历了Claude Sonnet 4.5、GPT-5.1、Gemini 3等模型的快速迭代。同时,编码智能体技术取得突破,从“时常可用”跃升至“基本可用”,能够稳定执行实际开发任务,这标志着整个领域的应用成熟度得到显著提升。

AnthropicOpenAI大佬观点开源生态
08:59
Claude Code:GitHub Releases(RSS)
精选65
Claude AI助手v2.1.144版本更新

Claude AI助手发布了v2.1.144版本。此次更新主要新增了对后台会话的/resume支持,并将“extra usage”更名为“usage credits”。同时包含了多项重要修复:优化了网络异常处理,解决启动卡顿问题;修复了窗口大小调整和长时间会话导致的终端显示错乱;解决了macOS特定文件夹下的崩溃问题。此外,还改进了模型选择持久化、文件读取、工具调用以及MCP服务器分页工具列表的处理,并减少了在VS Code中的渲染故障。本次更新显著提升了工具的稳定性和用户体验。

智能体Anthropic产品更新编码

推荐理由:如果你被 Claude Code 启动卡住 75 秒折磨过,这次更新终于修了,还支持后台会话 /resume,体验好了一个档次。
08:04
Hacker News 热门(buzzing.cc 中文翻译)
52
我不再使用 JetBrains 的产品了

开发者马修·科萨雷克在个人博客发文宣布将停止使用JetBrains全家桶产品,其文章于2026年5月18日在Hacker News发布后引发社区讨论,获得100个点赞。这一决定可能与对替代开发工具的探索或对原有工作流的重新评估有关,但具体动因在公开摘要中未作详细说明。

现象/趋势编码
02:06
The Decoder:AI News(RSS)
62
Cursor 发布 Composer 2.5:性能比肩 Opus 4.7 与 GPT-5.5,成本大幅降低

Cursor 推出了其最新的 AI 编程模型 Composer 2.5,该模型基于 Kimi K2.5 构建,训练时使用了前代模型 25 倍的合成任务数据。在性能基准测试中,Composer 2.5 达到了与 Opus 4.7 及 GPT-5.5 相当的水平,而其运行成本仅为后两者的一小部分,显著提升了成本效益比。

模型发布编码
01:26
OpenAI:官网动态(RSS · 排除企业/客户案例)
46
OpenAI与Dell合作将Codex引入混合及本地企业环境

OpenAI与Dell达成合作,将Codex编程代理引入企业混合云及本地部署环境。该合作旨在帮助企业在自身数据和业务流程中安全集成AI编码能力,强化对敏感数据的管控。此举标志着企业级AI工具部署方式的重要扩展,为受监管行业提供了符合数据主权要求的解决方案。

OpenAI编码行业动态
00:59
GitHub Blog
精选69
将你的本地GitHub会话带到任何地方

GitHub为Copilot功能推出了远程控制会话能力,并已全面上线。该功能允许用户在VS Code或命令行中启动Copilot任务后,可随时随地通过github.com网站或GitHub Mobile移动端应用继续操作,实现了开发工作流从桌面端到移动端的无缝衔接。此更新增强了开发者在不同场景下的灵活性和工作效率。

GitHub产品更新编码

推荐理由:Copilot跨设备会话看起来是个小功能,但它解决了开发者切换设备时的心流中断问题,这种对工作连续性的打磨比单纯堆性能更聪明。
00:51
Cursor Blog
精选74
Composer 2.5 发布与技术解析

Cursor 平台发布了智能与行为表现大幅提升的 Composer 2.5。该模型更擅长执行复杂指令和长期任务。其改进基于训练规模的扩大、更复杂的强化学习环境及新的学习方法。关键技术包括:使用文本反馈进行针对性强化学习以纠正具体错误;采用基于真实代码库、规模达前代25倍的合成数据进行训练;并引入分片Muon优化器等新架构。模型基于Moonshot的开源检查点构建。开发团队正合作训练一个计算量十倍的更大模型,并在大规模训练中发现了新型奖励作弊问题。

智能体产品更新编码

推荐理由:Cursor的Composer 2.5不只是换个模型,它在长任务上的耐性和指令跟随的准确性提升肉眼可见,训练细节里藏的’文本反馈修正‘方法,对做AI产品的应该会有所启发。
5月18日
20:45
IT之家(RSS)
65
腾讯推出 AI 应用生成平台"吐司":定位"探索型氛围编程产品"、支持一键打造 App 原型预览

腾讯于5月18日推出AI应用生成平台“吐司”,定位为探索型氛围编程产品。安卓版已上线,iOS版稍后推出,公测期间限时免费,后续通过分享任务提供更多次数。用户可用自然语言描述想法,AI自动拆解功能、生成原型并一键打包成App。平台提供创造应用、社交分享、灵感广场和应用搜索四大能力,聚焦灵感实现与共创,让无代码基础的用户也能创建应用,形成从想法到分发的闭环生态。

产品更新编码
18:45
IT之家(RSS)
57
阿里 QoderWork 上线设计工作台:语音描述就能交付专业设计
产品更新多模态编码
07:33
Hacker News 热门(buzzing.cc 中文翻译)
67
Show HN: Semble--一款面向代理的代码搜索工具,其使用的令牌数量比 grep 少 98%

Semble是一款面向AI代理的代码搜索工具,其核心优势在于比传统工具grep节省98%的令牌使用量。该工具已在GitHub开源,并在Hacker News上获得106点热度。这一效率提升旨在降低AI代理处理代码搜索时的计算资源消耗与成本。

智能体GitHub开源/仓库搜索
5月17日
19:44
IT之家(RSS)
63
无预算约束,OpenClaw 团队一个月烧掉 130 万美元 API 费用

奥地利开发者彼得・施泰因贝格尔披露,其领导的OpenClaw项目在30天内消耗OpenAI API费用高达130万美元,涉及760万次请求和6030亿词元。这笔费用由约100个Codex实例产生,用于自动化代码审核、漏洞修复等任务。施泰因贝格尔解释,这是“极速模式”下的结果,关闭后成本可降至约30万美元。该实验旨在无预算约束下探索AI辅助软件开发的极限,所有成果保持开源。

OpenAI开源生态编码行业动态
09:02
Hacker News 热门(buzzing.cc 中文翻译)
精选74
Zerostack--一款采用纯Rust语言编写、受Unix启发的编程代理

Zerostack是一款采用纯Rust语言编写、受Unix哲学启发的编程代理工具,已正式发布1.0.0版本并在Rust包管理平台crates.io上提供。该发布在技术社区Hacker News上获得115点关注,反映出开发者对其的高度兴趣。Rust语言以内存安全和性能见称,Unix设计强调简洁与模块化,Zerostack结合两者优势,旨在提升编程效率,为代码辅助领域带来新选择。

智能体开源/仓库编码

推荐理由:不走 IDE 插件的老路,Zerostack 把编程代理做成命令行管道,Rust 纯血、Unix 哲学,适合喜欢拼接工具的开发者尝鲜。
08:00
HuggingFace Daily Papers(社区热门论文)
57
SaaSBench:探索长周期企业SaaS工程中编码智能体的边界

为评估AI编码智能体在企业级SaaS工程中的真实能力,研究者发布了首个专用基准测试SaaSBench。该基准包含横跨6个SaaS领域的30个复杂任务,设有5370个验证节点,整合了8种编程语言、6种数据库和13种框架,高度模拟现实软件异构性。研究设计了针对长周期、多组件耦合系统的依赖感知混合评估范式。实验发现:当前最先进的智能体主要瓶颈并非生成代码逻辑,而是成功配置与集成多组件系统;超过95%的任务失败发生在触及深层业务逻辑之前,常因过度自信出错或陷入调试循环。

智能体编码论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
精选73
从可运行到可交付:基于多智能体测试驱动的开发范式用于从需求生成全栈Web应用

针对编码智能体生成的Web应用超70%不满足需求的问题,本文提出TDDev框架。该框架通过三阶段实现自动化闭环:先将需求转化为结构化测试,再通过浏览器模拟交互验证应用,最后将故障转化为修复报告。首次针对Web应用生成的TDD实证研究发现,引入TDD基础设施可提升质量34-48个百分点。关键结论是最佳协议需与模型生成风格匹配,不匹配将完全抵消TDD优势并最多增加25倍Token消耗。用户研究证实,该框架使人工干预降为零,开发转向自主反馈优化。

智能体arXiv编码论文/研究

推荐理由:把TDD塞进多智能体代码生成,直接把Web应用的正确率从不到30%拉到70%以上,更重要的是他们发现给不同模型配错了开发协议反而会雪崩,做Agent工程的必读。
5月16日
18:25
The Decoder:AI News(RSS)
61
每月花费130万美元,OpenClaw创始人Peter Steinberger运行100个AI代理进行编码、审查PR和查找漏洞

Peter Steinberger带领的三人团队为开源项目OpenClaw维持着约100个Codex实例的运行,每月驱动OpenAI API支出高达130万美元。他将这笔巨额开支定位为一项研究投资,旨在探索当令牌成本不再受限时,软件开发会呈现何种形态。该实验的核心是观察AI代理在编码、审查拉取请求和查找漏洞等任务上的规模化协作效能。

智能体OpenAI现象/趋势编码
10:42
IT之家(RSS)
52
Win11 再次失守,Pwn2Own Berlin 2026 第 2 天发放 38.5 万美元奖金

在Pwn2Own Berlin 2026活动第二天,安全研究人员共报告15个零日漏洞,获得总计38.575万美元奖金。其中,DEVCORE Research Team的Cheng-Da Tsai通过串联3个漏洞攻破微软Exchange,实现远程代码执行并提升至SYSTEM权限,赢得当天最高单项奖金20万美元。Windows 11系统再次被利用整数溢出漏洞攻破。此外,Red Hat Enterprise Linux及多款AI编码工具也成为了成功攻击的目标。

OpenAI编码行业动态
10:42
IT之家(RSS)
47
消息称微软取消 Claude Code 许可,6 月底前推动团队转向 Copilot CLI

据报道,微软正要求包括Windows 11、Microsoft 365、Outlook、Teams和Surface在内的工程团队,在6月底前停止使用Claude Code并迁移至GitHub Copilot CLI。此举基于半年的并行测试评估,微软认为自有产品能更好地整合内部代码库与安全需求。成本控制也是因素之一,以便在新财年开始前削减支出。尽管Claude Code在内部颇受欢迎,微软仍决定推动统一转向。

AnthropicMicrosoft编码行业动态
08:42
IT之家(RSS)
61
苹果 App Store 放行,AI 氛围编程应用 Replit 时隔 4 个月更新

苹果App Store已恢复AI编程应用Replit的更新,其iPhone和iPad版本在停滞4个月后发布新版本。Replit作为“氛围编程”工具,允许用户用自然语言生成代码,此前因违反App Store关于动态执行未审查代码的规则而被拒绝更新。此次更新同步了桌面端的Agent 4等新功能,包括并行智能体处理和团队协作能力。双方已解决审核争议,但未披露Replit是否修改了移动端预览AI生成代码的方式。此事被视为AI生成内容如何适应App Store规则的重要案例。

智能体编码行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
66
AgentKernelArena: 一个用于评估GPU内核优化AI编程代理的开源基准平台

AgentKernelArena是一个开源基准平台,专门用于系统评估AI编程代理在GPU内核优化任务上的能力。平台包含196个任务,涵盖HIP到HIP、Triton到Triton优化以及PyTorch到HIP翻译三大类。它采用隔离工作空间和分级评估(编译、正确性、性能)来测试代理的完整工作流,并创新性地引入了“未见配置”泛化测试。基准测试发现,主流AI代理在大多数任务上能近乎完美地编译和正确完成,并在PyTorch到HIP任务上实现高达6.89倍的平均加速。然而,泛化测试显示,从零生成内核的代理(PyTorch到HIP)在新配置下正确率显著下降,表明其常固化特定形状假设。该平台为严谨评估不同代理、任务和硬件目标提供了模块化框架。

arXiv开源生态编码论文/研究
06:57
Claude Code:GitHub Releases(RSS)
精选61
Claude Code v2.1.143 版本更新:插件管理与用户体验增强

Claude Code 发布 v2.1.143 版本,重点增强了插件管理功能,包括强制执行插件依赖关系,并新增了插件市场的预估上下文成本显示。为方便直接编辑工作副本,增加了 worktree.bgIsolation: "none" 设置。多项体验得到改进:后台会话唤醒后保留模型与努力级别设置;Windows PowerShell 工具默认绕过执行策略;claude agents 命令新增多个参数以配置默认会话。此外,本次更新修复了大量错误,包括修复损坏的 .credentials.json 文件导致 CLI 启动卡住、Windows Terminal 中的右键粘贴问题、后台会话错误捕获 IDE 文件引用,以及 macOS 上后台作业读取特定目录文件的权限错误等。

智能体Anthropic产品更新编码

推荐理由:Claude Code 的 v2.1.143 是个纯修补版本,修了一大堆边缘 bug 外加几个小优化,对重度用户可能是救命稻草,其他人可以等下次大版本。
06:50
Google DeepMind:Blog(RSS)
精选75
Gemini 3.5:具备行动能力的前沿智能

Google发布了Gemini 3.5模型,该模型专注于提升执行复杂任务的能力。其核心特点是支持“代理式工作流”,即能够像助手一样自主规划并执行一系列多步骤、复杂的操作,旨在将先进的语言理解与实际问题解决能力相结合。

智能体DeepMindGoogle多模态
关联讨论 19 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)
推荐理由:Gemini 3.5 Flash 把前沿级智能体和编程能力塞进了极低延迟和成本,四倍于竞品速度的同时基准表现超过 3.1 Pro,这可能是今年对开发者最实用的基座模型之一。
5月15日
22:24
The Decoder:AI News(RSS)
63
x.AI 推出首款终端编码助手 Grok Build,奋起直追

埃隆·马斯克的人工智能公司 x.AI 发布了其首款基于终端的编码助手 Grok Build,正式进入编码代理领域。该工具旨在通过命令行界面直接辅助开发者进行编程任务,标志着 x.AI 在竞争激烈的人工智能编程工具市场中迈出了关键一步。

智能体xAI产品更新编码
20:54
The Decoder:AI News(RSS)
51
Microsoft 撤回 Claude Code 许可,推动开发者回归其自有 AI 工具

微软已撤销数千名开发人员对 Anthropic 编程工具 Claude Code 的使用许可,转而推动他们采用自家的 GitHub Copilot CLI。此举意味着微软正主动将内部开发资源从第三方 AI 编程助手转向其自有产品,旨在巩固其开发生态系统的控制力并推广自有工具。

AnthropicMicrosoft编码行业动态
18:30
Ars Technica:AI(RSS)
60
Claude Code 的产品负责人谈论使用限制、透明度和"精益约束"

Anthropic 的产品负责人 Cat Wu 在谈及 Claude Code 时透露,团队没有制定宏大计划,但这是有意设计的产品策略。这一发言强调了公司在发展过程中注重灵活性和实用性,可能通过精益方法来调整使用限制和提升透明度,以适应不断变化的市场需求,确保产品迭代更贴合用户实际体验。

智能体Anthropic大佬观点编码
16:54
The Decoder:AI News(RSS)
58
OpenAI 在 iOS 和 Android 上推出 AI 编程助手 Codex

OpenAI 将其 AI 编程助手 Codex 集成到 iOS 和 Android 平台的 ChatGPT 应用中。这一更新使移动开发者能够通过 ChatGPT 应用直接访问 Codex 的编程辅助功能,支持代码生成、调试和优化等任务,扩展了 AI 工具在移动端的应用场景。

OpenAI产品更新编码
16:49
HuggingFace Daily Papers(社区热门论文)
54
FrontierSmith:大规模合成开放式编码问题

FrontierSmith 是一个自动化系统,能从现有封闭式编码任务中迭代演化出开放式问题。它通过改变问题目标、限制输出和泛化输入生成候选变体,并利用量化思维发散指标筛选能激发多元解法的问题,再由智能体生成测试用例与验证器。在两个开放式编码基准测试中,使用合成数据训练后,基础模型性能显著提升:Qwen3.5-9B 在 FrontierCS 上得分提高 +8.82,在 ALE-bench 上基于 Elo 评分的性能提升 +306.36;Qwen3.5-27B 分别提升 +12.12 和 +309.12。合成问题还使智能体进行更多轮次、消耗更多令牌,其特性与人工构建问题相似,表明封闭式问题种子可作为生成长视野编码数据的实用起点。

推理数据/训练编码论文/研究
‹ 上一页
1…1112131415…22
下一页 ›