AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 314 条
全部一手资讯X论文
标签「编码」清除
5月1日周五
01:15Claude:Blog(网页)64精选Claude Security 开启公开测试,赋能企业代码安全
00:13GitHub Blog59精选GitHub Copilot CLI 入门指南:交互模式与非交互模式
4月30日周四
20:00Cursor Blog55精选持续优化智能体工具链:上下文演进与效果评估
10:43智谱:研究(网页内嵌数据)55精选超大规模编码代理推理实践
02:11Claude:Blog(网页)64精选Claude API技能现已集成至CodeRabbit、JetBrains、Resolve AI及Warp
00:40Mistral AI:News(网页)76Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
4月29日周三
20:00Cursor Blog75精选使用 Cursor SDK 构建可编程智能体
11:35Claude Code:GitHub Releases(RSS)26v2.1.123
00:36Claude:Blog(网页)72精选像培训新开发者一样引导Claude Code:来自17年开发的经验教训
4月28日周二
12:33OpenAI:官网动态(RSS · 排除企业/客户案例)70精选一个用于编排的开源规范:Symphony
08:31Claude Code:GitHub Releases(RSS)60精选Claude Code v2.1.121 更新:新增功能、体验优化与内存泄漏修复
4月27日周一
23:58GitHub Blog79精选GitHub Copilot 将转向基于使用量的计费模式
4月24日周五
20:00OpenRouter:Announcements(RSS)67同事件精选使用Agent SDK搭建自定义编码智能体同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
20:00OpenRouter:Announcements(RSS)53使用 Agent SDK 构建你自己的 Harness
08:13Claude Code:GitHub Releases(RSS)56精选Claude 代码工具 v2.1.119 版本更新
4月23日周四
18:00OpenAI:官网动态(RSS · 排除企业/客户案例)63精选如何使用Codex进行日常工作
00:00Anthropic:Engineering(事故复盘 + 工程实践 · 网页)72精选关于近期 Claude Code 质量报告的更新说明
4月22日周三
21:00公众号:通义实验室(千问)59Qwen3.6-27B 开源发布:270亿稠密参数,编程能力超越前代MoE旗舰
08:07Claude Code:GitHub Releases(RSS)Claude Code v2.1.117 版本更新
06:17Cursor Blog68精选Cursor与SpaceX就模型训练达成合作
4月21日周二
21:02OpenAI:官网动态(RSS · 排除企业/客户案例)将 Codex 扩展至全球企业
20:00Cursor Blog55精选保持 Cursor 应用稳定
08:00Tomer Tunguz 博客(VC 分析)百亿美元的看涨期权
06:47Claude Code:GitHub Releases(RSS)v2.1.116 版本更新
02:15GitHub BlogGitHub Copilot Individual 计划变更
4月20日周一
23:40公众号:月之暗面(Kimi)57Kimi K2.6 发布并开源,全面精进代码和 Agent 集群能力
21:15OpenAI:官网动态(RSS · 排除企业/客户案例)OpenAI 助力凯悦面向全球员工推进 AI 应用
21:00Cloudflare Blog规模化AI代码审查的编排实践
19:48CMU:Machine Learning Blog卡内基梅隆大学在 ICLR 2026
15:40公众号:通义实验室(千问)59通义千问发布 Qwen3.6-Max-Preview
4月18日周六
09:43Claude Code:GitHub Releases(RSS)v2.1.114 版本发布
03:43Claude Code:GitHub Releases(RSS)Claude Code v2.1.113 发布
02:00GitHub Blog使用 GitHub Copilot CLI 构建 emoji 列表生成器
4月17日周五
04:42Claude Code:GitHub Releases(RSS)发布 v2.1.112 版本
4月16日周四
06:40Claude Code:GitHub Releases(RSS)Claude Code CLI v2.1.110 发布
01:00GitHub Blog用 GitHub Copilot CLI 构建个人组织指挥中心
4月15日周三
20:00Cursor Blog70精选更强AI模型推动开发者转向更高复杂度工作
12:57Claude Code:GitHub Releases(RSS)v2.1.109 版本发布
08:00Cursor Blog69精选在画布中与智能体创建的可视化界面交互
4月14日周二
20:00Cursor Blog62精选多智能体系统将GPU内核性能提升38%
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月1日
01:15
Claude:Blog(网页)
精选64
Claude Security 开启公开测试,赋能企业代码安全

Claude Security 现已面向所有 Claude Enterprise 客户开放公开测试。该功能基于 Claude Opus 4.7 模型,能够扫描代码库中的漏洞并生成针对性修复方案。公开版本新增了计划扫描与定向扫描功能,更易于与审计系统集成,并改进了问题追踪流程。此外,Opus 4.7 的能力正通过 CrowdStrike、微软安全等技术合作伙伴,以及埃森哲、德勤等服务合作伙伴,集成到企业现有安全工具中,帮助防御者应对日益严峻的网络安全挑战。

Anthropic产品更新安全/对齐编码

推荐理由:Claude Security 正式公测,Anthropic 把 Opus 4.7 的代码理解力直接嵌进企业安全流程,从扫描到 patch 一条龙,安全团队可能第一次能和 AI 齐步跑了。
00:13
GitHub Blog
精选59
GitHub Copilot CLI 入门指南:交互模式与非交互模式

GitHub Copilot CLI 提供了交互与非交互两种主要使用模式。交互模式允许用户通过对话式指令逐步构建和调整命令,适合探索性任务。非交互模式则支持直接输入完整指令快速执行,适用于自动化脚本或已知命令。理解这两种模式的区别能帮助开发者更高效地利用该工具,提升命令行工作效率。

GitHub教程/实践编码

推荐理由:如果你总在 Copilot CLI 的交互和非交互模式之间犯迷糊,这篇官方教程算是清晰的速查手册,初学者花五分钟就能搞清楚。
4月30日
20:00
Cursor Blog
精选55
持续优化智能体工具链:上下文演进与效果评估

Cursor团队以构建软件产品的方式迭代优化其智能体工具链,核心围绕上下文窗口的演进。早期模型能力有限,工具链依赖大量静态上下文和防护机制;随着模型能力提升,团队已转向提供更多动态上下文获取方式并移除限制。评估改进效果采用线上线下结合:通过CursorBench等基准测试进行标准化质量评估,同时进行线上A/B测试,使用“代码保留率”和用户反馈语义分析衡量真实场景表现。团队持续监控并修复工具调用错误,以应对日益复杂的工具链状态。

智能体AnthropicOpenAI教程/实践

推荐理由:Cursor 这篇 agent harness 复盘是今年聊 agent 基础设施最好的文章之一,从上下文管理到多 agent 调度,全是实战迭代的血泪经验,做 agent 的团队该逐字读。
10:43
智谱:研究(网页内嵌数据)
精选55
超大规模编码代理推理实践

在超大规模编码代理推理中,乱码和生僻字异常伴随低spec_accept_length,复读异常伴随高spec_accept_rate,均因KV Cache状态偏差导致。通过修复KV Cache竞态和加载时序缺失,引入显式同步约束及分层存储优化,提升了推理稳定性和效率。

编码论文/研究部署/工程

推荐理由:智谱公开了超大规模Coding Agent推理的工程细节,KV Cache竞态的修复和分层存储方案可以直接用,做Agent infra的值得收藏。
02:11
Claude:Blog(网页)
精选64
Claude API技能现已集成至CodeRabbit、JetBrains、Resolve AI及Warp

Claude API技能现已扩展集成至CodeRabbit、JetBrains、Resolve AI和Warp四款开发工具中,使开发者能在其常用环境中直接获得生产就绪的Claude API代码支持。该技能能自动捕获API最佳实践细节,如适配的智能体模式、参数变更与提示缓存规则,从而减少错误并简化模型迁移。开发者可在工具内直接指示Claude执行“提高缓存命中率”或“升级至最新Claude模型”等任务。此开源技能会随SDK更新自动同步,帮助团队更快采用新功能,避免因API知识过时导致的生产问题。

AnthropicMCP/工具产品更新编码

推荐理由:Anthropic 把 claude-api skill 从自家 IDE 扩散到 JetBrains、Warp 等主流开发工具,本质是用「内置专家知识」抢开发者心智,做 Claude API 集成的产品人值得看看它覆盖了哪些坑。
00:40
Mistral AI:News(网页)
76
Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体

Mistral AI推出旗舰模型Mistral Medium 3.5,这是一个128B参数的密集模型,拥有256K上下文窗口,在SWE-Bench Verified上获得77.6%的分数。该模型现作为Vibe和Le Chat的默认引擎,并驱动两项新功能:Vibe远程编程智能体可将编码任务移至云端异步并行执行,用户可通过CLI或Le Chat启动并在完成后接收通知;Le Chat的新工作模式则是一个由该模型驱动的智能体,能处理研究、分析和跨工具操作等多步骤复杂任务。这些更新旨在将开发者从本地线性任务中解放出来,提升工作效率。

智能体开源生态模型发布编码
4月29日
20:00
Cursor Blog
精选75
使用 Cursor SDK 构建可编程智能体

Cursor 正式推出 SDK 公开测试版,开发者仅需几行 TypeScript 代码即可构建和部署智能体。该 SDK 提供与 Cursor 应用相同的运行时、框架及前沿模型(如 GPT-5.5)支持,并允许将智能体部署于本地或 Cursor 云的专用虚拟机。借助其生产级云基础设施,如安全沙箱和持久状态管理,智能体正从个人工具演变为组织的可编程基础设施。许多团队已将其集成至 CI/CD 流水线、工作流自动化及核心产品中。

智能体产品更新编码

推荐理由:Cursor 把自家产线拆出来给外部用,对于想把 AI 代理嵌入 CI/CD 或产品的团队,省掉了自建完整 agent 栈的麻烦,对做自动化编码的开发者是个必看的更新。
11:35
Claude Code:GitHub Releases(RSS)
26
v2.1.123

本次更新修复了一个关键的OAuth身份验证故障。当环境变量CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS被设置为1时,系统此前会陷入401错误的重试循环,导致认证失败。此问题现已得到解决,确保了在该特定配置下身份验证流程的正常运行。

Anthropic产品更新编码
00:36
Claude:Blog(网页)
精选72
像培训新开发者一样引导Claude Code:来自17年开发的经验教训

华盛顿大学MacCoss实验室的Brendan MacLean将培训新开发者的方法论应用于Claude Code,以管理拥有70万行C#代码、持续开发17年的开源蛋白质分析软件Skyline。他通过创建独立的AI上下文仓库、编写CLAUDE.md引导文件以及设计“技能”模块(如调试技能),为Claude Code建立项目认知。该方法显著提升了开发效率:搁置一年的文件视图面板功能在两周内完成;CSS布局更新从依赖设计师变为不到一天实现。此外,Claude Code还自动化了2000多张教程图片的截图比对和每日测试报告生成,团队现在主要依靠它生成代码和脚本。

AnthropicMCP/工具教程/实践编码

推荐理由:这不是又一篇 Claude Code 安利文,而是一个维护了 17 年 70 万行 C# 代码库的人,把带新人的方法论原封不动搬给了 AI,结果真管用。做 legacy 项目的人应该认真看他的 context 管理和 skill 库设计。
4月28日
12:33
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选70
一个用于编排的开源规范:Symphony

Symphony 是一个用于 Codex 编排的开源规范,能够将问题跟踪器转化为持续运行的智能体系统。该系统通过自动化任务协调与执行,显著提升工程团队的产出效率,同时减少开发者在不同任务间频繁切换带来的认知负担。其核心在于以标准化、可扩展的方式,将日常开发流程转化为由智能体持续驱动的工作流。

智能体OpenAI产品更新开源/仓库

推荐理由:OpenAI 把 Codex 的编排层抽成开源规范,等于告诉所有做 coding agent 的团队,底层调度逻辑不用自己造轮子了。做 AI 编程工具的值得花半小时看架构思路。
08:31
Claude Code:GitHub Releases(RSS)
精选60
Claude Code v2.1.121 更新:新增功能、体验优化与内存泄漏修复

本次更新为 Claude Code 带来多项增强与修复。新增功能包括 MCP 服务器的 alwaysLoad 配置、claude plugin prune 命令以及 /skills 界面搜索框。用户体验方面,优化了全屏模式滚动、对话框键盘滚动和长 URL 点击体验。重点修复了处理多张图片或使用 /usage 命令时可能出现的数 GB 内存泄漏问题,并解决了 Bash 工具在工作目录被删除后失效等稳定性缺陷。此外,还改进了 MCP 服务器的错误重试机制和终端会话标题的本地化显示。

智能体Anthropic产品更新编码

推荐理由:Claude Code 这版修了一堆让人抓狂的内存泄漏和崩溃问题,加上 alwaysLoad 和 plugin prune 两个实用功能,重度用户值得立刻升级,但对非用户来说只是例行迭代。
4月27日
23:58
GitHub Blog
精选79
GitHub Copilot 将转向基于使用量的计费模式

自6月1日起,GitHub Copilot 的使用将开始消耗 GitHub AI Credits,计费模式正式从固定订阅制转变为基于实际使用量的计费。这一变化意味着用户的费用将与 AI 助手的具体调用量直接挂钩,而非统一的月费或年费。

编码行业动态部署/工程

推荐理由:GitHub Copilot 从订阅制转向按量计费,这是 AI 编程工具定价范式的标志性拐点,所有重度用户和竞品都得重新算账。
4月24日
20:00
OpenRouter:Announcements(RSS)
同事件精选67
使用Agent SDK搭建自定义编码智能体

OpenRouter Agent SDK 提供 create-agent-tui 和 create-headless-agent 两种技能,可在几分钟内脚手架搭建个性化编码智能体。前者附带终端 UI,后者为无头模式,适用于脚本与管道自动化场景。

智能体教程/实践编码
同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
推荐理由:虽然隔了一个多月,但这个官方教程把 Agent SDK 的脚手架玩法拆得很透,想自己搭 coding agent 的开发者抄一遍就能跑起来,省得从头写 harness。
20:00
OpenRouter:Announcements(RSS)
53
使用 Agent SDK 构建你自己的 Harness

Anthropic 发布了 Agent SDK,开发者可利用 create-agent-tui 和 create-headless-agent 技能,在几分钟内搭建个性化的编码智能体。该 SDK 支持两种模式:一是提供终端用户界面的交互式代理,二是无界面的“headless”代理,便于集成到自动化脚本和流水线中。这显著降低了为特定编码任务定制 AI 助手的门槛。

智能体产品更新编码
08:13
Claude Code:GitHub Releases(RSS)
精选56
Claude 代码工具 v2.1.119 版本更新

Claude 代码工具发布 v2.1.119 版本,带来多项功能优化与问题修复。主要更新包括:用户配置现持久化至本地文件;新增 prUrlTemplate 设置以自定义 PR 徽章链接;--from-pr 命令扩展支持 GitLab、Bitbucket 等多个平台。工具权限与交互行为在多处实现统一,例如 --print 模式现在遵从代理的前置元数据定义。界面体验获得改进,如斜杠命令建议会高亮匹配字符,长描述自动换行。此外,本次更新修复了大量已知问题,涉及粘贴格式错乱、工具意外隐藏、MCP 服务器连接失败、权限模式行为异常及界面显示错误等。

Anthropic产品更新编码

推荐理由:Claude Code 这次更新全是打磨细节,没有大功能但修了一堆让人骂娘的 bug,重度用户值得升级,其他人等下一个大版本也行。
4月23日
18:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选63
如何使用Codex进行日常工作

该内容探索了10个实用的ChatGPT Codex用例,旨在自动化任务、创建交付物,并将真实的输入转化为跨工具、文件和工作流的输出。

OpenAI教程/实践编码

推荐理由:虽然发布一月有余,但官方整理的十个 Codex 日常自动化用例依然是最佳上手模板,从邮件整理到数据报表,产品人和运营可以直接抄作业。
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选72
关于近期 Claude Code 质量报告的更新说明

Anthropic 确认并解决了过去一个月影响 Claude Code、Claude Agent SDK 和 Claude Cowork 的三个问题,所有问题已于 4 月 20 日修复。具体包括:3月4日将 Claude Code 的默认推理强度从“高”改为“中”,导致用户感知智能下降,已于4月7日回滚;3月26日一项缓存优化存在缺陷,导致会话恢复后模型“健忘”和重复,4月10日修复;4月16日一项旨在减少冗余的系统提示指令意外损害了代码质量,4月20日撤销。这些问题影响了 Sonnet 4.6 和 Opus 4.6/4.7 模型,但 API 未受影响。公司已重置所有订阅用户的使用限额,并承诺改进流程以防止类似问题。

Anthropic安全/对齐编码行业动态

推荐理由:Anthropic 把 Claude Code 连续一个月质量下滑的三个 bug 全部摊开讲,这种级别的工程复盘在大模型公司里极少见。做 Agent 产品的人该认真读,因为这三个坑你迟早也会踩。
4月22日
21:00
公众号:通义实验室(千问)
59
Qwen3.6-27B 开源发布:270亿稠密参数,编程能力超越前代MoE旗舰

Qwen3.6-27B 开源发布,采用270亿稠密参数,无需MoE路由,部署门槛更低。编程能力全面超越前代旗舰Qwen3.5-397B-A17B MoE,在SWE-bench Verified(77.2)、SWE-bench Pro(53.5)、Terminal-Bench 2.0(59.3)、SkillsBench(48.2)等基准上领先,深度思考能力媲美超大参数模型。原生支持多模态,可处理图像、视频与文本,支持视觉推理、文档理解和视觉问答,具备视觉语言思考与非思考模式。开源权重已上线Hugging Face与ModelScope,API即将在阿里云百炼上线,兼容OpenAI与Anthropic协议,即时对话可通过Qwen Studio体验。

多模态推理模型发布编码
08:07
Claude Code:GitHub Releases(RSS)
Claude Code v2.1.117 版本更新

Claude Code 发布 v2.1.117 版本。模型选择现支持跨会话持久化;Pro/Max 用户 Opus 4.6 与 Sonnet 4.6 默认 effort 级别提升至 high。原生 macOS/Linux 构建采用 bfs 和 ugrep 替代原有工具,搜索速度显著提升。插件系统支持自动安装缺失依赖。修复 Opus 4.7 上下文窗口计算错误(200K→1M),优化 MCP 服务器并发启动速度,/resume 新增大会话总结功能。

智能体Anthropic产品更新编码
06:17
Cursor Blog
精选68
Cursor与SpaceX就模型训练达成合作

智能编程助手Cursor宣布与SpaceX合作,以突破算力瓶颈,加速其模型训练进程。该公司在不到半年内快速迭代了Composer系列模型:首款智能编码模型Composer问世后,Composer 1.5将强化学习规模扩大20倍以上,而Composer 2通过持续预训练,以极低成本达到了前沿性能水平。此次合作将使Cursor团队利用xAI的Colossus基础设施,大幅提升训练规模,从而显著增强模型的智能水平。

智能体编码行业动态

推荐理由:Cursor 抱上 xAI 的算力大腿,意味着 AI 编程工具的竞争正式进入「谁的 GPU 多」阶段。对开发者来说,Composer 系列模型接下来的进化速度会明显加快,值得持续关注。
4月21日
21:02
OpenAI:官网动态(RSS · 排除企业/客户案例)
将 Codex 扩展至全球企业

OpenAI 推出 Codex Transformation Partners 计划,联合埃森哲、普华永道、印孚瑟斯等全球咨询与科技服务商,协助企业在软件开发生命周期内部署并规模化应用 Codex。该合作旨在通过专业服务体系,将 AI 编程工具从试点阶段推向全面生产环境,加速全球企业软件开发流程的智能化转型。

智能体OpenAI产品更新编码
20:00
Cursor Blog
精选55
保持 Cursor 应用稳定

Cursor 团队针对用户全天依赖应用、崩溃影响严重的问题,聚焦内存不足导致的崩溃。通过为多进程架构设计细粒度监控系统,实时追踪版本发布后的崩溃指标。采用双重调试策略:自上而下关联功能与崩溃数据,监控大消息负载;自下而上通过崩溃观察服务、堆快照等定位根本原因。自2月底以来,全版本会话OOM率下降80%,自3月1日起请求OOM率下降73%。具体措施包括处理大文件加载和修复资源泄漏,以应对突发与渐进性内存耗尽。

现象/趋势编码部署/工程

推荐理由:Cursor 把自家 OOM 问题的排查方法论完整公开了,自顶向下加自底向上的双线调试思路对做桌面端 Agent 产品的人有参考价值,但本质上是工程复盘而非行业事件。
08:00
Tomer Tunguz 博客(VC 分析)
百亿美元的看涨期权

SpaceX与Cursor达成100亿美元战略合作,保留年内以600亿美元收购后者的期权。Cursor作为史上增长最快的开发者工具,年收入20亿美元,拥有庞大开发者网络,但模型层长期依赖OpenAI等竞争对手。xAI虽拥有配备10万NVIDIA H100的Colossus数据中心,其Grok模型周处理量却从6万亿token暴跌90%至0.6万亿。此次交易使SpaceX获得关键分发渠道,同时让Cursor摆脱对第三方模型的依赖,实现垂直整合。

智能体xAI编码行业动态
06:47
Claude Code:GitHub Releases(RSS)
v2.1.116 版本更新

Claude Code v2.1.116 优化性能与终端体验。大型会话 /resume 速度提升最高67%,MCP 启动加快且资源列表延迟加载。改进 VS Code、Cursor 和 Windsurf 的全屏滚动,修复 Kitty 键盘协议下快捷键失效及 Devanagari 等印度语系渲染错位问题。安全方面修复 sandbox auto-allow 绕过危险路径检查的问题。同时改进 /config 搜索、/doctor 响应逻辑及插件依赖自动安装。

智能体Anthropic产品更新编码
02:15
GitHub Blog
GitHub Copilot Individual 计划变更

GitHub 宣布调整 Copilot Individual 个人版订阅计划,旨在确保现有用户获得更稳定、可预测的服务体验。官方表示此次变更将提升产品可靠性,但未披露具体调整内容、生效时间及定价变化等细节,完整信息有待官方进一步公布。

GitHub产品更新编码
4月20日
23:40
公众号:月之暗面(Kimi)
57
Kimi K2.6 发布并开源,全面精进代码和 Agent 集群能力
智能体开源/仓库模型发布编码
21:15
OpenAI:官网动态(RSS · 排除企业/客户案例)
OpenAI 助力凯悦面向全球员工推进 AI 应用

凯悦酒店集团在全球范围内部署 ChatGPT Enterprise,集成 GPT-5.4 与 Codex 模型,旨在提升员工生产力、运营效率及宾客体验。通过与 OpenAI 合作,凯悦将企业级生成式 AI 工具普及至全体员工,优化内部协作流程与酒店服务标准,推动 hospitality 行业数字化转型。

智能体OpenAI编码行业动态
21:00
Cloudflare Blog
规模化AI代码审查的编排实践

团队基于OpenCode构建CI原生AI代码审查系统,将智能审查能力深度集成至持续集成流程。该系统通过自动化编排实现大规模代码审查,在代码提交阶段为工程师提供实时质量检测与安全分析,帮助团队及时识别潜在问题,显著提升代码质量与交付安全性。

智能体教程/实践编码
19:48
CMU:Machine Learning Blog
卡内基梅隆大学在 ICLR 2026

卡内基梅隆大学将在2026年4月23日至27日于巴西里约热内卢举行的ICLR 2026会议上展示194篇研究论文。其中,研究人员发布了EditBench基准测试,包含545个真实世界代码编辑任务,用于评估大语言模型根据用户指令编辑现有代码的能力。该基准考虑了周围代码和光标位置等实际上下文。测试结果显示,大多数AI模型在该任务上表现挣扎。

编码论文/研究
15:40
公众号:通义实验室(千问)
59
通义千问发布 Qwen3.6-Max-Preview

通义千问发布 Qwen3.6-Max-Preview 预览版,相比 Qwen3.6-Plus 在多项基准上显著提升:智能体编程(SkillsBench +9.9、SciCode +6.3、NL2Repo +5.0、Terminal-Bench 2.0 +3.8)、世界知识(SuperGPQA +2.3、QwenChineseBench +5.3)、指令遵循(ToolcallFormatIFBench +2.8)。新版本支持 preserve_thinking,可在消息中保留前序轮次思维内容,避免多步任务上下文丢失,官方推荐用于智能体开发。用户可登录 Qwen Studio 直接对话,或通过阿里云百炼(即将上线)调用 API。

智能体推理模型发布编码
4月18日
09:43
Claude Code:GitHub Releases(RSS)
v2.1.114 版本发布

v2.1.114 版本发布,修复了权限对话框在 Agent Teams 队友请求工具权限时发生的崩溃问题。此次更新解决了多智能体协作场景中的关键稳定性故障,当团队成员发起工具权限申请时,系统不再出现异常退出,确保了协作流程的顺畅进行。

智能体Anthropic产品更新编码
03:43
Claude Code:GitHub Releases(RSS)
Claude Code v2.1.113 发布

Claude Code v2.1.113 将CLI改为通过原生二进制文件运行,替代原有JavaScript捆绑包。新增 deniedDomains 设置实现域名精确拦截,并强化Bash工具安全策略,将macOS系统路径列为危险删除目标,修复命令包装器绕过限制的问题。交互方面优化全屏选择、多行输入快捷键及长URL点击体验,改进/loop和/ultrareview命令性能。此外修复30余项Bug,涵盖MCP调用超时、表格渲染、远程控制会话及插件安装冲突等问题。

智能体Anthropic产品更新编码
02:00
GitHub Blog
使用 GitHub Copilot CLI 构建 emoji 列表生成器

开发者在 Rubber Duck Thursday 直播中展示了使用 GitHub Copilot CLI 构建 emoji 列表生成器的完整过程。该项目通过 AI 编程助手在命令行界面实现快速开发,演示了如何利用 GitHub Copilot CLI 生成功能性工具代码,体现了 AI 辅助编程在提升开发效率与快速原型制作方面的实际应用。

GitHub教程/实践编码
4月17日
04:42
Claude Code:GitHub Releases(RSS)
发布 v2.1.112 版本

发布 v2.1.112 版本更新,重点修复自动模式下 claude-opus-4-7 模型提示"temporarily unavailable"的可用性故障。此次补丁解决了该模型在自动模式调用时的服务中断问题,消除错误提示,恢复其正常响应功能,确保用户可稳定使用该 AI 模型进行交互。

智能体Anthropic产品更新编码
4月16日
06:40
Claude Code:GitHub Releases(RSS)
Claude Code CLI v2.1.110 发布

新增 /tui 命令实现全屏无闪烁渲染,Ctrl+O 改为切换详细转录模式,焦点视图由 /focus 独立控制。强化插件管理界面,新增 MCP 服务器配置冲突警告,扩展远程控制客户端对多条斜杠命令的支持。修复 30 余项问题,包括 MCP 工具调用挂起、全屏高 CPU 占用、非受信文件名命令注入漏洞等,并优化内存分配与会话管理。

智能体AnthropicMCP/工具产品更新
01:00
GitHub Blog
用 GitHub Copilot CLI 构建个人组织指挥中心

一位 GitHub 工程师基于 GitHub Copilot CLI 构建了个人组织指挥中心,详细展示了 AI 如何辅助该生产力工具的开发全过程。这一实践案例记录了从需求构思到功能实现的技术细节,体现了 AI 编程助手在加速个人项目开发和提升工作效率中的实际应用价值。

智能体GitHubMicrosoft教程/实践
4月15日
20:00
Cursor Blog
精选70
更强AI模型推动开发者转向更高复杂度工作

一项针对500家公司开发者使用Cursor的八个月研究发现,在Opus 4.5和GPT-5.2等先进模型发布后,人均周AI使用量增长44%。开发者初期用更强模型完成更多同复杂度任务,4-6周后开始转向更高复杂度工作,高复杂度任务量激增68%,远超低复杂度任务的22%。媒体广告、软件工具和金融科技行业增长最为显著。任务分布呈现结构性变化:文档编写、架构设计等管理性任务增长超50%,而UI设计等独立任务仅增15%,表明开发者角色正从代码生成转向代码库管理。研究揭示了类似杰文斯悖论的效应——AI效率提升反而刺激了总需求,并可能创造新的经济活动空间。

现象/趋势编码论文/研究

推荐理由:Cursor 拿 500 家公司八个月的真实数据证明了一个反直觉结论,AI 越好开发者用得越多,而且是从做更多简单活慢慢转向啃硬骨头。做 AI 产品的人该认真想想这个杰文斯效应。
12:57
Claude Code:GitHub Releases(RSS)
v2.1.109 版本发布

v2.1.109 版本正式发布,重点优化了扩展思考功能的交互体验。此次更新针对深度思考指示器进行改进,新增旋转进度提示动画,使用户在模型进行复杂推理期间能够更直观地感知实时处理状态。该版本聚焦于提升长时间计算场景下的视觉反馈,通过动态指示元素缓解等待焦虑,进一步完善了产品的人机交互细节。

智能体Anthropic产品更新编码
08:00
Cursor Blog
精选69
在画布中与智能体创建的可视化界面交互

Cursor新增画布功能,可将信息转化为可视化、可交互的界面,替代难以阅读的长篇文本。智能体能利用画布为真实数据创建仪表盘,或定制带逻辑的交互界面,应用于代码审查、学习库文档乃至管理其他智能体。该功能基于React组件库构建,包含表格、图表等原生组件。在数据密集型任务中尤为高效,例如聚合多源数据生成统一分析图表,或在代码审查中智能分组并优先展示关键变更。Cursor团队已借此显著提升了模型评估分析和复杂问题研究的效率,成为扩展人机协作信息带宽的关键工具。

智能体产品更新编码

推荐理由:Cursor 把 agent 输出从纯文本拉到可交互的可视化画布,PR review、eval 分析这些高频场景立刻能用上。做 coding agent 的同行该想想自己的 agent 输出形态是不是该升级了。
4月14日
20:00
Cursor Blog
精选62
多智能体系统将GPU内核性能提升38%

我们与NVIDIA合作,利用自主运行的多智能体系统,在为期三周内对235个真实CUDA内核进行了优化。该系统从零开始构建并优化Blackwell GPU内核直至汇编级别,实现了38%的几何平均速度提升,其中63%的问题超越基线,19%实现超2倍优化。这些内核直接影响AI训练与推理效率,传统上需资深工程师耗时数月乃至数年的优化工作,该系统在数周内即自主完成,并能探索更广阔解决方案空间,突破了人工逐项优化的限制。

智能体现象/趋势编码部署/工程

推荐理由:Cursor 把自家多 Agent 系统拉去优化 CUDA 内核,38% 的 geomean 提速不算炸裂,但真正值得看的是它证明了 Agent 可以在无人干预下跑三周啃硬骨头,这对做 Agent 产品的人是个强信号。
‹ 上一页
1…345678
下一页 ›