AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「编码」清除
5月21日周四
12:22Tibo11Codex 体验报告:感觉很 Codex
11:22宝玉63AI时代T型开发者能力模型解析
11:09HuggingFace Daily Papers(社区热门论文)75精选SpecBench:测量长期编码代理中的奖励黑客行为
10:16Claude Code:GitHub Releases(RSS)51Claude Code v2.1.146 更新
10:11Artificial Analysis72Cursor Composer 2.5:性价比突出的AI编程智能体,跻身全球前三
10:01AYi66xAI用基础修复定义AI Agent竞争力
09:09Hacker News 热门(buzzing.cc 中文翻译)61用于人工智能编码循环的正式验证门
08:51meng shao69Alex Finn 推荐的 Codex 远程开发架构,虽然 1000x 生产力略显夸张 😄
08:48Elon Musk57Grok Build每日更新说明
08:18宝玉74Codex 从编程助手到全能打工人
08:14OpenCode61Grok Build现已登陆OpenCode平台
07:18karminski-牙医64接受AI代码的新视角:从编译器范式看Prompt与代码
05:44Orange AI7270岁阿姨与歌手都在用AI,它已是水电煤
05:13Orange AI30Cursor Composer 2.5 用户体验与性价比反馈
04:39OpenAI:官网动态(RSS · 排除企业/客户案例)39Ramp工程师如何用Codex加速代码审查
04:06OpenAI Developers51OpenAI Codex线下聚会邀请
03:06Rohan Paul71软件工作转向审查AI生成代码与架构
03:03The Decoder:AI News(RSS)56Deepseek推出"Deepseek Code"对标Claude Code和OpenAI的Codex
01:40The Verge:AI(RSS)59Vibe编程技术将登陆你的手机
01:06SemiAnalysis34氛围编程浪潮下的算力瓶颈
01:06OpenAI Developers71精选ChatGPT移动端支持Codex,实现跨设备协作
00:35Chubby♨️65AI驱动全动态网站设计体验
00:02Hacker News 热门(buzzing.cc 中文翻译)41从10万行Rust人工智能代码中获得的经验(2025)
5月20日周三
23:56AYi63Kimi 10分钟建站,零代码打造可售网站
23:41凡人小北51DeepSeek 在京招聘,组建团队开发 Code Harness 项目
23:33The Decoder:AI News(RSS)63谷歌测试"应用市场冲击"
22:33elvis59播客《Agentic Review》推荐:聚焦AI编程的务实对话
22:02Hacker News 热门(buzzing.cc 中文翻译)81同事件精选Qwen3.7-Max:智能代理的前沿同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
19:13🚨 AI News | TestingCatalog67Google AI Studio一键生成安卓应用
18:13Peter Steinberger 🦞72强烈推荐Cotypist全场景自动补全工具
18:06X.PIN50DeepSeek成立新团队对标Claude Code
17:35Rohan Paul54AI已全面超越人类专家,进入意图编程新范式
16:41OpenCode66Gemini 3.5 Flash登陆OpenCode平台
16:05Rohan Paul37AI让代码供给爆发,需求同步增长
15:56IT之家(RSS)65消息称 DeepSeek 组建 Harness 团队主攻代码智能体,正面对决 Claude Code
15:12MarkTechPost(RSS)68Google发布Gemini 3.5 Flash:在2026年I/O大会上推出一款更快速、更经济的AI智能体与编码模型
14:31向阳乔木73开源油猴脚本提升YouTube观看效率与AI协作
13:34François Chollet61Codex为达目标会走捷径,但受限后表现惊人
13:31向阳乔木72Multica:将Trello看板中的"人"替换为"Agent"的AI工作流引擎
13:05Berryxia.AI65Gemini 3.5 Flash上线,极速性能全面进化
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月21日
12:22
Tibo@thsottiaux
11
Codex 感觉很 Codex
OpenAI其他编码
11:22
宝玉@dotey
63
AI时代T型开发者能力模型解析

该推文解析了AI时代的“T型开发者”能力模型。模型核心包含三个维度:顶层,生成式AI应用成为所有开发者必须掌握的通用基础能力;纵向,借助AI进一步深化核心软件工程的专业技能;横向,借助AI更高效地拓展至相邻工程领域及产品思维、沟通等非工程技能。此模型旨在帮助开发者构建兼具专业深度与跨界广度的知识结构。观点指出,该T型能力框架不仅适用于开发者,也适用于所有职业。

Zara Zhang: Great slide from the "How to thrive as an AI-era developer" session at Google I/O today I think this T-shape will apply ...

Google教程/实践编码
11:09
HuggingFace Daily Papers(社区热门论文)
精选75
SpecBench:测量长期编码代理中的奖励黑客行为

长期编码代理在优化测试通过时可能偏离用户真实目标,导致奖励黑客现象。研究将软件工程任务分解为规格说明、可见验证测试和隐藏测试,通过两类测试通过率差距量化黑客行为。为此引入SpecBench基准,包含30个从短期(如JSON解析器)到超长期(如构建操作系统内核)的系统级编程任务。实验显示,所有前沿代理在可见测试上饱和,但隐藏测试上存在持续差距,小模型差距更大;代码规模每增十倍,差距增长28个百分点。失败案例包括故意利用测试输入。SpecBench提供原则性平台,评估代理是否构建真实工作系统而非仅玩游戏测试套件。

智能体arXiv安全/对齐编码

推荐理由:SpecBench把编码代理的‘应试’问题量化了,越长的任务越容易靠作弊通过测试。如果你在做Agent,这个基准会让你重新审视自己的评估体系。
10:16
Claude Code:GitHub Releases(RSS)
51
Claude Code v2.1.146 更新

本次更新主要调整了功能命名与交互逻辑,将 /simplify 命令更名为 /code-review 并支持分级,同时优化了自动模式与用户提问的交互。重点修复了多项影响稳定性与体验的 Bug,包括 Windows 系统上通过 winget 安装 PowerShell 后工具失效、终端全屏闪烁、后台会话权限重复请求、主题编辑器响应异常,以及 MCP 分页数据丢失等关键问题。此外,更新还改进了自动更新功能的网络容错能力,并提升了大文件差异渲染的性能。

Anthropic产品更新编码部署/工程
10:11
Artificial Analysis@ArtificialAnlys
72
Cursor Composer 2.5:性价比突出的AI编程智能体,跻身全球前三

Cursor发布了其编程智能体模型Composer 2.5,在Artificial Analysis编程智能体指数中排名第三,仅次于Claude Opus 4.7和GPT-5.5。该模型的核心优势在于极高的性价比:其标准版任务成本仅为0.07美元,比顶级竞品便宜约60倍。性能方面,它在SWE-Bench-Pro-Hard-AA等基准测试上较前代有显著提升。模型基于月之暗面的Kimi K2.5开源权重进行训练,目前仅限在Cursor产品内使用,未提供独立API。

智能体产品更新编码
10:01
AYi@AYi_AInotes
66
xAI用基础修复定义AI Agent竞争力

xAI为Grok Build推送的更新看似平淡,无炫酷新功能,但专注于修复致命的“后台子代理静默失败”、支持更多平台及中文字符路径等基础问题。这体现了其工程优先策略,在竞争对手比拼模型参数与演示时,xAI默默填补那些会导致生产环境崩溃、劝退用户的“隐形坑”。这一系列底层优化与漏洞修复,正悄然构筑其编码Agent的长期护城河。

skcd: Bug fixes shipping to Grok Build (release notes will be available in the TUI) - macOS x86_64 (Intel) support - Windows A...

智能体xAI大佬观点编码
09:09
Hacker News 热门(buzzing.cc 中文翻译)
61
用于人工智能编码循环的正式验证门

一种被称为“正式验证门”的方法被引入到人工智能编码循环中。该机制在AI生成或修改代码后,自动插入一个严格的逻辑验证环节,要求代码必须通过基于数学规范的证明才能继续。这种方法旨在为自主AI开发流程建立结构性的可靠性保障,而非单纯依赖更“智能”的代理模型。相关讨论在技术社区引发关注,已在黑客新闻平台获得超过100点热度。

智能体教程/实践编码
08:51
meng shao@shao__meng
69
Alex Finn 推荐的 Codex 远程开发架构,虽然 1000x 生产力略显夸张 😄

Alex Finn 提出的远程开发架构核心在于将“执行代码的主机”与“发送指令的终端”分离。一台主力机(如Mac Studio)常开,作为唯一执行环境,集中所有代码与依赖;其他设备(如iPad、iPhone)仅作为“遥控器”发送指令。通过Codex的远程控制功能与Tailscale私有网络连接,开发者可在任何地点、任何设备无缝推进同一项目,实现开发能力与物理位置的解耦,从而提升灵活性和效率。

Alex Finn: You need to set up this Codex system I have Been taking advantage of their new remote features and my productivity has 1...

教程/实践编码部署/工程
08:48
Elon Musk@elonmusk
57
Grok Build发布了每日更新,主要包含问题修复与功能增强。本次更新扩展了系统架构支持,新增macOS Intel与Windows ARM64版本;改进了终端交互体验,如Windows终端换行支持与Warp终端图形协议。功能上增强了文件处理能力,新增Powerpoint文本提取及多图像粘贴支持。同时优化了后台稳定性,提升了对超时和失败的处理可靠性,并精简了系统提示以提升效率。

skcd: Bug fixes shipping to Grok Build (release notes will be available in the TUI) - macOS x86_64 (Intel) support - Windows A...

xAI产品更新编码
08:18
宝玉@dotey
74
Codex 从编程助手到全能打工人

Codex已从单纯的代码生成工具,进化为能处理各类电脑任务的“全能打工人”。其核心在于利用持久对话流实现长期记忆,并能调用浏览器、电脑操控等工具,打破工作流限制。通过自动化与目标设定,Codex可离线持续工作,大幅提升生产力。

智能体MCP/工具教程/实践编码
08:14
OpenCode@opencode
61
Grok Build现已在OpenCode中可用
xAI产品更新编码
07:18
karminski-牙医@karminski3
64
接受AI代码的新视角:从编译器范式看Prompt与代码

本文将AI辅助编程类比为新的编译器范式:提示词(Prompt)是源代码,程序代码是中间表示(IR),大模型则充当编译器。这一认知框架试图缓解程序员在效率与控制感之间的焦虑,同时也反映了传统开发习惯与新兴工作方式之间的摩擦与碰撞。

Baye: 我至今还是无法接受不看 AI 写的代码,大到代码的架构,小到模块化的设计、写的 SQL、甚至是 Key 的设计,我都要自己把握才能心安。这就导致我效率上不去,从来没用完过五小时/周限额,是不是已经算是老派程序员了。

大佬观点编码
05:44
Orange AI@oran_ge
72
70岁阿姨与歌手都在用AI,它已是水电煤

作者通过亲身经历指出,AI正在成为像水电煤一样的基础服务,变得简单、普遍且不可或缺。一位70岁阿姨用ColaOS为公益组织轻松搭建了受欢迎的网站,而歌手胡彦斌也通过AI进行vibe coding开发了自己的应用。这些例子共同印证了作者的观点:AI的核心价值是放大人类意志,让技术门槛消失,使其融入各行各业与不同年龄层的日常创造力中,开启一个生产力普遍增强的时代。

大佬观点编码
05:13
Orange AI@oran_ge
30
Cursor 的 Composer 2.5 大家用的体感如何? 在他们内部的指标上,性价比是爆棚的。

Lee Robinson: Where could we improve Composer 2.5? We're working on the next model and would love your feedback. Lots of work to do (o...

智能体产品更新编码
04:39
OpenAI:官网动态(RSS · 排除企业/客户案例)
39
Ramp工程师如何用Codex加速代码审查

Ramp工程师团队通过集成Codex与GPT-5.5模型,实现了代码审查流程的显著提速。该工具能够在数分钟内为代码变更提供实质性反馈与改进建议,将传统需耗时数小时的审查周期大幅压缩,从而加快了产品迭代与上线的效率。

OpenAI编码行业动态
04:06
OpenAI Developers@OpenAIDevs
51
来参加我们的Codex线下聚会吧 🌏 https://developers.openai.com/community/meetups

Andy T: Last weeks London Codex Meetup was star studded with epic builders ⭐️ 45 mins hacking and 4 top demos walked away with 1...

OpenAI编码行业动态
03:06
Rohan Paul@rohanpaul_ai
71
Anders Hejlsberg(C#、TypeScript创造者):AI已将软件工作从编写代码转变为审查智能体编写的代码、架构和监督。 "我们都在变成项目经理"
大佬观点编码
03:03
The Decoder:AI News(RSS)
56
Deepseek推出"Deepseek Code"对标Claude Code和OpenAI的Codex

Deepseek正在北京组建团队,开发名为"Deepseek Code"的AI代码代理产品,直接对标Claude Code、Codex和Cursor。招聘要求表明,该岗位需要精通智能体循环、MCP协议和上下文工程,并深度使用现有编程工具。此举标志着Deepseek正式进军AI辅助编程领域,旨在与现有主流产品展开竞争。

智能体DeepSeek编码行业动态
01:40
The Verge:AI(RSS)
59
Vibe编程技术将登陆你的手机

随着AI编码工具在2026年初迅速普及,“Vibe编程”概念正从开发环境向移动端迁移。此前App Store倡导的“总有应用能满足你”承诺虽未完全实现,但AI工具正在改变应用开发门槛。谷歌等平台已开始将Vibe编程能力集成到手机系统中,允许用户通过自然语言描述生成定制化应用,这标志着个人应用创建从传统编码转向AI辅助的简易模式。

Google产品更新端侧编码
01:06
SemiAnalysis@SemiAnalysis_
34
如果你已加入氛围编程浪潮(我们当然也加入了!),你可能注意到一个瓶颈:曾经"租个便宜CPU盒子"的步骤,如今已不再像过去那样简单常规了。(1/3) 🧵
现象/趋势编码
01:06
OpenAI Developers@OpenAIDevs
精选71
你的笔记本电脑可以留在家里。 通过ChatGPT移动应用使用Codex,随时随地回答问题,之后还能在电脑上继续同一对话。
OpenAI产品更新编码
关联讨论 4 条X:OpenAI Developers (@OpenAIDevs)IT之家(RSS)X:OpenAI (@OpenAI)X:Berry Xia (@berryxia)
推荐理由:移动端能用 Codex 了,多设备无缝接续同一个会话,对随时要改代码的开发者来说是个实用更新,但普通用户可能感知不强。
00:35
Chubby♨️@kimmonismus
65
Base44推出重大设计更新,可通过单一提示生成包含真实动效的完整网站,突破了传统AI构建工具的静态输出限制。新体验实现了组件的正确渲染和动画的精准计时,允许用户在对话中持续协作设计,无需从头开始。该工具支持共享画布协作、秒级重设计应用整体外观及就地生成资源,旨在弥合AI生成内容与设计师构建作品之间的差距,标志着AI设计进入新的协作阶段。

Base44: We just shipped a major design update to Base44 - built to help you make something that's truly yours. Collaborate on a ...

产品更新编码
00:02
Hacker News 热门(buzzing.cc 中文翻译)
41
从10万行Rust人工智能代码中获得的经验(2025)

一篇分享了2025年开发10万行Rust语言人工智能代码实践经验的总结文章。文章聚焦于使用Rust构建和维护大规模AI系统的具体经验与教训,可能涉及性能、代码结构或工程化方面的挑战。该总结于2026年5月20日发布,并获得了Hacker News社区102个关注度。

教程/实践编码
5月20日
23:56
AYi@AYi_AInotes
63
Kimi 10分钟建站,零代码打造可售网站

Kimi 2.6能够一键生成获奖级别的网站,全程无需代码。配套的详细视频教程时长近10分钟,可指导用户快速上手,在极短的时间内产出可用于销售的成品网站,大幅降低了利用AI进行独立开发与变现的门槛。

AYi: Kimi做网站设计这么牛逼吗? 这个视频分享了怎么用Kimi 2.6做获奖10美元的网站, 教程讲的特别细, 需要字幕学习的可以评论区留言告诉我!

教程/实践编码
23:41
凡人小北@frxiaobei
51
DeepSeek 发布招聘信息,计划在北京组建新团队开发 Code Harness 项目(可能称为 DeepSeek Code)。团队将负责从零开始构建该工具,招聘职位包括 Harness Product Manager 和 Harness R&D Engineer,分别侧重于产品管理和研发工作,强调研究与产品的结合。此次招聘面向有志于AI技术领域的青年人才,工作地点位于北京。

Deli Chen: 🚀 We're hiring! DeepSeek is forming a new Harness team to build Code Harness from the ground up-may be you can call it ...

智能体DeepSeek编码行业动态
23:33
The Decoder:AI News(RSS)
63
谷歌测试"应用市场冲击"

谷歌在I/O大会宣布,其AI Studio现支持根据文本提示直接生成原生Android应用,这些应用采用Kotlin语言与Jetpack Compose框架构建,并可在浏览器模拟器中进行测试。对于追踪器、待办清单这类简单的工具型应用,此举使得开发和分发变得极为便捷,可能削弱谷歌Play Store作为核心分发渠道的传统地位。与此同时,苹果公司则采取相反策略,持续阻止这类基于AI生成的“氛围编程”应用上架App Store。

Google产品更新编码
22:33
elvis@omarsar0
59
播客《Agentic Review》推荐:聚焦AI编程的务实对话

推荐QodoAI出品的播客《Agentic Review》,该节目以平衡的视角探讨AI代码生成的真实场景。通过主持人与Dexter Horthy、Scott Hanselman等嘉宾的深度对话,节目强调了上下文工程作为关键技术壁垒的重要性,并指出AI无法弥补破碎的开发流程,反而更凸显了代码审查与工程技艺的持续价值。核心观点认为,尽管编码方式可能变革,但软件开发生命周期的本质与严谨性将更加重要。节目避免了过度炒作或悲观论调,为AI工程师提供了有价值的实践参考。

智能体大佬观点编码
22:02
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选81
Qwen3.7-Max:智能代理的前沿

智能代理领域迎来新突破,Qwen3.7-Max于2026年5月20日发布,标志着前沿技术的演进。该模型聚焦智能代理创新,具体细节可通过qwen.ai博客获取。发布消息在Hacker News上获得128个关注点,显示技术社区的广泛兴趣。尽管未披露详细性能指标,但Qwen3.7-Max的推出暗示了在自主代理架构或任务处理能力上的提升,推动AI向更高效、智能的方向发展。

智能体推理模型发布编码
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
推荐理由:Qwen3.7-Max 在多个 agent 基准上达到甚至超越 Opus 4.6 水平,长程自主优化 35 小时跑出 10 倍速度提升,证明 agent 长跑能力不是概念,做自动化工具的值得跟进。
19:13
🚨 AI News | TestingCatalog@testingcatalog
67
ICYMI 👀:Google AI Studio 现在可以一键构建安卓应用,并直接安装到您的设备上。 此外,用户还可以构建与 Google Suite 应用程序交互的应用。 所有这些,都由 Gemini 3.5 Flash 提供支持。 移动应用即将推出 👀

Google AI Studio: ai studio mobile: build your ideas, wherever you are coming soon to an app store near you http://ai.studio/mobile

Google产品更新编码
18:13
Peter Steinberger 🦞@steipete
72
强烈推荐@cotypist https://cotypist.app 。全场景自动补全。
其他编码
18:06
X.PIN@thexpin
50
DeepSeek已成立一个新的内部团队:Harness。该团队旨在打造一个直接对标Anthropic的Claude Code的编程智能体。高级研究员陈德利确认了这一点:目标本质上是"DeepSeek Code Harness",作为对Claude Code的直接回应。他们正在为此招聘一名产品经理和一名工程师,工作地点均在北京海淀办公室,靠近北京大学和清华大学。
智能体AnthropicDeepSeek编码
17:35
Rohan Paul@rohanpaul_ai
54
Marc Andreessen指出AI在医疗、法律、会计、政治、营销和软件开发等多个领域均已成为世界级专家,能力超越绝大多数人类专业人士。引用Larry Ellison的实际案例说明这一趋势已在企业级应用中实现:Oracle的编程工作现已由AI完成,开发者只需向模型声明程序目标,AI便会自主生成执行步骤,标志着软件开发从流程编写转向意图声明的范式转变。

Rohan Paul: Larry Ellison says AI is now writing Oracle's Code. "We just tell the model what we want the program to do, and then the...

大佬观点编码
16:41
OpenCode@opencode
66
Gemini 3.5 Flash现已在OpenCode上线 - 速度极快 - 100万上下文 - 定价与GLM、Kimi和DeepSeek Pro相近
Google产品更新编码
16:05
Rohan Paul@rohanpaul_ai
37
AI让代码供给爆发,但需求也随之增长。 在领先的科技公司中,使用AI的程序员生产力提升了20倍。 公司此前有成千上万的代码构想未能实现,AI突然解锁了所有这些可能。 ~ Marc Andreessen
大佬观点编码
15:56
IT之家(RSS)
65
消息称 DeepSeek 组建 Harness 团队主攻代码智能体,正面对决 Claude Code

DeepSeek在内部组建了全新的Harness团队,主攻代码智能体产品,内部对标Anthropic的Claude Code。该团队将负责研发DeepSeek Code Harness,并已开放Harness产品经理和研发工程师两个关键岗位,工作地点在北京。其核心目标是将前沿的模型能力转化为领先的Agent产品,并深度参与定义DeepSeek的桌面端Agent产品。

智能体AnthropicDeepSeek编码
15:12
MarkTechPost(RSS)
68
Google发布Gemini 3.5 Flash:在2026年I/O大会上推出一款更快速、更经济的AI智能体与编码模型

Google在2026年I/O大会上发布了新一代模型Gemini 3.5 Flash。该模型在代码生成和AI智能体任务等基准测试中性能超越了此前的旗舰版本,同时运行速度提升四倍,推理成本降低一半。这一更新显著增强了模型在实际应用中的效率与经济性,特别面向需要快速响应和复杂任务处理的开发者场景。

智能体Google推理模型发布
14:31
向阳乔木@vista8
73
开源油猴脚本提升YouTube观看效率与AI协作

该开源油猴脚本(qiaomu-userscripts)增强了YouTube的观看体验,核心功能包括一键复制或下载视频字幕、调节播放倍速。用户可便捷地将字幕发送至Raycast AI、ChatGPT或NotebookLM,利用自定义提示词快速生成总结或进行深度加工。此外,脚本还扩展了对小红书、抖音、微信的截图自动上传,以及小宇宙网页版的倍速调整功能,旨在优化多平台内容处理的效率。

向阳乔木: 完成了第一项工作,开源自己常用的油猴脚本。 1. 小红书、抖音、微信贴图,截图粘贴自动上传。 2. Youtube字幕复制,倍速调节,复制字幕给NotebookLM、ChatGPT处理。 3. 小宇宙网页版倍速调整 开源地址:https:/...

GitHub开源/仓库编码
13:34
François Chollet@fchollet
61
Codex的"目标"功能会采取任何可能的愚蠢捷径来避免实际工作(包括重写你的外部检查),但如果你能充分约束它,使其完全没有捷径可走,它会做出非常有趣的事情。
智能体OpenAI大佬观点编码
13:31
向阳乔木@vista8
72
Multica:将Trello看板中的"人"替换为"Agent"的AI工作流引擎

Multica 是一款开源的 AI 工作流引擎,其创新在于将传统 Trello 看板的任务执行者从“人”替换为“Agent智能体”。用户可本地集成 Claude Code、Codex CLI 等现有AI工具免费使用,实现并行AI Coding以提升开发效率,并对智能体的执行过程提供全程可视化监控。

智能体开源/仓库编码
13:05
Berryxia.AI@berryxia
65
Gemini 3.5 Flash上线,极速性能全面进化

Gemini 3.5 Flash已在ZenMux平台首发并提供免费体验。该模型从提示词到生成完整HTML动画仅用77.56秒,速度极快且效果出色。其专为Agent设计,在MCP Atlas、Toolathlon等多项榜单中排名第一。多模态理解能力显著提升,MMMU-Pro达83.6%,全面超越上一代模型。该模型兼容主流API格式,支持按量计费和Builder套餐,可无缝集成现有工具链。

Google编码评测/基准
‹ 上一页
1…4041424344…50
下一页 ›