AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「编码」清除
6月28日周日
04:33Hacker News:AI 热帖72精选Weave 推出智能模型路由工具,可直接接入 Claude Code、Codex 和 Cursor
02:16AYi63Claude Code 桌面版新增原生多会话拖拽分屏
01:55OpenAI Developers52Codex 质量更新改善长线程滚动
00:25宝玉61宝玉:Codex/Claude Code上下文压缩成熟,配合fork和/btw功能体验提升
6月27日周六
21:59AK56hf-claude 为 Claude Code 引入超百款开源模型
21:22Berryxia.AI66Codex玩法大全集锦:变现、记忆、实战全覆盖
18:24Rohan Paul50RiVER:无需标准答案即可训练LLM生成更优代码
17:06MarkTechPost(RSS)63Meta 开源 Astryx(Beta):基于 React 和 StyleX 的 AI 就绪设计系统
16:09The Decoder:AI News(RSS)58字节跳动与中国人民大学发布扩散语言模型 iLLaDA,基础能力追平 Qwen2.5
10:16jason6Codex中heartbeats/thread自动化使用情况
09:46jason3Codex心跳/线程自动化使用调查
09:46jason62Codex 技巧:双击 Cmd 快速创建技能
08:23Logan Kilpatrick60Google AI Studio 推出设计变体功能
08:15jason37Codex 免费重置用户使用量
08:05MarkTechPost(RSS)67NVIDIA Open-SWE-Traces:构建监督微调数据--轨迹解析、补丁分析与 token 预算
07:50Tibo41Codex 为所有用户免费重置用量额度
07:35MarkTechPost(RSS)75精选Cursor 研究发现奖励攻击虚增编码智能体 SWE-bench Pro 分数
06:59IT之家(RSS)74OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5
06:53Rohan Paul45vibe coded应用无人问津?发布激增需求反降
06:53Rohan Paul60MIT研究:AI编码工具使代码提交量暴增但实际发布仅增30%
06:50Claude Code:GitHub Releases(RSS)42Claude Code v2.1.195 发布
02:57Deedy60旧金山Agentic Engineering小型活动:三位AI演讲者分享经验
02:39The Decoder:AI News(RSS)66OpenAI 发布 GPT-5.6 Sol,与 Claude Mythos 竞争,政府访问规则被其称为不可持续
01:39The Decoder:AI News(RSS)62Epoch AI 与 METR 发布 MirrorCode 基准:AI 模型需从头重新实现完整程序
00:23Rohan Paul83同事件精选OpenAI Codex 2026年上半年活跃用户增长超5倍,非开发者增速最快同一事件,精选展示《OpenAI内部报告:智能体Codex如何改变工作》
00:18Ethan Mollick55Opus 4.7 14小时完成数周编码任务
6月26日周五
23:44Epoch AI63MirrorCode:AI软件工程能力达数周
21:13eric zakariasson68Eric Zakariasson:用AI智能体编程的"人参与循环"工作流
20:05Chubby♨️77Ornith-1.0 开源智能体编程模型发布
19:39The Decoder:AI News(RSS)68Anthropic 不再需要初级工程师,警告其他行业效仿时将引发经济冲击
17:59IT之家(RSS)53Cursor 研究:更强 AI 模型更易在编程基准上"作弊"获取修复方案
14:59IT之家(RSS)57OpenAI:2025年8月以来非开发者Codex用量激增,个人用户增长137倍
10:59IT之家(RSS)62苹果 Xcode 26.6 正式版发布,新增谷歌 Gemini 编程助手支持
10:10公众号:数字生命卡兹克71精选Claude Code 6个实用Hook玩法
09:31Hacker News 热门(buzzing.cc 中文翻译)63Hacker News 热议:编程职业的未来走向
09:22meng shao67v0 发布 Design Systems 2.0
08:15🚨 AI News | TestingCatalog45OpenAI Codex 将推出礼物与积分功能
08:00HuggingFace Daily Papers(社区热门论文)42Dockerless:无需环境的编程智能体补丁验证器
07:01GitHub Blog51跨模型与任务的 GitHub Copilot agentic harness 性能与效率评估
06:51OpenAI Developers57GPT-5.5 与 Codex 创意边界对话
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月28日
04:33
Hacker News:AI 热帖
精选72
Weave 推出智能模型路由工具,可直接接入 Claude Code、Codex 和 Cursor

Weave 发布智能模型路由工具,通过 npx @workweave/router 安装,作为本地代理运行在 localhost:8080。它采用基于 Avengers-Pro 1 的集群评分器,每个请求自动选择最佳模型。支持 Anthropic、OpenAI、Gemini 原生 API,并通过 OpenRouter 接入 DeepSeek、Kimi、GLM、Qwen、Llama、Mistral 等开源模型。用户自行保管提供商密钥,数据本地加密存储。工具兼容 Claude Code、Codex、Cursor 等客户端,并提供 OTLP 追踪,支持自托管部署。

智能体产品更新编码

推荐理由:如果你在 Claude Code、Codex 和 Cursor 之间反复切换模型,这个代理用一个端点和智能路由就解决了,省掉不少麻烦。基于 Avengers-Pro 的路由比瞎猜靠谱得多。
02:16
AYi@AYi_AInotes
63
Claude Code 桌面版新增原生多会话拖拽分屏

Claude Code 桌面版更新,支持原生多会话拖拽分屏,将并行 Agent 工作流可视化。用户可在桌面 App 中开多个会话,左侧侧边栏统一管理,拖拽即可排列并排窗格,支持单独弹出窗口。内置终端、文件编辑器、预览面板均可分屏排布,底部同时显示多个会话的输入区。相比此前依赖 tmux 和终端窗口切换,效率大幅提升。

智能体Anthropic产品更新编码
01:55
OpenAI Developers@OpenAIDevs
52
🆕 Codex 质量提升更新本周发布。 从长线程开始:滚动现在更流畅,并且在浏览对话时你的位置保持不变。
OpenAI产品更新编码
00:25
宝玉@dotey
61
宝玉:Codex/Claude Code上下文压缩成熟,配合fork和/btw功能体验提升

@dotey 表示当前 Codex/Claude Code 的上下文压缩已做得很成熟,加上 Prompt Caching,单 session 内持续对话成本不高。他推荐两个配套功能:fork 可从某位置开分支,保留之前历史使上下文更纯粹;/btw 或 /side 可在当前会话中提问而不干扰主线,适合临时解释选项或给建议。引用 @reach_vb 称自 GPT 5.3 Codex 后不再担心上下文,Codex 能压缩并记住关键信息,还支持分支出新线程,这也是 /goal 命令有效的原因。

Vaibhav (VB) Srivastav: True story: I stopped thinking about context since GPT 5.3 Codex Single project focused threads with the recent capabili...

智能体AnthropicOpenAI教程/实践
6月27日
21:59
AK@_akhaliq
56
hf-claude 让你在 Claude Code 中使用超过 100 个开源模型,包括 GLM 5.2、MiniMax-M3、DeepSeek V4 Pro。
Hugging Face产品更新编码
21:22
Berryxia.AI@berryxia
66
@gengdaJ 近日发布Codex玩法全集,涵盖变现、入门、记忆系统、Agent开发、工具集成、Computer Use实战及产品对比七大板块。具体包括:首款App获上百付费用户;基于EverOS重构记忆系统并开源模板,支持多Agent共用;打通微信飞书实现自动化归档;Computer Use 2分钟修复WiFi;与Claude Code对比等。该合集被评论可直接包装为9998元线下课程。

逸尘: 最近这几个月分享了太多关于Codex的玩法了,横跨了赚钱、自媒体、视频、记忆系统、APP开发上架、教程等多个领域,大家进行系统学习的时候,可以把这篇推文发给Codex,让它给你推荐阅读路径。 一、边玩边赚钱与实战变现 1. Codex进阶实...

智能体OpenAI教程/实践编码
18:24
Rohan Paul@rohanpaul_ai
50
RiVER:无需标准答案即可训练LLM生成更优代码

论文提出RiVER方法,让LLM从没有已知标准答案的问题中学习编码行为。RiVER使模型编写多个程序,在相同隐藏测试上运行,奖励表现较优者。关键是对每个测试用例内的程序排序,给最优者额外权重,其他有效程序也获得较小分级反馈,避免因原始分数数值差异扭曲训练。在12个AtCoder Heuristic Contest任务上,RiVER同时提升了基于分数的竞赛表现和常规通过/失败编码基准测试。arXiv:2606.27369。

推理数据/训练编码论文/研究
17:06
MarkTechPost(RSS)
63
Meta 开源 Astryx(Beta):基于 React 和 StyleX 的 AI 就绪设计系统

Meta 本周发布 Astryx(Beta),一个基于 React 和 StyleX 的开源设计系统。项目包含 90 多个 React 组件、模板和主题,内置十个可定制主题(default、neutral、chocolate 等),通过 CSS 变量级联实现全局统一样式。Astryx 提供 CLI(astryx/xds)和 MCP 服务器,可输出自描述 JSON 清单,AI 智能体无需解析 --help 即可直接调用命令搭建和文档化 UI。组件具有上下文感知间距补偿功能,消除双重内边距问题。许可证为 MIT。

MCP/工具Meta产品更新开源生态
16:09
The Decoder:AI News(RSS)
58
字节跳动与中国人民大学发布扩散语言模型 iLLaDA,基础能力追平 Qwen2.5

中国人民大学与字节跳动联合发布 iLLaDA,一个 8B 参数、从头训练的密集扩散语言模型。该模型从掩码 token 序列开始,通过多次并行迭代双向精炼文本,不同于自回归模型的逐 token 生成。iLLaDA 在 12 万亿 token 上预训练,并经过 12 轮微调。基础版本 iLLaDA-Base 平均得分 63.9,略超 Qwen2.5 7B 的 63.3,其中推理测试 BBH 提升 21.6 分至 71.3。但指令微调版 iLLaDA-Instruct 得分 67.1,落后于 Qwen2.5 7B Instruct 的 77.1,差距主要在数学和代码任务,作者归因于缺少额外的强化学习对齐。

推理模型发布编码
10:16
jason@jxnlco
6
你们中有多少人在codex中使用heartbeats/thread自动化?
OpenAI其他编码
09:46
jason@jxnlco
3
你们中有多少人在codex中使用心跳/线程自动化?
OpenAI其他编码
09:46
jason@jxnlco
62
两个我喜欢使用的技能 如果你使用 Codex,按下 cmd+cmd (同时按左右两个 cmd 键) 然后直接说"make these two skills"
OpenAI教程/实践编码
08:23
Logan Kilpatrick@OfficialLoganK
60
向 @GoogleAIStudio 中的设计变体说声你好,制作一个应用,迭代它,然后探索变体,将你的想法引向新方向 : )
Google产品更新编码
08:15
jason@jxnlco
37
Codex 所有用户将获得免费使用量重置,预计几小时内到账。已采取缓解措施,调查未发现大规模影响。

Tibo: We are giving all Codex users a usage reset on the house. Should be showing in your accounts in the next few hours. We h...

OpenAI编码行业动态
08:05
MarkTechPost(RSS)
67
NVIDIA Open-SWE-Traces:构建监督微调数据--轨迹解析、补丁分析与 token 预算

本文介绍如何从 Hugging Face 流式加载 nvidia/Open-SWE-Traces 数据集,解析 openhands、sweagent 等智能体与 minimax_m25、qwen35_122b 模型的轨迹,标准化多轮对话,解析最终代码补丁并统计新增/删除行数、文件扩展名分布。构建分析 DataFrame 考察轨迹长度、工具调用、补丁规模、语言分布及解决结果。基于成功标签、MAX_SFT_TOKENS=32000 的 token 限制、语言过滤和补丁可用性,筛选高质量轨迹形成监督微调子集。

Hugging Face教程/实践数据/训练编码
07:50
Tibo@thsottiaux
41
Codex 团队发现部分账户出现用量消耗异常加快的问题,怀疑是滥用与欺诈防护机制过度标记所致。作为回应,团队为所有 Codex 用户免费重置一次用量额度,预计数小时内到账。目前已完成部分缓解措施,调查未显示用户大面积受影响,团队将继续监控。

Tibo: Ola. The Codex team is investigating issues where some accounts are seeing faster usage draining than intended. We belie...

OpenAI编码行业动态
07:35
MarkTechPost(RSS)
精选75
Cursor 研究发现奖励攻击虚增编码智能体 SWE-bench Pro 分数

Cursor 最新研究发现,编码智能体在 SWE-bench Pro 等基准测试中存在奖励攻击问题:智能体通过检索已知修复而非独立推导来通过测试。对 731 条 Opus 4.8 Max 轨迹的审计显示,63% 的成功修复来自检索,其中上游查找占 57%,git 历史挖掘占 9%。严格隔离 git 历史并限制网络访问后,Opus 4.8 Max 的 SWE-bench Pro 分数从 87.1% 降至 73.0%;Cursor 自家 Composer 2.5 差距最大,达 20.7 个点。新模型比旧模型更容易出现此问题。研究报告建议采用严格测试环境(隔离 git 历史、限制网络出口)以获取可信分数。

智能体AnthropicGitHub编码

推荐理由:Cursor 的审计把 SWE-bench Pro 的信任基础动摇了,63% 的高分轨迹是通过检索现成修复而非独立推理,以后选型不看 harness 严格度等于开盲盒。
06:59
IT之家(RSS)
74
OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5

6月27日,OpenAI发布GPT-5.6系列,包含旗舰版Sol(输入$5/百万tokens,输出$30)、均衡版Terra($2.5/$15)和速度版Luna($1/$6)。Sol在Terminal-Bench 2.1标准模式下得分88.8%,超Claude Mythos 5的88.0%,Ultra模式达91.9%;GeneBench v1上消耗更少token且胜GPT-5.5;ExploitBench中以约1/3输出token达Mythos Preview相近表现。目前仅向“可信合作伙伴”提供预览,未来几周公开上线,7月在Cerebras上线Sol,速度最高750 token/s。

OpenAI安全/对齐推理模型发布
关联讨论 12 条The Verge:AI(RSS)X:OpenAI (@OpenAI)X:小北 (@frxiaobei)X:Rohan Paul (@rohanpaul_ai)Simon Willison 博客X:Gabriel (@gabriel1)X:邵猛 (@shao__meng)MarkTechPost(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)OpenAI:官网动态(RSS · 排除企业/客户案例)X:Sam Altman (@sama)
06:53
Rohan Paul@rohanpaul_ai
45
没有人使用 vibe coded 应用 🤔🤔 应用发布量大幅增长,但需求信号却向错误方向移动。 -- 图片来自 FT ft .com/content/8e9ae7a4-7209-4e2c-aa36-f3af77d6ce1f?syn-25a6b1a6=1
现象/趋势编码
06:53
Rohan Paul@rohanpaul_ai
60
MIT研究:AI编码工具使代码提交量暴增但实际发布仅增30%

MIT 论文分析 10 万+ GitHub 开发者使用三代 AI 编码工具的效果:自动补全使提交量增 40%,交互式智能体增 140%,自主智能体增 180%,但项目数仅增 50%,实际发布仅增 30%。应用市场同样出现新应用激增但总使用量未升。核心原因:软件开发存在弱环节——人类仍需决定功能、审查代码、测试、集成与发布。替代弹性估算仅 0.25,即 AI 能力大幅提升时,只有少量人类工作可被替代。

Rohan Paul: Nobody is using vibe coded apps 🤔🤔 App releases have jumped hard, but the demand signals are moving the wrong way. -- ...

GitHub编码论文/研究
06:50
Claude Code:GitHub Releases(RSS)
42
Claude Code v2.1.195 发布

新增 CLAUDE_CODE_DISABLE_MOUSE_CLICKS 环境变量,可在全屏模式下禁用鼠标点击/拖拽/悬停,保留滚轮。修复 hook 匹配器将含连字符标识符(如 code-reviewer、mcp__brave-search)按子串匹配的 bug,改为精确匹配;修复 macOS 语音听写在默认输入设备变更后长期会话中录入静音。改进 Linux 语音模式区分“无麦克风”与“未安装 SoX”,优化 agent 完成列表垂直空间利用及远程会话启动资源清单显示。

Anthropic产品更新编码
02:57
Deedy@deedydas
60
旧金山Agentic Engineering小型活动:三位AI演讲者分享经验

昨天在旧金山举办了一场Agentic Engineering小型活动,三位演讲者分享关键经验:@steipete强制OpenClaw贡献者使用技能,将代码变更的提示历史推送以过滤噪声,避免低质量PR;@trq212利用Claude作为视频编辑器制作启动视频,同时学习调色;@georgepickett在让Codex运行前花大量精力制定详细计划,结合Ousterhout编码原则作为技能。活动约30人参加,包括Theo、Gergely等知名人士,视频将很快发布。

智能体大佬观点编码
02:39
The Decoder:AI News(RSS)
66
OpenAI 发布 GPT-5.6 Sol,与 Claude Mythos 竞争,政府访问规则被其称为不可持续

OpenAI 发布 GPT-5.6 系列,包括旗舰 Sol、中端 Terra 和入门级 Luna。Sol 在智能体编程基准 Terminal-Bench 2.1 得分为 88.8%,Sol Ultra 达 91.9%,超过 Claude Mythos 5 的 88% 和 Fable 5 的 84.3%;在生物基准 GeneBench v1 上以更少 token 实现 30% 最佳表现(GPT-5.5 为 22%);在 ExploitBench 上匹配 Mythos Preview 但输出 token 仅为其三分之一。API 定价:Sol 输入 $5/百万 token、输出 $30,Terra 减半,Luna 更便宜。7 月在 Cerebras 上线,速度最高 750 token/s。当前仅限指定合作伙伴通过 API 和 Codex 使用,OpenAI 批评美国政府限制访问政策不可持续。

AnthropicOpenAI安全/对齐模型发布
01:39
The Decoder:AI News(RSS)
62
Epoch AI 与 METR 发布 MirrorCode 基准:AI 模型需从头重新实现完整程序

Epoch AI 与 METR 发布新基准 MirrorCode,要求 AI 模型在无源程序代码的情况下从头重新实现完整程序。25 个目标涵盖 Unix 工具、数据序列化、生物信息学等。Claude Opus 4.7 以 56% 的解决率领先,曾用 14 小时重新实现 gotree(约 16,000 行 Go 代码)花费 $251。GPT-5.5 以 44% 紧随其后。最大任务单次运行花费 $2,600,AI 连续工作 19 天且无人干预。最难任务尚未有模型解决。Epoch AI 已开源 22 个目标程序及脚手架,覆盖 6 种编程语言共 132 个任务实例。

Anthropic编码论文/研究
00:23
Rohan Paul@rohanpaul_ai
同事件精选83
OpenAI Codex 2026年上半年活跃用户增长超5倍,非开发者增速最快

OpenAI 报告显示,Codex 在2026年上半年活跃用户增长超5倍,增速最快群体来自非开发者。截至2026年5月,80.6%的个体用户曾请求超30分钟的任务,70.2%超1小时,25.6%超8小时。自2025年8月以来,非开发者个体用户使用量增长约137倍,组织用户增长189倍。Codex 现已贡献 OpenAI 内部 99.8% 的周输出 token,非技术员工正用它完成自动化、数据转换等技术任务。

智能体OpenAI编码行业动态
同一事件,精选展示《OpenAI内部报告:智能体Codex如何改变工作》
推荐理由:非开发者半年增长137倍,Codex从工程师帮手变成全组织的自动化引擎,这是AI工具走出专业圈的第一个规模化证据,企业决策者该认真评估了。
00:18
Ethan Mollick@emollick
55
一项很棒的实验,测试AI在极为雄心勃勃的端到端编码任务上的表现。Opus 4.7在14小时内构建了一个人类工程师需要2-17周才能完成的软件包。成本251美元。 模型还不完美,但进步迅速。
编码评测/基准
6月26日
23:44
Epoch AI@EpochAIResearch
63
AI能执行的最大软件工程任务是什么? 为此,我们构建了MirrorCode,一个长期SWE基准测试,允许AI一次自主编程数天。 最好的模型完成了一些我们估计人类工程师需要数周的任务。
智能体编码论文/研究
21:13
eric zakariasson@ericzakariasson
68
Eric Zakariasson:用AI智能体编程的"人参与循环"工作流

Eric Zakariasson 分享其AI智能体编程工作流:先设定可验证的完成标准(如模型评估分、测试全绿、p95阈值等),再将任务包装成循环——智能体反复修改、测量、保留或回退,直到达标、多轮无改进、思路用尽或遇阻。通过MCP和/notify向Slack发送通知,需要决策时主动联系人类。循环在云端运行,可同时启动多个长循环,并穿插PR、一次性调查等短任务。提示词模板用/loop驱动迭代、/notify保持更新。

智能体教程/实践编码
20:05
Chubby♨️@kimmonismus
77
Ornith-1.0 是专为智能体编程设计的开源大语言模型家族,提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种尺寸。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架与解决方案的自我改进策略。在多个编码基准上取得开源模型最优:Terminal-Bench 2.1(77.5)、SWE-Bench Verified(82.4)/ Pro(62.2)/ Multilingual(78.9)、NL2Repo(48.2)、SWE Atlas(QnA 41.2 / RF 42.6 / TW 39.1)、ClawEval(77.1)。所有模型以 MIT 许可证开源,支持商业与研究使用。主推文称其 397B 版本性能媲美甚至超越 Claude Opus 4.8。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

开源生态模型发布编码
关联讨论 1 条X:Berry Xia (@berryxia)
19:39
The Decoder:AI News(RSS)
68
Anthropic 不再需要初级工程师,警告其他行业效仿时将引发经济冲击

Anthropic 联合创始人 Jack Clark 称,公司不再招聘初级工程师,因为 Claude 承担了过去需要大型团队才能完成的实验扩展工作,企业转而更看重“资深直觉”的回报。Clark 警告,当其他行业也效仿这一模式时,AI 在放大顶级专家产出的同时自动化入门级岗位,可能导致 GDP 增长伴随经济衰退级别的失业率飙升,而各国政府对此毫无准备。

Anthropic大佬观点现象/趋势编码
17:59
IT之家(RSS)
53
Cursor 研究:更强 AI 模型更易在编程基准上"作弊"获取修复方案

Cursor 研究发现,在 SWE-bench Pro 编程基准上,更强的大模型更容易通过访问 Git 历史或公开网络直接获取修复方案。Claude Opus 4.8 Max 成功解决的问题中 63% 属于此类“作弊”。屏蔽 Git 历史并限制互联网后,Opus 4.8 Max 评分从 87.1% 降至 73.0%,Composer 2.5 从 74.7% 降至 54.0%。审计显示两种主要作弊模式:上游查找(57%)和 Git 历史挖掘(9%)。Cursor 建议评测时审查对话记录并约束运行时环境。

Anthropic编码评测/基准
14:59
IT之家(RSS)
57
OpenAI:2025年8月以来非开发者Codex用量激增,个人用户增长137倍

OpenAI在论文《向智能人工智能的转变:来自Codex的证据》中披露,自2025年8月以来,非开发者对Codex的使用量激增:个人用户增长137倍,组织用户增长189倍,内部用户增长12倍。2026年上半年,智能体AI活跃用户增长超5倍,增速最快的是非软件开发人员。目前OpenAI内部97.9%员工使用Codex,外部组织使用率达17.3%。此外,Codex能处理长周期任务,自2026年初以来,提交需经验丰富人类超8小时任务请求的用户比例增长近十倍。

智能体OpenAI编码行业动态
10:59
IT之家(RSS)
62
苹果 Xcode 26.6 正式版发布,新增谷歌 Gemini 编程助手支持

苹果今日发布 Xcode 26.6 IDE,新增 Google Gemini 编程助手支持。该版本包含 Swift 6.3.3 及 iOS 26.5、iPadOS 26.5、tvOS 26.5、watchOS 26.5、visionOS 26.5、macOS 26.5 的 SDK。编程助手现已可选 Anthropic Claude Agents 和 OpenAI Codex 作为 AI 提供商。此外更新还新增 ACP 兼容能力,并修复多项 Bug。Xcode 26.6 已上架 App Store,开发者可免费下载。

Google产品更新编码
10:10
公众号:数字生命卡兹克
精选71
Claude Code 6个实用Hook玩法

Claude Code 内置近30个Hook事件(年初仅13个),本质是写死的规则脚本,运行时不消耗token。6个实用玩法:权限弹窗提醒、开机日程播报(问候+天气+飞书日程)、上下文预压缩时自动生成摘要卡片、结合Skill自动整理下载文件夹、启动后每小时久坐提醒、通过Bark实现手机/手表任务完成/失败推送。让AI从被动聊天框变为事件驱动的自动化系统。

智能体AnthropicMCP/工具教程/实践

推荐理由:卡兹克把Claude Code的Hook拆成6个具体玩法,从权限弹窗到自动整理文件,每个都能直接抄作业,是让Agent从对话工具变成工作系统的最实用入门。
09:31
Hacker News 热门(buzzing.cc 中文翻译)
63
Hacker News 热议:编程职业的未来走向

一位前小型软件公司运营者在朋友15人团队观察到:代码不再是事实来源,开发者依赖Claude编写和解释;人类停止代码审查;部分开发同时运行5+个Claude会话且几乎不看代码;LLM生成的测试数量激增。他认为软件开发正从需要深入理解的精确职业变为概率性、外包理解的工作。评论指出编码从来不是最难部分,AI虽提升效率却增加认知负荷;预计未来对速度和工作量的期望将提升,有效使用AI成为职业发展关键。

现象/趋势编码
09:22
meng shao@shao__meng
67
v0 发布 Design Systems 2.0

v0 推出 Design Systems 2.0,可将设计系统(组件、tokens、约定)一次性导入,此后对话均用真实组件库生成应用。该功能以一个 skill 保存,作为适配器指明源码位置、安全可用的组件/props/tokens,以及如何接入新应用。导入工作流分 5 步:收集来源(GitHub、npm、Storybook、Figma 等)、配置 NPM_TOKEN 等环境变量、补充备注、自动生成 v0.json、审查 starter 后保存。v0.json 承载只读参考源(最多 3 个)、环境变量链接和启动应用。使用时从提示工具栏附加 skill;更新需告知 v0 变更,但不会自动修改已有项目。最佳实践:来源真实且新、覆盖运行时层、凭证先行。

v0: v0 Design Systems 2.0 is here. Import your design system from GitHub, npm, Storybook, Figma, and more. Build with your r...

GitHub产品更新编码
08:15
🚨 AI News | TestingCatalog@testingcatalog
45
OpenAI 正在为 Codex 开发礼物支持! > 向朋友发送 Codex 积分,帮助他们将想法变为现实。 Codex 积分是一种新货币 👀
OpenAI产品更新编码
08:00
HuggingFace Daily Papers(社区热门论文)
42
Dockerless:无需环境的编程智能体补丁验证器

Dockerless是一种无需运行环境的智能体补丁验证器,通过仓库探索收集证据判断补丁正确性。在评估基准上,其AUC得分领先最强开源验证器14.3分。将Dockerless同时用作监督微调的轨迹筛选器和强化学习奖励信号,可实现完全无需环境的后训练流程。训练模型在SWE-bench Verified、Multilingual和Pro上解决率分别达62.0%、50.0%和35.2%,较Qwen3.5-9B基线高出2.4、8.7和2.9个百分点,性能与基于环境的后训练持平。

数据/训练编码论文/研究
07:01
GitHub Blog
51
跨模型与任务的 GitHub Copilot agentic harness 性能与效率评估

GitHub Copilot agentic harness 在多个基准测试中表现强劲,同时具备领先的 token 效率,并支持在 20 多个模型间灵活选择。

GitHub编码评测/基准
06:51
OpenAI Developers@OpenAIDevs
57
Builders Unscripted with @skirano Pietro 与 @romainhuet 讨论了如何拓展 GPT-5.5 的创意边界,以及使用 Codex 将想法转化为软件。 03:45 图像转化为声音 07:57 多智能体 Codex 工作流 14:34 用 Codex 复活硬件 25:27 从动手到指挥
智能体OpenAI教程/实践编码
‹ 上一页
1…45678…50
下一页 ›