AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 874 条
全部一手资讯X论文
标签「编码」清除
6月12日周五
00:17Hacker News 热门(buzzing.cc 中文翻译)75同事件精选MiMo Code 现已发布并开源同一事件,精选展示《小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议》
00:13xAI:News(网页)70精选xAI 推出 Grok Build Plugin Marketplace
6月11日周四
22:17Hacker News 热门(buzzing.cc 中文翻译)67为什么人工智能没有取代软件工程师,而且将来也不会
19:59HuggingFace Daily Papers(社区热门论文)65次二次架构对比:xLSTM在代码预训练与时间序列任务中优于Mamba-2和Gated DeltaNet
18:30公众号:火山引擎48银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半
17:59HuggingFace Daily Papers(社区热门论文)67语法约束解码可越狱大语言模型生成恶意代码:CodeSpear攻击与CodeShield防御
16:54MarkTechPost(RSS)67Cohere 发布 North Mini Code:30B 参数 MoE 编码模型,3B 活跃参数,单卡 H100 运行,支持 256K 上下文
14:24Claude Code:GitHub Releases(RSS)44Claude Code v2.1.173 发布:修复 Fable 5 模型名及 Windows 沙盒警告
12:58HuggingFace Daily Papers(社区热门论文)68Claw-SWE-Bench:评估OpenClaw风格智能体框架编程能力的多语言基准
11:30IT之家(RSS)61Xcode 27 Beta 原生集成谷歌 Gemini,三大 AI 编程智能体齐聚苹果开发平台
10:50公众号:小米 MiMo74精选小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议
04:30IT之家(RSS)71小米 MiMo Code V0.1.0 发布并开源:AI 编程助手,基于 OpenCode 二次开发
04:23Cursor Blog74精选Cursor Bugbot 更新:速度提升超 3 倍、成本降低 22%、发现更多 Bug
00:23GitHub Blog68精选通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能
6月10日周三
23:48TechCrunch:AI(RSS)56Datadog 资深人士创立 AI 编码初创公司 Niteshift,押注企业对抗大模型锁定
18:46MarkTechPost(RSS)532026 年顶级 AI 编程智能体与开发平台对比:Atoms、Devin、Windsurf、Cursor、Warp 等
16:28IT之家(RSS)72精选摩尔线程开源 MusaCoder 代码大模型,9B/27B 参数基于国产 GPU 全链路训练
13:45MarkTechPost(RSS)61NVIDIA Nemotron-Pretraining-Code-v3 数据集管道构建教程:流式读取、Pandas 分析与 tiktoken 估算
13:11Hacker News 热门(buzzing.cc 中文翻译)41软件黑客马拉松,安息吧。硬件黑客马拉松,万岁!
09:20Simon Willison 博客31llm 0.32a3 发布,代码几乎全部由 Claude Fable 5 编写
08:20Simon Willison 博客67Claude Fable 5 初步印象:容量更大、知识更丰富但速度慢价格高
07:50公众号:数字生命卡兹克77Claude Fable 5 正式发布:Mythos 5 加入安全分类器后开放,多项基准 SOTA
06:22OpenAI:官网动态(RSS · 排除企业/客户案例)43Codex 为 Notion 解锁的能力
05:43TechCrunch:AI(RSS)75同事件精选Anthropic 发布 Claude Fable 5,首个面向公众的 Mythos 级模型同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
05:09Hacker News 热门(buzzing.cc 中文翻译)80精选与Mythos合作是一种怎样的体验
04:55Hugging Face:Blog(RSS)73精选Cohere发布North Mini Code:面向开发者的开源编码模型
04:43TechCrunch:AI(RSS)72同事件精选Anthropic 的 Claude Fable 5 能一键生成古怪好玩的视频游戏同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
04:21OpenAI:官网动态(RSS · 排除企业/客户案例)30Nextdoor 工程师借助 Codex 与 GPT-5.5 无限制构建
02:45The Decoder:AI News(RSS)72Anthropic 发布 Claude Fable 5 和 Mythos 5,编程和科学能力大幅提升
01:13The Verge:AI(RSS)77Anthropic 发布首个 Mythos 系列模型 Claude Fable 5
01:04Anthropic:Newsroom(网页)90精选Claude Fable 5 和 Claude Mythos 5
00:18GitHub Blog68精选GitHub Copilot CLI 推出自定义 AI 智能体,将一次性终端提示转化为可重复工作流
6月9日周二
22:06Hacker News 热门(buzzing.cc 中文翻译)51为AI明星开发者收拾残局
21:42The Verge:AI(RSS)58Apple 的最佳 AI 创意与 vibe coding 高度相似
16:42MarkTechPost(RSS)70精选NVIDIA cuTile Python 教程:在 Colab 中构建用于向量加法、矩阵加法和矩阵乘法的 Tiled GPU 内核
14:22IT之家(RSS)72精选AI 编程独角兽 Cursor 欧洲总部落子伦敦,SpaceX 手握 600 亿美元收购选择权
10:33Hacker News 热门(buzzing.cc 中文翻译)71同事件精选FrontierCode 在 Hacker News 获 101 分同一事件,精选展示《FrontierCode 基准测试:AI 编程评估新标准——维护者审核通过率最高仅 13.4%》
08:00HuggingFace Daily Papers(社区热门论文)69DeNovoSWE: 扩展长周期环境以从零生成完整仓库
06:40The Verge:AI(RSS)49Apple 用 AI 解决 Safari 的扩展短板
06:24Claude:Blog(网页)63精选Claude 支持 Apple Foundation Models 框架,推出新 Swift 包
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
00:17
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选75
MiMo Code 现已发布并开源

2026年6月11日,小米旗下 MiMo Code 项目正式发布并开源,相关代码已托管于 mimo.xiaomi.com 供社区访问。

产品更新开源/仓库编码
同一事件,精选展示《小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议》
推荐理由:小米下场做 AI 编程工具,直接开源,121 个 HN 点赞说明社区有期待,对标 Cursor 还是自成一路,得看实际体验。
00:13
xAI:News(网页)
精选70
xAI 推出 Grok Build Plugin Marketplace

xAI 今日发布 Grok Build 内置插件市场。插件将技能、斜杠命令、AI 智能体、钩子、MCP 服务器和 LSP 打包为可安装包,用户无需离开终端即可浏览、安装和更新。首发合作伙伴包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 和 Superpowers。在 Grok Build 中输入 /marketplace 或使用 CLI 即可安装,每个远程插件均固定到特定 commit SHA 并经过验证。开发者可提交 PR 到 xai-org/plugin-marketplace 发布自己的插件。

MCP/工具xAI产品更新编码
关联讨论 1 条X:xAI (@xai)
推荐理由:Grok Build 这下可以像浏览器装扩展一样装插件了,涵盖数据库、部署、调试,开发者不必离开终端,这类集成对 AI 编程环境的体验影响挺大的。
6月11日
22:17
Hacker News 热门(buzzing.cc 中文翻译)
67
为什么人工智能没有取代软件工程师,而且将来也不会

Hacker News 上一则观点认为,人工智能并未取代软件工程师,并且将来也不会。该帖子获得了 103 个 HN Points。

现象/趋势编码
19:59
HuggingFace Daily Papers(社区热门论文)
65
次二次架构对比:xLSTM在代码预训练与时间序列任务中优于Mamba-2和Gated DeltaNet

在代码模型预训练、从大语言模型蒸馏代码模型以及时间序列基础模型预训练三项任务中,xLSTM、Mamba-2和Gated DeltaNet三种次二次架构中,xLSTM取得最佳整体性能。通过统一公式和机制分析发现,xLSTM的门控方案实现了更灵活稳定的记忆校正,其状态跟踪和记忆累积优势在合成长度泛化任务中得到验证。

推理编码论文/研究
18:30
公众号:火山引擎
48
银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半

银河证券与火山引擎合作,引入TRAE企业版并推进SDD(规格驱动开发)范式,将AI Coding嵌入研发全流程。研发需求交付周期缩短1/3至1/2,AI代码采纳率最高达87%,前端UI还原度稳定在90%以上(H5/Vue页面达98%以上)。子账户与融券系统重构周期从4个月压缩至2个月,Bug率降低25%,单元测试覆盖率提升30%,券池规模扩大10倍,服务客户量扩大20倍。通过MCP集成打通Ones、GitLab、DevOps等工具链,组织级Skill库减少60%手写测试工作量。TRAE企业版已覆盖银河证券100个研发席位,累计培训超130名研发人员。

MCP/工具教程/实践编码
17:59
HuggingFace Daily Papers(社区热门论文)
67
语法约束解码可越狱大语言模型生成恶意代码:CodeSpear攻击与CodeShield防御

语法约束解码(GCD)本用于提升大语言模型(LLM)生成代码的语法可靠性,但研究发现其可被逆向用作攻击面。新攻击方法CodeSpear仅通过施加良性代码语法约束即可诱导LLM生成恶意代码。防御方法CodeShield在代码模态中对齐模型,使其在GCD下生成语义无害、结构多样的蜜罐代码,同时保留自然语言拒绝能力。在10个流行LLM、4个基准上的实验显示,CodeSpear比代表越狱基线的攻击成功率平均提高30个百分点以上,CodeShield能恢复安全并保持良性功能。该发现揭示了GCD的潜在安全风险。

安全/对齐编码论文/研究
16:54
MarkTechPost(RSS)
67
Cohere 发布 North Mini Code:30B 参数 MoE 编码模型,3B 活跃参数,单卡 H100 运行,支持 256K 上下文

Cohere 推出首款开发者编码模型 North Mini Code,采用 30B 总参数的混合专家(MoE)架构,每次推理仅激活 3B 参数,可在单块 H100 GPU 上运行,支持 256K token 上下文窗口,专为智能体编码场景设计,模型权重开源。

模型发布编码
14:24
Claude Code:GitHub Releases(RSS)
44
Claude Code v2.1.173 发布:修复 Fable 5 模型名及 Windows 沙盒警告

本次更新修复了两个问题:其一,Fable 5 模型名称带 [1m] 后缀时未能自动规范化的问题已解决——Fable 5 默认包含 1M 上下文窗口,现后缀会被自动去除。其二,修复了在 Windows 系统上启用沙盒后出现虚假的“sandbox dependencies missing”启动警告。

Anthropic产品更新编码
12:58
HuggingFace Daily Papers(社区热门论文)
68
Claw-SWE-Bench:评估OpenClaw风格智能体框架编程能力的多语言基准

Claw-SWE-Bench是一个多语言SWE-bench风格基准和适配器协议,用于在公平设置下比较通用智能体框架(claws)的编程能力。完整基准包含350个GitHub issue解决实例,覆盖8种语言和43个仓库,来源于SWE-bench-Multilingual和SWE-bench-Verified-Mini。同时发布80实例的Lite子集用于快速验证。在完整基准上,OpenClaw搭配最小适配器仅得19.1% Pass@1,而完整适配器使用相同GLM 5.1骨干达到73.4%,表明适配器设计至关重要。模型选择改变Pass@1达29.4个百分点,框架选择改变27.4个百分点;相似精度的系统总API成本差异巨大。Claw-SWE-Bench将框架和成本核算作为SWE风格编码智能体评估的第一类维度。

智能体开源/仓库编码评测/基准
11:30
IT之家(RSS)
61
Xcode 27 Beta 原生集成谷歌 Gemini,三大 AI 编程智能体齐聚苹果开发平台

Xcode 27 Beta 新增原生谷歌 Gemini 集成,成为继 OpenAI Codex 和 Anthropic Claude Agent 之后第三个内置的 AI 编程智能体。开发者无需切换工具或窗口,即可在 Xcode 内完成构建新功能、审查代码和修复 Bug 等复杂多步骤任务。通过 Intelligence 设置面板配置 Gemini 后,Gemini 能理解项目上下文、辅助生成样板代码,并根据项目文档和文件结构更新整个项目。

智能体Google产品更新编码
10:50
公众号:小米 MiMo
精选74
小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议

小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议。内置限时免费MiMo-V2.5多模态模型,性能比肩Claude Sonnet 4.6;支持接入DeepSeek、Kimi、GLM等模型。核心能力包括持久记忆系统(项目记忆、会话检查点、任务进度)和无限上下文——通过独立subagent自动保存状态解决长会话遗忘。独创Compose模式实现模型与Agent协同优化,SWE-Bench Pro达62%(Claude Code 57%),Terminal Bench 2达73%(68%)。内置语音输入和/dream命令,每7天自动合并记忆。终端输入mimo即可使用,所有设置中文汉化。

智能体产品更新开源生态编码
关联讨论 2 条X:Berry Xia (@berryxia)X:小米 MiMo (@XiaomiMiMo)
推荐理由:小米悄悄发了MiMo Code,开源且免费,用记忆系统和Compose模式解决了AI编程两大顽疾:健忘和跑偏,实测比同模型Claude Code更强,开发者现在就能装上试。
04:30
IT之家(RSS)
71
小米 MiMo Code V0.1.0 发布并开源:AI 编程助手,基于 OpenCode 二次开发

6 月 11 日,小米 MiMo 发布并开源 MiMo Code V0.1.0,一款终端 AI 编程助手,基于 OpenCode 二次开发,采用 MIT 协议。内置限时免费多模态模型 MiMo-V2.5,支持接入 DeepSeek、Kimi、GLM 等模型。独创持久记忆系统通过项目记忆、会话检查点、任务进度三重机制解决长会话遗忘,由独立 subagent 自动保存状态并在窗口快满时生成简报。Compose 模式可一键完成设计、规划、编码、测试、审查全流程。内置 /dream 命令每 7 天自动合并、去重、验证路径并压缩记忆文件。支持语音输入与控制(MiMo-V2.5-ASR)。

智能体产品更新开源生态编码
04:23
Cursor Blog
精选74
Cursor Bugbot 更新:速度提升超 3 倍、成本降低 22%、发现更多 Bug

Cursor 的代码审查工具 Bugbot 迎来重大更新:运行速度提升超 3 倍,成本降低 22%,每轮审查多发现 10% 的 bug,90% 的运行在三分钟内完成。新增 /review 命令,可在推送代码前运行 Bugbot 和安全审查,并与 GitHub/GitLab 同步——若已通过 /review 审查过同一 diff,打开 PR 时 Bugbot 会自动跳过并备注。支持配置仅审查 PR 中新增内容。性能提升源于驱动 Bugbot 的 Composer 2.5 模型训练改进。Bugbot 遵循模型阻止列表,若组织禁用 Composer 2.5 则自动回退。该功能已在 Cursor 3.7+ 和 cursor.com/agents 上线,CLI 支持即将推出。

智能体产品更新编码

推荐理由:Cursor 的 Bugbot 三倍速跑 review 还便宜了 22%,这次更新让「commit 前先审一遍」变得几乎无痛,对日常开发流是个实在提升。
00:23
GitHub Blog
精选68
通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能

GitHub Copilot CLI 现在可以通过安装和配置 LSP(Language Server Protocol)服务器来替代原始的暴力 grep 或反编译方式,从而获得真正的代码智能。

GitHub教程/实践编码

推荐理由:虽然只是 Copilot CLI 的一个功能指南,但用 LSP 替代 grep 带来的代码理解提升是实打实的,搞 CLI 开发的可以直接抄作业。
6月10日
23:48
TechCrunch:AI(RSS)
56
Datadog 资深人士创立 AI 编码初创公司 Niteshift,押注企业对抗大模型锁定

AI 编码智能体初创公司 Niteshift 完成 700 万美元种子轮融资,投资方包括多位知名天使投资人。公司由 Datadog 资深人士创立,核心主张是企业应拥有对模型的控制权,而非被大型 AI 模型厂商锁定。

AnthropicOpenAI编码行业动态
18:46
MarkTechPost(RSS)
53
2026 年顶级 AI 编程智能体与开发平台对比:Atoms、Devin、Windsurf、Cursor、Warp 等

软件开发的模式已然改变——工程师不再手动输入大部分代码,而是描述意图,由 AI 智能体规划任务、跨文件编辑、运行测试并提交 Pull Request。许多工具已能在有限监督下直接部署到生产环境。这篇指南对比了 Atoms、Devin、Windsurf、Cursor、Warp 等主流 AI 编码代理与开发平台,帮助开发者选择最适合需求的工具。

智能体编码评测/基准
16:28
IT之家(RSS)
精选72
摩尔线程开源 MusaCoder 代码大模型,9B/27B 参数基于国产 GPU 全链路训练

摩尔线程发布并开源 MusaCoder 代码大模型,含 9B 和 27B 两个参数规模,是业内首个基于国产 GPU 算力底座完成全链路训练与验证的开源模型。后训练流程在基于 MTT S5000 的夸娥智算集群上完成,支持从 PyTorch 标准算子自动生成高性能 CUDA/MUSA 原生 Kernel 代码。在 KernelBench 评测中,MusaCoder-27B-RL 以 Overall Pass@8 93.2%、Avg.@8 88.60% 超越 Claude Opus、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6 等主流 SOTA 代码模型。

开源生态模型发布编码

推荐理由:摩尔线程这个模型直接瞄准GPU底层算子,KernelBench分数压过了不少主流大模型,虽然场景窄,但在国产硬件自建软件生态的路上,迈出了挺关键一步。
13:45
MarkTechPost(RSS)
61
NVIDIA Nemotron-Pretraining-Code-v3 数据集管道构建教程:流式读取、Pandas 分析与 tiktoken 估算

教程以 NVIDIA Nemotron-Pretraining-Code-v3 数据集为大规模元数据索引,采用流式方式而非完整下载,检查数据集 schema 并构建可管理样本。通过分析编程语言、文件扩展名、仓库频率及目录深度来理解索引结构,随后重构原始 GitHub URL 以获取真实源代码文件,并利用 tiktoken 估算所获代码的 token 规模。

教程/实践数据/训练编码
13:11
Hacker News 热门(buzzing.cc 中文翻译)
41
软件黑客马拉松,安息吧。硬件黑客马拉松,万岁!

作者在个人博客(blog.oscars.dev)上发文,宣告软件黑客马拉松的终结,并呼吁转向硬件黑客马拉松。

开源生态现象/趋势编码
09:20
Simon Willison 博客
31
llm 0.32a3 发布,代码几乎全部由 Claude Fable 5 编写

Simon Willison 的 llm 工具发布 0.32a3 版本,该版本的代码几乎全部由新的 Claude Fable 5 模型编写。

产品更新开源/仓库编码
08:20
Simon Willison 博客
67
Claude Fable 5 初步印象:容量更大、知识更丰富但速度慢价格高

Anthropic 发布 Claude Fable 5 与 Claude Mythos 5,后者无安全分类器。两模型均支持 1M token 上下文窗口、128k 最大输出 token,知识截止至 2026 年 1 月,定价为 Opus 4.5/4.6/4.7/4.8 的两倍($10/百万输入 token,$50/百万输出 token)。Simon Willison 测试发现 Fable 5 知识更丰富、响应更详细(如列出其开源项目远超 Opus 4.8 的准确度),但速度慢且价格高昂,推测为迄今最大模型之一。Anthropic 称 Fable 5 与 Mythos 5 性能相同,但安全护栏更严格,API 新增回退机制及护栏触发通知。

Anthropic模型发布编码评测/基准
07:50
公众号:数字生命卡兹克
77
Claude Fable 5 正式发布:Mythos 5 加入安全分类器后开放,多项基准 SOTA

Anthropic 发布 Claude Fable 5,基于 Mythos Preview 加入安全分类器后向公众开放,同时为合作伙伴升级 Mythos 5。Fable 5 在多项基准测试中取得 SOTA,每百万输入 token 10 美元、输出 token 50 美元。即日起至 6 月 22 日,Pro、Max、Team 及企业版订阅用户可免费使用,之后仅通过 API 提供。演示案例包括:一天完成 5000 万行 Ruby 代码迁移、纯视觉通关宝可梦火红、自主构建 3D CAD 编辑器并设计可打印模型;Mythos 5 在 14 个蛋白质靶点中产出 9 个药物候选方案,并将部分药物设计环节加速约十倍。

Anthropic大佬观点安全/对齐编码
关联讨论 30 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)X:Berry Xia (@berryxia)X:Vista (@vista8)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)
06:22
OpenAI:官网动态(RSS · 排除企业/客户案例)
43
Codex 为 Notion 解锁的能力

Notion 利用 Codex 一次性生成产品规格、构建面向网页的 AI 语音输入功能,并提升小团队的工程效率。

OpenAI编码行业动态
05:43
TechCrunch:AI(RSS)
同事件精选75
Anthropic 发布 Claude Fable 5,首个面向公众的 Mythos 级模型

Anthropic 推出 Claude Fable 5,这是其首个向公众开放的 Mythos 级大语言模型。该模型配备了内容护栏,可在网络安全和生物学等高危领域阻止生成响应。

Anthropic安全/对齐推理模型发布
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
推荐理由:Anthropic 最强大的模型终于向公众开放,但带着安全枷锁——高风险领域自动降级、数据强制保留 30 天,定价翻倍。开发者和产品人值得第一手感受它的上限,也得看清这些安全代价。
05:09
Hacker News 热门(buzzing.cc 中文翻译)
精选80
与Mythos合作是一种怎样的体验

一篇来自 oneusefulthing.org 的文章,探讨了与 Mythos 合作的个人感受。原英文标题为 “What it feels like to work with Mythos”,中文译为“与Mythos合作是一种怎样的体验”。该文章在 Hacker News 上获得 101 个点赞,发布于 2026 年 6 月 9 日。

智能体Anthropic大佬观点编码

推荐理由:Ethan Mollick 对 Mythos 的深度测试揭示了一个黑箱化的未来——你不再指挥,而是委托,AI 从工具变成工作室,人从操作员变成赞助人,这对产品与协作模式有足够冲击。
04:55
Hugging Face:Blog(RSS)
精选73
Cohere发布North Mini Code:面向开发者的开源编码模型

Cohere发布North Mini Code,一款30B参数MoE模型(3B活跃参数),Apache 2.0开源。在Artificial Analysis Coding Index上得分33.4,超越Qwen3.5、Gemma 4等同类模型。后训练采用两阶段SFT和RLVR,在SWE-Bench Verified上pass@10达80.2%,Terminal-Bench v2上达55.1%。支持64K/128K上下文长度,专为智能体编码任务优化。

智能体开源生态模型发布编码

推荐理由:Cohere的新编码模型North Mini Code以30B参数MoE架构,在SWE-bench pass@1达到61%,Apache 2.0开源,是小模型在agent coding领域真正可用的信号。
04:43
TechCrunch:AI(RSS)
同事件精选72
Anthropic 的 Claude Fable 5 能一键生成古怪好玩的视频游戏

Anthropic 发布 Claude Fable 5,可一键生成古怪好玩的视频游戏,预计将在网页 vibe coders 中广受欢迎。

Anthropic模型发布编码评测/基准
同一事件,精选展示《Claude Fable 5 和 Claude Mythos 5》
推荐理由:Fable 5是Mythos的首次公开亮相,Ethan Mollick的单提示生成游戏实测让人看到代码生成已近‘一键出活’,对开发者来说是个信号——整个技术栈都要重新评估。
04:21
OpenAI:官网动态(RSS · 排除企业/客户案例)
30
Nextdoor 工程师借助 Codex 与 GPT-5.5 无限制构建

Nextdoor 工程师利用 Codex 搭配 GPT-5.5 调查难以复现的问题、实现跨平台构建,并集中精力于产品成果。

OpenAI编码行业动态
02:45
The Decoder:AI News(RSS)
72
Anthropic 发布 Claude Fable 5 和 Mythos 5,编程和科学能力大幅提升

Anthropic 推出 Claude Fable 5 和 Mythos 5 两款新模型,声称全面超越当前 Opus 代,尤其在编程与科研方面。Fable 5 一天内完成 Stripe 的代码迁移,原需团队两个月工作量;Mythos 5 可自主设计候选药物,但因具备进攻性网络能力,目前仍保持封闭不开放。

Anthropic安全/对齐模型发布编码
关联讨论 30 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)X:Berry Xia (@berryxia)X:Vista (@vista8)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)
01:13
The Verge:AI(RSS)
77
Anthropic 发布首个 Mythos 系列模型 Claude Fable 5

Anthropic 发布 Claude Fable 5,称其为迄今广泛可用的最强模型。该模型在软件工程、知识工作与视觉任务中表现突出,且随着任务变长、变复杂,领先优势进一步扩大。Fable 5 是 Anthropic 首次大规模发布的 Mythos 类 AI 模型,此前该公司因该类模型在网络安全任务中能力过强、风险过高而未公开。此次发布得益于新增的安全措施,可在特定高风险领域阻止模型生成响应。

Anthropic多模态推理模型发布
关联讨论 30 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)X:Berry Xia (@berryxia)X:Vista (@vista8)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)
01:04
Anthropic:Newsroom(网页)
精选90
Claude Fable 5 和 Claude Mythos 5

Anthropic 今日推出 Claude Fable 5(通用安全版)和 Claude Mythos 5(受限安全版)。Fable 5 在软件工程、知识工作、视觉、科研等几乎所有测试基准上达到 SOTA,Stripe 称其将数月工程压缩至数天,FrontierCode 评分居前沿模型之首,可仅凭截图重建网页应用源码。Mythos 5 在药物设计中实现约 10 倍加速,其分子生物学假说盲测获科学家偏好的概率约 80%。两模型售价均为 $10/百万输入 tokens、$50/百万输出 tokens,较 Claude Mythos Preview 降价过半。Fable 5 在部分敏感主题上回退至 Claude Opus 4.8,安全触发率低于 5% 的会话。Mythos 5 通过 Project Glasswing 向网络安全防御者开放。

Anthropic多模态安全/对齐模型发布
关联讨论 30 条X:Perplexity (@perplexity_ai)Nathan Lambert:Interconnects(RSS)Tomer Tunguz 博客(VC 分析)X:Kim (@kimmonismus)TechCrunch:AI(RSS)Ethan Mollick:One Useful Thing(RSS)X:小互 (@xiaohu)Claude Code:GitHub Releases(RSS)X:OpenRouter (@OpenRouter)X:Testing Catalog (@testingcatalog)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Artificial Analysis (@ArtificialAnlys)X:宝玉 (@dotey)X:Andrej Karpathy (@karpathy)X:卡兹克 (@Khazix0918)IT之家(RSS)公众号:卡尔的AI沃茨X:歸藏 (@op7418)X:Berry Xia (@berryxia)X:Vista (@vista8)X:Claude (@claudeai)X:Boris Cherny (@bcherny)Simon Willison 博客X:Rohan Paul (@rohanpaul_ai)X:Dario Amodei (@DarioAmodei)The Verge:AI(RSS)The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)
推荐理由:Anthropic把最危险的模型安全地放出来了,Fable 5在编码、科研上不是小数点级别的提升,价格还砍半,95%的请求直接跑满血版,必读。
00:18
GitHub Blog
精选68
GitHub Copilot CLI 推出自定义 AI 智能体,将一次性终端提示转化为可重复工作流

GitHub Copilot CLI 新增自定义 AI 智能体功能,使 CLI 能够理解开发者的技术栈和团队工作流,将一次性终端提示转变为可重复、可审查的流程。

智能体GitHub教程/实践编码

推荐理由:GitHub Copilot CLI 的自定义代理把一次性提示变成可重复工作流,相当于给命令行配了个 AI 副驾驶,做自动化的朋友值得一试。
6月9日
22:06
Hacker News 热门(buzzing.cc 中文翻译)
51
为AI明星开发者收拾残局

文章探讨AI明星开发者在快速推进项目后,留下的混乱需要由团队或后续开发者清理的现象,聚焦于技术债务与协作困境。

智能体现象/趋势编码
21:42
The Verge:AI(RSS)
58
Apple 的最佳 AI 创意与 vibe coding 高度相似

Apple 在 WWDC 上展示的大部分 AI 功能与竞争对手雷同:可提问的聊天机器人、文本生成/摘要工具以及图像生成。Siri 的新功能已在 Android 手机及 Claude、ChatGPT 应用中存在。作者下载了 iPadOS 26 首个开发者测试版,认为 Apple 真正有想法的方向是 vibe coding——一种更贴近自然交互的编程方式。

产品更新编码
16:42
MarkTechPost(RSS)
精选70
NVIDIA cuTile Python 教程:在 Colab 中构建用于向量加法、矩阵加法和矩阵乘法的 Tiled GPU 内核

该教程基于 NVIDIA cuTile Python 实现了分块 GPU 内核编程工作流,在 Colab 环境中配置 GPU、驱动、CUDA 及 cuTile 可用性后,分别构建了 tiled 向量加法、矩阵加法和矩阵乘法核函数,并以 PyTorch 作为回退保持 notebook 可执行。每一步均通过 PyTorch 验证结果正确性,并基准测试了各阶段的中位运行时间。

教程/实践编码

推荐理由:NVIDIA cuTile把GPU tiled kernel编程的门槛拉低到Python,这个Colab教程从环境搭建到矩阵乘法全链路,想自己写算子的人可以跟着跑一遍。
14:22
IT之家(RSS)
精选72
AI 编程独角兽 Cursor 欧洲总部落子伦敦,SpaceX 手握 600 亿美元收购选择权

Cursor 将欧洲总部设在伦敦,计划招聘约 200 名员工,并在巴黎、慕尼黑等地开设小型办事处。SpaceX 拥有以 600 亿美元收购 Cursor 的选择权,或支付 100 亿美元开展全新合作。Cursor 目前 B2B 年化营收约 26 亿美元,客户包括英国航空、英国石油、诺基亚等。公司强调数据留存欧洲本地以满足监管合规,其平台支持用户用自然语言生成代码,主打模型中立,竞争对手包括 GitHub Copilot、OpenAI 和谷歌的同类产品。

编码行业动态
关联讨论 12 条TechCrunch:AI(RSS)X:Testing Catalog (@testingcatalog)X:阿易 AI Notes (@AYi_AInotes)X:Michael Truell (@mntruell)The Decoder:AI News(RSS)X:宝玉 (@dotey)X:歸藏 (@op7418)Hacker News 热门(buzzing.cc 中文翻译)The Verge:AI(RSS)IT之家(RSS)X:Emad Mostaque (@EMostaque)Ars Technica:AI(RSS)
推荐理由:伦敦招聘 200 人不稀奇,真正的信号是 SpaceX 手里那个 600 亿美元收购选择权,这是给 AI 编程的商业价值做了一次硬核锚定。
10:33
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选71
FrontierCode 在 Hacker News 获 101 分

cognition.ai 的 FrontierCode 项目在 Hacker News 上获得 101 个 points。目前公开信息仅包含项目名称和来源,具体功能、技术细节或性能数据尚未披露。

开源生态编码评测/基准
同一事件,精选展示《FrontierCode 基准测试:AI 编程评估新标准--维护者审核通过率最高仅 13.4%》
推荐理由:这是第一个真正衡量「代码能不能被合并」的基准,由几十位开源仓库维护者亲手设计标准,填补了 SWE-Bench 只测正确性不测质量的盲区。虽然任务集不公开,但它对‘生产级代码智能体’的评估思路会直接影响接下来的模型选型。
08:00
HuggingFace Daily Papers(社区热门论文)
69
DeNovoSWE: 扩展长周期环境以从零生成完整仓库

DeNovoSWE 是一个大规模完整仓库生成数据集,包含4,818个高质量实例,每个实例要求从文档生成完整仓库。该数据集通过沙盒智能体工作流自动构建,无需人工标注,采用分治与批评修复策略以及难度感知轨迹过滤保证质量。微调 Qwen3-30B-A3B 后,在 BeyondSWE-Doc2Repo 基准上的得分从5.8%提升至47.2%。

数据/训练编码论文/研究
06:40
The Verge:AI(RSS)
49
Apple 用 AI 解决 Safari 的扩展短板

Safari 长期缺少丰富的扩展库,原因是 Apple 的严苛开发要求。现在 Apple 邀请用户通过描述需求,让 Safari 借助 Apple Intelligence 自动生成扩展。演示中,用户输入“保存并跟踪来自网络的烹饪食谱”等提示,Safari 随即生成了一个“Recipe Keeper”扩展。

产品更新编码
06:24
Claude:Blog(网页)
精选63
Claude 支持 Apple Foundation Models 框架,推出新 Swift 包

Anthropic 通过一个新 Swift 包,让 Apple 开发者能在 Foundation Models 框架中直接调用 Claude。开发者用 Apple 框架以原生 Swift 方式,仅需三行代码即可通过引导生成返回类型化 Swift 值。当请求涉及多步推理、代码生成、联网搜索或数据分析时,Claude 可接手处理,并将流式响应传回同一视图。该支持可在 iOS 27、iPadOS 27、macOS 27、visionOS 27 和 watchOS 27 上使用,开发者需添加包并配置 Anthropic API 密钥。

Anthropic产品更新搜索编码
关联讨论 1 条X:Claude Devs (@ClaudeDevs)
推荐理由:Apple开发者福音,现在能用Swift原生调用Claude了。端侧模型处理简单任务,复杂推理交给Claude,这才是苹果AI的正确打开方式。
‹ 上一页
1…56789…22
下一页 ›