AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 632 条
全部一手资讯X论文
6月17日周三
07:07OpenRouter:Announcements(RSS)67精选Subagent:让模型把琐碎任务委托出去
06:13Midjourney:Updates(RSS)66同事件精选Midjourney V8.1 推出 Draft mode 草稿模式与新功能预览同一事件,精选展示《Midjourney V8.1 已成为默认模型》
06:13Midjourney:Updates(RSS)35Midjourney 将于明天直播揭晓首个秘密硬件项目
05:58Google DeepMind:Blog(RSS)34Google DeepMind 基于 Gemini 与英国政府合作开发 AI 规划原型,目标将家庭申请处理时间减半
04:53Claude Code:GitHub Releases(RSS)48Claude Code v2.1.179 发布
02:03Google Research:Blog(网页)45从像素到规划:Google Research 发布 Vectorized Farmscapes 2020 数据集
00:23xAI:News(网页)64同事件精选Grok for PowerPoint 发布:在 Microsoft PowerPoint 内直接生成和编辑幻灯片同一事件,精选展示《xAI 发布 Grok for Word 插件》
00:04Google Developers Blog(RSS)46TPU Developer Hub 正式发布:助力开发者解锁 Google Cloud TPU 全部性能
6月16日周二
22:30公众号:小米 MiMo69精选小米 MiMo Claw 正式版发布:旗舰模型+金山办公,全新订阅服务上线
05:48Claude Code:GitHub Releases(RSS)42Claude Code v2.1.178 发布
03:59GitHub Blog54GitHub 发布新开源数据集,加速多语言 AI 研究与开发
00:27xAI:News(网页)73精选Grok Build 推出 Agent Dashboard 管理多个编码会话
00:00Berkeley RDI:Blog(AI 安全与评测)68精选SageCTF:最强大CTF挑战AI智能体
6月15日周一
21:30公众号:百度智能云(文心)49百度搭子DuMate Harness引擎升级:复杂任务积分消耗最高降低75%
18:31公众号:月之暗面(Kimi)69精选6倍速!Kimi K2.7 Code 高速版已上线
6月14日周日
22:00公众号:昆仑万维(天工)43昆仑万维公布Matrix-Game 3.5技术突破:状态与动作联合训练
00:17OpenRouter:Announcements(RSS)73同事件精选OpenRouter融合预算模型面板超越GPT-5.5和Claude Opus 4.8同一事件,精选展示《OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7》
6月13日周六
17:54公众号:龙猫LongCat(美团)54WBench:面向交互式视频世界模型的首个系统性多轮评测基准
17:54公众号:腾讯元宝32腾讯元宝上线世界杯陪看功能,提供赛程解读与日程提醒
17:54公众号:腾讯元宝45腾讯元宝推出「元宝高考通」,行业首个高考咨询师 Agent 免费开放
17:54公众号:千问APP(阿里)26千问上线世界杯足球预测AI助手,首场预测准确命中进球与红牌
17:54公众号:火山引擎55火山引擎 Agent Plan 上线专业数据搜索服务
09:27Claude Code:GitHub Releases(RSS)25v2.1.177
06:29GitHub Blog61精选GitHub Copilot CLI 在委托任务上变得更具选择性
06:26Claude Code:GitHub Releases(RSS)42Claude Code v2.1.176 发布
00:00Hugging Face:Blog(RSS)74精选olmo-eval:面向模型开发循环的评估工作台
6月12日周五
12:25Claude Code:GitHub Releases(RSS)52Claude Code v2.1.175 发布:新增 enforceAvailableModels 管理设置
09:25Claude Code:GitHub Releases(RSS)44Claude Code v2.1.174 发布
05:05OpenRouter:Announcements(RSS)69同事件精选Advisor:让任何模型在生成过程中求助更强的模型同一事件,精选展示《OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成》
04:24Cursor Blog74Cursor 推出 Auto-review 实现智能体自治管控
01:24Cursor Blog74精选Cursor 推出 Auto-review 机制:用分类器智能体动态管控智能体自主权限
00:27GitHub Blog44GitHub 密钥扫描:利用上下文感知的 LLM 推理大规模减少误报
00:13xAI:News(网页)70精选xAI 推出 Grok Build Plugin Marketplace
00:00OpenRouter:Announcements(RSS)55精选OpenRouter:企业应转向多模型路由,放弃单一LLM供应商
6月11日周四
19:10公众号:京东JoyAI44为卫浴装上"AI大脑",JoyInside×惠达AI卫浴套系6月17日重磅开售
17:00公众号:千问APP(阿里)72精选千问推出首个足球预测AI助手,竞猜赢奖并捐建球场
16:50公众号:腾讯混元78精选腾讯混元 AI Infra 新开源:HPC-Ops 推理核心算子全面升级
14:24Claude Code:GitHub Releases(RSS)44Claude Code v2.1.173 发布:修复 Fable 5 模型名及 Windows 沙盒警告
10:50公众号:小米 MiMo74精选小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议
05:23Claude Code:GitHub Releases(RSS)69精选Claude Code v2.1.172 发布
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月17日
07:07
OpenRouter:Announcements(RSS)
精选67
Subagent:让模型把琐碎任务委托出去

OpenRouter 推出 openrouter:subagent 服务器工具,允许前沿模型在生成过程中将独立的琐碎任务(如文档总结、结构化数据提取、文本重格式化)委托给更小、更便宜、更快的 worker 模型执行,从而节省前沿模型的 token 消耗。

智能体MCP/工具产品更新

推荐理由:这是 OpenRouter 对 agent 交互模式的一个小但实用的创新,让主模型自动将摘要、格式化等确定性子任务分派给更便宜的小模型,做多模型编排的开发者可以直接拿来用。
06:13
Midjourney:Updates(RSS)
同事件精选66
Midjourney V8.1 推出 Draft mode 草稿模式与新功能预览

Midjourney V8.1 的 Draft mode 草稿模式每次生成24张低分辨率低质量图片。用户可对任意图片点击 "Vary",将其渲染为全质量、全分辨率版本。草稿任务消耗的快速小时数减半。

产品更新图像生成
同一事件,精选展示《Midjourney V8.1 已成为默认模型》
推荐理由:这是我最近看到最实用的 Midjourney 更新,草稿模式半价生成 24 张低质量图,快速筛选后再渲染,直接降低试错成本。
06:13
Midjourney:Updates(RSS)
35
Midjourney 将于明天直播揭晓首个秘密硬件项目

Midjourney 将在明天(美国太平洋时间下午6点)通过 Discord 和 X 平台直播,首次公开其秘密硬件项目。该项目被描述为“雄心勃勃、物理尺寸巨大且出人意料”。具体细节尚未公布。

产品更新图像生成端侧
05:58
Google DeepMind:Blog(RSS)
34
Google DeepMind 基于 Gemini 与英国政府合作开发 AI 规划原型,目标将家庭申请处理时间减半

Google DeepMind 与英国政府合作,基于 Gemini 构建 AI 规划原型,旨在将家庭规划申请处理时间减半。该工具可整合数据、识别本地政策、总结公众反馈并起草评估报告,但规划官员保留最终决策权。原型已在 Barnet、Camden 和 Dorset 试点,计划 2027 年向全英议会开放。此前推出的 Extract 工具(同样基于 Gemini)已向英格兰所有议会开放,能将非结构化 PDF 转为可用数据,预计为每个议会每年节省约 255 小时人工。家庭规划申请占每年规划申请的近 70%,AI 工具旨在让官员聚焦更复杂的公共利益申请。

DeepMindGoogle产品更新部署/工程
04:53
Claude Code:GitHub Releases(RSS)
48
Claude Code v2.1.179 发布

本次次要版本修复了多项问题:流式连接中断后保留部分响应并修复 spinner 卡死;修复 WSL2(Windows Terminal / VS Code)中鼠标滚轮失效(v2.1.172 引入的回归);修复 Linux 上 sandbox denyRead/allowRead glob 覆盖大目录树导致 Bash 工具描述膨胀、会话不可用;修复反馈调查在单次回复后立即捕获评分;修复欢迎界面每会话最多显示一个促销横幅;修复查看子 agent 时 Ctrl+O 不显示其对话记录;修复点击输入框无法从子 agent/底栏面板恢复焦点;修复远程会话后台任务轮次间显示“正在运行”但实际卡住;改进了远程会话中插件加载性能。

Anthropic产品更新编码部署/工程
02:03
Google Research:Blog(网页)
45
从像素到规划:Google Research 发布 Vectorized Farmscapes 2020 数据集

Google Research 发布 Vectorized Farmscapes 2020 向量化数据集,将英格兰超 130,000 km² 高分辨率栅格地图转化为树篱、石墙、小树林等精细生态特征量化清单。该数据集基于 RSF 的 Vision-Transformer Backbone(在超 3 亿张卫星图像上预训练)微调,融合亚米级影像与 1 米 LiDAR 数据实现双层标注。为突破 247 km² 标注数据限制,采用 Polsby–Popper 紧凑性评分对几何形状功能分类,区分林地、连接廊道与孤立树丛。旨在不侵占农业用地提升碳汇与生物多样性。

Google产品更新数据/训练
00:23
xAI:News(网页)
同事件精选64
Grok for PowerPoint 发布:在 Microsoft PowerPoint 内直接生成和编辑幻灯片

xAI 于 6 月 16 日发布 Grok for PowerPoint,作为免费 Microsoft 365 插件上线。用户无需离开应用即可利用 Grok 将大纲转为完整幻灯片,进行内容研究、撰写、排版,并支持添加单张幻灯片、调整样式主题、重构章节。插件还能调用 Grok 连接器,从邮件或 SharePoint 中获取信息。该插件同样适用于 Word 和 Excel。

Microsoft产品更新
同一事件,精选展示《xAI 发布 Grok for Word 插件》
推荐理由:Grok 进入 PowerPoint,让 Grok 用户可以在幻灯片里直接用,但功能跟微软 Copilot 高度重叠,属于跟进式覆盖,没带来新能力,不算重要。
00:04
Google Developers Blog(RSS)
46
TPU Developer Hub 正式发布:助力开发者解锁 Google Cloud TPU 全部性能

谷歌今日推出 TPU Developer Hub,面向模型构建者与开发者提供端到端教育资源。内容覆盖预训练、后训练及推理工作负载,涵盖硬件架构、软件栈(XLA、PyTorch 零成本迁移)、追踪调试(XProf 工具)、并行优化(Pallas 内核、KV cache 卸载)及网络安全实践。资源形式包括交互式 Colab、开源代码配方与深度技术文档,支持 AI 智能体辅助集成,帮助用户充分发挥 Cloud TPU 性能。

Google产品更新部署/工程
6月16日
22:30
公众号:小米 MiMo
精选69
小米 MiMo Claw 正式版发布:旗舰模型+金山办公,全新订阅服务上线

小米推出云端轻量化 Claw 类产品 MiMo Claw 正式版,搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 旗舰模型。该模型原生兼容 MCP 工具调用协议,内置百万级超长上下文,支持单会话千次以上连续工具调用;依托 MTP 三层解码架构,在 OpenClaw 标准 Agent 工作流中吞吐效率提升约 3 倍。ClawEval 测试中任务达标率(Pass³)达 63.8%,Token 消耗较同类产品降低 40%-60%。联动金山办公生态,提供 Word、Excel、PPT、PDF 等格式的 AI 生成、预览与在线编辑一站式服务。免费用户每日单次体验时长从1小时升级至4小时,面向高频用户推出 TokenPlan 分层订阅(Lite/Standard/Pro/Max),支持灵活叠加,限时定价14.9元/月、19.9元/月、233.8元/年。

智能体MCP/工具产品更新
关联讨论 2 条X:小米 MiMo (@XiaomiMiMo)IT之家(RSS)
推荐理由:小米给普通人用的 Agent 工具正式上线,14.9 元月费很激进,但核心还是看实际任务完成率和办公集成靠不靠谱。
05:48
Claude Code:GitHub Releases(RSS)
42
Claude Code v2.1.178 发布

本次更新新增 Tool(param:value) 语法用于权限规则匹配工具输入参数;嵌套 skills 目录中的技能自动加载,名称冲突时以 <dir>:<name> 形式保留;嵌套 agent、workflow、output-style 冲突时取最近目录。改进自动模式下子 agent 生成前的分类器评估;/doctor 采用扁平树布局;工作流提示词高亮为紫色闪烁,仅触发显式短语;/bug 提交前需填写描述。修复了 CLI 继承过期 WebSocket/OAuth 文件描述符导致的崩溃、Chrome 中 OAuth token 账号不匹配导致连接失败、子 agent 转录显示工具结果、后台恢复不从头重启、compaction 未使用 --fallback-model 等问题。

Anthropic产品更新编码
03:59
GitHub Blog
54
GitHub 发布新开源数据集,加速多语言 AI 研究与开发

GitHub 在 CC0-1.0 许可下发布了一个仓库级数据集,涵盖多语言开发者内容,包括 README、issue 和 pull request。该数据集旨在帮助研究者和开发者发现并利用跨语言的技术文档与社区讨论,以推动多语言 AI 的构建与优化。

GitHub开源/仓库数据/训练
00:27
xAI:News(网页)
精选73
Grok Build 推出 Agent Dashboard 管理多个编码会话

xAI 为 Grok Build 推出 Agent Dashboard,提供单一屏幕管理多个编码会话。仪表板按状态分组(等待输入、工作中、空闲),每行显示状态标记、名称、分支、权限模式和当前操作。选中会话可打开 peek 面板查看最新输出并直接回复,等待输入的会话支持用箭头键或数字键选择选项。底部输入框用于分派新会话,支持设置模型、启动计划模式或自动批准编辑。通过 grok dashboard、/dashboard 或 Ctrl+\ 打开,关闭后会话继续运行,重新打开即可恢复。

智能体xAI产品更新编码

推荐理由:xAI给Grok Build加了一个类似终端的仪表盘,可以并行管理多个编码代理,对重度用户来说能省下频繁切换窗口的心智负担。功能本身不颠覆,但标志着AI编程工具在往多会话编排走。
00:00
Berkeley RDI:Blog(AI 安全与评测)
精选68
SageCTF:最强大CTF挑战AI智能体

UC Santa Barbara与UC Berkeley团队基于OpenSage框架构建了CTF专用智能体SageCTF。在DEF CON CTF 2026资格赛中,SageCTF以单人玩家身份尝试15道挑战,成功攻克7道、恢复8个flag,总计1,743分,排名前5%,超越全部自评“不使用AI”或“低AI”的175支团队。在50道近期CTF挑战的对比测试中,SageCTF以Claude-Opus-4.6为主模型,在相同预算(每道$200/10小时)下解出39道,而Claude Code仅解出13道,且Claude Code的解出全部被SageCTF覆盖。技术核心包括AI自生成拓扑、多智能体通信、分层记忆及多模型协同编排。

智能体推理论文/研究评测/基准

推荐理由:SageCTF 在 DEF CON CTF 排进前 5%,是 AI agent 在顶级安全竞赛中的首次重大突破。OpenSage 的自构建多智能体架构和十小时持续探索的能力,给做复杂推理工具的人提供了真参考。
6月15日
21:30
公众号:百度智能云(文心)
49
百度搭子DuMate Harness引擎升级:复杂任务积分消耗最高降低75%

百度搭子DuMate完成Harness引擎系统性升级,复杂任务积分消耗最高降低75%。以行业深度调研报告为例,积分从约400降至约100;电商运营周报从近300降至约78。降本不降质源于三项优化:自研安全沙箱资源消耗降低、模型推理效率提升(非替换低成本模型)、Harness执行链路工程升级(提升任务规划精度与工具调用效率)。

智能体产品更新部署/工程
18:31
公众号:月之暗面(Kimi)
精选69
6倍速!Kimi K2.7 Code 高速版已上线

Kimi K2.7 Code 高速版上线,与普通版为同一模型,输出速度约 5-6 倍,常规编程场景约 180 Token/s,短上下文可达 260 Token/s。API 定价为普通版 2 倍,模型 ID:kimi-k2.7-code-highspeed。Kimi Code Plan 用户可通过「抢先体验计划」使用,用量消耗为普通版 3 倍。使用须开启思考模式,关闭会报错或回退至 K2.6。庆祝发布,Kimi API 开放平台推出为期三周充赠活动,充值 500 元及以上享 20%-30% 代金券。相比 K2.6,K2.7 Code 在长上下文编程指令遵循、长程任务性能提升,平均 token 消耗减少 30%,内部基准测试显著提升。普通版输入 6.5 元/百万 token、输出 27 元,缓存输入 1.3 元。非编程任务推荐 K2.6。

产品更新推理编码
关联讨论 4 条X:硅基流动 SiliconFlow (@SiliconFlowAI)IT之家(RSS)X:Kimi.ai (@Kimi_Moonshot)Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:这不是 K2.7 的换代,而是给开发者开了条高速车道,180 token/s 让代码补全几乎无感,虽然贵但省时间,重度编程用户值得切。
6月14日
22:00
公众号:昆仑万维(天工)
43
昆仑万维公布Matrix-Game 3.5技术突破:状态与动作联合训练

昆仑万维Skywork首席科学家刘扬在智源大会上提出“状态与动作联合训练”框架,并首次公布Matrix-Game 3.5核心技术:从游戏场景向真实场景扩展,支持多风格动态切换、指令控制及NPC交互,记忆机制采用三维空间块匹配替代历史帧拼接,并用PRoPE机制替代额外参数注入。Matrix-Game 3.0已实现5B参数蒸馏模型在720P分辨率下40FPS实时生成。团队构建了包含500万+视频切片、1万+训练小时的数据引擎。3.5计划于2026年7月发布。

产品更新多模态
00:17
OpenRouter:Announcements(RSS)
同事件精选73
OpenRouter融合预算模型面板超越GPT-5.5和Claude Opus 4.8

通过OpenRouter融合的一组预算模型,在100个复杂研究任务上得分超过GPT-5.5和Claude Opus 4.8。

AnthropicDeepSeekOpenAI产品更新
同一事件,精选展示《OpenRouter融合预算模型性能超越GPT-5.5与Claude Opus 4.7》
推荐理由:OpenRouter 的 Fusion API 用多个模型合成输出,基准测试里预算模型组合能接近前沿,这个思路对有质量要求又在意成本的开发者挺实用。
6月13日
17:54
公众号:龙猫LongCat(美团)
54
WBench:面向交互式视频世界模型的首个系统性多轮评测基准

美团 LongCat 团队推出 WBench,首个面向交互式视频世界模型的系统性多轮评测基准。包含 289 个测试案例、1058 个交互轮次,覆盖导航、主体动作、事件编辑、视角切换四种交互方式,从视频质量、设定遵循度、交互遵循度、一致性、物理真实性五维度评测 20 个前沿模型(包括 Kling 3.0、HY-World 1.5、Genie 3 等)。核心发现:无全能模型,导航能力与画质无关;多轮交互后所有模型性能下降,导航平均分下降 33 点;开源模型 HY-World 1.5 导航能力突出;视角切换最难(平均分 30.7)。WBench 已开源。

arXivGitHub开源生态视频
17:54
公众号:腾讯元宝
32
腾讯元宝上线世界杯陪看功能,提供赛程解读与日程提醒

腾讯元宝推出世界杯主题助手,支持赛事规则讲解、焦点战推荐、看球朋友圈文案生成,可设定比赛日程提醒,与用户实时互动。

产品更新
17:54
公众号:腾讯元宝
45
腾讯元宝推出「元宝高考通」,行业首个高考咨询师 Agent 免费开放

腾讯元宝上线「元宝高考通」功能,定位为行业首个高考咨询师 Agent。用户输入省市、分数、选科后,可一键生成「冲/稳/保」三梯度志愿方案,并支持通过对话实时调整意向(如剔中外合作、换专业优先)。数据源引用「掌上高考」官方信息,全程免费使用。

智能体产品更新
17:54
公众号:千问APP(阿里)
26
千问上线世界杯足球预测AI助手,首场预测准确命中进球与红牌

千问在世界杯开幕前夕推出足球预测AI助手,基于海量大数据训练,囊括历史比赛记录、球员数据、伤病、美加墨地貌、比赛天气乃至裁判信息。在首场墨西哥队与南非队的比赛中,该助手准确猜中2粒进球并预测了一张创历史记录的红牌。千问向球迷发起竞猜挑战:在全部104场比赛中预测超过80场且准确率超过千问,即可参与1万元大奖抽奖(100个名额);预测超过32场则有机会抽取千问AI眼镜G1(1000副)。

产品更新其他
17:54
公众号:火山引擎
55
火山引擎 Agent Plan 上线专业数据搜索服务

火山引擎 Agent Plan Harness 新增专业数据搜索服务,通过 Data MCP 接入股票金融、企业工商、学术论文三类数据源。用户可用自然语言搭建个人投资助手,自动生成带引用的个股简评并定时监控盘后风险。配置 Base URL、获取 API Key、安装 Data MCP 三步即可上手。即日起至8月7日,Agent Plan 首两月2.5折,入门版9.9元/月,热门模型用量提升2.5倍。

智能体MCP/工具产品更新
09:27
Claude Code:GitHub Releases(RSS)
25
v2.1.177
Anthropic产品更新
06:29
GitHub Blog
精选61
GitHub Copilot CLI 在委托任务上变得更具选择性

GitHub Copilot CLI 通过更好的编排实现了更少的任务交接和更快的进度,且没有新增任何配置选项。

智能体GitHub产品更新

推荐理由:官方博客把子代理从默认操作变成了需要权衡的决策,23% 的工具失败减少和明显的等待时间下降,说明 AI 工具的体验升级不一定要加新按钮,改好调度逻辑一样有用。
06:26
Claude Code:GitHub Releases(RSS)
42
Claude Code v2.1.176 发布

Claude Code v2.1.176 更新:会话标题现按对话语言生成;新增 footerLinksRegexes 设置支持正则匹配页脚行链接徽章;优化 Bedrock 凭证缓存。修复多项问题:环境变量不可再绕过 availableModels 限制;/fast 切换至白名单外模型时拒绝;auto 模式退化为可用 Opus 模型;修正路径 hook 条件匹配;修复 Linux 沙箱内符号链接启动问题;修复 tmux 内 SSH 剪贴板问题;修复 Remote Control 多项连接问题。

智能体Anthropic产品更新编码
00:00
Hugging Face:Blog(RSS)
精选74
olmo-eval:面向模型开发循环的评估工作台

olmo-eval 是基于 OLMES 标准构建的评估工作台,专为 LLM 持续开发中的反复评测场景设计。相比 OLMES,它减少了新增评测的实现工作量,支持 agentic 和多轮评测作为一等用例,并允许根据基准需求选择轻量直接运行或容器化隔离运行。采用模块化架构,模型、工具、容器环境、辅助模型均可独立替换。评测结果同时报告分数、标准误差和最小可检测效应。与 Harbor 侧重于发布不同,olmo-eval 聚焦开发阶段快速迭代,可逐问题对比检查点输出以区分真实改进与噪声。

Hugging Face产品更新开源生态评测/基准

推荐理由:做模型训练的人会感谢这个工具,它把评估从一次性打分变成能持续对比的流程,按题对比两个 checkpoint 的功能很实用,但如果你不训模型,这篇可以跳过。
6月12日
12:25
Claude Code:GitHub Releases(RSS)
52
Claude Code v2.1.175 发布:新增 enforceAvailableModels 管理设置

Claude Code v2.1.175 新增 enforceAvailableModels 管理设置。启用该设置后,availableModels 允许列表也会约束 Default 模型——若 Default 模型解析到被禁用的模型,则自动回退至第一个允许的模型;用户或项目设置无法再扩大受管理的 availableModels 列表。

Anthropic产品更新编码部署/工程
09:25
Claude Code:GitHub Releases(RSS)
44
Claude Code v2.1.174 发布

新增 wheelScrollAccelerationEnabled 设置,全屏禁用鼠标滚轮加速。修复 /model 选择器:Opus 在 Max/Team Premium/Enterprise 独立行,Sonnet 在 Pro/Team,Opus 在 API 按量付费账户;修复固定 Sonnet 版本时的硬编码标签;企业账户误显示积分横幅;Bedrock GovCloud 区域前缀错误导致 400 错误;后台会话继承另一会话环境变量;macOS/Linux 退出时 1-2 秒暂停;git co-author 模型名错误;/advisor 预选被 availableModels 屏蔽;skill 热重载仅发送变更;Workflow tool 子智能体缺失归属头;预温后台 worker 空闲后认证失败。[VSCode] 在 /usage 新增过去 24h/7d 的缓存未命中、长上下文、子智能体及 skill/agent/plugin/MCP 分解归因。

Anthropic产品更新编码部署/工程
05:05
OpenRouter:Announcements(RSS)
同事件精选69
Advisor:让任何模型在生成过程中求助更强的模型

OpenRouter 推出 advisor 服务器工具,允许快速、便宜的模型在生成过程中向更强模型咨询。用户可用 GPT-4o Mini 处理常规任务,在关键环节调用 Claude Fable 进行更高质量的推理。

智能体产品更新
同一事件,精选展示《OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成》
推荐理由:让 GPT-4o Mini 在关键时刻请教 Claude,用 1/10 的成本得到相近质量,这种跨模型顾问把“模型路由”做成了开箱即用的工具,做 agent 的值得试。
04:24
Cursor Blog
74
Cursor 推出 Auto-review 实现智能体自治管控

Cursor 本周推出 Auto-review,旨在让代码智能体在保持自主性同时降低安全风险。该功能引入分类器代理,在每次工具调用前根据上下文判断风险:低风险时允许自由操作,越界时阻止并返回解释,使父智能体自主调整路径。分类器为轻量模型,与父代理同 RPC 流运行避免延迟,并可读取工作区文件辅助决策。团队基于约 12 小时内部开发者会话整理 6,122 条标注数据,补充合成异常用例评测,以平衡安全与开发效率。

智能体产品更新安全/对齐
01:24
Cursor Blog
精选74
Cursor 推出 Auto-review 机制:用分类器智能体动态管控智能体自主权限

Cursor 近日推出 Auto-review,通过一个专门的分类器智能体在工具调用前审查动作风险。该分类器根据上下文判断动作是否与用户意图一致,高风险时阻止并返回解释给父智能体,低风险时放行。分类器采用小模型,运行在智能体循环内以避免额外延迟,并能读取工作区文件辅助判断。测试基于约12小时内部开发会话生成的6122条标签数据,以及针对读取密钥、操作生产数据等危险场景的合成数据。设计目标是在不频繁阻断日常开发的前提下,拦截风险动作。

智能体产品更新安全/对齐

推荐理由:Cursor把agent监管从"是/否"开关变成了可调节的刻度盘,一个专用小模型实时判断操作风险,高风险时给反馈让父agent换个安全方案,而非频繁打断用户。用Cursor的开发者都得了解这个逻辑。
00:27
GitHub Blog
44
GitHub 密钥扫描:利用上下文感知的 LLM 推理大规模减少误报

GitHub 改进了密钥扫描的验证步骤,通过上下文感知的 LLM 推理大幅降低误报率,使警报更加可信且可操作。该方案在保持检测覆盖面的同时,显著减少了噪音干扰,提升了开发者的告警处理效率。

GitHub产品更新
00:13
xAI:News(网页)
精选70
xAI 推出 Grok Build Plugin Marketplace

xAI 今日发布 Grok Build 内置插件市场。插件将技能、斜杠命令、AI 智能体、钩子、MCP 服务器和 LSP 打包为可安装包,用户无需离开终端即可浏览、安装和更新。首发合作伙伴包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 和 Superpowers。在 Grok Build 中输入 /marketplace 或使用 CLI 即可安装,每个远程插件均固定到特定 commit SHA 并经过验证。开发者可提交 PR 到 xai-org/plugin-marketplace 发布自己的插件。

MCP/工具xAI产品更新编码
关联讨论 1 条X:xAI (@xai)
推荐理由:Grok Build 这下可以像浏览器装扩展一样装插件了,涵盖数据库、部署、调试,开发者不必离开终端,这类集成对 AI 编程环境的体验影响挺大的。
00:00
OpenRouter:Announcements(RSS)
精选55
OpenRouter:企业应转向多模型路由,放弃单一LLM供应商

OpenRouter指出,企业不应只依赖一家LLM供应商,而应采用多模型路由策略以平衡成本与效果。Anthropic Opus 4.7的“tokenizer税”导致输入token增加35%,新模型Fable定价$10/M输入、$50/M输出,OpenAI GPT-5.5 Pro更高达$30/M输入、$180/M输出。用户正主动跨模型族分配任务,平台3月至4月新增90个模型。OpenRouter作为统一市场,通过标准化API消除切换成本,使路由成为“一等公民”。

AnthropicOpenAI产品更新部署/工程
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:OpenRouter 放出的多模型使用数据很实在,成本压力正推动企业从专一走向多模型路由,新分析 API 让这个趋势可度量。
6月11日
19:10
公众号:京东JoyAI
44
为卫浴装上"AI大脑",JoyInside×惠达AI卫浴套系6月17日重磅开售

京东JoyInside与惠达推出行业首款搭载JoyInside统一智能中枢的卫浴套系“惠达小京灵系列AI卫浴套装”,含AI智能马桶、AI智能花洒、AI智能浴室柜。依托JoyAI大模型,设备支持语音控制、模糊语义理解、连续多轮对话及方言识别,可实现自动预排冷水、语音控温、镜面除雾等场景联动。套系已开启预售,6月17日晚8点正式售卖。JoyInside已与近200家机器人、AI玩具、家电家居品牌合作,预计年内接入超千万终端设备。

产品更新端侧语音
17:00
公众号:千问APP(阿里)
精选72
千问推出首个足球预测AI助手,竞猜赢奖并捐建球场

千问上线首个足球预测AI助手,基于海量大数据(含历史比赛、球员数据、伤病、美加墨地貌及天气等)。以6月22日挪威对塞内加尔为例,预测“1:1平局”,理由为气候差异。活动:参与全部104场竞猜,预测超80场且准确率超千问可抽万元大奖(100个名额);预测超32场可抽千问AI眼镜G1(1000副),该眼镜支持赛后分析、拍屏识球员及赛事结果订阅。累积积分将向乡村学校捐建足球场,目标至少50所。

产品更新数据/训练

推荐理由:千问把AI预测和世界杯热点捆绑,玩法不算新鲜,但捐球场的设计让这件事多了点人情味。如果你对预测模型感兴趣,可以看看它怎么处理天气和地貌数据,虽然实际准确率还得踢了才知道。
16:50
公众号:腾讯混元
精选78
腾讯混元 AI Infra 新开源:HPC-Ops 推理核心算子全面升级

腾讯混元 AI Infra 团队开源升级 HPC-Ops 推理算子库,推出五大核心算子。Attention 采用运行时动态负载调度,长文本最高加速 2.95x,端到端 QPM 提升 17%;Router GEMM 以双 BF16 组合实现 FP32 精度,对比 CuBLAS FP32 最高提速 3.22x;FusedMoE 相对 vLLM、SGLang 性能提升 1.2x~1.6x;Fused AllReduce+Norm 对比主流方案最高提速 1.68x;Sampler 将解码采样融合为 2 个 CUDA Kernel,相对 vLLM 提速 4.0x~7.5x。所有能力均来自生产实践并完全开源。

产品更新开源/仓库推理部署/工程

推荐理由:腾讯混元把推理全链路的瓶颈都加速了一遍,Sampler 算子比 vLLM 快 4-7 倍,Attention 动态调度根治长尾延迟,这套开源算子库可以直接用,做推理部署的可以抄作业。
14:24
Claude Code:GitHub Releases(RSS)
44
Claude Code v2.1.173 发布:修复 Fable 5 模型名及 Windows 沙盒警告

本次更新修复了两个问题:其一,Fable 5 模型名称带 [1m] 后缀时未能自动规范化的问题已解决——Fable 5 默认包含 1M 上下文窗口,现后缀会被自动去除。其二,修复了在 Windows 系统上启用沙盒后出现虚假的“sandbox dependencies missing”启动警告。

Anthropic产品更新编码
10:50
公众号:小米 MiMo
精选74
小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议

小米发布并开源终端AI编程助手MiMo Code V0.1.0,采用MIT协议。内置限时免费MiMo-V2.5多模态模型,性能比肩Claude Sonnet 4.6;支持接入DeepSeek、Kimi、GLM等模型。核心能力包括持久记忆系统(项目记忆、会话检查点、任务进度)和无限上下文——通过独立subagent自动保存状态解决长会话遗忘。独创Compose模式实现模型与Agent协同优化,SWE-Bench Pro达62%(Claude Code 57%),Terminal Bench 2达73%(68%)。内置语音输入和/dream命令,每7天自动合并记忆。终端输入mimo即可使用,所有设置中文汉化。

智能体产品更新开源生态编码
关联讨论 3 条X:Berry Xia (@berryxia)Hacker News 热门(buzzing.cc 中文翻译)X:小米 MiMo (@XiaomiMiMo)
推荐理由:小米悄悄发了MiMo Code,开源且免费,用记忆系统和Compose模式解决了AI编程两大顽疾:健忘和跑偏,实测比同模型Claude Code更强,开发者现在就能装上试。
05:23
Claude Code:GitHub Releases(RSS)
精选69
Claude Code v2.1.172 发布

子智能体现可创建自己的子智能体,最多嵌套5层。Amazon Bedrock 在未设置 AWS_REGION 时从 ~/.aws/config 读取区域。插件市场新增搜索栏。修复了使用1M上下文且无使用额度的会话永久卡住的问题,现会自动压缩回标准上下文限制。修复了多个图片导致重复报错等问题。改进了长对话性能,减少冗余消息归一化和不必要的UI重绘,降低空闲CPU占用。Claude in Chrome 工具加载改为单次批量调用。/code-review 在未登录时保留 ultra 选项并提示需要 claude.ai 账户。

智能体Anthropic产品更新

推荐理由:子代理现在可以递归生成子代理(最多 5 层),这个特性让复杂的多 agent 编排成为可能,但总体还是以 bug 修复为主,Bedrock 的区域读取也更顺手了,Claude Code 用户直接升级即可。
‹ 上一页
12345…16
下一页 ›