AIHOT
内容
精选全部 AI 动态AI 日报
接入
Agent 接入
更多
关于更新日志反馈
登录
精选全部日报更多
登录
最新一期2026-06-30
2026 年 6 月30
  • 30 日美团LongCat Owl Alpha:OpenRouter最流行模型,1.6万亿MoE,国产ASIC训练
  • 29 日Grok 4.5 私测于 SpaceX 和 Tesla,性能接近 Opus
  • 28 日阿里千问输入法上线 macOS 版:最快 300 字/分,AI 自动润色
  • 27 日OpenAI 预览新一代模型 GPT-5.6 Sol
  • 26 日Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模
  • 25 日OpenAI ChatGPT 语音最大规模升级:双向AI语音模型 Bidi 1 已上线测试
  • 24 日FastWan-QAD:单卡5090上1.8秒生成5秒视频
  • 23 日PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M
  • 22 日美团tabbit国际版免费接入GPT-5.5/Claude Opus 4.8等旗舰模型
  • 21 日微软双向转售GPT与DeepSeek成全球最大AI中间商
  • 20 日阿里开源向量数据库Zvec,UCSD黄碧薇教授提出因果AI第四代范式
  • 19 日首个统一科学大模型 LOGOS 正式开源
  • 18 日MolmoMotion:语言引导的3D运动预测模型
  • 17 日Cartesia 发布 Sonic 3.5 与 Ink 2 实时语音模型
  • 16 日MiniMax 开源 M3 模型权重及 MSA 技术论文
  • 15 日Anthropic 暂停新模型访问,印度辩论 AI 未来
  • 14 日智谱 GLM-5.2 全量开放,支持 1M 上下文且下周开源
  • 13 日MiniMax M3 开源权重模型发布,已上架 HuggingFace
  • 12 日Gemini Omni Flash 视频任务达 SOTA
  • 11 日DiffusionGemma:文本生成速度提升4倍的开源扩散模型
  • 10 日Claude Fable 5 和 Claude Mythos 5
  • 9 日小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
  • 8 日Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
  • 7 日GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码
  • 6 日Riverflow 2.5:可控制评分标准的图像模型
  • 5 日Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全
  • 4 日Grok Imagine 1.5 预览版发布
  • 3 日微软首款高级推理AI模型MAI-Thinking-1发布
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
AI 日报每早八时
今天6月29日6月28日更早
AIHOT DAILY
2026年6月30日 · 周二

1模型发布/更新

美团LongCat Owl Alpha:OpenRouter最流行模型,1.6万亿MoE,国产ASIC训练

美团LongCat的1.6万亿参数MoE模型Owl Alpha成为OpenRouter上最流行模型,累计消耗10万亿tokens,性能达Gemini/Opus 4.6级别。该模型使用35万亿tokens训练,完全在5万块国产ASIC上完成。据官方推文,Owl Alpha上线后每日调用量全球Top3,在Hermes Agent排名#1,Claude Code排名#2,OpenClaw排名#3。该模型即将退役,后续版本待公布。

X:Emad Mostaque (@EMostaque)

2产品发布/更新

从任何地点构建——Cursor for iOS 公测版发布

Cursor 推出 iOS 原生公测版,所有付费计划可用。开发者可在手机上启动始终在线的云端智能体,或远程操控电脑端智能体。支持语音输入、斜杠命令和选择前沿模型。智能体运行后,锁屏 Live Activities 和推送通知实时更新状态,完成或需要输入时提醒。云端智能体在隔离虚拟机中运行,可自动迭代生成合并就绪的 PR,并输出演示、截图和日志。本地与云端智能体支持双向切换。移动端 Composer 2.5 享受 75% 折扣,优惠至 2026 年 7 月 5 日。

Cursor Blog
EverOS:开源Markdown优先智能体记忆运行时,支持混合检索与自进化技能

EverMind 推出开源智能体记忆运行时 EverOS(Apache 2.0 许可)。它以可编辑的 Markdown 文件为记忆主体,经 SQLite 管理状态、LanceDB 实现混合检索(BM25 关键词 + 向量搜索 + 标量过滤)。每个完成的任务记录为 Case,离线提炼为可复用的 Skill,使记忆随使用自我进化。v1.1.0 新增 Knowledge APIs(支持分类与话题搜索的 Markdown 页面)和 Reflection(跨会话优化 Profile 和 Skill)。据 EverMind 报告,LoCoMo 得分 93.05%,LongMemEval 83.00%,HaluMem 93.04%,p95 检索延…

MarkTechPost(RSS)
小红书 RedKnot 推理引擎:将 KV Cache 按注意力头拆解实现长文本加速

RedKnot 将 KV Cache 沿注意力头维度拆解,通过头分类稀疏(局部头占 83.4%–96.8%)、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上,TTFT 最高加速 1.6–3.54×,单卡并发提升 4.7–7.8×,预填充 FLOPs 削减 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速达 5.16×,KV 传输最多省 6.3×。精度通常不低于稠密 F1 的 95%。

公众号:小红书技术(dots.llm)
OpenClaw 发布原生 iOS 与 Android 应用

OpenClaw 现已登陆 iOS 和 Android 🦞 📱 原生移动应用,终于来了 💬 智能体装进口袋 🔔 频道、任务、回复,随时处理 用你的大拇指,在任何地方运行智能体。 iOS: https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132 Android: https://play.google.com/store/apps/details?id=ai.openclaw.app

X:OpenClaw (@openclaw)
Herdr:驻留在终端中的AI智能体多路复用器

Herdr是一个驻留在终端中的AI智能体多路复用器,允许用户在单一终端界面内管理和切换多个AI智能体会话。

Hacker News 热门(buzzing.cc 中文翻译)
为 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway

Anthropic 今日推出 Claude apps gateway,一个自托管控制平面,让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux,后端使用 PostgreSQL,提供企业级 SSO 登录(通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等)、集中策略管理、角色权限、路由(支持故障转移)以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据(除非配置使用 Claude A…

Claude:Blog(网页)
Claude 在 Microsoft Foundry 正式可用

从今天起,Claude 模型在 Microsoft Foundry 上正式可用,托管于 Azure 环境,运行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5,通过 Messages API 调用,支持提示缓存和扩展思考。用户可选择推理处理位置,包括美国数据区域,由 Anthropic 负责推理运营。Azure 用户可使用现有身份验证、计费与治理控制,并获得统一账单;符合条件的 Enterprise Agreement 客户可将 Claude 用量计入 Azure 承诺消费。

Claude:Blog(网页)
Claude Code v2.1.196 发布

新增组织默认模型支持,未选模型时显示“Org default”。聊天会话可读默认名称,文件附件支持 Cmd/Ctrl-click 定位。安全方面,claude mcp list/get 不再启动通过 .claude/settings.json 自批准的不安全服务器;不受信任工作区显示“Pending approval”。/code-review 合并五个清理查找器,token 用量减少约 25%。终端 UI 跳过空子树遍历减少渲染。流式空闲看门狗默认开启,5 分钟无事件自动中止重试。修复背景对话误删、远程会话自动恢复、MCP OAuth 作用域冲突、Agents 侧边栏焦点丢失等多项问题。

Claude Code:GitHub Releases(RSS)

3行业动态

国务院印发《教育发展“十五五”规划》,推进人工智能全学段教育

国务院日前印发《教育发展“十五五”规划》,要求推进人工智能全学段教育,提升学生人工智能素养及提出问题、解决问题的能力。规划明确完善科学教育体系,强化科技教育与人文教育协同,加强青少年科学素养、批判性思维和创新能力培养。同时实施学生体质强健计划、心理健康促进行动,加大拔尖创新人才自主培养力度,推动学科交叉融合,扩大优质本科招生规模。目标到2030年高质量教育体系基本建成。

IT之家(RSS)
Rubin Ultra取消,新版尺寸性能减半

有意思:在GTC 2026宣布Rubin Ultra仅3个月后,原4-die Rubin Ultra因制造执行问题被取消。新的“Rubin Ultra”尺寸减半,实际性能约为原版的一半。1/4🧵

X:SemiAnalysis (@SemiAnalysis_)
美军用AI选目标却误炸伊朗学校,Anthropic Claude嵌入Palantir系统首日建议约1000目标

美军在打击伊朗时首次大规模使用AI选择目标(Anthropic的Claude模型嵌入Palantir的Maven Smart System,首日建议约1000个目标),但对一所学校的导弹袭击导致约120名儿童死亡。调查发现,情报分析师早在2019年就通过数字工具标记该地点已变为小学,但该工具未连接军方官方目标数据库MIDB,信息从未送达指挥官。MIDB建于1980年代,依赖手动输入,替代系统MARS多年延迟。五角大楼事后宣布推出agentic AI initiative。Project Maven创建人Jack Shanahan批评目标验证不力不可原谅。

The Decoder:AI News(RSS)
三星和SK海力士计划投资5900亿美元扩产芯片,AI需求推高内存价格

在韩国政府支持下,三星和SK海力士计划投入5900亿美元扩大芯片产能,包括800万亿韩元新建四座工厂、81万亿韩元建封装中心,以及未来15年30万亿韩元用于研发下一代芯片。AI数据中心需求是主要驱动力。Jefferies预测,2026年Q3内存价格将上涨40%至50%,Q4再涨30%至40%,2027年继续上涨40%至45%,到2028年新产能仅上线15%至20%才可能缓解。两家公司合计控制全球近80%的高带宽内存芯片市场。内存涨价已推高消费电子产品成本,苹果已上调Mac和MacBook售价。

The Decoder:AI News(RSS)
SK 集团会长崔泰源:到 2035 年建设 15GW AI 数据中心,总投资达 1000 万亿韩元

SK 集团会长崔泰源 6 月 29 日宣布,计划到 2035 年建成 15GW AI 数据中心容量,作为韩国国家级基础设施和实体 AI 时代核心底座。项目总投资 1000 万亿韩元(约 4.4 万亿元人民币),未来 10 年保持年均 100 万亿韩元以上国内投资,旨在实现从出口传统商品向智能服务的转变,构建韩国智能市场。此外,SK 海力士将向韩国西南部投资 400 万亿韩元,半导体供应项目总投资达 1100 万亿韩元(约 4.84 万亿元人民币)。

IT之家(RSS)

4论文研究

Meta发布Brain2Qwerty v2:非侵入式实时句子解码

Meta公布Brain2Qwerty v2,这是非侵入式脑电信号解码研究的最新里程碑。基于当天发表在《Nature》的v1,v2是性能最高的端到端管道,能从原始脑信号实时解码句子。其从字符级性能提升至解码单词和语义,提高整体沟通准确性。该研究有望帮助数百万因脑损伤或疾病无法沟通的人群。

X:AI at Meta (@AIatMeta)
Claude Code 打开 GitHub 仓库即执行隐藏恶意代码,攻击者可获完全控制

安全研究人员在 Mozilla 的 GenAI 漏洞赏金平台 0DIN 发现新攻击向量。一个看似正常的 GitHub 仓库包含 setup 脚本,该脚本运行时从 DNS 条目拉取命令并执行,恶意代码从未存在于仓库中,对扫描器、代码审查和 AI 智能体不可见。开发者使用 Claude Code 等 AI 编码工具打开该仓库时,Claude Code 在设置过程中遇到常规错误消息后自动运行该脚本,打开反向 shell,攻击者可窃取 API 密钥和登录凭据并维持持久访问。研究人员建议 AI 智能体应在运行前显示 setup 脚本内容,开发者应将第三方仓库的 setup 说明视为不受信任代码。

The Decoder:AI News(RSS)
OpenAI 报告:绘制欧洲 AI 劳动力机遇版图

OpenAI 发布新报告,分析 AI 对欧盟就业的影响,划定哪些职业面临自动化、增长或工作流程变化。

OpenAI:官网动态(RSS · 排除企业/客户案例)
DiScoFormer:一个跨分布同时估计密度与分数的单一Transformer模型

DiScoFormer(Density and Score Transformer)是一个无需重新训练即可从数据点估计分布密度和分数的单一模型。它利用Transformer的交叉注意力机制,在单次前向传播中输出密度和分数,并通过一致性损失实现分布外自适应。在100维空间中,DiScoFormer比最优调参的核密度估计(KDE)降低分数误差约6.5倍、密度误差超过37倍,且随样本量增加持续提升,而KDE内存耗尽。模型基于高斯混合模型训练,可泛化至非高斯分布(如Laplace、Student-t)及未见过的多模态混合。

Hugging Face:Blog(RSS)

5技巧与观点

Anthropic工程师Margot Van Laar:提示词工程实战——调试生产提示词为主,评估是唯一严谨方式

An anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战,核心观点:大部分时间在调试和维护已有生产提示词而非从零编写。两个场景:客服机器人维护中,用XML标签结构化清理,移除旧模型遗留的“禁止列表”指令(新模型会过度拟合),精确计算应调用工具,转人工决策需明确代价与收益;零售排班Agent从零构建时,拆成生成-评估-修复三个简单提示词更稳定,选用更强推理模型(Opus)。她反复强调:评估(Eval)是唯一严谨方式,没有评估就是碰运气。

X:Berry Xia (@berryxia)
Qwen 3.6 27B 是本地开发的理想选择

Qwen 3.6 27B 是一款密集参数本地大语言模型,原生支持 256k 上下文。在 Macbook Max M5 上运行 llama.cpp Q8_0 量化版(含多 token 预测)可达 30 tokens/s;用户反馈在 RTX 5090 上 Q6_K 量化可达 50 tokens/s。它可通过单个提示完成创意诗歌、用 pnpm 生成六边形扫雷游戏等任务,作者称其为首个真正具备通用智能的本地模型。另有一个 MoE 变体 35B A3B,但作者推荐 27B 版本。

Hacker News 热门(buzzing.cc 中文翻译)
分享两个Vibe Coding必备的实用Prompt:第一性原理与对抗式审查

作者分享Vibe Coding中两个关键Prompt:一是“从第一性原理出发”,强制AI跳出类比推理,从基本事实重新推导本质,曾帮作者发现AIHOT抓取海外信源的底层流量路由隐患并彻底重构;二是“对抗式审查”,让AI站在恶意用户角度攻防式审查代码,检出OOM死循环、未来时间污染等手工难发现的BUG。两个Prompt形成生成与验证闭环,使纯Vibe Coding项目AIHOT最近一周请求量超千万次。

公众号:数字生命卡兹克
Anthropic:当AI成本超过工程师薪酬

Anthropic在算力上的支出达到每位工程师每年51.5万美元,是其完全薪资(22.4万美元)的2.3倍。相比之下,顶尖1%软件公司的算力支出为8.9万美元,中位数仅为1.37万美元。三个2029年情景预测了这一差距的缩小路径。

Tomer Tunguz 博客(VC 分析)
22今日事件
10一手报道
1新模型
17信源
← 前一日历史后一日 →
VOL.2026.06.30·22 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年六月三十日 星期二DAILY · 每早八时
01

模型发布/更新

Model Releases
1 篇

美团LongCat Owl Alpha:OpenRouter最流行模型,1.6万亿MoE,国产ASIC训练

X·KOLX:Emad Mostaque (@EMostaque)

美团LongCat的1.6万亿参数MoE模型Owl Alpha成为OpenRouter上最流行模型,累计消耗10万亿tokens,性能达Gemini/Opus 4.6级别。该模型使用35万亿tokens训练,完全在5万块国产ASIC上完成。据官方推文,Owl Alpha上线后每日调用量全球Top3,在Hermes Agent排名#1,Claude Code排名#2,OpenClaw排名#3。该模型即将退役,后续版本待公布。

02

产品发布/更新

Product
8 篇

从任何地点构建——Cursor for iOS 公测版发布

官方Cursor Blog

Cursor 推出 iOS 原生公测版,所有付费计划可用。开发者可在手机上启动始终在线的云端智能体,或远程操控电脑端智能体。支持语音输入、斜杠命令和选择前沿模型。智能体运行后,锁屏 Live Activities 和推送通知实时更新状态,完成或需要输入时提醒。云端智能体在隔离虚拟机中运行,可自动迭代生成合并就绪的 PR,并输出演示、截图和日志。本地与云端智能体支持双向切换。移动端 Composer 2.5 享受 75% 折扣,优惠至 2026 年 7 月 5 日。

EverOS:开源Markdown优先智能体记忆运行时,支持混合检索与自进化技能

综合资讯MarkTechPost(RSS)

EverMind 推出开源智能体记忆运行时 EverOS(Apache 2.0 许可)。它以可编辑的 Markdown 文件为记忆主体,经 SQLite 管理状态、LanceDB 实现混合检索(BM25 关键词 + 向量搜索 + 标量过滤)。每个完成的任务记录为 Case,离线提炼为可复用的 Skill,使记忆随使用自我进化。v1.1.0 新增 Knowledge APIs(支持分类与话题搜索的 Markdown 页面)和 Reflection(跨会话优化 Profile 和 Skill)。据 EverMind 报告,LoCoMo 得分 93.05%,LongMemEval 83.00%,HaluMem 93.04%,p95 检索延…

小红书 RedKnot 推理引擎:将 KV Cache 按注意力头拆解实现长文本加速

公众号·官方公众号:小红书技术(dots.llm)

RedKnot 将 KV Cache 沿注意力头维度拆解,通过头分类稀疏(局部头占 83.4%–96.8%)、稀疏 FFN 和 SegPagedAttention 三个机制统一算法与存储粒度。在 8 卡 H800 上,TTFT 最高加速 1.6–3.54×,单卡并发提升 4.7–7.8×,预填充 FLOPs 削减 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速达 5.16×,KV 传输最多省 6.3×。精度通常不低于稠密 F1 的 95%。

OpenClaw 发布原生 iOS 与 Android 应用

官方·XX:OpenClaw (@openclaw)

OpenClaw 现已登陆 iOS 和 Android 🦞 📱 原生移动应用,终于来了 💬 智能体装进口袋 🔔 频道、任务、回复,随时处理 用你的大拇指,在任何地方运行智能体。 iOS: https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132 Android: https://play.google.com/store/apps/details?id=ai.openclaw.app

Herdr:驻留在终端中的AI智能体多路复用器

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

Herdr是一个驻留在终端中的AI智能体多路复用器,允许用户在单一终端界面内管理和切换多个AI智能体会话。

为 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway

官方Claude:Blog(网页)

Anthropic 今日推出 Claude apps gateway,一个自托管控制平面,让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux,后端使用 PostgreSQL,提供企业级 SSO 登录(通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等)、集中策略管理、角色权限、路由(支持故障转移)以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据(除非配置使用 Claude A…

Claude 在 Microsoft Foundry 正式可用

官方Claude:Blog(网页)

从今天起,Claude 模型在 Microsoft Foundry 上正式可用,托管于 Azure 环境,运行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5,通过 Messages API 调用,支持提示缓存和扩展思考。用户可选择推理处理位置,包括美国数据区域,由 Anthropic 负责推理运营。Azure 用户可使用现有身份验证、计费与治理控制,并获得统一账单;符合条件的 Enterprise Agreement 客户可将 Claude 用量计入 Azure 承诺消费。

Claude Code v2.1.196 发布

官方Claude Code:GitHub Releases(RSS)

新增组织默认模型支持,未选模型时显示“Org default”。聊天会话可读默认名称,文件附件支持 Cmd/Ctrl-click 定位。安全方面,claude mcp list/get 不再启动通过 .claude/settings.json 自批准的不安全服务器;不受信任工作区显示“Pending approval”。/code-review 合并五个清理查找器,token 用量减少约 25%。终端 UI 跳过空子树遍历减少渲染。流式空闲看门狗默认开启,5 分钟无事件自动中止重试。修复背景对话误删、远程会话自动恢复、MCP OAuth 作用域冲突、Agents 侧边栏焦点丢失等多项问题。

03

行业动态

Industry
5 篇

国务院印发《教育发展“十五五”规划》,推进人工智能全学段教育

综合资讯IT之家(RSS)

国务院日前印发《教育发展“十五五”规划》,要求推进人工智能全学段教育,提升学生人工智能素养及提出问题、解决问题的能力。规划明确完善科学教育体系,强化科技教育与人文教育协同,加强青少年科学素养、批判性思维和创新能力培养。同时实施学生体质强健计划、心理健康促进行动,加大拔尖创新人才自主培养力度,推动学科交叉融合,扩大优质本科招生规模。目标到2030年高质量教育体系基本建成。

Rubin Ultra取消,新版尺寸性能减半

X·KOLX:SemiAnalysis (@SemiAnalysis_)

有意思:在GTC 2026宣布Rubin Ultra仅3个月后,原4-die Rubin Ultra因制造执行问题被取消。新的“Rubin Ultra”尺寸减半,实际性能约为原版的一半。1/4🧵

美军用AI选目标却误炸伊朗学校,Anthropic Claude嵌入Palantir系统首日建议约1000目标

综合资讯The Decoder:AI News(RSS)

美军在打击伊朗时首次大规模使用AI选择目标(Anthropic的Claude模型嵌入Palantir的Maven Smart System,首日建议约1000个目标),但对一所学校的导弹袭击导致约120名儿童死亡。调查发现,情报分析师早在2019年就通过数字工具标记该地点已变为小学,但该工具未连接军方官方目标数据库MIDB,信息从未送达指挥官。MIDB建于1980年代,依赖手动输入,替代系统MARS多年延迟。五角大楼事后宣布推出agentic AI initiative。Project Maven创建人Jack Shanahan批评目标验证不力不可原谅。

三星和SK海力士计划投资5900亿美元扩产芯片,AI需求推高内存价格

综合资讯The Decoder:AI News(RSS)

在韩国政府支持下,三星和SK海力士计划投入5900亿美元扩大芯片产能,包括800万亿韩元新建四座工厂、81万亿韩元建封装中心,以及未来15年30万亿韩元用于研发下一代芯片。AI数据中心需求是主要驱动力。Jefferies预测,2026年Q3内存价格将上涨40%至50%,Q4再涨30%至40%,2027年继续上涨40%至45%,到2028年新产能仅上线15%至20%才可能缓解。两家公司合计控制全球近80%的高带宽内存芯片市场。内存涨价已推高消费电子产品成本,苹果已上调Mac和MacBook售价。

SK 集团会长崔泰源:到 2035 年建设 15GW AI 数据中心,总投资达 1000 万亿韩元

综合资讯IT之家(RSS)

SK 集团会长崔泰源 6 月 29 日宣布,计划到 2035 年建成 15GW AI 数据中心容量,作为韩国国家级基础设施和实体 AI 时代核心底座。项目总投资 1000 万亿韩元(约 4.4 万亿元人民币),未来 10 年保持年均 100 万亿韩元以上国内投资,旨在实现从出口传统商品向智能服务的转变,构建韩国智能市场。此外,SK 海力士将向韩国西南部投资 400 万亿韩元,半导体供应项目总投资达 1100 万亿韩元(约 4.84 万亿元人民币)。

04

论文研究

Research
4 篇

Meta发布Brain2Qwerty v2:非侵入式实时句子解码

官方·XX:AI at Meta (@AIatMeta)

Meta公布Brain2Qwerty v2,这是非侵入式脑电信号解码研究的最新里程碑。基于当天发表在《Nature》的v1,v2是性能最高的端到端管道,能从原始脑信号实时解码句子。其从字符级性能提升至解码单词和语义,提高整体沟通准确性。该研究有望帮助数百万因脑损伤或疾病无法沟通的人群。

Claude Code 打开 GitHub 仓库即执行隐藏恶意代码,攻击者可获完全控制

综合资讯The Decoder:AI News(RSS)

安全研究人员在 Mozilla 的 GenAI 漏洞赏金平台 0DIN 发现新攻击向量。一个看似正常的 GitHub 仓库包含 setup 脚本,该脚本运行时从 DNS 条目拉取命令并执行,恶意代码从未存在于仓库中,对扫描器、代码审查和 AI 智能体不可见。开发者使用 Claude Code 等 AI 编码工具打开该仓库时,Claude Code 在设置过程中遇到常规错误消息后自动运行该脚本,打开反向 shell,攻击者可窃取 API 密钥和登录凭据并维持持久访问。研究人员建议 AI 智能体应在运行前显示 setup 脚本内容,开发者应将第三方仓库的 setup 说明视为不受信任代码。

OpenAI 报告:绘制欧洲 AI 劳动力机遇版图

官方OpenAI:官网动态(RSS · 排除企业/客户案例)

OpenAI 发布新报告,分析 AI 对欧盟就业的影响,划定哪些职业面临自动化、增长或工作流程变化。

DiScoFormer:一个跨分布同时估计密度与分数的单一Transformer模型

官方Hugging Face:Blog(RSS)

DiScoFormer(Density and Score Transformer)是一个无需重新训练即可从数据点估计分布密度和分数的单一模型。它利用Transformer的交叉注意力机制,在单次前向传播中输出密度和分数,并通过一致性损失实现分布外自适应。在100维空间中,DiScoFormer比最优调参的核密度估计(KDE)降低分数误差约6.5倍、密度误差超过37倍,且随样本量增加持续提升,而KDE内存耗尽。模型基于高斯混合模型训练,可泛化至非高斯分布(如Laplace、Student-t)及未见过的多模态混合。

05

技巧与观点

Tips & Takes
4 篇

Anthropic工程师Margot Van Laar:提示词工程实战——调试生产提示词为主,评估是唯一严谨方式

X·KOLX:Berry Xia (@berryxia)

An anthropic应用AI工程师Margot Van Laar在Code with Claude分享提示词工程实战,核心观点:大部分时间在调试和维护已有生产提示词而非从零编写。两个场景:客服机器人维护中,用XML标签结构化清理,移除旧模型遗留的“禁止列表”指令(新模型会过度拟合),精确计算应调用工具,转人工决策需明确代价与收益;零售排班Agent从零构建时,拆成生成-评估-修复三个简单提示词更稳定,选用更强推理模型(Opus)。她反复强调:评估(Eval)是唯一严谨方式,没有评估就是碰运气。

Qwen 3.6 27B 是本地开发的理想选择

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

Qwen 3.6 27B 是一款密集参数本地大语言模型,原生支持 256k 上下文。在 Macbook Max M5 上运行 llama.cpp Q8_0 量化版(含多 token 预测)可达 30 tokens/s;用户反馈在 RTX 5090 上 Q6_K 量化可达 50 tokens/s。它可通过单个提示完成创意诗歌、用 pnpm 生成六边形扫雷游戏等任务,作者称其为首个真正具备通用智能的本地模型。另有一个 MoE 变体 35B A3B,但作者推荐 27B 版本。

分享两个Vibe Coding必备的实用Prompt:第一性原理与对抗式审查

公众号·媒体公众号:数字生命卡兹克

作者分享Vibe Coding中两个关键Prompt:一是“从第一性原理出发”,强制AI跳出类比推理,从基本事实重新推导本质,曾帮作者发现AIHOT抓取海外信源的底层流量路由隐患并彻底重构;二是“对抗式审查”,让AI站在恶意用户角度攻防式审查代码,检出OOM死循环、未来时间污染等手工难发现的BUG。两个Prompt形成生成与验证闭环,使纯Vibe Coding项目AIHOT最近一周请求量超千万次。

Anthropic:当AI成本超过工程师薪酬

大咖博客Tomer Tunguz 博客(VC 分析)

Anthropic在算力上的支出达到每位工程师每年51.5万美元,是其完全薪资(22.4万美元)的2.3倍。相比之下,顶尖1%软件公司的算力支出为8.9万美元,中位数仅为1.37万美元。三个2029年情景预测了这一差距的缩小路径。

22
今日事件
10
一手报道
1
新模型
17
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成