6月28日

07:33

Hacker News 热门（buzzing.cc 中文翻译）

中国网络安全公司360推出Tulongfeng和Yitianzhen两款AI安全工具，分别用于自动发现软件漏洞和自动化网络防御与事件响应，称可对标Anthropic的Mythos。日本AI初创Sakana AI推出前沿模型Fugu，声称与Anthropic的Fable 5和Mythos Preview水平相当，专为智能体设计，能通过API协调其他模型。两款产品发布于美国政府对Anthropic的Mythos和Fable 5实施出口禁令两周后，旨在为亚洲市场提供不受出口管制限制的替代方案。Sakana称Fugu采用自研“编排模型”路线，可集合多模型智能，降低对单一供应商的依赖。

Anthropic 安全/对齐模型发布

07:08

Chubby♨️@kimmonismus

朋友们，一个小提醒：从技术上讲，Fable 5 仅包含在订阅层中，直到 6 月 22 日。下周，我们就会知道他们为此想出了什么解决方案。

Chubby♨️: Per Axios: Fable 5 is expected to be back and available starting next week. Let's hope it won't be too heavily guardrail...

推理模型发布

6月27日

22:28

Deedy@deedydas

字节跳动7月初发布Seedance 2.5视频生成模型，生成长度翻倍至30秒

字节跳动将于7月初发布视频生成模型Seedance 2.5，将生成长度从15秒翻倍至30秒，支持音频+4K视频；参考图片/音频/视频数量提升至50个以上；支持局部编辑（特定角色、闭合、细节），附带版权过滤。其前代Seedance 2已是视频生成模型第一名，ARR达20亿美元，定价$2.5/15秒，累计生成超330万小时视频。对比时间线：Veo 3（2025年5月）首降音视频生成15秒，Kling 3（2026年1月）15秒，Seedance 2（2026年2月）15秒，Seedance 2.5（2026年7月）30秒。中国视频模型持续扩大对美国的领先优势。

多模态模型发布视频

22:18

TechCrunch：AI（RSS）

亚洲AI公司发布对标Anthropic模型的产品，应对出口禁令

中国360公司发布Tulongfeng和Yitianzhen两款AI安全工具，分别用于自动发现软件漏洞和自动化网络防御与事件响应，声称可与Anthropic的Mythos匹敌。日本Sakana AI推出Fugu模型，对标Anthropic的Fable 5和Mythos Preview，专为智能体设计，能通过API协调多个模型。两款产品发布正值美国对Mythos和Fable 5实施出口禁令两周后。Sakana表示Fugu已研发一年，目标日本企业和政府以降低出口管制风险；360创始人周鸿祎将漏洞发现AI定位为国家战略资产，警告“单向透明”风险。

Anthropic 安全/对齐模型发布

17:29

小互@xiaohu

Wan Streamer v0.1：首个端到端Transformer实时音视频对话模型

阿里通义实验室Wan团队发布Wan Streamer v0.1，首个端到端Transformer实现实时音视频对话。模型侧响应延迟约200ms，总延迟约550ms，25fps下流式处理单元160ms，分辨率192p。同步生成语音与面部视频，支持全双工打断，取消外部ASR/TTS/动画模块，通过thinker-performer部署压至200ms。官方称唯一单模型同步音视频且延迟<1秒的方案。目前为技术验证，未开放使用。

arXiv 多模态模型发布视频

16:09

The Decoder：AI News（RSS）

字节跳动与中国人民大学发布扩散语言模型 iLLaDA，基础能力追平 Qwen2.5

中国人民大学与字节跳动联合发布 iLLaDA，一个 8B 参数、从头训练的密集扩散语言模型。该模型从掩码 token 序列开始，通过多次并行迭代双向精炼文本，不同于自回归模型的逐 token 生成。iLLaDA 在 12 万亿 token 上预训练，并经过 12 轮微调。基础版本 iLLaDA-Base 平均得分 63.9，略超 Qwen2.5 7B 的 63.3，其中推理测试 BBH 提升 21.6 分至 71.3。但指令微调版 iLLaDA-Instruct 得分 67.1，落后于 Qwen2.5 7B Instruct 的 77.1，差距主要在数学和代码任务，作者归因于缺少额外的强化学习对齐。

推理模型发布编码

15:54

Rohan Paul@rohanpaul_ai

OpenAI 今日发布 GPT-5.6 模型套件有限预览版，包含旗舰模型 Sol、中端模型 Terra 及低成本日常模型 Luna。Sol 在智能体任务上超越 GPT-5.5，Terminal-Bench 2.1 编码基准测试表现突出。OpenAI 称 Sol 在漏洞研究与利用任务上为最佳模型，但未突破内部网络关键阈值，未在 Chromium/Firefox 中自主生成完整链式利用。Sol 新增"max"深度推理与"ultra"子智能体两种模式。定价方面，Sol 为 $5/百万输入 token、$30/百万输出 token，与 GPT-5.5 持平；Terra 性能接近 GPT-5.5 但成本低 2 倍；Luna 为最便宜的大规模工作负载模型。OpenAI 使用超 70 万 A100 等效 GPU 小时进行自动化红队测试。发布受美国政府要求，先从小规模可信合作伙伴预览开始。

Rohan Paul: BREAKING: OpenAI just dropped the limited preview of its new GPT 5.6 model suite: Sol, the flagship; Terra, a medium-tie...

智能体 OpenAI 安全/对齐推理

09:54

meng shao@shao__meng

OpenAI 发布 GPT-5.6 系列有限预览

OpenAI 发布 GPT-5.6 系列有限预览，包括旗舰 Sol（$5/$30）、均衡 Terra（$2.50/$15）和轻量 Luna（$1/$6）。Terra 性能与 GPT‑5.5 相当但成本减半。新增 Ultra 模式，通过 subagent 协同加速复杂任务，Terminal‑Bench 2.1 上 Sol Ultra 达 91.9%（Sol 88.8%）。编码创 SOTA；GeneBench v1 中 Sol 比 GPT‑5.5 分数更高且 token 更少；ExploitBench 中 Sol 用约 1/3 输出 token 即可与 Mythos Preview 竞争。目前仅小范围预览，需配合美国政府监管审查。

OpenAI: Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...

智能体 OpenAI 推理模型发布

08:22

Berryxia.AI@berryxia

OpenAI 发布 GPT-5.6 系列有限预览

OpenAI 正式发布 GPT-5.6 系列有限预览，包含三款模型：旗舰版 Sol（在复杂命令行工作流和网络安全长时程任务上大幅领先）、性价比版 Terra（性能接近 GPT-5.5 但成本减半）、高吞吐低成本版 Luna。发布明确提到“应美国政府要求”，目前仅开放给一小部分受信任合作伙伴，普通用户和开发者暂时用不了，计划几周后逐步开放。Sol 在智能体编码和安全相关任务上提升显著。

OpenAI: Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced m...

OpenAI 安全/对齐推理模型发布