AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
6月23日周二
12:10meng shao57字节跳动发布Seedream 5.0 Pro与Seedance 2.5
11:14Berryxia.AI63百度开源 Unlimited OCR:单次解析多页 PDF,疑似挖角 DeepSeek 技术骨干
10:07IT之家(RSS)66字节豆包 Seed 2.1 Pro 和 Turbo 深度思考模型发布,面向 Coding 与 Agent 时代全面升级
08:31向阳乔木48百度开源 Unlimited OCR:3B参数500M激活性能惊艳
08:13Berryxia.AI73百度开源 Unlimited-OCR,R-SWA 实现单次多页 PDF 解析
08:00HuggingFace Daily Papers(社区热门论文)68Wan-Streamer v0.1: 端到端实时交互基础模型
05:06🚨 AI News | TestingCatalog70OpenAI 推出 GPT-5.5-Cyber 模型更新及 Daybreak 安全扩展计划
04:41Rohan Paul75OpenAI 发布 GPT-5.5-Cyber 在 CyberGym 击败 Mythos 5,扩大 Daybreak 网络安全计划
04:40Tibo57OpenAI 发布 GPT-5.5-Cyber 与代码安全更新
03:07elvis52Sakana Fugu Ultra发布,性能匹配Fable和Mythos
02:35Sam Altman45GPT-5.5-Cyber完整版发布,安全工具上线
01:14OpenAI:官网动态(RSS · 排除企业/客户案例)63精选OpenAI 扩展 Daybreak 计划:推出 GPT-5.5-Cyber 完整版与 Codex Security 更新
01:12Berryxia.AI66百度开源Unlimited-OCR:可一次性处理数百页文档
6月22日周一
23:09Nathan Lambert56GLM-5.2:开放智能体的DeepSeek时刻
23:05Nathan Lambert:Interconnects(RSS)67同事件精选GLM-5.2:开放智能体的阶跃变化同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
22:56Chubby♨️55GPT-5.6、5.6 Pro及双向语音模型周四发布
22:11Hugging Face:Blog(RSS)69精选PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M
22:05IT之家(RSS)63生数 Vidu Q3 多模态视频大模型上线华为云 MaaS,主打文/图生视频一体化成片
21:26Chubby♨️38Sonnet 5 首次测试已启动
19:40Alibaba Cloud48阿里云HappyHorse 1.1正式上线
18:05IT之家(RSS)69百川智能联合清华发布医疗增强大模型 Baichuan-M4,登顶 OpenAI 医疗评测
17:05IT之家(RSS)71同事件精选让大模型从"一问一答"走向"边看边说",京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction同一事件,精选展示《京东全栈开源JoyAI-VL-Interaction,从“一问一答”走向“边看边说”》
16:05🚨 AI News | TestingCatalog64Sakana AI 发布 Fugu 和 Fugu Ultra 多智能体编排系统
15:05IT之家(RSS)62阿里巴巴发布视频生成模型 HappyHorse 1.1
07:37Hacker News 热门(buzzing.cc 中文翻译)62Apertus:面向主权人工智能的开放式基础模型发布
6月21日周日
21:35Rohan Paul50Cursor新Composer模型算力提升10-20倍
17:26Chubby♨️67GLM-5.2 编码能力震惊 Vercel CEO
03:55Chubby♨️44GPT-5.6 将是重大正面惊喜
6月20日周六
14:59IT之家(RSS)62OpenAI 最强 AI 模型:GPT-5.6 系列有望下周登场
08:59IT之家(RSS)64超越Claude Fable 5:智谱GLM 5.2登顶Design Arena网页设计AI榜单
06:24MarkTechPost(RSS)68VibeThinker-3B:基于Qwen2.5-Coder-3B的3B密集推理模型,开源MIT
6月19日周五
18:51MarkTechPost(RSS)62Liquid AI 发布 LFM2.5-Embedding-350M 与 LFM2.5-ColBERT-350M 双向编码检索模型
16:16IT之家(RSS)67全球首个人形机器人通用小脑 GPT 模型:银河通用发布 AstraBrain-WBC 0.5
14:40小互65豆包实时语音模型3.0 API上线,支持自定义工具
11:29Z.ai54GLM-5.2 移动开发长程任务性能翻倍
03:23The Decoder:AI News(RSS)73OpenAI 升级 ChatGPT 医疗能力:GPT-5.5 Instant 达到 Thinking 模型水平,免费可用
01:47Chubby♨️45GPT-5.6 将于下周四发布
01:41歸藏(guizang.ai)31GPT-5.6 系列即将发布
01:21xAI66同事件精选Grok TTS 盲测人类感得分96登顶同一事件,精选展示《Grok 成为 Vapi 的默认语音引擎》
01:21🚨 AI News | TestingCatalog40OpenAI GPT-5.6系列或下周发布
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月23日
12:10
meng shao@shao__meng
57
字节跳动发布Seedream 5.0 Pro与Seedance 2.5

字节跳动在火山引擎FORCE 2026原动力大会上官宣发布Seedream 5.0 Pro和Seedance 2.5,分别聚焦图像和视频的理解与生成。在OpenAI Sora关停、Google Veo迟迟不更新的背景下,图像视频生成赛道基本成为中国大厂的竞争阵地,包括字节跳动、阿里巴巴、快手等。

图像生成模型发布视频
11:14
Berryxia.AI@berryxia
63
百度开源 Unlimited OCR:单次解析多页 PDF,疑似挖角 DeepSeek 技术骨干

百度在 HuggingFace 开源 Unlimited OCR 模型,核心卖点为 One-Shot Long-Horizon Parsing(单次长时解析),一次前向推理即可转录几十页 PDF 或图像。其创新机制 R-SWA(参考滑动窗口注意力)模拟人类抄写时的注意力模式——每个 token 看到完整图像,输出端只维护前 128 个状态,32K 上下文,KV Cache 大小恒定不随文档长度增长。技术报告披露灵感与 DeepSeek-OCR 架构有密切联系,核心贡献者中技术总监 YY 疑为近期从 DeepSeek 离职的研究者。模型已在 GitHub 和 HuggingFace 开放。

DeepSeek多模态开源/仓库模型发布
10:07
IT之家(RSS)
66
字节豆包 Seed 2.1 Pro 和 Turbo 深度思考模型发布,面向 Coding 与 Agent 时代全面升级

字节跳动在火山引擎上线豆包 Seed 2.1 系列模型,包括 Pro 和 Turbo 两个深度思考版本,以及 Seed-Evolving 迭代模型和角色模型。Pro 版本为面向 Coding 与 Agent 的旗舰模型,在 Coding 工程交付、Agent 长链路任务执行和多模态理解三大方向全面升级;Turbo 版本面向规模化生产,效果比肩 Pro

推理模型发布编码
08:31
向阳乔木@vista8
48
百度开源 Unlimited OCR:3B参数500M激活性能惊艳

百度开源 Unlimited OCR 模型,仅3B参数、500M激活参数,在小参数量下实现极佳效果。推文提到其参考了滑动注意力窗口技术,并附带了技术解读和开源地址。

多模态开源/仓库端侧
08:13
Berryxia.AI@berryxia
73
百度开源 Unlimited-OCR,R-SWA 实现单次多页 PDF 解析

百度在 HuggingFace 开源 Unlimited-OCR 模型,核心创新 R-SWA 使解码时 KV Cache 恒定,不随页数增长。模型不逐页处理,一次前向推理即可转录多页 PDF,32K 上下文覆盖几十页。在 OmniDocBench 上获 93 分,比 DeepSeek-OCR 高 6 个百分点。技术报告致谢栏将 DeepSeek-OCR 排首位,暗示架构继承;同期 DeepSeek-V4 报告末 10 人标注“已离职”。模型已开源。

Berryxia.AI: 这速度真特么离谱啊!卧槽! 最新开源的Unlimited-OCR能一次性处理几百页文档,而且速度还很稳。 而这个模型来自百度刚刚在hugging face 发布,其核心创新是R-SWA(Reference Sliding Window At...

多模态开源/仓库模型发布
08:00
HuggingFace Daily Papers(社区热门论文)
68
Wan-Streamer v0.1: 端到端实时交互基础模型

Wan-Streamer v0.1 是原生流式、端到端的交互基础模型,在单一 Transformer 中统一建模语言、音频和视频的输入与输出,序列表示为交错视觉、音频、文本 token,通过块因果注意力实现增量流式。无需外部 VAD、ASR、TTS、视频生成等模块,感知、推理、生成、响应时序等由单一模型联合学习。整套栈围绕流式化重新设计,支持 25 fps 下 160 ms 的流式单元。模型侧响应延迟约 200 ms,结合 350 ms 双向网络延迟后总交互延迟约 550 ms,实现亚秒级全双工音视频通信。

多模态模型发布视频语音
05:06
🚨 AI News | TestingCatalog@testingcatalog
70
OpenAI 宣布 GPT-5.5-Cyber 模型更新,在 CyberGym 基准上得分 85.6%(早期版本为 81.9%)。Codex 新增 Security 插件,可在 Codex 内部发现、验证和修复漏洞。作为 Daybreak 扩展计划的一部分,完整版 GPT-5.5-Cyber 模型面向可信防御者;Cyber Partner Program 允许安全公司基于 OpenAI 网络安全能力构建产品;Patch the Planet 项目与维护者合作保护关键开源项目。

OpenAI: We're expanding OpenAI Daybreak to help democratize patching vulnerable software at machine speed: - Codex Security plug...

OpenAI安全/对齐模型发布编码
04:41
Rohan Paul@rohanpaul_ai
75
OpenAI 发布 GPT-5.5-Cyber 在 CyberGym 击败 Mythos 5,扩大 Daybreak 网络安全计划

OpenAI 新模型 GPT-5.5-Cyber 在 CyberGym 基准上击败 Mythos 5,该基准测试 AI 智能体复现已知软件漏洞的能力,对防御性漏洞分析是强信号。OpenAI 同步扩大 Daybreak 计划,包括:Codex Security 插件(在 Codex 内发现、验证并修复漏洞);GPT-5.5-Cyber 完整版(供受信任防御者使用);Cyber Partner Program(赋能安全公司构建基于 OpenAI 能力的安防产品);Patch the Planet(与维护者合作保护关键开源项目)。本轮模型和计划属于“Trusted Access for Cyber”项目,不公开发布。OpenAI 旨在用 GPT-5.5-Cyber 作为 Codex 内的防御性安全工人,自动扫描代码、确认漏洞真实可达、编写补丁并测试,

OpenAI: We're expanding OpenAI Daybreak to help democratize patching vulnerable software at machine speed: - Codex Security plug...

OpenAI安全/对齐模型发布编码
关联讨论 2 条IT之家(RSS)OpenAI:官网动态(RSS · 排除企业/客户案例)
04:40
Tibo@thsottiaux
57
Let's Patch The Planet. Codex 安全更新和新 GPT-5.5-Cyber。 网络防御加速的庆祝日。
OpenAI安全/对齐模型发布
03:07
elvis@omarsar0
52
Sakana AI 推出 Fugu 多智能体编排系统,通过单个模型 API 即可访问。其 'Fugu Ultra' 模型性能匹配 Fable 和 Mythos,提供前沿能力且无出口管制风险。在生成程序化地形(Three.js)的对比中,Fugu Ultra 在一次生成(one-shotted)下表现突出。更多示例即将分享。

Sakana AI: Introducing Sakana Fugu: A full multi-agent orchestration system accessible via a single model API. Our 'Fugu Ultra' mod...

智能体模型发布
02:35
Sam Altman@sama
45
我们希望帮助所有公司变得安全,与美国政府和安全生态系统合作。 *GPT-5.5-Cyber完整版已发布;在CyberGym上达到最先进性能。 *Patch The Planet 和 Codex Security 将帮助解决安全问题,而不仅仅是发现它们。
OpenAI安全/对齐模型发布
01:14
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选63
OpenAI 扩展 Daybreak 计划:推出 GPT-5.5-Cyber 完整版与 Codex Security 更新

OpenAI 于 2026 年 6 月 22 日宣布扩展 Daybreak 计划,发布 GPT‑5.5‑Cyber 完整版和 Codex Security 插件更新。GPT‑5.5‑Cyber 在 CyberGym 上达 85.6%,超越 GPT‑5.5 的 81.8%。Codex Security 插件可深度扫描代码库、验证漏洞并自动生成补丁,支持导出至漏洞管理系统。自 3 月预览以来已扫描超 3000 万次提交,超 7 万项发现经人工确认已修复。同期启动 Patch the Planet 计划,联合 Trail of Bits、HackerOne 等,cURL、Go、Python、Sigstore、pyca/cryptography 等 30 多个开源项目已参与。

OpenAI安全/对齐模型发布
关联讨论 2 条IT之家(RSS)OpenAI:官网动态(RSS · 排除企业/客户案例)
推荐理由:OpenAI 把安全模型做成了从发现到修补的完整工具链,GPT-5.5-Cyber 性能比 GPT-5.5 小幅提升,但关键在开源修补计划和政府合作,做安全的值得看看。
01:12
Berryxia.AI@berryxia
66
百度开源Unlimited-OCR:可一次性处理数百页文档

百度PaddlePaddle在HuggingFace发布Unlimited-OCR,核心创新R-SWA(Reference Sliding Window Attention)使解码时KV Cache保持恒定,避免随页数爆炸。该模型可一次性处理数百页文档,速度和稳定性优于逐页处理。在OmniDocBench上得分93%,比DeepSeek-OCR高出6个百分点。这使长文档OCR从“分块+拼接”变为端到端一镜到底,直接理解整篇文档结构与布局。

Adina Yakup: Unlimited-OCR 🔥New OCR from @PaddlePaddle It can parse hundreds of pages in a single pass while maintaining stable spee...

DeepSeekHugging Face多模态开源/仓库
6月22日
23:09
Nathan Lambert@natolambert
56
GLM-5.2 应该是智能体的"DeepSeek 时刻"。我们进入一个新世界,开放模型中拥有了顶尖智能体能力。 如果你关心开放,现在就是向监管者说明我们应该如何构建一个安全、前沿、开放智能世界的时候。

Interconnects: GLM-5.2 is the step change for open agents A capability threshold I've been carefully monitoring. https://www.interconne...

智能体开源生态模型发布
23:05
Nathan Lambert:Interconnects(RSS)
同事件精选67
GLM-5.2:开放智能体的阶跃变化

Z.ai 于 6 月 13 日向 GLM Coding Plan 成员发布 GLM-5.2,6 月 16 日开源 MIT 许可权重。该模型在 Arena 智能体排行榜上成为唯一与 OpenAI 和 Anthropic 最新模型匹敌的开放模型,匹配 Opus 4.8 无思考模式;在 Design Arena 中甚至超越 Claude Fable。作者认为这是自 DeepSeek R1 以来最受关注的开放模型发布,GLM-5.2 是首个在编码工具中作为通用智能体表现合格的开放权重模型。从 Claude Opus 4.5 发布(2025 年 11 月 24 日)到 GLM-5.2 发布(2026 年 6 月 16 日)间隔约 6.8 个月。

开源生态模型发布编码
同一事件,精选展示《GLM-5.2 上线并开源:专注 Coding 与长程任务》
推荐理由:GLM-5.2是第一个真正能打的开放编码代理模型,社区反应堪比DeepSeek R1时刻,对依赖Claude Code的开发者是个好消息,开放模型的竞争力又前进了一大步。
22:56
Chubby♨️@kimmonismus
55
据X用户Kim消息,本周四将发布多个新GPT模型,包括GPT-5.6、5.6 Pro以及双向语音模型GPT-Bidi-1。早期测试显示语音模型表现卓越。引用推文指出,5.6 Pro在正确提示词下可完成任意任务,GPT-Bidi-1知识截止于2025年8月,自GPT-4o时代以来备受期待。其余GPT-5.6模型此前以kindle alpha版本测试,预计将推出新checkpoint。

Chetaslua: This Thursday 🤞 We already tested 5.6 pro a lot ( this model is special like with right prompt it can do anything) GPT-...

OpenAI多模态模型发布
22:11
Hugging Face:Blog(RSS)
精选69
PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M

PP-OCRv6 是 PaddleOCR 最新一代通用 OCR 模型族,提供 tiny(1.5M)、small(7.7M)和 medium(34.5M)三级。medium 和 small 支持 50 种语言(简体/繁体中文、英文、日文及 46 种拉丁语系)。在官方多场景基准上,medium 检测 Hmean 86.2%,识别准确率 83.2%,较 PP-OCRv5_server 分别提升 +4.6 和 +5.1 个百分点。模型采用 PPLCNetV4 统一骨干、RepLKFPN 检测模块和 EncoderWithLightSVTR 识别模块,可通过 PaddleOCR、Transformers、ONNX Runtime 等后端灵活部署。

Hugging Face多模态模型发布部署/工程

推荐理由:OCR模型并没有因为VLM的兴起而消失,PP-OCRv6用1.5M到34.5M参数覆盖50种语言,对需要轻量、准确OCR的产品来说,这是一个务实的选择。
22:05
IT之家(RSS)
63
生数 Vidu Q3 多模态视频大模型上线华为云 MaaS,主打文/图生视频一体化成片

6 月 22 日,生数科技多模态视频生成大模型 Vidu Q3 上线华为云 MaaS,面向企业营销、内容制作等行业提供视频生成服务。Vidu Q3 是全球首个“为剧而生”的视频大模型,支持 16 秒声画同出、1080P 画质,具备稳定多镜头叙事与精准切镜能力及多国语言文字渲染。本次上线两个版本:Vidu Q3 Turbo 极速版包含 T2V、I2V、H2V、R2V 四种能力,推理快、成本低;Vidu Q3 Pro 专业版包含 T2V、I2V、H2V 三种能力,画面细节最优,最高支持 4K 分辨率,适合广告大片等精品创作。

多模态模型发布视频
21:26
Chubby♨️@kimmonismus
38
Sonnet 5 首次亮相。模型速度极快,且未使用参考图。看来下周会很忙。Kim 评论称,若测试确认,这将是一次很棒的发版。

Jayden Davis: BREAKING: First Look at Sonnet 5 🚨 SVG of Nintendo Switch 2 This model is hella fast and it is impressive since I didn'...

Anthropic图像生成多模态模型发布
19:40
Alibaba Cloud@alibaba_cloud
48
🚀 推出 HappyHorse 1.1 - 现已正式在阿里云模型工作室上线! 所有 HappyHorse 1.1 功能均可通过 API 获取,为企业客户和开发者提供完整的集成解决方案。此次发布带来了生产级视频合成,已在核心内容生成场景中系统优化。 🔥 发布促销:前两周享受全场 40% 折扣!立即优化您的集成成本。
模型发布视频
18:05
IT之家(RSS)
69
百川智能联合清华发布医疗增强大模型 Baichuan-M4,登顶 OpenAI 医疗评测

6月22日,百川智能与清华大学联合发布医疗增强大模型Baichuan-M4。该模型在OpenAI提出的HealthBench及Hard、Professional三个榜单上同时位列世界第一,综合得分68.6,领先第二名GPT-5.5超10分,幻觉率仅3.3%。M4会主动追问症状细节并优先排查危急重症。在基于OSCE构建的动态问诊评测SCAN-bench中,M4初诊79.0、复诊74.7,全面领先GPT-5.5等模型。模型具备“全病程记忆”,长上下文临床记忆得分86.9;首创“证据锚定”循证引用,精度达90.0,远超GPT-5.5和OpenEvidence。

推理模型发布评测/基准
17:05
IT之家(RSS)
同事件精选71
让大模型从"一问一答"走向"边看边说",京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction

京东官方宣布开源实时视频视觉语言交互模型 JoyAI-VL-Interaction,这是全球首个全栈开源的 interaction 模型和系统,获 vLLM-Omni day-0 原生支持。该模型具备三重突破:主动判断(持续观察视频流自主决定何时说话)、实时响应(面向正在发生的视频流即时响应)、适时智能体委托(复杂任务转交后台模型,前台继续观察)。支持摄像头、直播流、监控流等视频输入,以及语音输入输出、可视化界面、长期记忆和 vLLM 部署。在 58 个真人盲评案例中,对比豆包视频通话助手总体胜率 77.6%,对比 Gemini 视频通话助手总体胜率 87.9%。

多模态模型发布视频
同一事件,精选展示《京东全栈开源JoyAI-VL-Interaction,从"一问一答"走向"边看边说"》
推荐理由:京东开源了首个全栈实时视频交互模型,让大模型能持续观察并主动响应,开发者可以直接用代码搭建安防、导购等实时AI助手,实用性很强。
16:05
🚨 AI News | TestingCatalog@testingcatalog
64
Sakana AI 发布 Fugu 和 Fugu Ultra 多智能体编排系统

Sakana AI 宣布推出 Fugu 和 Fugu Ultra 系统。Fugu 是一个多智能体编排模型,训练用于操控其他 LLM,通过单一模型 API 访问。其中 Fugu Ultra 在多项基准测试中性能匹敌 Claude Fable 5 和 Mythos 5,并宣称提供前沿能力且规避出口管制风险。该系统目前通过 API 提供服务,但暂不支持 EEA 地区。推文指出,编排式多模型系统将超越单一模型,使小型实验室和企业更易构建,并已促使 Meta、Apple、微软等巨头考虑采用竞争对手的模型搭建编排系统。

Sakana AI: Introducing Sakana Fugu: A full multi-agent orchestration system accessible via a single model API. Our 'Fugu Ultra' mod...

智能体MCP/工具模型发布
15:05
IT之家(RSS)
62
阿里巴巴发布视频生成模型 HappyHorse 1.1

阿里巴巴今日发布视频生成模型 HappyHorse 1.1,在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升级。技术规格与 1.0 版本一致,单次生成 3 到 15 秒,支持 720p 和 1080p 分辨率及自由宽高比。HappyHorse 官网、阿里云百炼和千问云均已接入最新版本。同日,HappyHorse 联合虎鲸文娱集团启动“Horsepower”AI 影像大赛,优胜者可获百万商单合作,张纪中等担任评委。

多模态模型发布视频
07:37
Hacker News 热门(buzzing.cc 中文翻译)
62
Apertus:面向主权人工智能的开放式基础模型发布

瑞士AI倡议(EPFL、苏黎世联邦理工学院、CSCS合作)推出完全开放的基础模型Apertus,公开训练数据、代码、权重、方法和对齐原则。模型符合欧盟AI法案要求,支持1000+种语言,提供8B和70B参数版本。同时发布Apertus Mini,含16个小模型用于演示知识蒸馏与量化技术。技术报告已被ACL 2026接收。针对提契诺州微调的版本已用于内部AI翻译。瑞士电信为战略合作伙伴。

开源生态模型发布
6月21日
21:35
Rohan Paul@rohanpaul_ai
50
@mntruell(Michael Truell,Cursor联合创始人兼CEO)在Compile上宣布了Cursor的新Composer模型: Cursor现在的算力是此前的10到20倍,让他们能够从头训练这个GPT规模的模型。
模型发布编码
17:26
Chubby♨️@kimmonismus
67
就连 Vercel CEO 都对 GLM-5.2 在编码上的出色表现感到印象深刻/震惊。 开源,开放权重。

Guillermo Rauch: Genuinely impressed, almost shocked, at how good GLM-5.2 by @zai_org is at coding. This changes things.

开源生态模型发布编码
03:55
Chubby♨️@kimmonismus
44
我预感 GPT-5.6 会是一个巨大的正面惊喜。让我们回忆一下关于 GPT-5.6 的信息: "该公司正单独准备发布一款新的 AI 模型,代号为 5.6,它将是当前旗舰模型 GPT-5.5 的'有意义的改进',OpenAI 首席科学家 Jakub Pachocki 在一份给员工的备忘录中写道。"

Derya Unutmaz, MD: People were flabbergasted by Fable 5, rightly so. But those who also think this will remain the best AI for a long time ...

OpenAI模型发布
6月20日
14:59
IT之家(RSS)
62
OpenAI 最强 AI 模型:GPT-5.6 系列有望下周登场

科技媒体 testingcatalog 报道,OpenAI 有望下周推出 GPT-5.6 系列,涵盖 mini、标准版和 Pro 版。部分 Pro 订阅用户已可访问 GPT-5.6 Pro,理解力增强,前端/Web 开发认知有进步。性能方面,上下文窗口从 100 万 tokens 扩展至 150 万 tokens,优化了长周期编码能力和 Codex 响应速度。消息称在智能体编码中,GPT-5.6 已优于 Anthropic 的 Mythos 系列。定价上,OpenAI 当前 token 价格仅为 Anthropic 一半左右,计划进一步降价。

AnthropicOpenAI推理模型发布
08:59
IT之家(RSS)
64
超越Claude Fable 5:智谱GLM 5.2登顶Design Arena网页设计AI榜单

智谱 GLM 5.2 在 Design Arena 单轮 HTML 网页设计评测中首次登顶总分第一,超越 Claude Fable 5、Opus 4.6 和 Opus 4.7,比前代 GLM 5.1 提升 5 个名次。推理价格每百万 tokens 为 1.40/4.40 美元,远低于 Fable 5 的 10/50 美元。模型高效调用 chart.js、three.js 等第三方库,使用这些库的会话胜率提升 6.0 个百分点;91% 会话使用 TailwindCSS,51% 使用 font‑awesome,交互设计使胜率提升 1.2 个百分点(Fable 5 仅 57% 使用 TailwindCSS)。在布局、排版、视觉动画方面表现出色。

模型发布编码
06:24
MarkTechPost(RSS)
68
VibeThinker-3B:基于Qwen2.5-Coder-3B的3B密集推理模型,开源MIT

新浪微博研究人员发布VibeThinker-3B,一个仅3B参数的密集推理模型,基于Qwen2.5-Coder-3B,采用谱到信号后训练流水线(SFT、强化学习与自蒸馏),MIT开源。在AIME26上得分94.3,比肩DeepSeek V3.2(671B)和Kimi K2.5(1T);LiveCodeBench v6达80.2 Pass@1;2026年4月至5月LeetCode周赛与双周赛首次提交通过率96.1%。搭载CLR测试时缩放后AIME26升至97.1。BF16权重约6GB,单GPU可运行,推荐使用vLLM 0.10.1或SGLang ≥0.4.9.post6推理。

开源生态推理模型发布
6月19日
18:51
MarkTechPost(RSS)
62
Liquid AI 发布 LFM2.5-Embedding-350M 与 LFM2.5-ColBERT-350M 双向编码检索模型

Liquid AI 本周发布两款 350M 参数检索模型:稠密双编码器 LFM2.5-Embedding-350M 和后期交互模型 LFM2.5-ColBERT-350M。二者基于 LFM2.5-350M-Base,通过将因果注意力改为双向注意力实现双向编码,支持阿拉伯语、德语、英语等 11 种语言的单语与跨语言搜索。在 NanoBEIR 多语言检索上,ColBERT 版 NDCG@10 为 0.605,Embedding 版为 0.577,均优于 Qwen3-Embedding-0.6B。在 MKQA-11 问答 Recall@20 上分别为 0.694 和 0.691。上下文窗口 32,768 tokens,文档调优至 512 tokens。提供 GGUF 格式,MacBook Pro M4 Max 上查询延迟低于 10 ms。模型以 LFM Open License v1.0 发布在 Hugging Face。

Hugging Face检索增强搜索模型发布
16:16
IT之家(RSS)
67
全球首个人形机器人通用小脑 GPT 模型:银河通用发布 AstraBrain-WBC 0.5

6月19日,银河通用推出全球首个人形机器人通用小脑GPT基础模型AstraBrain-WBC 0.5。该模型基于2万小时人类动作数据训练,参数规模达8040万,是行业首个达到GPT-1量级的人形机器人全身实时运控大模型。采用因果Transformer架构,将全身控制定义为连续序列预测问题。实验表明,训练数据从200万帧扩展至20亿帧时,成功率从83.26%提升至92.58%,零样本跟踪误差持续下降。

具身智能数据/训练模型发布
14:40
小互@xiaohu
65
豆包实时语音模型3.0 API上线,支持自定义工具

豆包实时语音模型3.0 API正式上线。支持全双工(同时听和说,可随时插话)和端到端(语音进、语音出,无转录),交互更快速自然。具备精准遵循指令能力,如设定“先不出声,聊到世界杯再加入”后安静待命。关键升级是支持自定义工具,可在实时对话中直接调用工具完成任务(预定日历、发邮件、总结文档、发起查询等),从“语音助手”向“语音 Agent”迈进。

MCP/工具模型发布语音
11:29
Z.ai@Zai_org
54
智谱 GLM-5.2 在内部 35 项挑战性移动开发任务(共 70 次试验)中完成率达 48/70,较 GLM-5.1 的 21/70 提升超两倍;同期 Claude Fable 5 为 56/70。主推文指出长程能力应落地真实场景,更多场景即将推出。

Zixuan Li: GLM-5.2 delivers a substantial leap in app development capabilities, which also represent demanding long-horizon tasks. ...

智能体模型发布编码
03:23
The Decoder:AI News(RSS)
73
OpenAI 升级 ChatGPT 医疗能力:GPT-5.5 Instant 达到 Thinking 模型水平,免费可用

OpenAI 升级 ChatGPT 医疗能力,新模型 GPT-5.5 Instant 在 HealthBench 及 HealthBench Professional 测试中达到最贵 Thinking 模型水平,成本大幅降低。该模型对所有免费用户开放(有使用限制),其回答在准确性、清晰度和完整性上优于医生书写的回答,过去两个月错误健康陈述减少 71%。超 260 名来自 60 个国家的医生审查了 70 多万条模型响应。每周有超 2.3 亿人通过 ChatGPT 咨询健康问题。OpenAI 还提供 ChatGPT for Clinicians 和 OpenAI for Healthcare 等专业工具。

OpenAI模型发布
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)X:Greg Brockman (@gdb)OpenAI:官网动态(RSS · 排除企业/客户案例)
01:47
Chubby♨️@kimmonismus
45
不错,看来下周四将有大动作:GPT-5.6 即将发布

leo 🐾: If you're wondering how people on your timeline seem to have access to GPT-5.6 Pro, it's now being stealth tested when 5...

OpenAI推理模型发布
01:41
歸藏(guizang.ai)@op7418
31
OpenAI 正在准备 GPT-5.6 模型系列的发布,测试中已发现 GPT-5.6-Pro。很快就能看到。

🚨 AI News | TestingCatalog: OPENAI 🔥: GPT-5.6 model family is being prepared for the upcoming release, as GPT-5.6-Pro has been spotted in testing. ...

OpenAI模型发布
01:21
xAI@xai
同事件精选66
xAI 的 Grok TTS 模型在 @Vapi_AI 的 Humanness Index 盲测中以 96 分(真人 100 分)位居榜首。该指数选取同一声音和引文,经各模型克隆后由听众盲评。

Vapi: Two days into blind voting of voice models on our Humanness IndexTM, and xAI's Grok TTS model is at the top of the pack....

xAI模型发布语音
同一事件,精选展示《Grok 成为 Vapi 的默认语音引擎》
推荐理由:xAI Grok TTS 在 Vapi 盲测里人类相似度 96 分,只差真人 4 分,这个分数很有说服力,做语音产品的值得去听听看,能直观感受语音合成的进步。
01:21
🚨 AI News | TestingCatalog@testingcatalog
40
OPENAI 🔥: GPT-5.6 和 GPT-5.6-Pro 模型可能最快下周就会到来。 非常快 👀

🚨 AI News | TestingCatalog: OPENAI 🔥: GPT-5.6 model family is being prepared for the upcoming release, as GPT-5.6-Pro has been spotted in testing. ...

OpenAI模型发布
‹ 上一页
1…56789…36
下一页 ›