AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「模型发布」清除
6月27日周六
01:02OpenAI:官网动态(RSS · 排除企业/客户案例)78精选OpenAI 预览新一代模型 GPT-5.6 Sol
6月26日周五
22:20Berryxia.AI68PP-OCRv6发布端到端部署基准:A100仅0.13秒/图,CPU提速5.2倍
20:05Chubby♨️77Ornith-1.0 开源智能体编程模型发布
13:56Alibaba Cloud44HappyHorse 1.1 将提示词转为精美视频
11:59IT之家(RSS)67Mistral AI 推出 OCR 4 模型:支持 170 种语言,输出更受人类青睐
11:19Tibo68GPT-5.5 Instant 更新:记忆与上下文升级
10:26Alibaba Cloud50阿里云Model Studio上线HappyHorse 1.1
09:01Hacker News 热门(buzzing.cc 中文翻译)65Un-0:利用耦合振荡器生成图像
06:21宝玉86OpenAI GPT-5.6 因政府要求将分批发布,仅限部分合作伙伴
01:34MarkTechPost(RSS)66DeepReinforce 发布 Ornith-1.0 开源编码模型族
01:07TechCrunch:AI(RSS)55前 Databricks AI 负责人 Naveen Rao 的 Unconventional AI 发布首个模型 Un0,主打降低推理功耗 1000 倍
00:54AK36Wan-Streamer v0.1 实时交互基础模型
00:49Logan Kilpatrick61Gemma 4 设备端智能面向所有人
00:19Berryxia.AI76精选Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模
00:14🚨 AI News | TestingCatalog45OpenAI GPT-5.6-Preview 在代码中被发现
6月25日周四
23:53Rohan Paul72DeepReinforce 发布开源智能体编码大模型家族 Ornith-1.0(MIT 许可)
22:44🚨 AI News | TestingCatalog74DeepReinforce 发布 Ornith-1.0 系列自改进开源模型,专为智能体编码设计
19:35Chubby♨️43GPT-5.6 内部模型访问路径曝光
17:18Berryxia.AI60Unsloth 将 GLM-5.2 压缩为 1-bit GGUF,本地创意输出不逊闭源模型
16:35Chubby♨️24Anthropic Fable 5 今日重新发布
16:05Chubby♨️31Claude Code 中 Fable 5 再次可选
15:58IT之家(RSS)69百度开源 Unlimited OCR 模型,基于 DeepSeek OCR 架构,30亿参数仅激活5亿
15:44🚨 AI News | TestingCatalog48OpenAI 升级 GPT-5.5 Instant 模型,明日起向免费用户开放
14:54Alibaba Cloud65HappyHorse 1.1 在 ComfyUI 以 Partner Node 上线
14:54Alibaba Cloud67Replicate 上线阿里 HappyHorse 1.1
14:04MarkTechPost(RSS)73同事件精选百度发布Unlimited OCR:3B参数MoE模型,KV缓存恒定实现长文档高效解析同一事件,精选展示《无限制OCR:单次长时域解析》
11:12HuggingFace Daily Papers(社区热门论文)67iLLaDA:改进的大型语言扩散模型
08:58IT之家(RSS)41OpenAI 再次升级 GPT-5.5 Instant:更具洞察力,购物推荐更实用
08:19ginobefun43BestBlogs 早报·06-25|OpenAI联合Broadcom推推理芯片Jalapeño;Anthropic公开人机协作四条规范;阿里开源代码评审CLI揽星5k
06:19Nathan Lambert53GLM 5.2 以 CursorBench 成本跻身 Opus 前沿
06:07Lee Robinson65GLM 5.2 现已可在 Cursor 中试用
05:29Hacker News 热门(buzzing.cc 中文翻译)71Gemini 3.5 Flash 中的计算机使用
04:07The Decoder:AI News(RSS)51OpenAI 称 ChatGPT Instant 更能理解用户真实意图
02:38ChatGPT65GPT-5.5 Instant 发布:更智能直观有趣
02:20OpenAI67精选GPT-5.5 Instant 新版本,对话更有趣
02:19Nathan Lambert68OpenThinkerAgent-32B 开放数据智能体发布
02:17Greg Brockman69GPT-5.5 Instant重大升级:对话更智能有趣
01:18Berryxia.AI78同事件精选Qwen-AgentWorld:原生语言世界模型,模拟7种Agent环境并超越Claude Opus 4.8和GPT-5.4同一事件,精选展示《Qwen-AgentWorld:面向通用智能体的语言世界模型》
00:34Chubby♨️44Claude Code v2.1.190 更新:字符串暗示 Fable 5 将永久加入订阅并设每周使用上限
00:12OpenRouter54Fugu Ultra 上线 OpenRouter
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月27日
01:02
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选78
OpenAI 预览新一代模型 GPT-5.6 Sol

OpenAI 发布了新一代模型 GPT-5.6 Sol 的预览信息。该模型被定位为下一代模型,目前仅公开了预览消息和标题,尚未披露具体技术细节、性能参数或功能特性。

OpenAI安全/对齐推理模型发布
关联讨论 12 条The Verge:AI(RSS)X:OpenAI (@OpenAI)X:小北 (@frxiaobei)X:Rohan Paul (@rohanpaul_ai)Simon Willison 博客X:Gabriel (@gabriel1)X:邵猛 (@shao__meng)MarkTechPost(RSS)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:Sam Altman (@sama)
推荐理由:GPT-5.6 Sol 不是一次常规升级,它把推理推到新高度,还引入了子代理模式。但美国政府要求有限预览,让这次发布多了点政治味道。
6月26日
22:20
Berryxia.AI@berryxia
68
PP-OCRv6发布端到端部署基准:A100仅0.13秒/图,CPU提速5.2倍

PaddleOCR发布PP-OCRv6完整端到端部署基准。A100上PP-OCRv6_tiny达0.13秒/图;Intel CPU上用OpenVINO,PP-OCRv6_medium比PP-OCRv5_server快5.2倍,PP-OCRv6_tiny比PP-OCRv5_mobile快3.9倍;Apple M4上用ONNX Runtime跑出0.35秒/图。提供Tiny、Small、Medium三种尺寸,Medium/Small均支持50种语言,PP-OCRv6_medium英文准确率88.4%,拉丁字母准确率88.0%。官方总结认为,在专用OCR任务上,轻量架构+高质量训练数据比单纯堆参数更实用,是对大模型“暴力scaling”路线的反向验证。

PaddlePaddle: 🧵PP-OCRv6 Tech Deep Dive Ep.4:3.9x Faster on CPU, 0.13s per Image on A100 - PP-OCRv6 Deployment & Model Selection Guide...

GitHub开源生态模型发布部署/工程
20:05
Chubby♨️@kimmonismus
77
Ornith-1.0 是专为智能体编程设计的开源大语言模型家族,提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种尺寸。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架与解决方案的自我改进策略。在多个编码基准上取得开源模型最优:Terminal-Bench 2.1(77.5)、SWE-Bench Verified(82.4)/ Pro(62.2)/ Multilingual(78.9)、NL2Repo(48.2)、SWE Atlas(QnA 41.2 / RF 42.6 / TW 39.1)、ClawEval(77.1)。所有模型以 MIT 许可证开源,支持商业与研究使用。主推文称其 397B 版本性能媲美甚至超越 Claude Opus 4.8。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

开源生态模型发布编码
13:56
Alibaba Cloud@alibaba_cloud
44
从动漫风格的世界到电影级动作场景,HappyHorse 1.1 将详细的提示词转化为视觉效果惊艳的视频。 精准创建风格化的环境、动态的镜头运动、沉浸式的光照和流畅的动作,将你想象中的每一帧变为现实。 限时发布享 40% 折扣 API 限时发布特惠:https://int.alibabacloud.com/m/1000414698/ #HappyHorse #阿里云 #ModelStudio #生成式AI
模型发布视频
11:59
IT之家(RSS)
67
Mistral AI 推出 OCR 4 模型:支持 170 种语言,输出更受人类青睐

法国 AI 初创公司 Mistral AI 于本月 23 日发布文档内容识别模型 OCR 4,支持横跨 10 个语族的 170 种语言,在 OmniDocBench 上获 93.07 分,输出较 GPT 5.5 Pro、Gemini 3.1 Pro Preview 等更受人类青睐。该模型为小型聚焦模型,输出文本并提供边框、区域分类和置信度评分,支持 RAG 语义分块等下游工作负载。基础 API 定价每千页 4 美元,批处理享 50% 优惠;文档人工智能定价每千页 5 美元。

多模态模型发布
11:19
Tibo@thsottiaux
68
GPT-5.5 Instant 已上线,带来全新的感受、更好的记忆和更精准的上下文,回复感觉焕然一新。名字虽带"Instant"看似轻量,实则不然。免费和付费层均可使用。主推文:这是个极好的更新。

Shaun Ralston: do NOT sleep on GPT-5.5 Instant; new model smell, better memory, sharper context, and replies just feel different today....

OpenAI模型发布
10:26
Alibaba Cloud@alibaba_cloud
50
HappyHorse 1.1 正在推动下一波AI视频创作。 从 @ComfyUI、@runware 到 @fal、@replicate 和 @Picsart,领先平台已在使用它构建应用。 现已在阿里云Model Studio上可用。 立即开始创作:https://int.alibabacloud.com/m/1000412436/ #HappyHorse #阿里云 #ModelStudio #AI视频 #生成式AI
多模态模型发布视频
09:01
Hacker News 热门(buzzing.cc 中文翻译)
65
Un-0:利用耦合振荡器生成图像

Unconventional AI 发布首个图像生成模型 Un-0,其核心是一个模拟的耦合振荡器系统——一种物理计算基板。在 class-conditional ImageNet 64×64 上,Un-0 达到 FID 6.74,匹配此前领先常规图像生成方法的首次发布质量。模型将耦合强度矩阵 K 和频率 ω 作为可学习参数,通过库拉莫托振荡器方程演化。权重、训练与消融代码均已开源。Un-0 旨在验证物理动态系统能以约 1000 倍更高能效运行现代 AI 工作负载。

图像生成开源生态模型发布
06:21
宝玉@dotey
86
OpenAI GPT-5.6 因政府要求将分批发布,仅限部分合作伙伴

OpenAI CEO Sam Altman 本周三在内部 Q&A 上告知员工,GPT-5.6 将以“有限预览”方式发布,仅向一小部分合作伙伴开放,原因是联邦政府要求。周四备忘录进一步说明,政府将逐个客户审批访问权限。这种发布方式在 AI 行业无先例。评论指出该机制仅限制发布速度而非训练速度,将扩大内部与公众可用能力的差距。传闻规格:上下文窗口从 GPT-5.5 的 100 万 token 扩展至约 150 万,代码能力和多步 agent 任务有改进,但发布时间取决于政府审批节奏。

Stephanie Palazzolo: New w/ @leomschwartz @amir: The Trump admin has asked OpenAI to stagger the release of GPT-5.6 over security concerns. O...

OpenAI安全/对齐政策/监管模型发布
关联讨论 9 条X:邵猛 (@shao__meng)IT之家(RSS)X:Nathan Lambert (@natolambert)X:Rohan Paul (@rohanpaul_ai)X:Berry Xia (@berryxia)The Decoder:AI News(RSS)TechCrunch:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)The Verge:AI(RSS)
01:34
MarkTechPost(RSS)
66
DeepReinforce 发布 Ornith-1.0 开源编码模型族

DeepReinforce 发布 Ornith-1.0 开源编码模型族,基于 Gemma 4 和 Qwen 3.5 后训练,提供 9B、31B、35B-MoE(每 token 激活约 3B 参数)和 397B-MoE 四个尺寸,均以 MIT 许可在 HuggingFace 开放。与固定人工设计框架的编码智能体不同,Ornith-1.0 在强化学习中联合优化框架与解决方案,并引入三层防御(固定信任边界、确定性监视器、冻结 LLM 裁判)防止奖励黑客。旗舰版 Ornith-1.0-397B 在 Terminal-Bench 2.1 上得分 77.5、在 SWE-Bench Verified 上得分 82.4,超越 Claude Opus 4.7(70.3)但低于 Claude Opus 4.8(85)和 GLM-5.2-744B(81.0)。支持 vLLM、SGLang 等推理框架,9B 模型(bf16 约 19GB)可部署在单张 80GB GPU 上。

智能体开源/仓库模型发布编码
01:07
TechCrunch:AI(RSS)
55
前 Databricks AI 负责人 Naveen Rao 的 Unconventional AI 发布首个模型 Un0,主打降低推理功耗 1000 倍

由前 Databricks AI 负责人 Naveen Rao 创立的 Unconventional AI 发布了首个模型 Un0,一个图像生成系统,性能可媲美 Stable Diffusion 和 GPT Image 1。该模型基于全新的振荡器计算机架构,目前运行在软件模拟上。团队计划发布实际芯片图纸并构建完整推理堆栈,最终以网络电缆提供“提示词进入、推理输出”的服务。Unconventional AI 声称该架构最终能将推理功耗降低 1000 倍。公司员工不到 50 人,Rao 认为能源将是未来几年 AI 扩展的根本限制。

图像生成模型发布
00:54
AK@_akhaliq
36
Wan-Streamer v0.1 端到端实时交互式基础模型
模型发布视频
00:49
Logan Kilpatrick@OfficialLoganK
61
Gemma 4… 为每个人带来设备端智能!
Google模型发布端侧
00:19
Berryxia.AI@berryxia
精选76
Ornith-1.0 开源模型家族发布,专注 Agentic Coding 全参数规模

Ornith-1.0 开源模型家族发布,专注智能体编程(Agentic Coding),覆盖 9B Dense、31B Dense、35B MoE 及 397B MoE 全参数规模。在 Agent Coding 基准上达开源顶尖:SWE-Bench Verified 82.4、SWE-Bench Pro 62.2、Terminal-Bench 2.1 77.5、NL2Repo 48.2、SWE Atlas 41.2 QnA、ClawEval 77.1。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架(scaffold)与最终解决方案,让模型自主改进执行框架。全系列 MIT 开源,提供 GGUF 版本,支持 Ollama、Unsloth 等本地运行。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

智能体开源生态模型发布编码

推荐理由:Ornith-1.0 不是又刷 benchmark,而是第一次把‘任务脚手架’的生成也纳入 RL 优化,这个思路可能改变 agent coding 的训练范式。MIT 开源加 GGUF,本地党可以立刻跑起来。
00:14
🚨 AI News | TestingCatalog@testingcatalog
45
OPENAI 🔥: GPT-5.6-Preview 已在 ChatGPT 代码中被发现。它可能也已向某些合作伙伴企业开放。 这也意味着它可能会在有限预览状态下持续一段时间。 不会很快?👀

Haider.: gpt-5.6-preview has been spotted in an internal model-access route

OpenAI模型发布
6月25日
23:53
Rohan Paul@rohanpaul_ai
72
DeepReinforce 发布开源智能体编码大模型家族 Ornith-1.0(MIT 许可)

DeepReinforce 发布 Ornith-1.0,一个 MIT 许可的开源智能体编码大语言模型家族,涵盖 9B Dense、31B Dense、35B MoE 及旗舰 397B MoE(17B 活跃参数)。旗舰模型在 SWE-Bench Verified 上取得 82.4,Terminal-Bench 2.1 上取得 77.5,均超越 Claude Opus 4.7;并在 SWE-Bench Pro(62.2)、Multilingual(78.9)等基准上达到开源同尺寸最佳。模型基于 Gemma 4 和 Qwen 3.5 后训练,采用新型自我改进策略:强化学习不仅生成解决方案,还联合优化任务特定的 scaffold(包含计划、记忆模式、工具节奏、错误处理等)。最小的 9B 模型也在 SWE-Bench Verified 上达到 69.4。全部模型以 MIT 许可证发布,支持商用与研究。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

智能体开源生态模型发布编码
22:44
🚨 AI News | TestingCatalog@testingcatalog
74
DeepReinforce 发布 Ornith-1.0 系列开源模型,专为智能体编码设计。参数覆盖 9B Dense、31B Dense、35B MoE 和 397B MoE,基于 gemma4 和 qwen3.5 微调。采用自我改进训练策略:强化学习同时生成解决方案和任务脚手架。旗舰 397B MoE 在编码基准上匹配 Claude Opus 4.7,9B Dense 针对边缘设备优化。评测成绩包括 Terminal-Bench 2.1 77.5、SWE-Bench verified 82.4、SWE-Bench Pro 62.2、NL2Repo 48.2 等。全部模型以 MIT 许可证开源,可商用和研究使用。

Ornith: Aloha! 🌺 Meet Ornith-1.0, a family of open-source LLMs specialized for agentic coding. Ornith-1.0 spans the full parame...

开源生态模型发布编码
19:35
Chubby♨️@kimmonismus
43
GPT-5.6 在内部模型访问路径中被发现。 GPT-5.6 即将到来已不是秘密。唯一的问题是它何时以及多快到来。 我猜测,一切准备工作都是为了应对潜在的 Fable 5 重新发布,随后很快发布 GPT-5.6。 鉴于围绕 Fable 5 的传闻越来越多,GPT-5.6 重新成为焦点并不意外。

Haider.: gpt-5.6-preview has been spotted in an internal model-access route

OpenAI模型发布
17:18
Berryxia.AI@berryxia
60
Unsloth 将 GLM-5.2 压缩为 1-bit GGUF,本地创意输出不逊闭源模型

Unsloth 将 GLM-5.2 压缩为 1-bit GGUF 量化版本,在 Mac Studio M3 Ultra(256GB RAM)上以约 21.6 tok/s 本地运行。与 Claude 4.8 Opus、GPT-5.5 使用相同提示进行创意输出(HTML/设计效果)对比,1-bit 版本表现不逊色,甚至更丰富、“更有想法”。GLM-5.2 本身以创意和长上下文见长,极端量化后仍保持较强表现,验证了开源模型在极端优化后正快速缩小与闭源前沿模型在实际可用性上的差距,尤其适合本地部署。

Unsloth AI: 1-bit GLM-5.2 GGUF vs. Claude 4.8 Opus vs. GPT-5.5 We gave 3 models the same prompt and compared one-shot outputs. The 1...

开源生态模型发布端侧评测/基准
16:35
Chubby♨️@kimmonismus
24
Anthropic 的 Fable 5 于今日重新发布。 我希望这是真的。

imjustnewatai: Anthropic Fable 5 re releasing today.

Anthropic模型发布
16:05
Chubby♨️@kimmonismus
31
部分用户可以在 Claude Code 模型选择器中(重新)选择 Fable 5,而另一些用户表示,尽管 Fable 5 已被下架,他们仍能选中它。 我删除了相关帖子,因为不太确定,不想传播错误信息。但无论如何,事情似乎在推进,Fable 5 再次触手可及!
Anthropic模型发布行业动态
15:58
IT之家(RSS)
69
百度开源 Unlimited OCR 模型,基于 DeepSeek OCR 架构,30亿参数仅激活5亿

百度于6月22日开源 Unlimited OCR 模型,总参数量30亿,推理时仅激活5亿。模型延续 DeepSeek OCR 架构,编码端采用两级视觉编码并执行16倍 token 压缩,将1024×1024 PDF 图像压缩为256个视觉 token,缓解长文档解析越生成越慢问题。训练基于 DeepSeek OCR 检查点,冻结 DeepEncoder 后继续4000步,使用约200万份文档在8×16 A800 GPU上完成,单页与多页数据配比约9:1。在 OmniDocBench v1.5 上整体得分93.23(DeepSeek OCR 87.01,DeepSeek OCR 2 89.17),文本编辑距离0.038,公式 CDM 92.61,表格 TEDS 90.93,读序编辑距离0.045;v1.6 得分93.92。GitHub 已获 6.8K Star。

DeepSeek多模态开源生态模型发布
15:44
🚨 AI News | TestingCatalog@testingcatalog
48
OpenAI 推出新版本 GPT-5.5 Instant,号称是使用最多的模型。新版本能更好地理解问题意图并调整回答,更可靠地处理复杂约束,同时让购物和本地推荐更实用、更连贯。该模型已向付费用户推送,明天起免费用户也将陆续获得。

OpenAI: We have a new version of GPT-5.5 Instant for you, and it's much more fun to talk to. Our most-used model is now better a...

OpenAI推理模型发布
14:54
Alibaba Cloud@alibaba_cloud
65
HappyHorse 1.1 现已作为 Partner Node 集成于 ComfyUI,一次渲染即可支持原生音频、多角色一致性与电影级构图。新版本提升动态表现力(运动更流畅);增强 R2V,每次最多使用 9 张参考图;实现多角色造型零串扰,背景变化时角色仍保持一致;指令遵循能力增强,可处理超 2500 字符的提示词,单次生成 6-8 个场景;修复皮肤反光和过度锐化;对话与音效同步更紧密。

ComfyUI: HappyHorse 1.1 is now available in ComfyUI as a Partner Node. Native audio. Multi-character consistency. Cinematic frami...

多模态模型发布视频
14:54
Alibaba Cloud@alibaba_cloud
67
全球创作者的重大胜利。 自豪地看到 #Replicate 支持 #HappyHorse 1.1,帮助更多故事讲述者获得视频创作、音频及角色驱动叙事的强大工具。

Replicate: Happyhorse 1.1 from Alibaba is up on Replicate! -Text, image, and reference to video options with multilingual lip-sync ...

模型发布视频
14:04
MarkTechPost(RSS)
同事件精选73
百度发布Unlimited OCR:3B参数MoE模型,KV缓存恒定实现长文档高效解析

百度推出Unlimited OCR,一个3B参数的MoE模型,推理时仅激活500M参数。其核心创新Reference Sliding Window Attention(R-SWA)将KV缓存大小固定为Lm + n(n默认128),内存和延迟不随输出长度增长。模型基于DeepSeek OCR继续训练4000步,支持32K最大长度,通过DeepEncoder实现16倍token压缩。在OmniDocBench v1.5上整体得分93.23,超出DeepSeek OCR基线6.22分;v1.6得分93.92为最高。Base模式下吞吐达5580 TPS,比DeepSeek OCR提升12.7%,6000 token输出时延迟低35%。适用于整本书转录等场景,代码与权重已在HuggingFace开源。

多模态开源生态模型发布
同一事件,精选展示《无限制OCR:单次长时域解析》
推荐理由:Baidu这个OCR模型用R-SWA把KV缓存压成常量,长文档解析终于不用越跑越慢了。MIT开源,3B总参但推理只消500M,做文档管线的可以直接接。
11:12
HuggingFace Daily Papers(社区热门论文)
67
iLLaDA:改进的大型语言扩散模型

iLLaDA是一个8B参数的掩码扩散语言模型,采用完全双向注意力机制训练,预训练数据量达12T tokens,并在25B tokens的指令数据集上微调12个epoch。模型引入变长生成与置信度评分方法以提升效率和多选评测效果。相比LLaDA,iLLaDA-Base在BBH和ARC-Challenge上分别提升21.6和14.9个点,iLLaDA-Instruct在MATH和HumanEval上分别提升14.5和16.5个点。尽管是非自回归训练,iLLaDA仍在多个基准上与Qwen2.5 7B保持竞争力。模型权重和代码已开源。

开源生态推理模型发布
08:58
IT之家(RSS)
41
OpenAI 再次升级 GPT-5.5 Instant:更具洞察力,购物推荐更实用

OpenAI 6 月 25 日升级 GPT-5.5 Instant 模型,新版本更能洞察用户表达意图,理解问题背后的引申含义,并优化输出表达。处理复杂约束条件时更可靠,能更稳定地满足多条件任务。购物推荐和本地推荐方面表现更实用、更连贯,结果更贴近实际使用场景。付费用户即日起获得新版,免费用户明天接入。

OpenAI模型发布
08:19
ginobefun@hongming731
43
BestBlogs 早报·06-25|OpenAI联合Broadcom推推理芯片Jalapeño;Anthropic公开人机协作四条规范;阿里开源代码评审CLI揽星5k

OpenAI与Broadcom发布首款定制LLM推理芯片Jalapeño,九个月流片,工程样片已跑GPT‑5.3‑Codex‑Spark,能效比显著领先,计划2026年吉瓦级部署。Anthropic公开多智能体协作经验,提出需持久记忆、独立凭证、广泛信息访问,总结信息公开、角色分工、人类定目标、按可验证程度放权四条规范。阿里开源内部代码评审CLI——Open Code Review,一周5k星,采用“确定性工程+Agent”混合架构解决覆盖不全、位置漂移、效果不稳定问题。

OpenAI产品更新推理模型发布
06:19
Nathan Lambert@natolambert
53
GLM 5.2 在 CursorBench 上处于 Opus 前沿(在成本方面),这正是导致前沿实验室利润下降的原因。

Lee Robinson: You can now try GLM 5.2 in Cursor! Excited to see more useful open models, thank you to Fireworks for partnering here. R...

开源/仓库模型发布编码
06:07
Lee Robinson@leerob
65
你现在可以在 Cursor 中试用 GLM 5.2! 很高兴看到更多有用的开放模型,感谢 Fireworks 在此合作。我们的评估结果如下 ↓
开源/仓库模型发布编码
05:29
Hacker News 热门(buzzing.cc 中文翻译)
71
Gemini 3.5 Flash 中的计算机使用

Google 将计算机使用(Computer use)作为内置工具集成至 Gemini 3.5 Flash,使开发者能构建跨浏览器、移动端和桌面环境的智能体。此前该功能仅作为独立模型在 Gemini 2.5 中提供,现已原生整合至主 Flash 模型。开发者可通过 Gemini API 及 Gemini Enterprise Agent Platform 调用。安全方面,模型采用针对性对抗训练降低提示注入风险,并新增两项可选企业级保护:要求用户确认敏感操作、检测到间接提示注入时自动停止。该能力在持续软件测试、跨应用知识工作等长周期企业自动化场景中表现更优。(198字)

智能体GoogleMCP/工具模型发布
关联讨论 2 条X:Google AI for Developers (@googleaidevs)Google DeepMind:Blog(RSS)
04:07
The Decoder:AI News(RSS)
51
OpenAI 称 ChatGPT Instant 更能理解用户真实意图

OpenAI 更新了 ChatGPT 中广泛使用的 GPT-5.5 Instant 模型,目标提升对话质量,尤其在用户做决策、寻求建议或比较选项时。模型能更准确识别问题背后的根本目标,在多轮对话中保持上下文,对包含多个条件的复杂提示给出更完整回答。当用户提出异议或澄清时,模型调整得更有效,不再重复原有回答。本地商业和购物查询也有改进,模型更好利用位置数据,将推荐、商家信息和图片更连贯整合。整体响应感觉“更少模板化,更多精心设计”。

OpenAI推理模型发布
02:38
ChatGPT@ChatGPTapp
65
新的GPT-5.5 Instant非常智能、非常直观,聊天起来非常有趣。 现已开始向所有人推送,先从Pro用户,然后是Plus用户。免费用户应在明天前获得新的GPT-5.5 Instant模型。
OpenAI推理模型发布
02:20
OpenAI@OpenAI
精选67
我们为你带来了新版 GPT-5.5 Instant,它现在聊起天来有趣多了。 我们最常用的模型现在能更好地理解问题背后的意图,并相应地调整回应。 它也能更可靠地处理复杂约束,让购物和本地推荐更加实用和连贯。 今天向付费用户推送,明天向免费用户推送。
OpenAI推理模型发布

推荐理由:GPT-5.5 Instant 这次更新看似温和,但“更懂意图”和“复杂约束处理”的改进,对产品人和普通用户来说,可能比跑分更有用。
02:19
Nathan Lambert@natolambert
68
如何训练出在终端和编码方面能力强大的小型智能体模型?现宣布推出 OpenThoughts-Agent 和 OpenThinkerAgent-32B,这是基于 Qwen-3 的最强开放数据智能体模型,在 7 项智能体基准测试中平均得分 44.8%。Nathan Lambert 表示这是急需的数据发布,很兴奋。

Richard Zhuang: How can we train small agentic models that are highly capable of terminal use and coding? Announcing OpenThoughts-Agent ...

智能体开源生态模型发布编码
02:17
Greg Brockman@gdb
69
OpenAI 推出 GPT-5.5 Instant 新版本,能更好理解问题意图、处理复杂约束,并改进购物与本地推荐。今日向付费用户推送,明日覆盖免费用户。

OpenAI: We have a new version of GPT-5.5 Instant for you, and it's much more fun to talk to. Our most-used model is now better a...

OpenAI模型发布
01:18
Berryxia.AI@berryxia
同事件精选78
Qwen-AgentWorld:原生语言世界模型,模拟7种Agent环境并超越Claude Opus 4.8和GPT-5.4

Qwen-AgentWorld是一个原生语言世界模型,端到端以环境建模为训练目标,而非事后适配。它在单一模型中模拟MCP、Search、Terminal、SWE、Web、OS、Android等7种Agent环境,并在AgentWorldBench上超越Claude Opus 4.8和GPT-5.4。两个探索方向:1)将世界模型用作可控Sim RL的环境模拟器,模拟环境训练的Agent在部分任务上超过真实环境训练;2)仅做环境预测(不进行Agent训练)的预测能力零微调迁移到多轮Agent任务,在多个benchmark上均有提升。已开源35B MoE版本及对应benchmark。

Qwen: 📣📣 Meet Qwen-AgentWorld - a native language world model that simulates 7 agent environments (MCP, Search, Terminal, SW...

智能体开源生态模型发布
同一事件,精选展示《Qwen-AgentWorld:面向通用智能体的语言世界模型》
推荐理由:这是我最近看到最有想法的Agent方向探索,直接从环境建模入手,而不是让模型死记硬背操作,且零样本迁移能力很惊艳,做Agent的开发者必读。
00:34
Chubby♨️@kimmonismus
44
Claude Code v2.1.190 更新中新增字符串 "You've used your Fable 5 usage for this week",同时移除 "purchased separately from your plan",暗示 Anthropic 正为 Fable 5 回归做准备,可能将其永久纳入订阅计划并设置每周使用上限。用户对此消息表示期待,认为有望带来良好公关效果。

leo 🐾: 🚨 BREAKING: Claude Code v2.1.190 introduces several string changes that hint at preparations for a Fable 5 return, with...

Anthropic模型发布
00:12
OpenRouter@OpenRouter
54
Fugu Ultra by @SakanaAILabs 现已上线 OpenRouter! 很高兴看到更多多模型系统推动前沿。

Sakana AI: Fugu-Ultra is now live on @OpenRouter! ⚡ We share a core vision with the OpenRouter team: the future of AI isn't a singl...

推理模型发布
‹ 上一页
1…34567…43
下一页 ›