🚀 Meet Qwen3.6-27B, our latest dense, open-source model, packing flagship-level coding power! Yes, 27B, and Qwen3.6-27B...
Qwen3.6-27B 开源发布,采用270亿稠密参数,无需MoE路由,部署门槛更低。编程能力全面超越前代旗舰Qwen3.5-397B-A17B MoE,在SWE-bench Verified(77.2)、SWE-bench Pro(53.5)、Terminal-Bench 2.0(59.3)、SkillsBench(48.2)等基准上领先,深度思考能力媲美超大参数模型。原生支持多模态,可处理图像、视频与文本,支持视觉推理、文档理解和视觉问答,具备视觉语言思考与非思考模式。开源权重已上线Hugging Face与ModelScope,API即将在阿里云百炼上线,兼容OpenAI与Anthropic协议,即时对话可通过Qwen Studio体验。
🚨 OpenAI just accidentally leaked all the internal models in Codex model picker Seem to be only on pro accounts
关联讨论 2 条X:小互 (@xiaohu)IT之家(RSS)🚨 OpenAI just accidentally leaked all the internal models in Codex model picker Seem to be only on pro accounts
Really excited for this week! Next up, we've got something to show you at 12 pm PT today.
该模型由 inclusionAI 发布,属于 DR-Venus 系列,参数量为 40 亿,采用强化学习训练并已转换为 GGUF 格式,便于在本地设备高效运行。其推出延续了通过开源与开放科学推动人工智能技术发展与普及的使命,旨在降低先进 AI 技术的使用门槛,促进更广泛的社区参与和创新应用。
inclusionAI 团队开源了 DR-Venus-4B-RL 模型。这是一个基于强化学习技术微调的 40 亿参数语言模型,旨在通过开源与开放科学的方式推动人工智能的发展与普及。该模型的发布为研究社区提供了一个中等规模、经过指令与人类偏好对齐的可用模型,延续了其促进 AI 民主化的目标。
该团队正致力于通过开源与开放科学的方式,推动人工智能技术的进步与民主化。其核心目标是降低AI技术的门槛,促进更广泛的参与和创新,使先进AI工具能够被更多开发者和研究者所使用。这一举措旨在构建一个开放、协作的AI生态系统。
DR-Venus 是一个仅用1万条开放数据训练的40亿参数深度研究智能体,基于Qwen3-4B-Thinking-2507架构,支持200步工具调用和超20万tokens的上下文。它通过监督微调与强化学习两阶段训练,在BrowseComp、GAIA等多个深度研究基准上树立了小模型性能新标杆。其SFT版本已超越多数同类开源模型,而RL版本进一步将长程任务可靠性和工具使用校准度提升2-3个百分点。项目已全面开源模型、代码与训练流程。
通义千问发布 Qwen3.6-Max-Preview 预览版,相比 Qwen3.6-Plus 在多项基准上显著提升:智能体编程(SkillsBench +9.9、SciCode +6.3、NL2Repo +5.0、Terminal-Bench 2.0 +3.8)、世界知识(SuperGPQA +2.3、QwenChineseBench +5.3)、指令遵循(ToolcallFormatIFBench +2.8)。新版本支持 preserve_thinking,可在消息中保留前序轮次思维内容,避免多步任务上下文丢失,官方推荐用于智能体开发。用户可登录 Qwen Studio 直接对话,或通过阿里云百炼(即将上线)调用 API。
Holy SHIIIIIIITTTTTTTTT @TheRealAdamG what did you guys created , this is insane GPT pro update created a masterpiece un...
ImagineArt 2.0在文本到图像排行榜首登第9位,生成质量与xAI的grok-imagine-image及Google的Imagen 4 Ultra相当。作为ImagineArt推出的最新专有图像模型,该版本目前已集成于ImagineArt Image Studio应用,面向开发者的API即将上线。ImagineArt作为综合性AI创意平台,为用户提供多种图像与视频模型的一站式访问。
OpenAI 推出专为生命科学领域打造的推理模型 GPT-Rosalind,旨在加速研究人员从假设到实验的转化流程。该模型目前处于严格管控的访问阶段。作为针对生命科学研究场景优化的 AI 系统,GPT-Rosalind 试图缩短科研周期,帮助科学家更快验证理论假设。
🚨Grok 4.3 beta spotted on http://Grok.com
LLaDA2.0-Uni是一个统一的多模态模型,具备对世界的理解与生成能力。该模型通过整合视觉、语言等多模态信息,实现了跨模态的语义理解和内容生成。其架构支持从图像理解到文本生成、跨模态检索等复杂任务,标志着多模态人工智能向更通用、统一的方向演进。
字节跳动将其 AI 视频生成模型 Seedance 2.0 推向全球 100 多个国家,但美国不在此次发布范围内。这一排除可能源于该公司与好莱坞制片厂之间持续的版权纠纷。此次国际扩张标志着字节跳动在 AI 视频生成领域的全球布局取得进展,尽管其在美国市场仍面临法律障碍。
as seems to almost always be the case these days, the 5.5 launch has been pushed back (it will not be tomorrow) not too ...
Google 发布 Gemini 3.1 Flash TTS 语音模型及 Chrome Skills 工具,支持场景化语音合成与提示词复用。OpenAI 推出 GPT-5.4-Cyber 并升级 Agents SDK 为长期运行代理环境,支持沙盒执行与状态管理。与此同时,AI 技术遭遇强烈社会抵制,出现针对数据中心的激进行动。
Google 推出 Gemini 3.1 Flash TTS 文本转语音模型,支持超过70种语言的自然语音合成。该模型引入音频标签功能,允许用户精确控制输出语音的风格、语速和语调,显著提升了语音合成的表现力和可控性,适用于多语言内容创作场景。
Generate nuanced, engaging audio experiences across 70+ languages with Gemini 3.1 Flash TTS - our most controllable & ex...
OpenAI 正式发布 GPT-5.4-Cyber,这是一款专门为防御性网络安全场景训练和优化的专用模型。与通用大模型不同,该模型专注于网络安全防御任务,目前访问权限受到严格限制,仅向经过身份验证的安全领域专家开放,普通用户暂无法使用。
Cognition发布基于强化学习的bug检测模型SWE-check,在匹配前沿模型性能的同时实现10倍推理加速。作者提出AI工程的核心范式:通过模型与工具组合推动AI帕累托前沿,而非直接突破模型边界;应采用"先最大化能力再蒸馏"的策略。Applied Compute正为多家Agent Lab提供算力基础设施。AI领域仅存在两种商业模式:能力整合与能力拆分。
Today we're releasing SWE-check, a specialized bug detection model we RL-trained with @appliedcompute that matches front...
New model: GPT-5.4-Cyber 'Today we're expanding this program by introducing additional tiers of access for users willing...
OpenRouter上线匿名模型elephant,实测排除其为DeepSeek-v4。该模型100B参数,支持262K上下文,推理速度近300 token/s,双32G显卡可部署4bit版。但编程能力薄弱,依赖的three.js库停留在2021年r128版,训练数据陈旧,整体表现不及DeepSeek-V3。不建议用于编程,仅适合免费日常试用。
MiniMax M2.7 与 Hermes Agent 结合,构建可自我进化的 AI 智能体工作流。