微软通过其AI官方网站 microsoft.ai 发布了新模型 “MAI-Thinking-1”。该消息随链接一同发布,并出现在相关技术社区中。
微软通过其AI官方网站 microsoft.ai 发布了新模型 “MAI-Thinking-1”。该消息随链接一同发布,并出现在相关技术社区中。
Claude Code 新增动态工作流功能,允许模型在运行时即兴创建和协调多智能体框架来处理复杂任务。该功能通过执行特定的 JavaScript 文件来生成和协调拥有独立上下文窗口的子代理,可解决单一上下文窗口中长时间执行任务可能出现的智能惰性等问题。工作流适用于研究、安全分析、代码审查等场景,通常消耗更多 token,更适合高价值复杂任务,其最佳实践仍在发展中。
同一事件,精选展示《在Claude Code中引入动态工作流》Claude Code 新增动态工作流功能,使 Claude 能根据任务动态创建定制化的执行框架。该功能通过执行 JavaScript 文件来协调子智能体,并可指定模型与工作区隔离级别。它适用于研究、安全分析、代码审查等复杂任务,支持共享与复用。需要注意,动态工作流会消耗更多 token。
关联讨论 4 条Claude:Blog(网页)Claude Code:GitHub Releases(RSS)X:邵猛 (@shao__meng)X:Claude Devs (@ClaudeDevs)http://x.com/i/article/2061850535708483585
微软推出 MAI-Code-1-Flash 模型,仅使用 50 亿个活动参数(5B Active Params),在 SWE-Bench Pro 基准测试中获得了 51% 的成绩,展示了高参数效率。
微软在 Build 2026 大会上发布了其首款高级推理模型 MAI-Thinking-1。该模型为中等规模,在软件工程基准测试中达到业界领先水平,且完全基于干净数据从零开始训练,未使用第三方模型的蒸馏数据。同时,微软还推出了 MAI-Image 2.5(文生图/图像编辑)、MAI-Transcribe-1.5(语音转写,速度达竞争对手五倍)、MAI-Voice-2(语音合成,新增15种语言支持)和 MAI-Code-1(编程辅助,已集成至 GitHub Copilot 和 VS Code)等多款新模型。
OpenAI 正在为旗下编程工具 Codex 扩展功能,新增针对数据分析、销售和投资银行业务的角色专用插件。该公司表示,Codex 每周有500万用户,其中五分之一并非开发者。非开发者用户群体的增长速度是开发者群体的三倍,这表明 OpenAI 正将 Codex 定位为面向所有人的通用工作应用。
我去,一句话建网站啊,还能分享给别人查看。 企业版,注意必须企业版更新Codex后, @ site 使用。 Codex这次更新有点强! Anthropic 只是Design,OpenAI更进一步,包设计,还包网站生成。
Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website ...
OpenAI披露,Codex每周用户已超500万,其中非开发者用户约占20%,增速是开发者的3倍多。此次更新旨在将其从开发工具推向通用工作系统,主要推出三项能力:1) 面向数据分析、销售等角色的角色插件,覆盖62个应用和110个技能;2) 面向企业客户的Sites功能,可将计划生成为可协作的交互式网站;3) 扩展到文档、表格等的批注功能,支持局部修改。这些更新旨在让Codex更好地理解岗位上下文,进入企业现有工具链。
微软在官网更新了 MAI 模型系列,重点发布了 MAI Code 1 Flash 和 MAI Thinking 1。MAI Thinking 1 拥有 35B 活跃参数和约 1T 总参数,采用 MoE 架构,其推理成本低于更大型模型,但在 SWE-Bench Pro 上的表现可与 Claude Opus 4.6 竞争。MAI Code 1 Flash 则专注于通过规划和推理来完成端到端的复杂编码任务。此外,MAI Image 2.5、MAI Voice 2 及 MAI Transcribe 1.5 也同步上线。
Factory推出Factory Router,一个编码智能体模型选择器。它通过将每次编码任务视为路由决策,首先使用最具性价比的模型处理,仅在遇到失败或需要深度推理时升级至更强前沿模型。该方案旨在保持与Claude Opus 4.7相近的性能(报告称达到其Terminal-Bench 2分数的99%),同时将AI会话成本降低20-25%。其核心理念是“前沿AI应保留给前沿工作”。
Introducing model routing to Factory. Factory Router picks the right model for every task, automatically. Maintain front...
微软推出了基于 Windows Terminal 的开源实验性分支“智能终端”(Intelligent Terminal)0.1 版本,现已通过微软商店和 WinGet 开放下载。该终端将 AI 编程能力直接集成到命令行环境,默认使用 GitHub Copilot CLI,其核心是一个可停靠的 Agent 窗格,能感知 Shell 输出上下文。当命令执行失败时,终端会自动检测错误并在状态栏显示图标,用户点击即可打开加载了错误上下文的 Agent 窗格,由智能体解释问题并建议修复方案。此版本发布后,微软将弃用 Canary 通道中的 Terminal Chat 功能。
在微软 Build 2026 大会上,GitHub 发布了新的工具和更新,并将 Copilot 应用定位为“智能体原生的桌面体验”。其核心目标是让 AI 智能体能够以用户已经习惯的方式进行工作。
关联讨论 1 条The Verge:AI(RSS)Introducing Kombai 2.0 - the first AI design engineer. We keep hearing that AGI is almost here. Still, we're stuck with ...
独立开发者Bennett利用Codex AI编程工具,在23.5小时内开发出开源App Goose。该应用可直接通过蓝牙读取Whoop 5.0的健康数据,无需订阅。实现基于公开的BLE协议分析,使用Rust和SwiftUI将数据本地化存储。此举暴露了依赖用户数据锁定和惯性构成的订阅制硬件护城河的脆弱性,并展示了AI工具如何降低个人挑战封闭生态的成本。
https://openai.com/index/codex-for-every-role-tool-workflow/
Moonshot AI创始人杨植麟最近放出了一个40分钟视频。 这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2的...
OpenAI 为 Codex 带来重大升级,将其从编码助手转变为可构建交互式工作空间的“空间构建器”。核心新功能“Sites”能生成托管的交互式工作区,而不仅是文档或代码文件。同时新增插件以适配不同职业,并推出“标注”功能允许用户对结果的特定部分进行修复。Codex 目前拥有500万周活跃用户,其中20%为非开发者,该群体增长速度是开发者的3倍以上。“Sites”功能正面向 Business 和 Enterprise 计划推出。
Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website ...
关联讨论 4 条OpenAI:官网动态(RSS · 排除企业/客户案例)X:OpenAI (@OpenAI)X:Sam Altman (@sama)IT之家(RSS)这个有点厉害,Codex 出 Python SDK了。 安装指令:pip install openai-codex 整合到自己的代码中,相当于直接内置了顶级编程和生图Agent? 最关键的是,可以复用 Codex 登录态。
We just released the Codex Python SDK 🔥 You can now embed Codex directly into your Python apps and workflows! > Start t...
Introducing Kombai 2.0 - the first AI design engineer. We keep hearing that AGI is almost here. Still, we're stuck with ...
Kombai 推出了首个专用于前端开发的AI编程智能体。针对通用智能体在处理前端任务时的不足,Kombai 通过读取设计上下文、浏览器状态、组件等数据,像前端工程师一样进行代码编辑。推文称,Kombai 在真实代码库任务上的表现超越了 SOTA 模型和通用编程助手,并在一个超过 50 万行的开源代码库中演示了添加复杂功能。此外,Kombai 还开源了一个可用于评测复杂前端任务的基准数据集。
Introducing Kombai, the first AI agent built for frontend development. Kombai vastly outperforms SOTA models + generic a...
The open-weight labs did not come to play this week. StepFun dropped Step 3.7 Flash. MiniMax dropped M3. Both with open ...
In case you missed it, I published a video last week that was 100% edited by @cursor_ai + @Remotion + @FFmpeg turning th...
GitHub Copilot从今年4月起宣布的计费方式变更已开始实施,由固定月度订阅制转为按token使用量计费。变更刚启动一天,用户已普遍反映成本上涨。新的计费模式使得大语言模型服务的实际成本更直接地反映使用量,给企业和个人用户带来了不同的财务影响。
The Next Era of Knowledge Work报告指出,Codex正通过AI增强的研究、数据分析、工作流自动化与内容创作,变革知识工作的生产力。
Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...
多名用户发现,OpenAI将Codex平台针对免费账号和Go订阅账户的额度重置周期从7天延长至30天。Plus、Pro、Business、Edu和Enterprise等付费订阅用户的额度仍维持每周重置。这一调整意味着免费用户每月可用额度次数从约4次减少为1次,而单次配额数值未变。Codex是OpenAI开发的AI代码生成与智能体平台。
JetBrains 开源了面向软件工程的模型 Mellum2。该模型总规模为 12B 参数,采用稀疏 Mixture-of-Experts 框架,激活参数量为 2.5B。上下文窗口扩展至 131072 Token。Mellum2 支持生成编辑代码、调用外部工具及执行多步骤智能体式工作流。模型基础版、指令版和思考版均以 Apache 2.0 许可证开源。
Simon Willison 开发了“粘贴文件编辑器”工具原型,灵感源于 Claude.ai 能将大段粘贴文本自动转为文件附件的功能。该工具支持粘贴文本、直接打开文件(包括图片缩略图显示)以及拖拽文件。它是由 Codex 桌面版协助构建的。