AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 242 条
全部一手资讯X论文
标签「Microsoft」清除
🚨 AI News | TestingCatalog@testingcatalog · 5月30日60

Microsoft ❤️ NVIDIA > NVIDIA GTC Keynote is happening on June 1 > Microsoft Build Keynote event is happening on June 2 > Both Windows and NVIDIA accounts teased an upcoming announcement, saying "A new era of PC." A new Windows hardware is coming 👀

译Microsoft ❤️ NVIDIA > NVIDIA GTC 主题演讲将于6月1日举行 > Microsoft Build 主题演讲活动将于6月2日举行 > Windows和NVIDIA的账号都预告了即将发布的公告,称“PC的新时代”。 新的Windows硬件即将到来 👀

🚨 AI News | TestingCatalog@testingcatalog · 5月29日56

Microsoft announced a major redesign of its 365 Copilot, which now looks a lot like ChatGPT. Which makes total sense, considering the amount of user research hours put into the current UX. ChatGPTfy 👀

译微软宣布对其365 Copilot进行重大重新设计,现在看起来非常像ChatGPT。 考虑到在当前用户体验上投入的大量用户研究时间,这完全合乎情理。 ChatGPTfy 👀

Rohan Paul@rohanpaul_ai · 5月29日60

The problem is that agent skills are usually hand-written, made once by an LLM, or revised in loose ways that can easily make them worse. SkillOpt from Microsoft, argues that agent skills should be trained like small external programs, it teaches AI agents better task habits by editing a reusable skill document, not the model itself. The paper’s core idea is to treat the skill document like the thing being trained, while the main AI model stays frozen and unchanged. SkillOpt watches the agent try tasks, studies what worked and failed, then asks a stronger optimizer model to suggest small edits to the skill. It only accepts an edit when the new skill improves on a held-out check set, so the skill does not drift just because an edit sounds good. The authors tested this across 6 benchmarks, 7 target models, and 3 agent settings, including direct chat, Codex, and Claude Code. SkillOpt was best or tied on all 52 tested cases, and on GPT-5.5 it raised average accuracy by 23.5 points in direct chat. The final result is a small readable skill file that can improve agents across tasks and settings without retraining the model. The best part is that the optimizer is used during training, but deployment only needs the final skill file. That makes the artifact inspectable, portable, and cheap to reuse, which is exactly what most prompt-engineering systems lack. ---- Link – arxiv. org/abs/2605.23904 Title: "SkillOpt: Executive Strategy for Self-Evolving Agent Skills"

译微软提出SkillOpt方法,旨在改进AI智能体技能的优化过程。其核心思想是将一个独立的技能文档视为优化对象,而非直接修改底层大语言模型。该方法让智能体尝试任务,分析成功与失败案例,然后由一个更强的优化器模型对技能文档进行小幅编辑。编辑只会在提升验证集表现时被接受,从而确保技能的稳定改进。在6个基准测试、7个目标模型和3种智能体设置(包括直接聊天、Codex和Claude Code)的共52个测试案例中,SkillOpt均达到最佳或并列最佳。在GPT-5.5上,它将直接聊天的平均准确度提升了23.5点。最终产出的技能文件可读、可移植且可复用,部署时无需重新训练模型。

Satya Nadella@satyanadella · 5月29日64

We've redesigned Copilot to be simpler, faster, and more intuitive, to help keep you in the flow of your work. Try it out: https://www.microsoft.com/en-us/microsoft-365/blog/2026/05/28/introducing-a-new-design-for-microsoft-365-copilot/?v=1

译我们重新设计了 Copilot,使其更简洁、更快速、更直观,帮助您保持工作流畅。 试用:https://www.microsoft.com/en-us/microsoft-365/blog/2026/05/28/introducing-a-new-design-for-microsoft-365-copilot/?v=1

Microsoft Research@MSFTResearch · 5月29日63

Data Formulator introduces AI-powered analytics for enterprise data workflows. Data teams can easily bring enterprise data into an AI-ready workspace where users can explore, analyze, and visualize data with AI agents to turn raw data into actionable insights: https://msft.it/6013vZzUl

译Data Formulator 为企业数据工作流引入了 AI 驱动的分析功能。数据团队可以轻松将企业数据带入一个 AI 就绪的工作空间,用户可以使用 AI 智能体来探索、分析和可视化数据,将原始数据转化为可操作的洞察:https://msft.it/6013vZzUl

Perplexity@perplexity_ai · 5月28日77

Perplexity Computer is now available inside Microsoft Excel, Word, PowerPoint, and Outlook. Orchestrate across work with Computer directly in the side panel of your app to draft documents, model, build decks, and handle email. Available now: https://www.perplexity.ai/hub/products/integrations/microsoft

译Perplexity Computer现已登陆Microsoft Excel、Word、PowerPoint和Outlook。 您可以在应用程序的侧边栏中直接使用Computer来协调工作,起草文档、建模、制作演示文稿并处理电子邮件。 现已推出:https://www.perplexity.ai/hub/products/integrations/microsoft

Chubby♨️@kimmonismus · 5月28日56

Microsoft is launching homegrown AI models at Build next week, positioned as cheaper alternatives to OpenAI and Anthropic. Buried in the reporting: relying on Anthropic's Claude forced Microsoft to raise GitHub Copilot prices and cap how much developers could actually use it. They get OpenAI's models free through 2032 but are spending billions to not need them when that expires. Suleyman's team hasn't topped a single leaderboard in two year, the explanation being that Microsoft's OpenAI deal restricted him from training frontier models until April. Convenient timing for a launch. Via The Information Anyways, really excited for Microsoft Build next week. Ill attend in person.

译微软计划在下周的 Build 大会上发布其自研 AI 模型,旨在成为 OpenAI 和 Anthropic 的更廉价替代方案。据报道,依赖 Anthropic 的 Claude 迫使微软提高了 GitHub Copilot 的价格并限制了开发者的实际使用量。尽管通过协议在 2032 年前可免费使用 OpenAI 模型,但微软正投入巨资以期在协议到期后减少依赖。负责 AI 模型的 Suleyman 团队两年来未在任何基准测试中领先,其解释称是受与 OpenAI 的协议限制,直至今年四月才可训练前沿模型。此次发布时机值得关注。

Microsoft Research@MSFTResearch · 5月28日30

Understanding AI as an extension of human intelligence—not a replacement for it—offers a more grounded path for building trustworthy AI systems. Learn more: https://msft.it/6010vkoHk

译将AI理解为人类智能的延伸——而非其替代品——为构建可信赖的AI系统提供了一条更扎实的路径。了解更多:https://msft.it/6010vkoHk

meng shao@shao__meng · 5月27日71

微软发布终端原生 Web Agent 框架:Webwright https://github.com/microsoft/webwright 核心设计:代码即动作 传统网页智能体采用"观察→预测下一步点击→执行"的循环,每一步都依赖 LLM 判断。Webwright 的做法更贴近软件工程师思维: · 让 LLM 写 Playwright 脚本 —— 把网页操作变成可运行的 Python 程序 · 工作区即状态 —— 脚本、截图、日志保存在本地,浏览器会话可随时重建 · 终端优先 —— 核心循环只有三个模块约 1000 行代码,无隐藏编排层 这种模式产生的"副产物"是可复用的自动化程序,而非一次性交互痕迹。 性能表现:SOTA 水平 · Online-Mind2Web (300 任务):86.7% (GPT-5.4),同类开源框架中最高 · Odysseys (200 长程任务,平均 76.1 步):60.1% (GPT-5.4),较此前 SOTA (+15.6pt),较基线 GPT-5.4 (+26.6pt) · Claude Opus 4.7:84.7% / 难例 80.5%,难例上超越 GPT-5.4 架构极简 Runner (150行) -> Model Endpoint (550行) -> Environment (300行) · 仅依赖 httpx、pydantic、playwright、typer · 无多智能体系统、无图引擎、无插件层 · 支持 OpenAI、Anthropic、OpenRouter 后端 产品化与集成 · Claude Code:插件 /plugin install webwright@webwright,支持 /webwright:run 和 /webwright:craft · OpenAI Codex:插件市场安装,通过 @ webwright 调用 · OpenClaw / Hermes:共享 skills/webwright/ 目录,统一技能规范 关键创新点 · Task2UI 模式 (2026-05-11 新增) —— 任务完成后自动渲染为 HTML 应用,结果可视化且可重用 · 脚本可复用性 —— 即使是 Qwen-3.5-9B 这样的小模型,在预置工具脚本辅助下也能达到 66.2% 的难例完成率 · 可审计性 —— 每次运行都保存轨迹、截图、报告,便于调试和回归

译微软开源了终端原生Web Agent框架Webwright。其核心创新是“代码即动作”:让大语言模型直接编写可执行的Playwright Python脚本,而非传统的“观察-预测-点击”循环,由此生成的程序可复用。在性能上,基于GPT-5.4在Odysseys长程任务基准上达60.1%,较此前SOTA提升15.6个百分点;基于Claude Opus 4.7在难例上达80.5%,超越GPT-5.4。框架架构极简,核心代码约1000行,并已与Claude Code、OpenAI Codex等集成。用户评论表达了对该工具在浏览器自动化方面相比Playwright能带来巨大提升的期待。

karminski-牙医@karminski3 · 5月27日69

什么?! skill 也能"训练"了? 以往大家都是凭经验让AI写 skill, 然后调试的时候也是运行几下感觉没bug就完事了. 但 skill 能运行就一定好吗? 于是微软联合上交复旦同济等机构发了一个新框架 SkillOpt, 直接让AI评估skill写的好不好然后不断去优化! 最终, 这个框架写的 skill 让GPT-5.5的直接对话准确率飙升了 23.5分! 这个框架具体是怎么做的也很简单, 让skill迭代过程实现 harness 闭环! 大模型写完 skill 后, 立刻进入跑分流程, 只有得分更高的 skill 变更才会留下来. 跟大模型的强化学习过程如出一辙. 框架的设计也很值得做 Agent 框架的同学借鉴, 比如: 它设计了一个独立的优化器模型, 这个模型是用来写 skill 的, 它会根据 Agent 执行任务的试错表现得分, 对 skill 进行编辑操作(增加、删除、替换文本). 然后就是 harness 流程了:每一次文本编辑都必须在独立的验证集上分数有提升, 才会允许合并. 最后, 也是最精彩的地方, 框架还引入深度学习训练机制, 设计了文本层的学习率预算, 这个的核心就是限制大模型每次只能修改skill的一小部分, 慢慢迭代, 而不是全都重写. 论文中最有价值的数据就在这里, 论文实验发现, 每一步设置 4 到 8 个编辑操作的预算效果最好. 最终的最佳 skill 往往只包含 1 到 4 个被接受的核心修改. 甚至他们还设计了被拒编辑缓冲区, 用来存储训练过程的反面胶材, 以及周期性慢速/元更新, 这个则是跑完一个周期后, 会进行一次盘点, 类似于让框架形成记忆, 能更好的维持后续迭代. 这篇论文的结论十分深刻: skill(prompt) 完全配得上, 也需要一套系统级的训练流程. 原文中的描述直接是: 我们主张, skill 应当作为 Agent 的外部冻结状态来被"训练", 并且训练过程还要"让权重空间优化具有可重复性"! 这是不是意味着, 提示词工程(Prompting)和模型训练(Training) 的界限将逐渐变得模糊? 而提示词工程完全进入了机器学习的领域. 也许很快, 我们再也不需要人类去手动瞎改和调试提示词了! 论文地址: http://arxiv.org/pdf/2605.23904 #skillopt #微软 #提示词工程 #harness

译微软联合上海交通大学等机构发布SkillOpt框架,旨在通过机器学习流程系统性地优化AI智能体的技能。该框架引入独立的优化器模型,通过harness闭环流程对技能进行编辑,且每次编辑必须在验证集上带来分数提升才被接受。框架设置了每步4到8个编辑操作的学习率预算,使核心修改控制在1到4个。实验表明,优化后的技能可使GPT-5.5的对话准确率提升23.5分。

Microsoft Research@MSFTResearch · 5月26日62

Can AI reason about human values with real-world complexity? Microsoft Research Asia's new Global AI Values Challenge invites researchers across philosophy, ethics, law, and the social sciences to help find out. Register now: https://msft.it/6012vk8OO

译AI能否理解人类价值观的现实复杂性?微软亚洲研究院的全新全球AI价值观挑战赛,诚邀哲学、伦理、法学和社会科学领域的研究人员共同探索。立即注册:https://msft.it/6012vk8OO

elvis@omarsar0 · 5月25日66

New research from Microsoft Research I see a lot of AI engineers handwriting agent skill docs and hope they generalize. Probably not optimal. This works show why. It treats the skill doc as a trainable external state of a frozen agent instead. It introduces SkillOpt, where an optimizer model makes validation-gated edits to the skill file. It adds, deletes, or replaces instructions, with a textual learning rate that controls how aggressively each round rewrites the doc. The agent itself never changes. SkillOpt is best or tied on all 52 (model, benchmark, harness) cells. On GPT-5.5 it adds 23.5 points in direct chat, 24.8 with Codex, and 19.1 with Claude Code over no skill. It beats human-written skills, TextGrad, GEPA, and EvoSkill, carries zero extra inference-time cost, and the learned skills transfer across models and harnesses. Paper: https://arxiv.org/abs/2605.23904 Learn to build effective AI agents in our academy: https://academy.dair.ai/

译微软研究院提出了SkillOpt方法,将AI智能体的技能文档视为可训练的外部状态,而非由工程师手动编写。该方法利用一个优化器模型对技能文件进行验证门控编辑,通过添加、删除或替换指令来优化文档,并引入文本学习率控制每轮重写力度,而智能体本身保持不变。实验显示,在全部52个测试单元(涵盖不同模型、基准测试和工具链)中,SkillOpt均达到最佳或并列最佳。具体在GPT-5.5上,相比无技能文档,SkillOpt在直接聊天、Codex和Claude Code下分别取得23.5、24.8和19.1分的提升,超越人类手写技能及其他自动化方法,且不增加推理时开销,学到的技能还能跨模型和工具链迁移。

meng shao@shao__meng · 5月24日33

懂了,程序员生存之道: token 别降价,我要降价 😂

Rohan Paul@rohanpaul_ai · 5月23日74

Satya Nadella reveals how Microsoft is applying the concept of "Lean for knowledge work" internally with AI. The internal ROI on AI investment and leveraging the cost reduction effect of AI. Borrowing from Toyota's manufacturing efficiency principles and applying them to white-collar operations powered by AI. e.g. Microsoft spends approximately $4 billion per year on customer support operations. By deploying AI agents for front-end deflection (resolving issues before they reach human agents) and real-time reasoning assistance for support staff, they are dramatically reducing costs in areas like Xbox and Azure support. --- From "Bg2 Pod" YT channel ( link in comment)

译Satya Nadella透露微软正借鉴丰田精益生产原则,将“精益知识工作”理念应用于内部AI运营。通过计算AI投资回报并利用其成本削减效应,微软在白领工作中部署AI以优化流程。例如,微软每年在客户支持业务上支出约40亿美元,通过部署AI代理处理前端问题分流及为支持人员提供实时推理协助,在Xbox和Azure等支持领域大幅降低了成本。

Replit ⠕@Replit · 5月23日56

Replit is featured in the @msft4startups startup spotlight at Microsoft Build 2026, and we're proud to be in good company. Check out the full cohort of startups building on Azure and solving real enterprise problems at the link below. See you in San Francisco. https://msft.it/6016vVpM2

译Replit在微软Build 2026活动中被@msft4startups重点推介,是构建Azure并解决企业实际问题的创业公司之一。该计划聚焦于弥合AI演示与生产环境实际运行之间的鸿沟,入选的初创公司正通过Azure平台将技术方案落地。

Chubby♨️@kimmonismus · 5月22日70

Microsoft put $13 billion into OpenAI and built the cloud infrastructure Anthropic runs on. This week it canceled its internal Claude Code licenses because the token bill was too high. Even for MSFT Claude is too expensive.

译微软因token费用过高取消了内部Claude Code授权,凸显出企业AI使用成本正急剧上升。这标志着AI补贴时代的终结,基于使用量的定价模式正迫使企业面对大模型运行的高昂成本。企业面临两难:缩减AI投入会影响AI实验室的增长目标;若实验室降价则会损害自身盈利。两种路径都指向当前成本模式难以为继,最终可能需进行资产减值。

meng shao@shao__meng · 5月22日66

VSCode 团队介绍 Agent-First Development 的五大支柱 1. Model —— 选择思考的深度 模型不是"越大越好",而是"匹配任务"。 Copilot 提供 Low / Medium / High / Auto 四档思考深度: · Low:补全、改名、格式化等机械任务,追求延迟 · Medium:常规功能开发,平衡速度与质量 · High:架构设计、复杂 bug、跨文件重构,宁可慢也要对 · Auto:让系统按任务复杂度自动调度 真正的认知是:思考深度是有成本的(时间、token、用户耐心)。Agent-First 的成熟用户会主动为任务"挑档位",而不是默认全开 High。 2. Harness —— Agent 的行动边界 Harness 指 Agent 能做什么、不能做什么的运行环境。Copilot Chat 面板就是 harness,它决定了 Agent 是"嘴上说说"还是"动手执行"。 三种模式构成了一个渐进信任阶梯: · Ask:只对话,不动文件 - 探索、问问题、学习代码 · Plan:列出步骤,等你批准 - 方案讨论、风险大的改动 · Agent:自主规划、执行、迭代 - 方向明确、需要落地的任务 关键洞察:从 Ask → Plan → Agent 是从"我主导"到"它主导"的权力让渡。强行一上来用 Agent 模式做模糊任务,等于让一个不了解情况的人替你做决定——失控是必然结果。 3. Context —— Agent 的"视野" 模型本身不知道你的代码库。Context 是它做对事的前提。 Copilot 获取 context 的方式分两类: · 自动:搜索 workspace、读取相关文件 · 手动(更可靠):用 # codebase、# file、# fetch 显式指定 这是最容易被低估的一环。多数"Agent 改坏了代码"的案例,根因不是模型不行,而是它根本没看到关键文件就开始猜。显式提供 context 不是冗余,是控制变量。 4. Prompt —— 意图的精度 Prompt = 目标 + 约束 + 验收标准。 "帮我加个登录功能" 和 "在 auth/ 目录下用现有的 SessionService 实现邮箱登录,复用 LoginForm 组件,错误信息走 toast,不要引入新依赖" 得到的结果完全不同。 专业用户的 prompt 通常包含: · 要做什么(goal) · 在哪里做(scope) · 不能做什么(constraints) · 怎么算完成(acceptance) 模糊的输入只能换来通用的输出。 5. Tools —— Agent 的"手" Tools 是 Agent 实际能调用的能力:读文件、跑命令、搜索、调 API、跑测试…… Tools 越多越强,但也意味着爆炸半径越大。Agent-First 的纪律是: · 给它需要的工具,不给不必要的工具 · 危险操作(删库、推 main、改 prod 配置)应当显式审批 · 工具链应可观测——Agent 跑了什么命令、改了什么文件,必须可见可回滚 整体框架:五个旋钮,而不是五个步骤 结果差 = f(模型档位错 × 载体模式错 × 上下文缺失 × 提示模糊 × 工具不够/太多) Agent-First Development 的本质是承认一件事:写代码的主体正在从"人 + 编辑器"变成"人 + Agent + 编辑器"。人的角色从"打字员"转向"模型选择者、上下文提供者、意图定义者、边界设定者"。 VS Code Learn 系列视频 https://www.youtube.com/playlist?list=PLj6YeMhvp2S4l1_iP4-pS6p7lgyqKo-Ix

译VSCode团队提出Agent-First Development框架,核心理念是开发主体从“人+编辑器”转向“人+Agent+编辑器”,人的角色转变为选择模型、提供上下文、定义意图和设定边界。五大支柱为:模型(匹配任务深度,按需选择思考档位)、执行边界(从问答到自主规划的渐进信任模式)、上下文(显式提供关键信息以避免错误)、提示(需清晰包含目标、范围与约束)与工具(能力需可控、可审计)。该框架旨在系统化指导人与AI代理高效协作开发。

宝玉@dotey · 5月22日57

微软开始大规模收回内部员工的 Claude Code 许可证,要求开发者转向自家的 GitHub Copilot CLI。 据 The Verge 报道,微软去年 12 月开始在内部推广 Claude Code,鼓励项目经理、设计师等非技术岗位尝试用 AI 写代码。半年下来,Claude Code 在微软内部非常受欢迎,但这个受欢迎反而成了问题:它让微软自家刚推出的 GitHub Copilot CLI 显得尴尬了。 Copilot CLI 是 GitHub Copilot 的命令行版本,跟 Claude Code 的定位高度重叠。微软负责 Windows、Microsoft 365、Outlook、Teams 和 Surface 的 Experiences + Devices 团队,已经要求工程师在 6 月底前完成迁移,全面切换到 Copilot CLI。 微软对内的说法是统一工具链,但知情人士透露,背后也有成本考量。毕竟每个 Claude Code 的 license 费用都是交给竞争对手 Anthropic 的。 据悉,被要求迁移的工程师对此并不情愿。

译微软已开始大规模收回内部员工对Anthropic公司Claude Code工具的访问权限,要求开发者转向自家的GitHub Copilot CLI。尽管Claude Code在微软内部广受欢迎,但其成功反而凸显了自家Copilot CLI的定位尴尬。微软以统一工具链为由推动此次迁移,但核心考量也包括将支付给竞争对手Anthropic的成本收回。此举已引发被要求迁移工程师的普遍抵触。

meng shao@shao__meng · 5月22日70

AI 补贴时代终结了吗? @HedgieMarkets 认为:AI 服务的"包月时代"正在结束,按 token 计费正在成为行业默认 · 微软取消内部 Claude Code:理由是基于 token 的计费模式让成本"难以承受",即便对一家拥有近乎无限云资源的公司也是如此。 · Uber 的 CTO 内部备忘录:警告公司在四个月内烧光了 2026 年全年的 AI 预算。 · 行业定价层面的变化:美国 AI 软件价格上涨 20%–37%,GitHub 正在全线产品中放弃固定费率套餐,转向按用量计费。 摆在面前的两条路,都不太好走 路径 A:维持当前价格 · 企业缩减 AI 用量以适配预算 · AI 公司收入增长放缓,而 labs 正需要营收来支撑 IPO 前的估值 路径 B:AI 公司降价 · 企业用量恢复 · 单位经济性进一步恶化,亏损扩大 Hedgie 用了一张典型的"利润剪刀差"图 · 绿色曲线(Per-Seat Revenue):按席位收费的订阅收入,呈温和上升; · 红色曲线(Per-Token AI Compute Cost):按 token 计的算力成本,呈指数式上扬; · 两线在右侧拉开巨大缺口,标注为 "Profit Collapse(利润崩塌)"。 只要定价单位(per-seat)和成本单位(per-token)不匹配,使用量越大,亏损越深。这正是 Claude Code、Codex、Cursor 等"包月制 AI 编程工具"目前面临的结构性问题,也解释了为什么 GitHub 要放弃 flat-rate。

译AI服务定价正从包月制转向按用量计费,微软、Uber等企业因成本压力缩减AI预算。行业面临两难:维持价格将抑制使用量并影响AI公司收入增长,降价则会加剧亏损破坏经济性。核心矛盾在于固定订阅收入与指数增长的算力成本不匹配,形成利润剪刀差,这是AI编程工具及整个行业面临的结构性挑战。

Rohan Paul@rohanpaul_ai · 5月22日65

The Information: Anthropic is currently in early-stage talks to lease and deploy Microsoft's custom AI chips for inference workloads. Microsoft is pitching Maia 200 as a cheaper way to run some AI inference, and claims maia 200 is more cost-effective than nvidia chips for certain inference jobs. Maia 200 is Microsoft’s second-generation AI accelerator, built on TSMC 3nm, with FP8/FP4 math, 216GB HBM3e, 7TB/s bandwidth, and 272MB SRAM, which makes it aimed at feeding large models fast rather than teaching them from scratch. Anthropic already committed $30B to Azure, Microsoft may invest up to $5B in Anthropic, and Claude is already tied into Microsoft’s Copilot stack, so the chip talks are also a customer-supplier feedback loop. IMO, Maia does not need to beat Nvidia everywhere to matter, because a cheaper chip for narrow, high-volume inference jobs can still shift billions of tokens away from GPUs. --- theinformation .com/articles/anthropic-talks-use-microsofts-ai-chips

译据The Information报道,微软正向AI公司Anthropic推销其第二代AI芯片Maia 200,强调该芯片在特定推理任务中比NVIDIA芯片更具成本效益。Maia 200专注于高速推理而非训练,双方已有深度合作基础:Anthropic已在Azure承诺300亿美元支出,且Claude已整合进微软Copilot。此次芯片合作旨在深化协同。分析认为,Maia 200无需全面超越NVIDIA,只要能在高量推理中提供更低成本选项,便可能将部分计算需求从GPU转移。

Berryxia.AI@berryxia · 5月21日62

兄弟们,看来微软的Copilot 是真的自己都懒得用! 这不微软今天办了一场Claude 使用的的工作坊! 花半小时看完它,还是不错的! 高级开发者布道师Marlene Mangami直接拉着大家动手,用Foundry + Claude建了一个真实可用的AI Agent。 他们没讲空洞概念,而是用一家叫Sparkles的纸杯蛋糕店做案例: 顾客涌进来点单、选口味、生成客户ID、处理优惠券、准备取货……全流程让Agent自动接管。 从部署云模型,到接入MCP服务器连工具和数据源,再到给Agent赋予企业级安全和可观测性,一步一步教完。 现场还直接用Skillable环境让大家跟着敲代码,完成就送纸杯蛋糕。 AI Agent终于不是实验室玩具,而是开发者能快速从原型做到生产落地的真实工具。

译微软举办Claude使用工作坊,通过构建纸杯蛋糕店AI Agent的案例,演示了从部署云模型、接入MCP服务器连接工具与数据源,到赋予企业级安全与可观测性的完整流程。工作坊以实操为主,开发者可现场跟随编码,强调AI Agent已从概念验证进入快速生产落地的实用阶段,成为开发者能直接构建的业务工具。

Microsoft Research@MSFTResearch · 5月20日62

Equipping communities to influence AI through involvement in AI development pipelines can improve AI and help communities realize the potential AI has to serve them well. https://news.microsoft.com/source/features/ai/why-better-ai-starts-with-the-people-it-often-misses/

译让社区通过参与AI开发流程来影响AI,可以改善AI,并帮助社区认识到AI为其提供良好服务的潜力。

Microsoft Research@MSFTResearch · 5月19日51

New in Research Focus: Cloud efficiency, smarter agentic cost reduction, a randomized trial on 3D telemedicine, and an open call for inclusive AI language projects in Africa. https://msft.it/6010vTpuG

译研究聚焦新动态:云效率、更智能的智能体成本削减、3D远程医疗随机试验,以及面向非洲包容性AI语言项目的公开征集。

Rohan Paul@rohanpaul_ai · 5月18日58

Microsoft’s AI chief is warning that AI may automate most computer-based professional tasks within 12 to 18 months. Mustafa Suleyman’s claim targets work done through screens, documents, email, spreadsheets, code, dashboards, tickets, contracts, campaigns, and project trackers, because these jobs turn human intent into digital instructions that an AI agent can increasingly read, plan, execute, and revise. The risky jobs are not risky because they are low-skill, but because many expensive office tasks are repeatable patterns of reading, writing, comparing, filing, summarizing, searching, and deciding under known rules. --- fortune .com/article/why-microsoft-ai-chief-mustafa-suleyman-predicts-ai-automation-18-months/

译微软AI业务负责人Mustafa Suleyman警告,AI可能在12到18个月内实现对大多数基于计算机的专业任务的自动化。他指出,这类工作的核心是将人类意图转化为数字指令(如处理文档、邮件、代码、项目管理等),而这正是AI代理日益能够阅读、规划、执行并修正的流程。其风险并非源于技能门槛低,而在于许多高成本的办公任务本质上是重复性的阅读、书写、比较、归档、总结、搜索和基于已知规则的决策模式。

Chubby♨️@kimmonismus · 5月18日61

Former Microsoft VP says Microsoft missed the AI wave like the internet and mobile, as Copilot scales back in Windows 11 Microsoft spent $37.5B per quarter on AI. Less than 3.3% of Microsoft 365 users pay for Copilot. OEMs stuffed NPUs into every laptop, and not a single k1ller use case materialized in Windows or Office. That's a distribution-first company learning that distribution doesn't work when the product doesn't pull. However: The same former VP who calls this a failure also says Microsoft's enterprise moat is unbreakable. Both things are true simultaneously and that tension is exactly why the next 18 months matter more than the last 18.

译前微软高管指出,尽管微软每季度投入巨额资金于AI,但其Copilot等产品的实际用户付费率极低,未能有效激发市场热情。硬件厂商在笔记本电脑中内置NPU芯片,却未能催生出具有吸引力的杀手级应用,这反映出即使是擅长分发的巨头,若产品本身缺乏足够的拉动力,也难以取得成功。与此同时,该高管也强调微软在企业市场拥有的强大护城河依然稳固。这种矛盾的现状,使得未来18个月对微软AI战略的走向至关重要。

Chubby♨️@kimmonismus · 5月17日75

Mustafa Suleyman says 18 months until AI automates all white-collar work. Microsoft AI CEO Mustafa Suleyman predicts "human-level performance on most professional tasks" within 18 months. Accounting, legal, marketing, project management, all fully automated. "Suleyman predicted “human-level performance on most, if not all professional tasks” being done by AI. Most tasks that involve “sitting down at a computer” will be fully automated by AI within the next year or 18 months, he said, naming accounting, legal, marketing, and even project management as vulnerable." (Fortune) Suleyman says his mission is building "superintelligence" and that creating a new AI model will soon be "like creating a podcast or writing a blog." Via Fortune

译微软AI CEO Mustafa Suleyman预测,AI将在18个月内实现人类水平的性能,自动化大多数专业任务,包括会计、法律、营销和项目管理。他在Fortune采访中指出,所有涉及“坐在电脑前”的白领工作都将被AI完全取代。Suleyman透露自己的使命是构建“超级智能”,并展望未来创建新AI模型将像制作播客或写博客一样便捷。

Chubby♨️@kimmonismus · 5月17日25

2026 has been the craziest - and honestly the best - year of my life so far. - I got to attend NVIDIA GTC and speak on camera with two NVIDIA VPs about some of the most exciting topics in AI: with Ming-Yu Liu about world models, and with Kari Briski about Nemotron. I also got to experience autonomous driving powered by NVIDIA’s “Alpamayo.” - A month later, I traveled to China for the first time and visited XPeng, where I saw their humanoid robots, learned more about their autonomous driving efforts, and had some truly fascinating conversations. - On Monday, I’m heading back to California for Google I/O. And I hope I’m allowed to say this much already: it looks like I’ll have the chance to do some very exciting interviews with people from Google, which I’ll share afterwards. - One week later, I’ll be back in the US again for Microsoft Build, my third trip to the States in just a few months, to cover the event and see what Microsoft is about to unveil. I’ve only just started editing and uploading the conversations, vlogs, and behind-the-scenes footage from all of this. I really hope you’ll enjoy watching them. I never thought I would ever get to do something like this. It is, without a doubt, the most amazing and exciting thing I’ve ever done. The only downside: every time I leave, I have to say goodbye to my 10-month-old son for a week. And honestly, that part is really hard. Thank you all for being part of this journey! Seriously! I’ll keep you posted - especially starting Monday. :)

译作者回顾2026年密集参与的全球顶级科技活动。在NVIDIA GTC期间,与副总裁探讨世界模型和Nemotron等AI前沿话题,并体验了NVIDIA Alpamayo自动驾驶系统。随后首次访问中国小鹏汽车,考察其人形机器人及自动驾驶进展。即将启程参加Google I/O和微软Build大会,计划进行深度采访并报道最新技术发布。作者正整理多场对话、幕后影像,坦言旅程唯一遗憾是与幼子的短暂分别。

Rohan Paul@rohanpaul_ai · 5月17日42

Satya Nadella's energy is something here. 🔥 "Tokens per Dollar per Watt" The new equation for the AI age for every Company or Industry or Country. "And that means Infrastructure, Infrastructure and Infrastructure."

译Satya Nadella的能量在此彰显。🔥 “每瓦特每美元的Token数” 这是每个公司、行业或国家在AI时代的新公式。 “这意味着基础设施、基础设施,还是基础设施。”

ginobefun@hongming731 · 5月17日55

下一个企业战场不是模型:而是智能体控制平面 过去两年,大家关注企业 AI 的视角主要是「哪个模型更好」,谁的基准更高,谁的上下文更长,谁的推理更准。VentureBeat 这篇调查报告提出了一个不同的框架:这个维度的竞争已经进入下半场,真正的战场正在转移到「智能体控制平面」。 什么叫控制平面?简单说,就是智能体干活的时候用到的基础设施:它怎么规划任务,怎么调用工具,怎么访问数据,怎么向安全团队证明它没有越权。这一层,决定了企业能不能放心地部署 AI、能不能在内部推广开、出了事有没有地方追责。 调查数据很清晰。微软以 38.6% 份额领跑,从一月份的 35.7% 继续增长;OpenAI 以 25.7% 位居第二;Anthropic 则是第一次出现在这个追踪器里,以 5.7% 入局。5.7% 绝对值不大,但它的意义在于「从零到有」,说明Anthropic 的 Claude 正在从「被调用的模型」变成「参与编排的基础设施」。 还有一个数据更值得关注:企业在选编排平台时,排第一位的考量是安全与权限管理,而不是模型性能。这直接说明企业买家的决策逻辑:我不只是在选一个更聪明的助手,我在选一个能对内部审计、安全团队、合规流程负责的基础设施。这个评估标准,对那些从「安全可信」角度建立品牌的厂商来说是利好。

译企业AI的竞争维度正从模型性能转向智能体控制平面,即管理AI任务规划、工具调用、数据访问与安全权限的基础设施层。VentureBeat调查显示,微软以38.6%份额领先,OpenAI占25.7%,Anthropic首次以5.7%进入榜单,标志其Claude从被调用模型转变为编排基础设施。企业选择编排平台时,安全与权限管理已超越模型性能成为首要考量,反映企业更重视部署AI时的合规、审计与责任归属。

Microsoft Research@MSFTResearch · 5月15日67

New tools, models, repos, and papers out of Microsoft Research are here. Use AI and agents? It's worth watching: • MagenticLite from MSR AI Frontiers • Agentic GitHub workflows • Verification‑first agents • Meaning‑matching fine‑tuning • AI transition + the economy

译微软研究院的新工具、模型、代码库和论文现已发布。 使用AI和智能体?值得关注: • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先智能体 • 意义匹配微调 • AI转型与经济发展

Microsoft Research@MSFTResearch · 5月15日51

New tools, models, repos, and papers out of Microsoft Research are here. Use AI and agents? It's worth watching: • MagenticLite from MSR AI Frontiers • Agentic GitHub workflows • Verification‑first agents • Meaning‑matching fine‑tuning • AI transition + the economy

译微软研究院的新工具、模型、代码库和论文现已发布。 使用AI和智能体?值得关注: • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先型智能体 • 意义匹配微调 • AI转型与经济发展

Microsoft Research@MSFTResearch · 5月14日44

New releases from Microsoft Research, live in 1 hour. Join for ai that runs your repo + verification-first research + more. 👉 https://msft.it/6014vRGqK ⏰ 9 AM PT/12 PM ET 💬 Join live + ask questions in chat

译微软研究院新发布,一小时后直播。 加入我们,了解运行代码库的AI + 验证优先研究 + 更多内容。 👉 https://msft.it/6014vRGqK ⏰ 太平洋时间上午9点/东部时间中午12点 💬 参与直播 + 在聊天中提问

meng shao@shao__meng · 5月14日58

Meta 收购 Manus 时,第一反应是: Microsoft 要收购 GenSpark 了吧,这可能是 Microsoft 唯一的选择 但后来 OpenClaw 很快就横空出世,Manus 的产品形态变得更普遍甚至被超越,Meta 一时间变成了“冤大头”,随即后面商务部叫停了收购,Meta 也算是意外免去了损失 在 Hermes Agent 等一众 OpenClaw 接替产品,和 Codex、Claude Code 等不断变成通用 Agent 的时间点,留给 GenSpark 和 Manus 的方向是什么呢?

Ethan Mollick@emollick · 5月14日64

“Whimsey attacks” that seem absurd (“I cannot pay that much because of the Geneva Convention”) work against AI agents as guardrails are weak against out-of-distribution arguments. Smaller models fall often, but it even gives an edge against bigger ones. https://www.microsoft.com/en-us/research/articles/whimsical-strategies-break-ai-agents-generating-out-of-distribution-adversarial-strategies-at-scale/

译看似荒谬的“荒诞攻击”(例如“根据日内瓦公约我无法支付这么多”)对AI代理有效,因为防护机制难以应对非常规论点。较小模型常被攻破,但即使较大模型也略受影响。https://www.microsoft.com/en-us/research/articles/whimsical-strategies-break-ai-agents-generating-out-of-distribution-adversarial-strategies-at-scale/

🚨 AI News | TestingCatalog@testingcatalog · 5月14日60

Microsoft is exploring a deal to acquire Inception, an AI lab that recently released Mercury 2, the world's first reasoning diffusion LLM, according to Reuters. Imagine diffusion Copilot 👀

译据路透社报道,微软正在探索收购Inception的交易,该AI实验室近期发布了全球首个推理扩散大语言模型Mercury 2。 想象一下扩散版Copilot 👀

Microsoft Research@MSFTResearch · 5月14日44

Introducing GridSFM, a small foundation model that can predict AC optimal power flow in milliseconds, boosting efficiency and unlocking cost savings. Learn how GridSFM gives grid operators direct visibility into congestion, stability, and system health: https://msft.it/6018vucjs

译介绍GridSFM——一个能在毫秒内预测交流最优潮流的小型基础模型,可提升效率并实现成本节约。 了解GridSFM如何帮助电网运营商直接掌握拥堵、稳定性和系统健康状况:https://msft.it/6018vucjs

Peter Steinberger 🦞@steipete · 5月13日68

Kudos to Microsoft, they're helping to get OpenClaw ready for enterprises.

译感谢微软,他们正助力OpenClaw做好企业级准备。

Satya Nadella@satyanadella · 5月13日68

Our new multi-model agentic security system brings together more than 100 specialized agents across frontier and custom models to find exploitable bugs, delivering top performance on the CyberGym benchmark. We used it ahead of Patch Tuesday to help find and fix 16 vulnerabilities. Today we’re announcing that customers can sign up to test it in private preview. https://www.microsoft.com/en-us/security/blog/2026/05/12/defense-at-ai-speed-microsofts-new-multi-model-agentic-security-system-tops-leading-industry-benchmark/?v=1

译微软推出新型多模型智能体安全系统,整合了超过100个基于前沿和定制模型的专用智能体,用于发现可利用的安全漏洞。该系统在CyberGym基准测试中取得了顶级性能。在最近的Patch Tuesday之前,该系统已帮助发现并修复了16个漏洞。微软宣布客户现可申请加入该系统的私有预览测试。

Emad@EMostaque · 5月13日67

Trial lawyers missed a great chance to ask everyone on the stand, under oath, what their definition of AGI is

译在宣誓作证中,山姆·奥特曼明确了OpenAI与微软知识产权授权协议的关键条款。OpenAI将知识产权分为研究IP和产品IP。微软目前已不再拥有研究IP的权利,但可继续获得产品IP授权直至2032年底。核心条款是,一旦达成通用人工智能(AGI),微软将彻底失去获取后续研究IP的权限。此外,微软的商业化权利仅限于OpenAI自身或与合作伙伴已商业化的产品;若OpenAI出于安全等原因决定不将某些研究商业化,微软同样无法获得。

Microsoft Research@MSFTResearch · 5月12日62

MatterSim is expanding what AI can do for materials science—from faster large-scale simulations to MatterSim-MT, a new multi-task model for simulating properties beyond potential energy surfaces alone. https://msft.it/6017vPamT

译MatterSim正在拓展AI在材料科学中的应用边界——从更快速的大规模模拟,到全新多任务模型MatterSim-MT,可模拟超越势能面的多种物性。https://msft.it/6017vPamT

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月30日
06:20
🚨 AI News | TestingCatalog@testingcatalog
60
Microsoft ❤️ NVIDIA > NVIDIA GTC 主题演讲将于6月1日举行 > Microsoft Build 主题演讲活动将于6月2日举行 > Windows和NVIDIA的账号都预告了即将发布的公告,称"PC的新时代"。 新的Windows硬件即将到来 👀

Microsoft: Loud and clear. #MSBuild kicks off on June 2.

Microsoft端侧行业动态
5月29日
18:20
🚨 AI News | TestingCatalog@testingcatalog
56
微软宣布对其365 Copilot进行重大重新设计,现在看起来非常像ChatGPT。 考虑到在当前用户体验上投入的大量用户研究时间,这完全合乎情理。 ChatGPTfy 👀

Satya Nadella: We've redesigned Copilot to be simpler, faster, and more intuitive, to help keep you in the flow of your work. Try it ou...

Microsoft产品更新
17:15
Rohan Paul@rohanpaul_ai
60
SkillOpt:实现智能体技能自我进化的执行策略

微软提出SkillOpt方法,旨在改进AI智能体技能的优化过程。其核心思想是将一个独立的技能文档视为优化对象,而非直接修改底层大语言模型。该方法让智能体尝试任务,分析成功与失败案例,然后由一个更强的优化器模型对技能文档进行小幅编辑。编辑只会在提升验证集表现时被接受,从而确保技能的稳定改进。在6个基准测试、7个目标模型和3种智能体设置(包括直接聊天、Codex和Claude Code)的共52个测试案例中,SkillOpt均达到最佳或并列最佳。在GPT-5.5上,它将直接聊天的平均准确度提升了23.5点。最终产出的技能文件可读、可移植且可复用,部署时无需重新训练模型。

智能体Microsoft数据/训练论文/研究
01:37
Satya Nadella@satyanadella
64
我们重新设计了 Copilot,使其更简洁、更快速、更直观,帮助您保持工作流畅。 试用:https://www.microsoft.com/en-us/microsoft-365/blog/2026/05/28/introducing-a-new-design-for-microsoft-365-copilot/?v=1
Microsoft产品更新
00:22
Microsoft Research@MSFTResearch
63
Data Formulator 为企业数据工作流引入了 AI 驱动的分析功能。数据团队可以轻松将企业数据带入一个 AI 就绪的工作空间,用户可以使用 AI 智能体来探索、分析和可视化数据,将原始数据转化为可操作的洞察:https://msft.it/6013vZzUl
智能体Microsoft产品更新
5月28日
23:06
Perplexity@perplexity_ai
精选77
Perplexity Computer现已登陆Microsoft Excel、Word、PowerPoint和Outlook。 您可以在应用程序的侧边栏中直接使用Computer来协调工作,起草文档、建模、制作演示文稿并处理电子邮件。 现已推出:https://www.perplexity.ai/hub/products/integrations/microsoft
智能体Microsoft产品更新

推荐理由:Perplexity把Computer塞进Office全家桶,侧栏里就能写文档、做表格、理邮件。对每天跟Office打交道的人,这是个无需切换工作流的原地升级。
22:42
Chubby♨️@kimmonismus
56
微软将于 Build 大会发布自研 AI 模型,定位为更廉价替代品

微软计划在下周的 Build 大会上发布其自研 AI 模型,旨在成为 OpenAI 和 Anthropic 的更廉价替代方案。据报道,依赖 Anthropic 的 Claude 迫使微软提高了 GitHub Copilot 的价格并限制了开发者的实际使用量。尽管通过协议在 2032 年前可免费使用 OpenAI 模型,但微软正投入巨资以期在协议到期后减少依赖。负责 AI 模型的 Suleyman 团队两年来未在任何基准测试中领先,其解释称是受与 OpenAI 的协议限制,直至今年四月才可训练前沿模型。此次发布时机值得关注。

Microsoft模型发布行业动态
00:12
Microsoft Research@MSFTResearch
30
将AI理解为人类智能的延伸--而非其替代品--为构建可信赖的AI系统提供了一条更扎实的路径。了解更多:https://msft.it/6010vkoHk
Microsoft安全/对齐现象/趋势
5月27日
09:00
meng shao@shao__meng
71
微软发布终端原生 Web Agent 框架:Webwright

微软开源了终端原生Web Agent框架Webwright。其核心创新是“代码即动作”:让大语言模型直接编写可执行的Playwright Python脚本,而非传统的“观察-预测-点击”循环,由此生成的程序可复用。在性能上,基于GPT-5.4在Odysseys长程任务基准上达60.1%,较此前SOTA提升15.6个百分点;基于Claude Opus 4.7在难例上达80.5%,超越GPT-5.4。框架架构极简,核心代码约1000行,并已与Claude Code、OpenAI Codex等集成。用户评论表达了对该工具在浏览器自动化方面相比Playwright能带来巨大提升的期待。

Omar Shahine: Need to try this. Hoping for massive boost over Playwright for browser automation. https://github.com/microsoft/webwrigh...

智能体Microsoft开源/仓库
07:21
karminski-牙医@karminski3
69
微软等发布SkillOpt框架,用机器学习流程系统优化AI智能体技能

微软联合上海交通大学等机构发布SkillOpt框架,旨在通过机器学习流程系统性地优化AI智能体的技能。该框架引入独立的优化器模型,通过harness闭环流程对技能进行编辑,且每次编辑必须在验证集上带来分数提升才被接受。框架设置了每步4到8个编辑操作的学习率预算,使核心修改控制在1到4个。实验表明,优化后的技能可使GPT-5.5的对话准确率提升23.5分。

智能体arXivMicrosoft数据/训练
5月26日
22:10
Microsoft Research@MSFTResearch
62
AI能否理解人类价值观的现实复杂性?微软亚洲研究院的全新全球AI价值观挑战赛,诚邀哲学、伦理、法学和社会科学领域的研究人员共同探索。立即注册:https://msft.it/6012vk8OO
Microsoft安全/对齐行业动态
5月25日
23:54
elvis@omarsar0
66
微软研究院提出SkillOpt方法,通过优化器自动学习AI智能体技能文档

微软研究院提出了SkillOpt方法,将AI智能体的技能文档视为可训练的外部状态,而非由工程师手动编写。该方法利用一个优化器模型对技能文件进行验证门控编辑,通过添加、删除或替换指令来优化文档,并引入文本学习率控制每轮重写力度,而智能体本身保持不变。实验显示,在全部52个测试单元(涵盖不同模型、基准测试和工具链)中,SkillOpt均达到最佳或并列最佳。具体在GPT-5.5上,相比无技能文档,SkillOpt在直接聊天、Codex和Claude Code下分别取得23.5、24.8和19.1分的提升,超越人类手写技能及其他自动化方法,且不增加推理时开销,学到的技能还能跨模型和工具链迁移。

智能体Microsoft论文/研究
5月24日
11:20
meng shao@shao__meng
33
懂了,程序员生存之道: token 别降价,我要降价 😂

geniusvczh: 微软已经开始觉得token比人贵了🤪

Microsoft大佬观点编码
5月23日
21:27
Rohan Paul@rohanpaul_ai
74
微软以AI实践"精益知识工作"降本增效

Satya Nadella透露微软正借鉴丰田精益生产原则,将“精益知识工作”理念应用于内部AI运营。通过计算AI投资回报并利用其成本削减效应,微软在白领工作中部署AI以优化流程。例如,微软每年在客户支持业务上支出约40亿美元,通过部署AI代理处理前端问题分流及为支持人员提供实时推理协助,在Xbox和Azure等支持领域大幅降低了成本。

智能体Microsoft大佬观点
03:08
Replit ⠕@Replit
56
Replit在微软Build 2026活动中被@msft4startups重点推介,是构建Azure并解决企业实际问题的创业公司之一。该计划聚焦于弥合AI演示与生产环境实际运行之间的鸿沟,入选的初创公司正通过Azure平台将技术方案落地。

Microsoft for Startups: The startups joining us at #MSBuild 2026 are working on the problems that sit between a promising AI demo and something ...

Microsoft行业动态
5月22日
18:56
Chubby♨️@kimmonismus
70
微软因token费用过高取消了内部Claude Code授权,凸显出企业AI使用成本正急剧上升。这标志着AI补贴时代的终结,基于使用量的定价模式正迫使企业面对大模型运行的高昂成本。企业面临两难:缩减AI投入会影响AI实验室的增长目标;若实验室降价则会损害自身盈利。两种路径都指向当前成本模式难以为继,最终可能需进行资产减值。

Hedgie: 🦔Microsoft canceled its internal Claude Code licenses this week after token-based billing made the cost untenable, even...

AnthropicMicrosoft现象/趋势
15:46
meng shao@shao__meng
66
VSCode Agent-First Development五大支柱解析

VSCode团队提出Agent-First Development框架,核心理念是开发主体从“人+编辑器”转向“人+Agent+编辑器”,人的角色转变为选择模型、提供上下文、定义意图和设定边界。五大支柱为:模型(匹配任务深度,按需选择思考档位)、执行边界(从问答到自主规划的渐进信任模式)、上下文(显式提供关键信息以避免错误)、提示(需清晰包含目标、范围与约束)与工具(能力需可控、可审计)。该框架旨在系统化指导人与AI代理高效协作开发。

Microsoft Developer: The @code team released a new Introduction to Agent-First Development series. It breaks down these 5 pillars behind grea...

智能体Microsoft教程/实践编码
10:43
宝玉@dotey
57
微软内部收回Claude Code权限,力推自家Copilot CLI

微软已开始大规模收回内部员工对Anthropic公司Claude Code工具的访问权限,要求开发者转向自家的GitHub Copilot CLI。尽管Claude Code在微软内部广受欢迎,但其成功反而凸显了自家Copilot CLI的定位尴尬。微软以统一工具链为由推动此次迁移,但核心考量也包括将支付给竞争对手Anthropic的成本收回。此举已引发被要求迁移工程师的普遍抵触。

Microsoft产品更新编码行业动态
08:42
meng shao@shao__meng
70
AI 补贴时代终结了吗?

AI服务定价正从包月制转向按用量计费,微软、Uber等企业因成本压力缩减AI预算。行业面临两难:维持价格将抑制使用量并影响AI公司收入增长,降价则会加剧亏损破坏经济性。核心矛盾在于固定订阅收入与指数增长的算力成本不匹配,形成利润剪刀差,这是AI编程工具及整个行业面临的结构性挑战。

Hedgie: 🦔Microsoft canceled its internal Claude Code licenses this week after token-based billing made the cost untenable, even...

AnthropicMicrosoft现象/趋势
02:26
Rohan Paul@rohanpaul_ai
65
微软正向Anthropic推销Maia 200 AI芯片

据The Information报道,微软正向AI公司Anthropic推销其第二代AI芯片Maia 200,强调该芯片在特定推理任务中比NVIDIA芯片更具成本效益。Maia 200专注于高速推理而非训练,双方已有深度合作基础:Anthropic已在Azure承诺300亿美元支出,且Claude已整合进微软Copilot。此次芯片合作旨在深化协同。分析认为,Maia 200无需全面超越NVIDIA,只要能在高量推理中提供更低成本选项,便可能将部分计算需求从GPU转移。

AnthropicMicrosoft推理行业动态
5月21日
11:09
Berryxia.AI@berryxia
62
微软Claude工作坊:AI Agent从原型到生产落地

微软举办Claude使用工作坊,通过构建纸杯蛋糕店AI Agent的案例,演示了从部署云模型、接入MCP服务器连接工具与数据源,到赋予企业级安全与可观测性的完整流程。工作坊以实操为主,开发者可现场跟随编码,强调AI Agent已从概念验证进入快速生产落地的实用阶段,成为开发者能直接构建的业务工具。

智能体AnthropicMCP/工具Microsoft
5月20日
01:02
Microsoft Research@MSFTResearch
62
让社区通过参与AI开发流程来影响AI,可以改善AI,并帮助社区认识到AI为其提供良好服务的潜力。
Microsoft大佬观点
5月19日
00:39
Microsoft Research@MSFTResearch
51
研究聚焦新动态:云效率、更智能的智能体成本削减、3D远程医疗随机试验,以及面向非洲包容性AI语言项目的公开征集。
智能体Microsoft行业动态部署/工程
5月18日
21:41
Rohan Paul@rohanpaul_ai
58
微软AI负责人预警:专业岗位或面临快速自动化

微软AI业务负责人Mustafa Suleyman警告,AI可能在12到18个月内实现对大多数基于计算机的专业任务的自动化。他指出,这类工作的核心是将人类意图转化为数字指令(如处理文档、邮件、代码、项目管理等),而这正是AI代理日益能够阅读、规划、执行并修正的流程。其风险并非源于技能门槛低,而在于许多高成本的办公任务本质上是重复性的阅读、书写、比较、归档、总结、搜索和基于已知规则的决策模式。

智能体Microsoft大佬观点
16:05
Chubby♨️@kimmonismus
61
前微软高管:AI战略面临困境,企业优势与产品力矛盾并存

前微软高管指出,尽管微软每季度投入巨额资金于AI,但其Copilot等产品的实际用户付费率极低,未能有效激发市场热情。硬件厂商在笔记本电脑中内置NPU芯片,却未能催生出具有吸引力的杀手级应用,这反映出即使是擅长分发的巨头,若产品本身缺乏足够的拉动力,也难以取得成功。与此同时,该高管也强调微软在企业市场拥有的强大护城河依然稳固。这种矛盾的现状,使得未来18个月对微软AI战略的走向至关重要。

Microsoft大佬观点
5月17日
18:34
Chubby♨️@kimmonismus
精选75
微软AI CEO预测18个月内AI自动化所有白领工作

微软AI CEO Mustafa Suleyman预测,AI将在18个月内实现人类水平的性能,自动化大多数专业任务,包括会计、法律、营销和项目管理。他在Fortune采访中指出,所有涉及“坐在电脑前”的白领工作都将被AI完全取代。Suleyman透露自己的使命是构建“超级智能”,并展望未来创建新AI模型将像制作播客或写博客一样便捷。

Microsoft大佬观点现象/趋势

推荐理由:Microsoft AI 老大亲口说 18 个月内所有“坐电脑前的工作”都会被 AI 干掉,不是普通预测,是直接给全球白领贴了倒计时标签。虽然听着像吹牛,但他说这话的位置让我们不得不认真掂量。
16:34
Chubby♨️@kimmonismus
25
2026年科技盛会之旅:亲历AI与自动驾驶前沿

作者回顾2026年密集参与的全球顶级科技活动。在NVIDIA GTC期间,与副总裁探讨世界模型和Nemotron等AI前沿话题,并体验了NVIDIA Alpamayo自动驾驶系统。随后首次访问中国小鹏汽车,考察其人形机器人及自动驾驶进展。即将启程参加Google I/O和微软Build大会,计划进行深度采访并报道最新技术发布。作者正整理多场对话、幕后影像,坦言旅程唯一遗憾是与幼子的短暂分别。

GoogleMicrosoft其他
10:40
Rohan Paul@rohanpaul_ai
42
Satya Nadella的能量在此彰显。🔥 "每瓦特每美元的Token数" 这是每个公司、行业或国家在AI时代的新公式。 "这意味着基础设施、基础设施,还是基础设施。"
Microsoft大佬观点现象/趋势
07:54
ginobefun@hongming731
55
企业AI竞争焦点转向智能体控制平面

企业AI的竞争维度正从模型性能转向智能体控制平面,即管理AI任务规划、工具调用、数据访问与安全权限的基础设施层。VentureBeat调查显示,微软以38.6%份额领先,OpenAI占25.7%,Anthropic首次以5.7%进入榜单,标志其Claude从被调用模型转变为编排基础设施。企业选择编排平台时,安全与权限管理已超越模型性能成为首要考量,反映企业更重视部署AI时的合规、审计与责任归属。

智能体AnthropicMCP/工具Microsoft
5月15日
23:35
Microsoft Research@MSFTResearch
精选67
微软研究院的新工具、模型、代码库和论文现已发布。 使用AI和智能体?值得关注: • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先智能体 • 意义匹配微调 • AI转型与经济发展
智能体Microsoft开源/仓库行业动态

推荐理由:微软研究院这波把 agent 工具链摊开了,MagenticLite 轻量框架和 verification-first 思路值得跟,做智能体的可以去 GitHub 翻翻。
23:05
Microsoft Research@MSFTResearch
51
微软研究院的新工具、模型、代码库和论文现已发布。 使用AI和智能体?值得关注: • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先型智能体 • 意义匹配微调 • AI转型与经济发展
智能体MCP/工具Microsoft产品更新
5月14日
23:35
Microsoft Research@MSFTResearch
44
微软研究院新发布,一小时后直播。 加入我们,了解运行代码库的AI + 验证优先研究 + 更多内容。 👉 https://msft.it/6014vRGqK ⏰ 太平洋时间上午9点/东部时间中午12点 💬 参与直播 + 在聊天中提问
智能体Microsoft编码论文/研究
23:15
meng shao@shao__meng
58
科技并购变局与AI代理未来方向

Meta 收购 Manus 时,第一反应是: Microsoft 要收购 GenSpark 了吧,这可能是 Microsoft 唯一的选择 但后来 OpenClaw 很快就横空出世,Manus 的产品形态变得更普遍甚至被超越,Meta 一时间变成了“冤大头”,随即后面商务部叫停了收购,Meta 也算是意外免去了损失 在 Hermes Agent 等一众 OpenClaw 接替产品,和 Codex、Claude Code 等不断变成通用 Agent 的时间点,留给 GenSpark 和 Manus 的方向是什么呢?

Eric Jing: I'm very happy to have been invited to the Microsoft CEO Summit, and to see my former boss Satya again. ❤️

智能体MetaMicrosoft大佬观点
22:05
Ethan Mollick@emollick
64
看似荒谬的"荒诞攻击"(例如"根据日内瓦公约我无法支付这么多")对AI代理有效,因为防护机制难以应对非常规论点。较小模型常被攻破,但即使较大模型也略受影响。https://www.microsoft.com/en-us/research/articles/whimsical-strategies-break-ai-agents-generating-out-of-distribution-adversarial-strategies-at-scale/
智能体Microsoft安全/对齐
18:08
🚨 AI News | TestingCatalog@testingcatalog
60
据路透社报道,微软正在探索收购Inception的交易,该AI实验室近期发布了全球首个推理扩散大语言模型Mercury 2。 想象一下扩散版Copilot 👀

🚨 AI News | TestingCatalog: BREAKING 🚨: Inception has launched Mercury 2, the first reasoning diffusion LLM with 5x the performance of top-speed-op...

Microsoft推理行业动态
01:04
Microsoft Research@MSFTResearch
44
介绍GridSFM--一个能在毫秒内预测交流最优潮流的小型基础模型,可提升效率并实现成本节约。 了解GridSFM如何帮助电网运营商直接掌握拥堵、稳定性和系统健康状况:https://msft.it/6018vucjs
Microsoft论文/研究
5月13日
14:04
Peter Steinberger 🦞@steipete
68
感谢微软,他们正助力OpenClaw做好企业级准备。

Omar Shahine: New in @openclaw beta: one path scheme to rule them all. `openclaw path read|write|append` works the same across md, jso...

GitHubMCP/工具Microsoft开源/仓库
08:13
Satya Nadella@satyanadella
精选68
微软推出多模型AI安全系统,集成超百智能体高效发现漏洞

微软推出新型多模型智能体安全系统,整合了超过100个基于前沿和定制模型的专用智能体,用于发现可利用的安全漏洞。该系统在CyberGym基准测试中取得了顶级性能。在最近的Patch Tuesday之前,该系统已帮助发现并修复了16个漏洞。微软宣布客户现可申请加入该系统的私有预览测试。

智能体Microsoft产品更新部署/工程

推荐理由:微软把多模型代理系统用到安全漏洞挖掘上,100多个专业代理协作,在CyberGym基准拿了第一,做安全的朋友值得看看实际效果。
07:39
Emad@EMostaque
67
在宣誓作证中,山姆·奥特曼明确了OpenAI与微软知识产权授权协议的关键条款。OpenAI将知识产权分为研究IP和产品IP。微软目前已不再拥有研究IP的权利,但可继续获得产品IP授权直至2032年底。核心条款是,一旦达成通用人工智能(AGI),微软将彻底失去获取后续研究IP的权限。此外,微软的商业化权利仅限于OpenAI自身或与合作伙伴已商业化的产品;若OpenAI出于安全等原因决定不将某些研究商业化,微软同样无法获得。

morgan -: sam altman, under oath, clarifies that microsoft will lose access to openai's research IP "after AGI" sam: "we separated...

MicrosoftOpenAI行业动态
5月12日
21:31
Microsoft Research@MSFTResearch
62
MatterSim正在拓展AI在材料科学中的应用边界--从更快速的大规模模拟,到全新多任务模型MatterSim-MT,可模拟超越势能面的多种物性。https://msft.it/6017vPamT
Microsoft模型发布
‹ 上一页
1234567
下一页 ›