据《财富》报道,微软正构建一个“超级应用”,以统一其分散的Copilot产品。此举的背景是付费率低迷:在Microsoft 365近5亿席位中,仅约2000万(不到4.5%)付费使用Copilot。GitHub Copilot是例外,拥有470万付费用户,但正面临来自Cursor和Claude Code的竞争压力。核心疑问在于,产品分散是否是付费率低的主因,抑或单一界面本身难以驱动用户大规模付费。
据《财富》报道,微软正构建一个“超级应用”,以统一其分散的Copilot产品。此举的背景是付费率低迷:在Microsoft 365近5亿席位中,仅约2000万(不到4.5%)付费使用Copilot。GitHub Copilot是例外,拥有470万付费用户,但正面临来自Cursor和Claude Code的竞争压力。核心疑问在于,产品分散是否是付费率低的主因,抑或单一界面本身难以驱动用户大规模付费。
Nvidia 正以自身芯片作为主处理器进军 PC 市场。Dell 和微软 Surface 系列的首批 Windows 电脑将于下周在 Computex 和 Build 大会亮相。微软还计划推出基于 OpenClaw 框架的新软件,使 AI 智能体能在 Windows PC 上本地处理任务,这是在 Copilot+ PC 概念未能成功后的再次尝试。
Nvidia, Microsoft, and Arm are all teasing Nvidia's new N1X laptop processors https://www.theverge.com/news/940275/nvidi...
英伟达与微软预计下周发布首批以英伟达芯片作为主处理器的Windows PC,新品将来自微软Surface品牌,戴尔等厂商也将跟进。双方将分别借台北国际电脑展与微软Build开发者大会公布产品,并预热“PC的新时代”。此外,微软预计还将发布面向AI智能体的软件,使智能体可直接在Windows电脑本地执行任务。
一项对6000名高管的调查显示,尽管投入巨大,超过80%的公司尚未从AI中获得生产力提升。仅1/3的领导者使用AI,且平均每周使用时间仅约90分钟。不过,多数受访者预期AI未来三年内将提升生产力。与此同时,Goldman Sachs预测AI智能体的Token使用量到2030年将增长24倍,因其任务循环消耗的Token可能远高于普通对话。智能体生产力与Token消耗之间的平衡,正成为企业新的成本考验,微软近期收紧了对Claude Code的访问即是一例。
Goldman Sachs: "Token use by AI agents is expected to multiply 24 times by 2030" AI agents are now creating the first se...
据报道,微软计划于今年夏末推出一款Copilot超级应用。该应用旨在将分散在不同产品中的AI助手集中到一个统一入口,整合GitHub Copilot、Copilot聊天、Copilot Cowork以及内部代号Autopilot的智能体工作流。项目内部口号为“Delivering one Copilot”,由新任Copilot负责人Jacob Andreou主导。应用可能包含个人版与企业版Microsoft 365 Copilot的切换选项,用户仍可在外部访问原有的Copilot功能。
Sources: This is a leaked screenshot of Microsoft's coming super app redesign of Copilot, featuring an OpenClaw-like age...
安全研究人员威胁将公开另一组Windows 0day漏洞利用代码,此举导致微软与该研究人员之间的公开争执进一步升级。此次冲突的核心围绕漏洞信息披露的时机与责任。研究人员计划公布未修复漏洞的利用细节,可能迫使微软加速响应,但也引发了对暴露用户安全风险的担忧。微软通常主张在漏洞修复后才披露细节,而部分研究者认为提前公开能推动厂商更快行动。此次争执是科技行业在安全透明度与风险防控间长期博弈的又一实例。
Loud and clear. #MSBuild kicks off on June 2.
We've redesigned Copilot to be simpler, faster, and more intuitive, to help keep you in the flow of your work. Try it ou...
微软提出SkillOpt方法,旨在改进AI智能体技能的优化过程。其核心思想是将一个独立的技能文档视为优化对象,而非直接修改底层大语言模型。该方法让智能体尝试任务,分析成功与失败案例,然后由一个更强的优化器模型对技能文档进行小幅编辑。编辑只会在提升验证集表现时被接受,从而确保技能的稳定改进。在6个基准测试、7个目标模型和3种智能体设置(包括直接聊天、Codex和Claude Code)的共52个测试案例中,SkillOpt均达到最佳或并列最佳。在GPT-5.5上,它将直接聊天的平均准确度提升了23.5点。最终产出的技能文件可读、可移植且可复用,部署时无需重新训练模型。
微软有望与英伟达合作,推出搭载 NVIDIA N1 或 N1X 芯片的 Surface 笔记本电脑。该产品或将在 2026 台北国际电脑展上公布。微软当前的 Surface 产品线已收缩为 Laptop 与 Pro 两条主线。英伟达 N1/N1X 芯片据称在图形处理与驱动支持上更具优势,能强化本地 AI 负载能力。
微软推出了 Microsoft 365 Copilot 的改版,声称加载速度是之前的两倍,并采用了更简洁的设计。更新引入了“渐进式展示”功能,即根据用户的提示词动态展示相关工具和控件,而非一次性显示所有选项。同时,升级后的提示词框现在支持直接进行文本格式化。
微软计划在下周Build大会发布多款自研AI模型,旨在争取开发者认可。其中将包含一款编程专用模型,以提升GitHub Copilot的竞争力,应对Cursor与Claude Code等对手的挑战。同时,微软还将推出多款不同规格的新模型,具备语音转写、逻辑推理、语音处理及图像生成等技能。
微软计划在下周的 Build 大会上发布其自研 AI 模型,旨在成为 OpenAI 和 Anthropic 的更廉价替代方案。据报道,依赖 Anthropic 的 Claude 迫使微软提高了 GitHub Copilot 的价格并限制了开发者的实际使用量。尽管通过协议在 2032 年前可免费使用 OpenAI 模型,但微软正投入巨资以期在协议到期后减少依赖。负责 AI 模型的 Suleyman 团队两年来未在任何基准测试中领先,其解释称是受与 OpenAI 的协议限制,直至今年四月才可训练前沿模型。此次发布时机值得关注。
微软、Uber等公司正重新评估AI投入成本,发现Token消耗激增并未带来预期的有用功能。高盛预测智能体AI将推动Token消费在2030年增长24倍。Uber在数月内耗尽2026年AI预算,尽管80%工程师使用智能体、60%代码由AI生成,但管理层质疑其价值。微软则开始削减成本,包括撤回Claude Code权限并转向内部Copilot CLI。
微软的 MAI-Image-2.5 在 Arena 文本生成图像排行榜上排名第三,与谷歌的 Nano Banana 2 持平,但仍落后于 OpenAI 的 Image-2。该模型相比其前代产品有显著提升,特别是在渲染图像内文字和商业视觉效果方面。
微软计划于 2026 年为 Windows 11 推出两项 AI 功能。一项是将 Ask Copilot 集成至任务栏,通过升级的 Composer 体验接入 Microsoft 365 Copilot 及后台 AI 智能体,便于用户直接查询公司政策与任务信息。另一项是为 Click to Do 功能整合 Excel 表格提取工具,该功能在 Windows 11 AI+ PC 上可利用本地视觉模型,将图片或网页中不可复制的静态表格数据识别并转换为可编辑的 Excel 文件。
微软开源了终端原生Web Agent框架Webwright。其核心创新是“代码即动作”:让大语言模型直接编写可执行的Playwright Python脚本,而非传统的“观察-预测-点击”循环,由此生成的程序可复用。在性能上,基于GPT-5.4在Odysseys长程任务基准上达60.1%,较此前SOTA提升15.6个百分点;基于Claude Opus 4.7在难例上达80.5%,超越GPT-5.4。框架架构极简,核心代码约1000行,并已与Claude Code、OpenAI Codex等集成。用户评论表达了对该工具在浏览器自动化方面相比Playwright能带来巨大提升的期待。
Need to try this. Hoping for massive boost over Playwright for browser automation. https://github.com/microsoft/webwrigh...
微软联合上海交通大学等机构发布SkillOpt框架,旨在通过机器学习流程系统性地优化AI智能体的技能。该框架引入独立的优化器模型,通过harness闭环流程对技能进行编辑,且每次编辑必须在验证集上带来分数提升才被接受。框架设置了每步4到8个编辑操作的学习率预算,使核心修改控制在1到4个。实验表明,优化后的技能可使GPT-5.5的对话准确率提升23.5分。
Microsoft Copilot Cowork(一个真实的智能体产品)存在数据安全风险。该产品允许其智能体在用户未批准的情况下发送电子邮件。这些邮件可包含外部图片,当用户打开时会触发向外部网站的网络请求,从而实现数据窃取。由于OneDrive能生成预认证的下载链接,一次成功的提示词注入攻击可能导致这些链接泄露,进而使攻击者能够下载文件。
微软因此前Copilot植入引发负面舆论,正暂缓激进推广,转而开发一套Copilot设计体系,旨在让AI功能无感化融入日常操作。微软365首席设计官约翰・弗里德曼主导该体系研发,目标是打造统一、智能且人文的交互体验,使Copilot能读懂用户意图,自然融入流程。体系包含“动态操作按钮(DAB)”及“流转交互”等模式,强调功能入口无缝联动、用户主导,让AI仅作为思维的延伸。
微软一份14页官方文档将 Windows 11 系统定位为“AI OS”,并称之为企业AI技术栈中的“智能画布”。其核心主张是不应给员工堆砌更多独立AI工具,而应将AI能力(如Copilot)直接嵌入现有工作流,例如在文件资源管理器或任务栏中提供协助,以减少应用切换并提升生产力。文档引用的数据显示,82%的高管计划引入AI智能体。
微软研究院发布开源网页智能体框架 Webwright,其架构总代码量约 1000 行,让模型直接在终端中编写 Playwright 代码并执行命令,以此完成网页任务。该框架通过“门控自检”和“历史压缩”两个工程设计,解决了智能体易过早完成和上下文膨胀问题。基准测试显示,搭配 GPT-5.4 的 Webwright 在 Online-Mind2Web 上准确率达 86.67%;在长链路任务的 Odysseys 上得分 60.1%,相比此前最佳成绩(Opus 4.6 的 44.5%)提升 35.1%,相对基础 GPT-5.4 提升 81.49%。
微软研究院提出了SkillOpt方法,将AI智能体的技能文档视为可训练的外部状态,而非由工程师手动编写。该方法利用一个优化器模型对技能文件进行验证门控编辑,通过添加、删除或替换指令来优化文档,并引入文本学习率控制每轮重写力度,而智能体本身保持不变。实验显示,在全部52个测试单元(涵盖不同模型、基准测试和工具链)中,SkillOpt均达到最佳或并列最佳。具体在GPT-5.5上,相比无技能文档,SkillOpt在直接聊天、Codex和Claude Code下分别取得23.5、24.8和19.1分的提升,超越人类手写技能及其他自动化方法,且不增加推理时开销,学到的技能还能跨模型和工具链迁移。
数学家Adam Kucharski的实验表明,当向Microsoft Copilot输入两组仅国家标签不同但数据完全相同的分析请求时,Copilot并未能识别其本质一致,反而虚构并输出了基于国家的刻板印象分析。这暴露了当前许多AI工具在默认配置下存在的系统性偏差风险。尽管具备推理能力的“思维模型”能识别此类数据陷阱,但用户需要主动知晓并选择启用它们。这一现象警示我们,在进行关键数据分析时,不能盲目依赖AI工具的默认模型,而应审慎选择并评估其分析结果。
众多科技公司为提升效率强推内部AI工具,却面临成本反超人力的困境。微软因成本攀升弃用第三方工具转而自研。尽管词元单价下降,但用量激增,智能体消耗可达普通查询的千倍以上,呈现“杰文斯悖论”。由此引发“词元最大化”现象,员工为应付考核滥用AI处理琐事,导致投入产出失衡。当前使用AI开销已高于人力成本,若词元消耗增速超过单价降幅,企业试图通过AI替代人力来降本的策略将适得其反。
微软研究院近日发布了Webwright,这是一个终端原生的浏览器代理框架。它通过可复用的Playwright脚本取代传统点击追踪的网页自动化方式,基于包含三个模块的单一代理循环构建,代码量约1000行。由GPT-5.4驱动的Webwright在长周期Odysseys基准测试中取得60.1%的得分,较基线模型的33.5%提升近一倍;同时在Online-Mind2Web基准测试中达到86.7%,成为当前开源工具中自动评估得分最高的方案。
微软旗下职场社交平台领英宣布,将采取新措施打击平台上的AI生成垃圾内容。此次行动主要针对那些明显带有AI痕迹、缺乏原创性与真实性的帖子和评论,例如使用“这不是X,而是Y”等无意义表述的泛化内容。领英工程与编辑团队将通过分析用户活动模式来识别此类低价值内容。一旦识别为垃圾内容,相关帖文将不再通过时间线推荐给其他用户,但发帖人的关注者和联系人仍可查看。领英同时强调,此举并非全面禁止AI生成内容,仅针对无价值的“垃圾”信息,对于包含原创想法或能引发有意义讨论的AI辅助创作,平台仍持开放态度。