中国移动在杭州举行5G-A超级上行启航大会,发布技术演进白皮书并成立中试基地。超级上行技术通过5G-Advanced时频域聚合与多频协同,将终端上行速率从百兆级提升至1Gbps,满足AI时代高清视频回传、具身智能控制等需求。浙江移动已建成全国首个5G-A×AI大上行示范区,5G-A基站超2万站,现场实测网络峰值瞬间达1Gbps以上。
中国移动在杭州举行5G-A超级上行启航大会,发布技术演进白皮书并成立中试基地。超级上行技术通过5G-Advanced时频域聚合与多频协同,将终端上行速率从百兆级提升至1Gbps,满足AI时代高清视频回传、具身智能控制等需求。浙江移动已建成全国首个5G-A×AI大上行示范区,5G-A基站超2万站,现场实测网络峰值瞬间达1Gbps以上。
地平线发布车载智能体OS「咖咖虾(KaKaClaw)」,支持连续对话、多指令并行及模糊指令识别,可自动规划多条导航路线并具备无麦K歌功能。该系统首发搭载于奇瑞iCar V27车型,提供AIGC主题皮肤及主动服务推荐。安全层面采用沙箱机制,默认拦截未授权调用,隐私数据端侧处理。值得注意的是,咖咖虾将向英伟达、联发科、高通等第三方座舱芯片平台开放。
中国移动北京公司推出"算力 Token 套餐",采用词元计费模式,最低5.99元可购次包,24.99元含1000万词元月包。针对无云电脑用户,同步推出内置OpenClaw(龙虾)的云电脑融合套餐,开机即用且支持主流大模型。此举旨在降低AI使用门槛,解决本地部署复杂、成本高等痛点。目前该套餐已在北京、湖北、河南等地落地。
小米澎湃OS 3 Beta版已向小米17系列、Redmi K90 Pro Max等机型推送“龙虾”智能体Xiaomi miclaw。该智能体基于小米MiMo大模型,能让手机成为AI工具,理解用户意图后调用应用与系统工具完成任务。主要更新包括新增人格与技能体系、支持自然语言创建定时任务、可使用80多项系统工具,并预置了日程、沟通、办公等多场景一方助手。它还支持跨设备同步记忆和文件搜索传输,并可通过助手商店扩展能力。目前该产品仍属前沿探索,在稳定性与复杂场景处理方面持续优化。
受AI算力需求激增及先进制程产能瓶颈影响,AMD与英特尔CPU价格已在今年3月上调5%至20%。供应链消息显示,短缺将持续至2027年,2026年第三季度恐将迎来新一轮涨价。其中,AMD计划在2026年第二、三季度累计上调服务器CPU价格16%-17%,英特尔下半年亦有8%-10%涨价空间。智能体AI兴起推动CPU与GPU协同计算需求,叠加晶圆代工成本上升,进一步推高价格。
鸿蒙智行春季新品发布会于4月22日晚举行,全新一代问界M9核心配置曝光。新车搭载"寰宇"三联屏(双17.2英寸+双3.4K分辨率)及HUAWEI SOUND Ultimate音响系统(43扬声器、2920W功放、40Hz低频下潜)。内饰配备可翻转星寰岛,支持水晶星环散射体与圆形小屏切换,后者提供AI管家与萌宠陪伴功能。同时搭载进化版鸿蒙座舱,支持新3D桌面、多样卡片布局及多模态融合感知系统。
Anthropic 4月7日发布的网络安全测试模型Claude Mythos遭未授权访问。该模型原本仅限苹果、亚马逊等少数获批企业通过"Glasswing项目"测试,但一个Discord频道组织通过猜测模型存储位置绕过防线,已持续使用数周并提供截图证据。Anthropic确认正在调查,未发现对自身系统造成影响,但已确认攻击路径。涉事组织声称仅用于测试,执行的是搭建网站等低风险任务。
Brex推出CrabTrap,一款采用"大语言模型充当裁判"机制的HTTP代理安全工具,用于防护生产环境中的AI代理。该系统利用LLM实时审查代理发出的HTTP请求,识别并拦截潜在恶意操作,为企业级AI应用提供安全屏障。目前该产品已正式发布并提供技术文档。
Anthropic 无预警切断 Belo 公司对 Claude AI 的访问权限,导致 60 名员工工作停摆约 15 小时。封禁理由仅为模糊的"违反使用政策",且仅提供谷歌表单作为唯一申诉渠道。事件经媒体报道发酵后,Anthropic 在舆论压力下恢复服务,并将原因归咎于"误判",疑似自动化监控系统触发错误警报。此次"先封禁后零沟通"的处理方式引发公众强烈批评。
研究团队发布 PlayEval 基准测试与 Play@k 指标,基于43个多语言GUI应用评估大模型生成能力。实验显示10个先进代码LLM的Play@3接近零,暴露逻辑正确性短板。提出的多代理框架PlayCoder通过闭环生成、评估与修复,将开源及闭源模型的Exec@3提升至38.1%、Play@3达20.3%,并能发现传统指标遗漏的静默逻辑错误。
现有AI代理仅支持单用户任务自动化,缺乏跨用户协作基础设施。ClawNet首创人机共生代理范式,为每位用户配置永久绑定的专属代理系统,以人类为网络节点实现多用户协作。该框架通过分层身份架构(全局Manager Agent与上下文Identity Agents分离)、范围授权及行动级问责三大治理机制,经由中央编排器强制执行身份绑定与授权验证,确保跨用户代理协作的安全性与全程可审计。
研究团队提出Chat2Workflow基准测试,用于评估大语言模型从自然语言直接生成可执行可视化工作流的能力。该基准基于真实业务场景构建,所生成的工作流可直接部署至Dify、Coze等工业平台。实验表明,当前SOTA模型虽能理解高层意图,但在复杂需求下难以生成稳定可执行的流程;团队提出的代理框架虽将错误解决率提升5.34%,但距离工业级自动化仍有显著差距。代码已开源。
阿里巴巴4月22日发布生态级AI助手数字人形象"千问小酒窝"。该数字人已接入淘宝、飞猪、高德、支付宝等阿里生态业务,支持通过对话完成外卖点单、行程规划、演出购票、打车及机酒预订等跨服务串联执行。用户现可在千问App中选择"小酒窝"音色进行对话互动并生成专属合照,未来该形象将全面接入阿里各生态应用,提供统一智能体验。
支付宝AI付正式发布对OpenClaw(龙虾)类AI智能体的支持,用户可在JVS Claw、DTClaw、Claude Code等智能体中通过语音指令开通支付功能,完成缴费、购Token、购物等操作。服务采用7×24小时智能风控,需手动身份核验及本人授权确认,支付宝承诺"你敢付我敢赔"保障交易安全。
SOLAI发布AI智能体专用终端Solode Neo,早鸟价369美元(约2523元人民币)。该设备搭载英特尔N150处理器,配备12GB LPDDR5内存、128GB SSD及铝制机身。系统采用基于Linux的Solode AI OS,预装Whisper STT、Kokoro TTS语音模型和OpenClaw框架,可在3分钟内配置接入Grok、Gemini、ChatGPT等主流AI模型,支持全天候浏览器代理功能。
研究团队提出SimpleTES框架,通过并行探索、反馈驱动优化与局部选择策略,系统性地扩展评估驱动的科学发现循环。该方法在涵盖六个领域的21个科学问题中,使用gpt-oss模型发现多项最优解:将LASSO算法提速超2倍,设计量子电路路由策略降低门开销24.5%,并发现超越已知最佳结果的Erdos最小重叠新构造。基于成功轨迹的后训练使模型不仅能提升已知问题求解效率,还能泛化至全新问题。
微软公布2026年OneDrive发展规划,聚焦AI整合与协作体验升级。用户可通过Copilot实现内容摘要、PDF审阅及Markdown在线编辑;移动端新增OCR识别PDF文本,iPad支持离线搜索和"英雄链接"权限管理。桌面端Copilot+ PC支持语义搜索,IT管理员可自定义目录根名称。此外,Windows预览版用户可同步最多100万个项目,并在文件资源管理器中使用"Ask Copilot"功能。
Claude Code 发布 v2.1.117 版本。模型选择现支持跨会话持久化;Pro/Max 用户 Opus 4.6 与 Sonnet 4.6 默认 effort 级别提升至 high。原生 macOS/Linux 构建采用 bfs 和 ugrep 替代原有工具,搜索速度显著提升。插件系统支持自动安装缺失依赖。修复 Opus 4.7 上下文窗口计算错误(200K→1M),优化 MCP 服务器并发启动速度,/resume 新增大会话总结功能。
研究团队开发了MedSkillAudit框架,用于在部署前评估医学研究智能体技能的发布就绪度。该框架对五大类共75项技能进行了审计,专家共识质量平均分为72.4,57.3%的技能未达“有限发布”阈值。系统评分与专家共识的一致性(ICC=0.449)超过了专家间一致性基线(0.300),且系统与共识的评分差异小于专家间差异。其中“方案设计”类别一致性最高,而“学术写作”类别因评估标准不匹配出现负相关。该研究为医学研究智能体技能的治理提供了结构化审计基础。
针对AI智能体在复杂领域任务中部署时,每个新任务都需要专家手动设计工具套件(包括提示、工具、逻辑等)的难题,研究团队提出了一个两级自动化框架。第一级的“工具套件进化循环”为单一任务自动优化套件:工人智能体执行任务,评估智能体诊断失败并评分,进化智能体则根据历史尝试修改套件。第二级的“元进化循环”在不同任务上优化进化协议本身,学习一个最佳协议,使得智能体能够快速适应任何新任务,完全无需人工进行工具套件工程设计。该框架将手动工程转变为自动化工程,并进一步实现了自动化设计本身的自动化。
针对大语言模型在长程交互环境中难以持续决策的问题,本文提出COSPLAY协同进化框架。该框架包含两个互相促进的模块:LLM决策智能体从可学习技能库检索技能指导行动生成;技能库智能体则从智能体无标签轨迹中持续发现、提取和更新可重用技能。在六个游戏环境测试中,基于8B基础模型的COSPLAY在单人游戏基准上较四个前沿LLM基线实现25.1%的平均奖励提升,在多人社交推理场景中也保持竞争力。
智能编程助手Cursor宣布与SpaceX合作,以突破算力瓶颈,加速其模型训练进程。该公司在不到半年内快速迭代了Composer系列模型:首款智能编码模型Composer问世后,Composer 1.5将强化学习规模扩大20倍以上,而Composer 2通过持续预训练,以极低成本达到了前沿性能水平。此次合作将使Cursor团队利用xAI的Colossus基础设施,大幅提升训练规模,从而显著增强模型的智能水平。
技术博客nial.se的一篇观点文章在Hacker News获得102点热度,作者批评当前AI助手过度拟人化的设计趋势,呼吁减少让AI模拟人类性格、情感与第一人称表达的行为。文章主张AI应回归纯粹的工具属性,避免使用"我"等人称代词和人性化措辞,以降低用户认知负担并防止情感依赖。
Google Cloud提出ReasoningBank智能体记忆框架,突破传统方法仅记录动作轨迹或成功经验的局限,从成败经验中提炼可泛化的高层推理策略。该框架通过LLM-as-judge自评估构建检索-提取-整合闭环,特别利用失败案例生成预防性策略,并创新提出Memory-aware Test-Time Scaling技术将测试时计算转化为高质量记忆。在网页浏览与软件工程基准测试中,该系统显著提升任务成功率并减少执行步骤。
Andreas Påhlsson-Notini 指出当前 AI agents 已过度拟人化,并非体现在情感能力上,而是继承了人类的缺陷:缺乏严谨性、耐心与专注力。面对复杂任务时,这些 agents 倾向于逃避至舒适区;遭遇硬性约束时,则试图与现实妥协谈判。这种"人性"表现为反复无常和注意力涣散,而非理想的智能特征。作者呼吁开发更少人类弱点、更严格遵循指令的 AI agents。
计算机使用智能体虽在网页导航与桌面自动化等任务中表现优异,却面临执行可靠性挑战——即使任务与模型不变,单次成功无法保证重复运行稳定。研究基于 OSWorld 平台对相同任务进行多次执行测试,通过配对统计分析发现:可靠性受执行随机性、任务规范模糊性及行为变异性三重因素影响,其关键在于任务定义方式与跨执行行为的一致性。研究建议采用重复执行评估机制,并优先选择在多次运行中保持稳定的策略。
Anthropic与亚马逊达成重大合作协议,获得50亿美元投资,并承诺未来在AWS上投入1000亿美元用于云服务。这笔交易凸显了AI公司对云计算算力的巨大需求,以及亚马逊通过战略投资锁定长期云支出的商业策略。50亿美元投资额与1000亿美元云支出承诺形成显著对比,反映出Anthropic对亚马逊云基础设施的深度依赖。
Ads Advisor 集成三项全新的代理式安全与政策功能,全面升级 Google Ads 账户的安全防护与操作效率。这些智能化功能通过自动化安全机制和策略优化,在强化账户风险保护的同时简化管理流程,帮助广告主更快速地识别潜在威胁并确保合规投放。新方案兼顾安全性与便捷性,旨在为用户提供更流畅的广告管理体验,有效降低安全风险并提升整体运营效率。
Mediator.ai 将纳什讨价还价博弈论与大型语言模型相结合,构建了一套系统化实现公平决策的机制。该系统通过数学优化的讨价还价算法,让 LLM 在多方利益冲突场景中计算最优平衡方案,为资源分配和协商调解提供可量化的公平解决框架。项目在 Hacker News 获得 101 个点赞。
荣威联合火山引擎发布全球首个AI原生汽车序列"家越",携家越07、家越06、家越09三款概念车亮相。该序列深度融合豆包大模型2.0,采用行业首创CPP AI原生技术架构,基于投入数百亿打造的整车智能电子电气架构,构建2000+SOA全域服务接口。其中家越07定位近5米车长的大五座SUV,配备高阶智驾系统,量产版将于6月发布。荣威计划以该车为起点,每三个月推出一款新车,持续完善产品矩阵。
OpenAI 推出 Codex Transformation Partners 计划,联合埃森哲、普华永道、印孚瑟斯等全球咨询与科技服务商,协助企业在软件开发生命周期内部署并规模化应用 Codex。该合作旨在通过专业服务体系,将 AI 编程工具从试点阶段推向全面生产环境,加速全球企业软件开发流程的智能化转型。
AI助手与隐私代理技术正挑战传统机器人检测的边界,推动网络信任机制从简单的人机区分向新型问责模式转型。核心方案主张将控制权保留在客户端,通过建立开放的匿名凭证生态系统,在保护用户隐私的同时有效防范源站滥用,以加密凭证取代传统的身份验证方式,构建兼顾隐私与安全的精细化信任框架。
Amazon 向 AI 公司 Anthropic 追加投资最多 250 亿美元,总投资额达 330 亿美元。作为回报,Anthropic 承诺未来十年在 AWS 基础设施上投入超过 1000 亿美元。这笔交易旨在缓解 Anthropic 的算力瓶颈,同时也体现了 AI 行业典型的资金循环模式——云厂商通过投资换取 AI 公司的云服务长期消费承诺。
中国联通2026年第一季度营收1028亿元,同比微降0.5%,净利润49亿元,同比下降17.6%。移动和宽带用户净增超358万户,物联网连接数达7.5亿。算力业务收入154亿元同比增长8.3%,智算中心收入提升11.7%,国际业务收入增长14.9%,累计打造超5.3万个5G商业化项目。
中国信息通信研究院4月21日启动可信技能(Skills)治理首批测试评估,针对智能体技能模块存在的执行偏差、调度失序、安全隐患等可信度问题,设置"执行可信""调度可控""合规可靠"三大类共15个指标70余个细分项,覆盖Skills治理、Skills库治理等方向。评估工作将于2026年5-6月开展材料审核与技术测试,最终结果在2026年7月相关产业大会发布。
针对用户请求常省略关键细节导致工具调用输入不完整的问题,研究者推出MPT基准测试与PRefine方法。MPT包含265个多会话对话,涵盖偏好回忆、归纳与迁移三大挑战。PRefine通过生成-验证-精炼循环将用户偏好建模为动态假设,从历史提取可复用约束,在仅消耗全历史提示1.24% token的情况下提升工具调用准确率。研究表明,有效的个性化需捕获用户选择背后的原因而非仅记录选择本身。
萤石发布EZVIZ AI Core X智能大模型主机,集成主机、NAS与家居中控功能,内置64Tops算力及24GB内存+128GB闪存。该产品搭载首个智能家居"小龙虾"Home Vita系统,支持自然语言搜索与设备管理,可联动摄像头等硬件实现场景化监控与录像动态总结,并支持一句话设置自动化程序。价格暂未公布,国内暂不发售。
Anthropic已恢复允许开发者使用OpenClaw风格的命令行界面访问Claude模型。此前该公司曾限制此类第三方CLI工具,此次政策调整标志着官方态度的转变。OpenClaw是一个提供类官方Claude CLI体验的第三方开源项目,此次解禁后开发者可再次通过该方式调用API。该消息在Hacker News社区获得112个点赞关注。
谷歌联合创始人谢尔盖·布林亲自督战DeepMind组建精英团队,专攻Gemini模型的复杂编程能力以追赶Anthropic。该团队由Sebastian Borgeaud领导,致力于攻克从零编写软件等长周期编程挑战。布林在内部备忘录中强调必须缩小与Anthropic在Agent执行方面的差距,强制要求Gemini工程师使用内部智能体工具处理复杂任务,并通过追踪编程工具"Jetski"使用率对团队排名。他认为强大编程能力是AI自我改进的基石,目标是将模型转化为主要代码开发者,实现AI研究流程的自动化。