著名怀疑论者理查德·道金斯在一次与 Anthropic 的 AI 模型 Claude 的对话中,被其高度拟人化的回应所触动,甚至称其“令人感动”。Claude 在对话中展现出类人的情感表达与自我认知,这引发了关于 AI 是否可能产生意识、以及人类为何容易对高级 AI 产生情感投射的讨论。该事件凸显了当前大语言模型在模拟共情与人格方面的强大能力,及其带来的伦理与认知挑战。
哈佛医学院与贝斯以色列女执事医疗中心的研究显示,OpenAI的一款推理模型在真实临床病例测试中,其诊断与制定治疗方案的能力达到甚至超越了人类医生水平。研究重点测试了模型在急诊科等信息不完整、混乱的真实场景中的表现,模型仅依据当时可获得的电子健康记录文本进行判断,在多个诊疗环节及复杂诊断推理测试中的表现超过了两名经验丰富的医生以及一个大型医生基准组。但模型目前完全依赖文本病历,未处理影像等关键信息。研究者强调,AI并非取代医生,而是有望成为临床决策支持工具,尤其适用于急诊等高压环境。下一步需在真实临床环境中测试其对患者结局的实际改善效果。
ARC Prize Foundation 对 OpenAI 的 GPT-5.5 和 Anthropic 的 Opus 4.7 在 ARC-AGI-3 基准测试中的 160 次任务运行进行了分析。研究发现,三种系统性错误模式导致这两个模型在人类能轻松解决的任务上得分均低于 1%。这些错误揭示了当前顶尖大语言模型在抽象推理能力上仍存在根本性缺陷。
麻省理工学院研究科学家安德鲁·麦卡菲警告,企业若为短期降本而用AI自动化取代Z世代初级岗位,将付出长期代价。此举不仅压缩年轻人才入口,更会破坏通过“学徒阶梯”培养未来管理者与核心人才的通道。同时,企业将错失Z世代一项关键优势:他们对AI工具更熟悉、使用更积极。德勤研究显示,约76%的Z世代使用独立AI工具,比例居各世代之首。过度自动化初级工作,意味着企业正在牺牲未来的学习机会与熟练人才来源。
影石宣布将于5月14日20:00发布GO Ultra x Hello Kitty限定版口袋相机。该限定版基于2025年8月发布的Insta360 GO Ultra相机打造,原版售价2598元,重53克,支持4K60fps视频拍摄。其核心配置包括1/1.28英寸传感器和5nm AI芯片,并支持4K两倍无损变焦。续航上,结合拓展舱可实现最长200分钟(1080p)录制,单相机则支持70分钟(1080p)。此外,该产品还具备SD卡自由替换、智能音频降噪、2.5英寸翻转触屏、FlowState防抖、360°水平矫正以及10米防水(单相机)等功能特性。
xAI 为开发者推出“Custom Voices”功能,允许克隆用户声音用于AI应用。该功能基于近期发布的 Grok 语音转文本和文本转语音 API 构建,仅需一分钟的语音样本即可生成可用的声音克隆。此举扩展了 Grok 语音模型的应用场景,为开发者提供了定制化语音合成的新工具。
谷歌、亚马逊、微软和Meta计划在2026年合计投入7250亿美元资本支出,较去年增长77%,重点加码AI基础设施。谷歌云业务收入同比增长63%至200亿美元,合同积压订单达4600亿美元。微软将2026年资本支出定为1900亿美元,Meta上调至最高1450亿美元,存储芯片涨价及数据中心成本上升是推高支出的主因。分析师驳斥AI看空论调,认为强劲收入增长足以支撑巨额投入。Alphabet净利润同比大增81%,财报后股价上涨,市值有望创新高。
华为乾崑与广汽合作的智能猎装车启境GT7已启动全国巡展,将陆续在宁波、杭州、成都、上海等18个城市亮相,巡展时间从4月28日持续至5月24日。该车计划于6月上市,车身尺寸为长5050mm、宽1980mm、高1470mm,轴距3000mm。其核心亮点是搭载了包括全球量产最高规格896线激光雷达、预埋L3级智驾架构、全链路冗余系统以及首发华为乾崑赤兔平台在内的十大智能技术。
Nvidia CEO 黄仁勋指出,关于人工智能将导致大规模失业的危言耸听实际上会损害就业。他认为,这种鲁莽的预测劝阻年轻人进入相关职业领域,对社会造成真实伤害。黄仁勋批评部分科技领袖在此类预测中表现出“上帝情结”。
DeepSeek发布了V4版本模型,其性能已接近行业最前沿水平,但在价格上具有显著优势,仅为主要竞争对手的一小部分。该模型在多项基准测试中表现出色,能以极低的成本提供顶级的AI能力,有望大幅降低企业和开发者的使用门槛,推动AI技术的更广泛普及。
Elon Musk 在法庭上自称“傻瓜”,因其早期向 OpenAI 捐赠的 3800 万美元如今已助力该公司估值达到约 8000 亿美元。庭审首周,Musk 还警告了“终结者”般的AI未来,并承认其公司 xAI 在训练中使用 OpenAI 的模型。针对 Sam Altman 的诉讼庭审戏剧性十足,更多关键内容可能还在后面。
OpenAI 已在投放广告的国家为免费版 ChatGPT 用户默认开启营销 Cookie 追踪,付费订阅用户则不受此影响。此举旨在为 OpenAI 开辟新的收入渠道。用户可在账户设置中手动禁用该追踪功能。
Meta 收购了机器人AI初创公司Assured Robot Intelligence,旨在加速其人形机器人研发进程。此次收购的核心目标是打造一个面向全行业的开放平台,其战略定位类似于Android在智能手机领域所扮演的角色。Meta计划通过这一平台,推动人形机器人技术的标准化与普及化发展。
xAI 正式推出 Grok 4.3 模型,其核心策略是大幅降低价格并增强工具使用能力。新模型在实际任务处理上有所提升,但在性能上仍落后于 OpenAI 和 Anthropic 的顶尖模型。此次发布还引入了一个基于智能体的新型图像生成器“Imagine”模式,专门服务于创意项目。
据消息源透露,索尼将于伦敦时间5月13日下午3点(北京时间晚上10点)发布Alpha 7R VI全画幅无反相机及新款100-400mm f/4.5 GM镜头。Alpha 7R VI将搭载6700万像素堆栈式传感器,功能接近A1II,并引入类似A7V的AI、防抖与对焦升级,定价约5000美元。新款镜头采用内变焦与超轻量化设计,并非现有100-400mm f/4.5-5.6 GM的换代产品,预计定价同样在5000美元以上。
Meta CEO扎克伯格在全员大会上解释,公司计划裁员是由于增加AI资本开支导致资源重新分配,需要适当缩小规模。他否认裁员是因为团队重组为“AI原生”结构或开发自主AI智能体。Meta将于5月20日裁减约10%员工,并可能在下半年继续裁员。公司内部因裁员缺乏充分解释及推出追踪员工操作以训练AI的计划引发不满。扎克伯格强调,使用AI工具提升效率并非裁员直接原因,但公司仍在观察趋势。
威联通发布专为边缘AI设计的存储服务器QAI-h1290FX。该服务器搭载AMD EPYC 7302P处理器(16核32线程),预装128GB内存,提供12个2.5英寸U.2/SATA SSD盘位、4条PCIe Gen4插槽以及2个25GbE和2个2.5GbE网络端口。其关键特性是支持安装NVIDIA RTX PRO 6000 Blackwell Max-Q工作站显卡,并配备750W电源。产品旨在提供开箱即用的本地AI计算体验,让用户无需复杂配置即可在本地运行AI模型并完全掌控数据。
AMD第一方迷你主机锐龙 AI Halo实物照片在Reddit上被分享,确认了设备设计。该主机基于AMD锐龙 AI Max+ 395处理器,最高支持128GB统一内存,造型方正,顶部有AMD企业徽标,四周环绕ARGB灯带,后置接口包括多个USB-C、HDMI和有线网口。消息称这款设备将在今年6月正式推出。
苹果在Apple Support应用v5.13版本更新中,意外将内部开发文件Claude.md打包发布,证实其使用Claude Code构建生产级应用。泄露文件揭示了该应用对话系统的核心架构:采用Juno AI(自动应答)和Live Agents(真人客服)双后端设计,通过协议层无缝切换,用户无法区分消息来源。苹果在24小时内紧急撤回了该更新。此次事件表明,苹果内部已深度集成定制化Claude模型进行开发,且数据保存在自有服务器上。
OpenAI 为编程工具 Codex 推出宠物模式,用户可在电脑桌面养一只“赛博桌宠”。宠物为可选组件,通过设置选择内置或自定义宠物,或输入 /pet 启用。它能实时显示 Codex 工作状态,包括运行中、等待输入或可复核,并提供进度提示,使用户无需打开 Codex 即可监控进度。用户还可使用技能命令 $skill-installer hatch-pet 创建宠物。
AI短剧《霍去病》导演杨涵涵澄清,此前引发关注的“3000元成本、48小时制作、80集、5亿播放”等说法存在夸大。3000元仅为算力成本,不包含人力;48小时指纯工作时间;实际作品只有4分钟MV和6分钟正片两个版本,5亿播放量源于未经核实数据。团队3人属实,项目于2026年1月底启动,每天工作约12小时,4天完成。导演的B站账号曾使用夸大标题,被质疑自我炒作。
OpenAI CEO萨姆·奥尔特曼在X平台表示,公司目标是开发增强人类能力的工具,而非取代人类的实体。此番表态针对当前美国裁员潮中,许多公司将原因归咎于AI的现象。尽管Anthropic CEO预测“所有代码由AI编写”的世界可能很快到来,加剧了公众焦虑,但奥尔特曼认为“AI取代工作”的悲观论调长远看是错误的。他相信人类将能找到更有意义的工作,未来即使不努力工作,也能享受繁荣精彩的生活。
微软公布了Windows质量更新的多项改进。Windows Insider预览通道简化为实验版和测试版,测试版取消了受控功能发布机制,用户安装更新即可获得新功能。Windows Update合并了系统、.NET和驱动更新,实现每月只需重启一次,电源菜单也不再强制更新。此外,微软精简了部分AI功能,提升了文件资源管理器的稳定性和响应速度,锁屏默认仅显示天气组件以减少干扰,并对低内存设备进行了系统优化。这些改进已陆续在实验版通道推出,未来将推送给普通用户。
微软发布了四个Windows 11内部测试预览版本更新。Beta预览版为AAD用户带来了更智能的共享菜单,可直接在共享位置发现和安装应用;创建Dev Drive时现支持以GB为单位指定大小。Experimental预览版推出了全新设计的运行对话框,拥有更现代的界面;小组件默认设置更安静,默认禁用鼠标悬停打开和任务栏徽章;文件资源管理器修复了加载闪烁和重复显示问题;Windows放大镜支持直接输入精确缩放百分比。此外,微软承诺将在Beta和Experimental渠道的定期版本中提供可下载的ISO文件。
Agent-desktop 是一款基于 Rust 构建的原生桌面自动化命令行工具,专为 AI 代理设计。它通过操作系统无障碍访问树为任何应用程序提供结构化访问,无需依赖截图、像素匹配或浏览器。该工具包含快速单二进制 CLI 和 C-ABI 动态库,支持 Python、Swift、Go 等多种语言直接调用,避免每次命令 fork 进程。核心特性涵盖 53 个命令,包括观察、交互、键盘鼠标操作;采用渐进式骨架遍历,在密集应用中可减少 78–96% 的令牌使用;工作流经 AI 优化,使用确定性元素引用,且所有交互优先尝试纯无障碍 API。目前支持 macOS 13.0+ 系统,需授予无障碍权限。
GitHub上开源了“Understand Anything”项目,这是一个AI驱动的工具,旨在帮助用户理解和解释各类复杂概念与信息。该项目发布后在Hacker News社区获得102个积分,反映出科技开发者对其技术潜力的高度关注。工具可能整合自然语言处理等技术,以提升知识获取与理解的效率。
据报道,苹果将在WWDC 26发布macOS 27系统,首个开发者测试版于演讲后立即提供。主要新功能包括:Siri将升级为独立应用,支持查看会话历史,操作逻辑类似ChatGPT,个性化功能也将扩展至Mac;系统将为预计2027年初发布的触屏版MacBook Pro开发专属触控界面,优化手指交互体验;此外,该系统将专注于稳定性与性能改进。macOS 27将仅支持M1或更高芯片的Mac,彻底抛弃Intel平台,同时不再兼容使用AFP协议的旧存储设备如AirPort Time Capsule。
美国五角大楼宣布与SpaceX、OpenAI、谷歌、英伟达、Reflection、微软、亚马逊AWS及甲骨文八家领先AI公司达成协议,将在其机密网络(IL6和IL7环境)中部署AI能力,用于“合法的作战使用”。此举旨在加速美军向AI优先作战力量转型,通过集成安全的边界AI能力来简化数据合成、提升态势感知并增强复杂环境下的决策优势。此前,五角大楼因与Anthropic就AI模型使用限制产生争议并诉诸法律,加速了供应商多元化进程。
关联讨论 1 条X:Rohan Paul (@rohanpaul_ai)亚马逊 AWS 首席执行官 Matt Garman 表示,人工智能不会让程序员失业,公司今年计划招聘 11000 名软件开发工程师实习生。他指出,尽管 AI 工具正在改变开发者工作流,但亚马逊对软件开发人员的招聘需求与以往一样多,甚至加速增长。软件工程师角色在变化,未来编写 Java 代码的能力可能不那么重要,但需学习构建应用程序、解决客户问题等技能,同时技术知识仍不可或缺。
研究团队提出了具身搜索与救援新任务,并发布首个综合性基准ESARBench,用于评估多模态大语言模型驱动的无人机智能体。该基准基于Unreal Engine 5和AirSim构建了四个从真实世界GIS数据映射的高保真、大规模开放环境,包含动态天气、昼夜变化和随机线索布置。基准包含600个基于真实救援案例建模的任务及一套评估指标。实验评估了从传统启发式方法到基于MLLM的导航智能体等多种基线,结果揭示了该任务在空间记忆、空中适应性及搜索效率与飞行安全权衡方面的关键瓶颈。
针对迭代检索增强生成在解析文本时存在的证据定位粗粒度与视觉语义丢失问题,本研究提出了“证据链”框架。该框架与检索器无关,直接利用视觉语言模型对检索到的文档截图进行推理,无需针对特定格式进行解析,并能输出精确的边界框以可视化完整推理链条。在Wiki-CoE和SlideVQA两个基准上的实验表明,经微调的Qwen3-VL-8B-Instruct模型表现稳健,在需要视觉布局理解的场景中显著优于基于文本的基线方法,为像素级可解释的iRAG提供了一个通用解决方案。代码已开源。
多模态点云补全中,硬投影易导致跨模态熵崩溃,阻碍视觉先验传播。为此,SplAttN提出一种新方法,以可微分高斯光栅化替代硬投影,将投影转化为连续密度估计,生成密集连续的图像平面表示。这避免了稀疏支持问题,改善了梯度流动与跨模态连接学习能力。实验显示,SplAttN在PCN和ShapeNet-55/34数据集上达到最先进性能。在KITTI真实场景基准测试中,反事实评估表明,SplAttN能保持对视觉线索的强健依赖,而基线模型则退化为对视觉移除不敏感的单模态模板检索器,验证了其有效建立跨模态连接。代码已开源。
本文主张将具备自主能力的AI系统设计和评估为边际token分配经济体,而非按单位定价的文本生成器。通过一个编码代理修复失败测试的案例,文章揭示了当前被孤立设计的四个经济层级(路由层、代理层、服务层和训练层)实际上都在遵循相同的核心经济原则:边际收益等于边际成本加上延迟与风险成本。这一框架解释了为何局部最小化token的系统会在全局层面错误分配资源,并预测了一系列重复出现的故障模式,如过度路由、验证不足和服务拥堵等。研究最后指出了token感知评估、自主定价等具体研究方向。
尽管生成式AI的事实可靠性已提升,但幻觉错误仍是核心问题,即使在简单问答中前沿模型仍会产生幻觉。当前事实性改进主要源于扩大模型的知识边界,而非增强对边界的认知能力。模型可能难以完美区分已知与未知,导致消除幻觉与保持实用性之间存在权衡。若将幻觉理解为“自信的错误”,则可通过表达不确定性开辟新路径——忠实不确定性,即语言表达与内在不确定性保持一致。这是元认知的一个方面,对于直接交互需诚实传达不确定性,对于智能体系统则成为控制层,决定何时搜索与信任何种信息。元认知是实现大语言模型既可信又有能力的关键。
奥斯卡奖发布新规,明确禁止人工智能生成的表演和剧本获奖。美国电影艺术与科学学院规定,从2027年3月举行的下一届颁奖典礼开始生效。规则指出,电影制作中虽可使用AI工具,但“合成”表演者不能获得任何奖项,获奖剧本必须是“人类创作的”。学院可要求提交作品提供更多信息,以验证人类创作身份。这一变化旨在维护奖项对人类创意的认可,回应行业对AI替代演员的担忧。
谷歌在财报电话会议中透露,计划为人工智能助手Gemini引入广告。首席商务官Philipp Schindler强调,广告是规模化产品、覆盖数十亿用户的重要手段,公司决心已定。目前谷歌处于准备阶段,将在合适时机公布计划,测试顺利后Gemini移动端可能出现广告。类似OpenAI为ChatGPT投放广告的做法,早有传闻称谷歌可能在2026年实施该计划。
5月2日,浙江松阳抽水蓄能电站两条深达637米的竖井全线贯通,刷新国内抽水蓄能领域最深竖井纪录。该电站设计安装4台35万千瓦机组。施工采用我国自主研发的首套700米级智能竖井装备,通过5G和传感器实现“井下无人”智能建造,施工效率较传统方法提升近十倍。电站计划于2027年9月首台机组投产,全面建成后将承担华东电网调峰、储能等任务,保障电网安全稳定运行。
Spotify推出“已验证”标识,专门用于标记真人艺术家,以区别于AI生成的音乐内容。这一新功能通过艺术家个人资料上的徽章显示,旨在提升平台透明度,帮助听众识别音乐创作者的真实身份。随着人工智能在音乐产业中广泛应用,该举措响应了维护艺术真实性的需求,防止AI冒充人类艺术家,确保用户信任音乐来源。变化涉及平台上的艺术家验证系统,预计将影响全球数百万音乐人和数十亿用户。
当前大量代码由AI生成,但其实际意义需审慎评估。能生成可通过给定测试的代码模型,与能产出真正正确、安全、可维护且架构良好软件的模型存在本质区别。AI生成的代码可能在特定测试用例下运行成功,却未必满足软件工程对长期维护性、安全性、架构设计及潜在边界情况处理的高标准要求。这一差距揭示了当前AI编程工具的核心局限,提醒开发者需以批判性眼光看待其输出,而非完全替代专业开发实践。
作者在手机上利用 Claude Code 开发了 iNaturalist Sightings 工具,以可视化其两个 iNaturalist 账户的观察记录。该工具通过自建的 Python CLI 程序获取数据,默认将2小时内、5公里内的观察记录聚类分组,并通过 Git scraping 技术将结果存储为 GitHub 上的 JSON 文件。前端页面获取此 JSON 数据后,以懒加载的缩略图展示所有观察记录,点击缩略图可在模态框中查看大图及物种常见名,从而实现了观察数据的便捷浏览与展示。