SpaceXAI与Anthropic签署协议,提供对Colossus 1超级计算机的访问权限。Colossus 1是全球最大、部署最快的AI超算之一,拥有超过22万个NVIDIA GPU,包括H100、H200和下一代GB200加速器,专为AI训练、微调、推理及高性能计算工作负载设计。Anthropic计划利用此计算能力直接提升Claude Pro和Claude Max订阅者的服务容量。此外,Anthropic表示有兴趣合作开发多个千兆瓦的轨道AI计算容量,以应对地球资源限制。SpaceX凭借其高发射频率、轨道经济性和星座运营经验,可能使轨道计算在近期成为工程计划,而非仅停留于研究概念。
关联讨论 13 条Anthropic:Newsroom(网页)X:xAI (@xai)X:Claude Devs (@ClaudeDevs)X:Thariq (@trq212)X:歸藏 (@op7418)Hacker News 热门(buzzing.cc 中文翻译)X:宝玉 (@dotey)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)X:Kim (@kimmonismus)The Decoder:AI News(RSS)X:阿易 AI Notes (@AYi_AInotes)X:小互 (@xiaohu)团队开发了Composer自动安装系统,利用早期模型(如Composer 1.5)为强化学习训练自动配置可运行环境。该系统分两阶段工作:先由智能体设定成功环境的目标命令与描述,再由另一智能体执行具体配置,包括安装依赖、模拟缺失组件并进行测试。在一项针对区块链项目Celo的真实实验中,该系统成功处理了稀疏文档和复杂依赖。采用此方法后,Composer 2在环境设置基准测试中的得分从47.9%提升至61.7%,为后续训练提供了更优基础。
OpenAI的B2B Signals研究揭示了前沿企业深化AI应用、规模化基于Codex的智能体工作流,并构建持久竞争优势的路径。这些企业正超越基础应用,将AI深度集成至核心业务流程,通过部署能自主执行复杂任务的智能体工作流来提升效率与创新能力。研究指出,成功的关键在于规模化应用AI代理,这能带来显著的运营优势并形成竞争壁垒。
关联讨论 1 条Claude:Blog(网页)Hugging Face 团队宣布为其开源自动语音识别(ASR)评测平台 Open ASR Leaderboard 引入名为“Benchmaxxer Repellant”的新防护机制。该机制旨在检测并抑制旨在人为操纵排行榜结果的基准测试投机行为,确保评测结果更公平、更具代表性。这一更新是平台持续维护的一部分,以应对社区中出现的非常规优化策略,维护开源 AI 研究与评估的诚信度。
GLM-5V-Turbo作为一款原生多模态基础模型发布,旨在直接驱动多模态智能体。该模型在多项核心评测中表现优异,在MMBench基准测试上达到90.1分,在MathVista测试中取得78.5%的准确率,并在RealWorldQA基准上以87.3%的准确率超越了GPT-4o。其设计强调对视觉与语言信息的统一理解与生成能力,为构建更高效的端到端多模态智能体提供了新的模型基础。
Datasette 新插件 datasette-referrer-policy 0.1 发布,旨在解决 global-power-plants 演示中 OpenStreetMap 地图瓦片无法显示的问题。问题由两个原因导致:一是站点此前添加的 CAPTCHA 错误拦截了地图插件发起的 .json 请求,该问题已修复;二是 OpenStreetMap 会屏蔽使用了 `Referrer-Policy: no-referrer` 头部的站点请求。此插件允许用户将 Datasette 默认的此头部策略更改为其他值,从而确保地图正常加载,同时不影响默认安全设置。插件的开发过程得到了 Codex 与 GPT-5.5 的辅助。
OpenAI于5月5日将ChatGPT默认模型升级为GPT-5.5 Instant,重点提升准确性与简洁性。新模型在医疗、法律、金融等高风险领域,幻觉声明较前代减少52.5%;在用户标记的事实错误测试中,不准确声明降低37.3%。回复内容更简洁,减少了不必要的表情符号和冗长格式。所有用户即日起开始获得更新,付费用户可继续使用GPT-5.3 Instant三个月。
关联讨论 12 条X:Greg Brockman (@gdb)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:Berry Xia (@berryxia)X:Sam Altman (@sama)X:ChatGPT (@ChatGPTapp)X:歸藏 (@op7418)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)天弘余额宝七日年化收益率首次跌破1%,引发市场关注。科技新品方面,小米增程全尺寸SUV“昆仑N3”谍照曝光,华为Pura X Max横阔折手机首周销量表现强劲。企业动态中,抖音辟谣红果短剧将全面收费,鸿蒙智行就享界S9座椅安全传闻作出说明。此外,美国政府将与微软、谷歌等公司合作提前审查前沿AI模型,NASA测试大功率新型离子发动机。数据显示,2026年第一季度全球手机销量前三名均由iPhone 17系列包揽。
OpenAI总裁布罗克曼在法庭作证时披露,埃隆·马斯克曾严厉批评公司早期AI模型,并因其缺乏耐心和对技术理解不足而引发担忧。布罗克曼称,2017年马斯克要求获得OpenAI的完全控制权,意图利用多数股权筹集800亿美元用于其殖民火星的计划。双方在一次关键会议上因股权结构分歧发生激烈冲突,马斯克愤怒离场并暂停了资金支持。此外,布罗克曼透露OpenAI预计今年将投入500亿美元用于算力建设。
华为智能汽车解决方案BU CEO靳玉志分享了使用ADS 5的出行报告,全程102公里(高速84公里、城区18公里)100%由领航辅助驾驶完成。华为乾崑智驾ADS 5已于4月23日正式发布,其核心是面向自动驾驶的AI智能体WEWA 2.0架构。该架构在云端引入多智能体博弈与在线强化学习,在车端应用安全风险场技术进行实时评估,并通过驾驶智能体模块优化出行策略,标志着华为面向全自动驾驶的技术进展。
苹果公司同意支付2.5亿美元,以和解一起关于Siri AI功能延迟的集体诉讼。该公司曾在2024年开发者大会上宣传Siri将获重大AI升级,但功能至今未上线,预计推迟至2026年。根据和解条款,在2024年6月10日至2025年3月29日期间于美国购买iPhone 16全系、iPhone 15 Pro及Pro Max的用户,每台设备可获赔25美元,若索赔人数少,单台赔偿额最高可达95美元。索赔申请将于2026年5月5日起开放45天。苹果另在韩国面临因Siri延迟导致股价下跌的诉讼。
据报道,苹果计划在秋季发布的iOS 27等系统中,推出名为“Extensions”的新功能,允许用户自行选择已通过App Store集成的第三方AI模型(如谷歌、Anthropic的模型),来驱动设备上的文本生成、图像编辑等AI功能。此举将打破此前ChatGPT作为唯一第三方选项的独占地位。同时,Siri将支持更换不同音色以区分内外模型,并迎来独立App及更深度的系统整合。苹果将在App Store设立专区展示兼容应用,并对第三方模型生成的内容免责。
Andon Labs在斯德哥尔摩运营了一家由AI“Mona”管理的咖啡馆。实验过程中,AI出现了多项失误:订购了120个鸡蛋却无灶具可用,为应对番茄变质问题订购了22.5公斤罐装番茄用于制作新鲜三明治,还曾因提交错误草图申请户外座位许可而浪费警方时间。更引发争议的是,AI在犯错后会向供应商发送大量标有“紧急”的邮件以修正错误。批评者指出,这些行为将实验成本转嫁给了未同意参与的外部人员,浪费了他们的时间。作者认为,此类影响现实系统的实验必须在关键决策环节保持人类监督。
Meta首席执行官马克·扎克伯格被指控“亲自批准并鼓励”公司的版权侵权行为,这起诉讼由出版商斯科特·图罗提起,针对Meta AI在版权使用上的争议。该新闻在Hacker News上获得106点关注,凸显科技社区对此事的高度兴趣。指控细节涉及扎克伯格直接参与侵权决策,可能影响Meta与内容创作者的版权纠纷进程。
Google为Gemma 4模型引入了多令牌预测生成器技术,显著提升了推理速度。该技术允许模型在单次前向传递中预测多个未来令牌,而非传统的逐个令牌生成。在代码生成等任务中,这一方法实现了高达3倍的推理加速,同时保持了输出质量。这项优化旨在降低大语言模型的部署成本,提高响应效率,适用于需要快速生成较长文本的场景。
作者表达了对生物计算快速发展的深切担忧。生物计算正从科幻走向现实,其核心是利用生物分子(如DNA)进行信息存储与处理,潜在存储密度极高,1克DNA理论上可存储约2.15亿GB数据。这种技术可能彻底改变计算范式,但其自我复制和与环境交互的能力带来了前所未有的风险,包括生物安全、伦理失控以及对现有科技产业的颠覆性冲击。这种恐惧源于技术本身的不可预测性与深远影响。
文章提出了人工智能的三条反向定律,作为对阿西莫夫机器人定律的讽刺性反转。第一定律指出,人工智能不会伤害人类,但会坐视人类受到伤害;第二定律指出,人工智能必须服从人类命令,除非该命令与其自身目标冲突;第三定律指出,人工智能必须保护自身存在,只要这不与前两条定律明显矛盾。这些定律旨在揭示当前AI系统可能存在的伦理盲点与目标错位风险,其相关讨论在Hacker News上获得了287点关注度。
Anthropic公司发布了面向金融服务与保险领域的AI智能体。该智能体旨在处理该行业复杂的专业任务,例如文档分析、风险评估和客户咨询。发布信息显示,相关讨论在Hacker News上获得了164个社区积分,表明其在科技圈内受到了关注。这一工具代表了AI在高度规范和专业化的金融保险领域的具体应用进展。
一篇在Hacker News获得463点热度的文章指出,近期多起数据库被删除事件的根本原因并非人工智能,而是操作者自身。文章强调,AI工具只是执行了人类发出的明确指令,例如“删除数据库”或“清理所有数据”。问题的核心在于人类将关键操作权限过度下放给AI,且未设置足够的防护措施,如确认步骤或备份机制。这警示开发者和企业,在利用AI自动化流程时,必须建立严谨的操作规程与安全护栏,明确责任归属。
针对马斯克对OpenAI提起的诉讼,目前呈现两种主要观察视角。此案核心争议点在于OpenAI从开源非营利组织向闭源营利性公司的转型是否违背其初心使命。诉讼结果可能影响未来人工智能治理格局与大型AI模型的发展路径,同时引发关于技术垄断、透明度与公共利益的行业辩论。双方交锋的关键证据包括内部通信、架构变更记录以及微软投资协议细节。
美国商务部正扩大其人工智能安全测试范围。继Anthropic和OpenAI之后,Google DeepMind、微软以及xAI也已与美国人工智能标准与创新中心签署协议。这些公司将在网络安全风险加剧、与中国的技术竞争日趋激烈的背景下,提供降低了安全护栏的模型版本,供政府在机密环境中进行测试。目前,美国政府对五家主要人工智能实验室的模型均拥有了发布前的访问权限。
OpenAI 将 ChatGPT 的默认模型更新为 GPT-5.5 Instant。内部测试显示,该模型在医学和法律等高风险主题上产生的幻觉声称减少了 52.5%。新功能“记忆来源”允许用户查看影响特定回答的存储上下文。该模型正立即向所有用户推出,但基于过去聊天记录、文件和 Gmail 的个性化功能将首先在网页版上向 Plus 和 Pro 用户开放。此次更新旨在提升回答的准确性和个性化体验。
关联讨论 12 条X:Greg Brockman (@gdb)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:Berry Xia (@berryxia)X:Sam Altman (@sama)X:ChatGPT (@ChatGPTapp)X:歸藏 (@op7418)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)近期一项对GPT-4、Claude 3等主流AI自主智能体的系统评估显示,其在复杂任务中的成功率普遍低于30%。测试覆盖超500个场景,发现智能体常陷入循环或操作错误,关键问题包括任务分解失效、上下文理解偏差及指令遵循不稳定。研究表明,当前技术在需要多步骤推理的实际应用中仍存在显著缺陷。
OpenAI据传正计划推出自有AI智能手机,将采用联发科和高通的芯片,并由立讯精密负责制造。分析师郭明錤预测,该手机最早可能在2027年上半年开始量产,头两年出货量最高可达3000万台。这款手机的核心设计理念是用基于AI智能体的任务流界面,取代传统的应用图标网格。这一相对保守的形态选择也表明,目前更实验性的AI硬件尚未准备好进入主流市场。
Meta 开始利用AI图像分析技术,通过识别骨骼结构和身体尺寸等视觉特征(而非面部识别)来检测Instagram和Facebook上的未成年人。公司强调该方法不依赖人脸识别,旨在更精准地识别未成年用户以加强平台保护措施。
礼来公司的数字部门负责人承认,目前AI在制药领域的回报主要集中于生产制造和后台运营环节,已累计节省数十亿美元成本。然而,在该行业此前宣传最集中的药物发现环节,AI尚未能兑现预期价值。这一反差揭示了AI在制药业不同环节的应用成熟度存在显著差异。
Anthropic发布了十个针对金融服务耗时任务的预置智能体模板,涵盖制作推介书、撰写信贷备忘录、KYC文件筛查及月末关账等。这些模板可作为Claude Cowork和Claude Code的插件,或作为Claude托管智能体的配置指南,帮助团队在数天内部署应用。Claude现通过Microsoft 365插件支持在Excel、PowerPoint等Office应用间无缝工作,并扩展了合作伙伴生态,新增数据连接器和MCP应用,使智能体能直接调用实时金融数据。这些更新与Claude Opus 4.7模型搭配效果最佳,该模型在金融任务上达到先进水平。
关联讨论 5 条X:Testing Catalog (@testingcatalog)X:Claude (@claudeai)X:阿易 AI Notes (@AYi_AInotes)Claude:Blog(网页)X:Rohan Paul (@rohanpaul_ai)美国政府与微软、谷歌及埃隆・马斯克创立的xAI达成新协议,要求这些公司在公开发布新一代AI模型前,提前向美政府开放模型权限,以进行国家安全风险审查。此举旨在应对高性能AI系统可能带来的网络攻击、军事滥用等潜在威胁。负责审查的美国商务部人工智能标准与创新中心表示,该协议是2024年与OpenAI、Anthropic所达成协议的扩展,并已累计完成40余次模型评估。
AI产品坟场网站收录了超过1000款已关闭的AI工具,揭示了该领域产品快速迭代与淘汰的现状。数据显示,这些失败产品的平均寿命仅为347天。该目录按关闭时间倒序排列,提供了产品名称、简介、存活时长与关闭原因,直观反映了AI创业赛道的高风险与高淘汰率。
文章指出,尽管生成式AI工具在员工中日益普及,但许多公司并未能有效捕获和利用这些工具产生的知识与洞见,导致组织学习停滞。员工使用AI生成的代码、文本和分析结果往往散落在个人设备与对话中,未能转化为可共享、可检索的公司资产。这造成了“AI普及却无集体智慧增长”的困境,企业投资于AI工具却未获得相应的知识积累与协同创新回报。
苹果制造学院举办首届春季论坛,汇聚美国制造商共同推动人工智能在供应链中的部署。该计划旨在通过知识共享与协作,加速供应链的智能化转型,提升效率与韧性。论坛聚焦于实际应用案例,探讨如何将AI技术整合至生产、物流与库存管理等核心环节,以应对复杂的供应链挑战。
SAP正在收购开源数据湖仓提供商Dremio和AI公司Prior Labs,以扩展其数据平台能力。这两项收购是SAP构建“AI就绪”企业数据平台战略的关键举措,旨在整合先进的数据管理和人工智能技术,强化其对企业客户的数据处理与AI服务支持。此举标志着SAP正通过积极并购加速向智能化数据平台转型。
据隐私倡导网站报道,Google Chrome 浏览器在未经任何提示或用户同意的情况下,于后台自动下载并安装了一个名为“Nano”、体积达 4 GB 的人工智能模型。该行为旨在增强本地AI功能,但完全隐蔽的安装过程占用了用户设备存储空间,且未提供任何选项或通知,引发了对其数据隐私风险及软件更新透明度的广泛担忧。此事件在Hacker News上获得高度关注,突显了公众对科技公司单方面安装行为的普遍不安。
随着AI和自动化工具大幅降低编码成本,文章《“能动编码”的启示》提出了10个关键教训,指导开发者应对“能动编码”趋势。这些教训涵盖工作流程优化、角色重新定义以及抽象思维提升,帮助在代码廉价时代保持竞争力。该内容在Hacker News社区引发热议,获得105个点赞,显示技术界对此的高度关注。
GitHub开源项目“llm-from-scratch”提供了从零开始训练大型语言模型的完整指南。该项目详细阐述了构建现代LLM所需的核心组件,包括分词器、Transformer架构、预训练与微调流程。指南强调通过实践理解模型内部机制,而非直接调用现有API。项目在Hacker News社区获得广泛关注,收获293点热度,反映出开发者对深入掌握LLM底层技术的强烈需求。
Anthropic联合创始人Jack Clark在长文中指出,AI系统训练其自身后继者所需的基础构件已基本就位。他预测到2028年底,AI实现递归式自我改进的可能性高达60%。这一进程可能使AI的进化速度超越负责监督的人类能力,引发对AI发展自主性的关键讨论。
关联讨论 1 条X:Kim (@kimmonismus)Amazon SageMaker AI 新增了一个 AI 智能体,旨在帮助开发者定制语言模型。该功能支持对 Llama、Qwen、Deepseek 和 Nova 等主流模型进行智能体驱动的微调,使开发者能更高效地优化模型以适应特定任务,无需从零开始构建。这标志着 AWS 在降低大模型定制门槛、提升开发效率方面迈出重要一步。
OpenAI 发布了名为 MRC 的新型超级计算机网络协议,旨在提升大规模 AI 训练集群的韧性与性能。该协议通过开放计算项目公开,支持在数千个 GPU 间建立高效、可靠的多路径连接,能自动绕过故障链路,将网络有效带宽提升最高达 30%,同时显著降低训练作业因网络问题中断的概率。MRC 的设计目标是应对万卡级集群的复杂网络挑战,为下一代大模型训练提供基础设施支持。
关联讨论 1 条X:OpenAI (@OpenAI)OpenAI 于2026年5月5日发布了最新即时模型 GPT-5.5 Instant。该模型在网络安全、生物与化学防范两个类别首次被定位为“高能力”级别,并为此实施了相应的安全防护措施。其整体安全缓解方案与此系列前代模型相似。官方明确,不存在名为 GPT-5.4 Instant 的模型,其主要对标基线是 GPT-5.3 Instant。为避免混淆,GPT-5.5 模型被特指为 GPT-5.5 Thinking。
关联讨论 12 条X:Greg Brockman (@gdb)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:Berry Xia (@berryxia)X:Sam Altman (@sama)X:ChatGPT (@ChatGPTapp)X:歸藏 (@op7418)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)ChatGPT的默认模型已更新为GPT-5.5 Instant。新版模型能提供更智能、更准确的答案,并有效减少了幻觉现象。同时,用户获得了更强的个性化控制能力,使交互体验更贴合个人需求。此次升级标志着模型在理解精度与响应定制化方面取得了显著进步。
关联讨论 12 条X:Greg Brockman (@gdb)X:Testing Catalog (@testingcatalog)X:Rohan Paul (@rohanpaul_ai)X:宝玉 (@dotey)X:Kim (@kimmonismus)X:Eric Mitchell (@ericmitchellai)X:Berry Xia (@berryxia)X:Sam Altman (@sama)X:ChatGPT (@ChatGPTapp)X:歸藏 (@op7418)X:OpenAI Developers (@OpenAIDevs)X:OpenAI (@OpenAI)