Claude Desktop 会在用户无授权的情况下自动启动一台虚拟机,且提供任何停止或关闭该虚拟机的途径。这一行为已在 GitHub 上引发讨论,用户担忧其可能带来的资源占用及隐私安全风险。
Claude Desktop 会在用户无授权的情况下自动启动一台虚拟机,且提供任何停止或关闭该虚拟机的途径。这一行为已在 GitHub 上引发讨论,用户担忧其可能带来的资源占用及隐私安全风险。
安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。
Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架,已在 Apache 基金会下发布。该项目提供工具和抽象,帮助开发者设计、开发和部署可信任的智能体应用,强调可靠性、可观测性和生产级部署能力。
6 月 10 日,eToro 宣布其 AI 智能体 Tori 集成来自 SpaceXAI 的文本模型,能够从 X 平台实时读取市场情绪变化、追踪信号并分析信息。Tori 现已在 eToro 的投资流程中嵌入该能力,支持用户以自然语言查询和解读市场情绪。eToro 拥有超过 4000 万注册用户,覆盖 75 个国家。该功能基于 SpaceXAI API 构建,其他开发团队也可通过 API 控制台在数分钟内搭建类似应用,如研究助手或情绪看板。
Anthropic 推出 Claude Managed Agents,一套可组合 API 套件,用于构建和部署生产级智能体。该产品从早期简单 API 演进至 Claude Agent SDK,再到将智能体调度层与代码执行沙箱解耦的 Managed Agents。通过只追加日志的会话机制,Managed Agents 解决了托管伸缩、会话持久化、文件系统管理、执行隔离、凭证安全与可观测性等生产部署挑战。团队借助该方案可在数天内完成从原型到生产环境的转化,无需自建基础设施。
同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》DiffusionGemma 是 Google 基于 Gemma 4 架构的实验性文本生成模型,采用扩散式并行生成替代逐 token 自回归,实现更快推理、双向上下文感知和实时自我修正,并可在消费级 GPU 上部署。模型通过迭代去噪并行生成并细化 256-token 块,在处理数独等复杂约束任务上优于传统语言模型,且微调效果显著。它已集成 vLLM 等推理框架,为开发者提供一种高性能、高效长上下文扩展且易于定制部署的非自回归新方法。
关联讨论 6 条Google DeepMind:Blog(RSS)X:Google DeepMind (@GoogleDeepMind)X:Demis Hassabis (@demishassabis)X:Testing Catalog (@testingcatalog)X:Google AI for Developers (@googleaidevs)MarkTechPost(RSS)OpenAI 正在深入谈判,计划租赁俄亥俄州一个拟建的 10GW 数据中心园区,并可能获得英伟达的资金支持。项目完全建成后总成本至少 5000 亿美元(约 3.39 万亿元人民币),一期预计 2028 年投产。机房将全部搭载英伟达硬件,英伟达通过资产负债表提供兜底担保,为 OpenAI 的租金偿付和项目融资出具资金保障。
OpenAI 正在谈判租赁俄亥俄州一个计划中的 10 吉瓦数据中心,该数据中心可能由 Nvidia 提供财务支持。这是 OpenAI 迄今为止规模最大的数据中心项目。
小米MiMo-V2.5-Pro UltraSpeed模式在单8卡节点上实现万亿参数MoE推理模型输出速度1000 token/s,峰值达2140 token/s,是普通版的3倍,且此前已降价99%。接入Claude Code桌面端开启UltraCode模式后,可调度12个Agent在11分钟内完成项目升级报告并打包成Skill;3分钟内生成含灯光、剪影、星光特效的3D吉他英雄网页。技术层面通过FP4混合量化、提前草稿机制及计算/搬数据/通信流水线调度实现高速推理。
BrainSurgery是一种针对神经网络checkpoint的“张量手术”工具,通过声明式YAML计划执行复杂的权重变换。它支持结构修改、数学变换、张量重塑,利用正则表达式和结构定位进行精准操作,并内置断言验证张量形状、数据类型和值,防止静默错误。工具覆盖从模型升级(upcycling)到LoRA提取等四个示例和三个案例研究,旨在提供可重复、可验证的模型编辑基础。
工信部日前印发《“人工智能+信息通信”创新发展实施意见(2026—2028年)》,提出到2028年形成30个以上高价值典型场景,城域算力1毫秒时延圈覆盖率不低于75%;到2030年实现人工智能与信息通信网络融合核心技术突破。意见要求加强高速光电芯片、全光交换器件、光电共封装器件等研发验证,开展光电混合组网试验,并推进广域无损网络、任务式调度、算网运维智能体等技术验证,以降低比特带宽成本。
工信部发文,要求加快建设400Gbps/800Gbps骨干传输网络,优化东中西部国家枢纽节点间通道;推进城域400Gbps及以上、全光交叉等高速光传输系统应用,构建城域毫秒级低时延入算能力。同时推动5G-A/6G、新一代光网络、“IPv6+”、工业互联网与AI融合发展,攻关空口智能化、网络高等级自智、智能体互联网等核心技术。鼓励基础电信企业用AI赋能传统业务,深化智慧个人助理、智慧管家、家庭看护、3D观影等新型应用。
Meta与印度信实集团(Reliance)签署在印度的首个AI数据中心协议。该设施容量为168兆瓦,将支持Meta全球AI计算需求,并具备未来扩展能力。
Meta 与印度信实工业达成合作,以租赁形式建设其首个位于印度的 AI 数据中心。该设施位于古吉拉特邦贾姆讷格尔的信实数据中心园区,使用可再生能源供电并以淡化海水冷却。一期规模 168MW,由 Meta 租赁,后续可进一步扩张。Meta 将承担园区全部能源和用水成本,并在印度签订了近 1GW 的新增可再生能源合同。此举旨在为增长迅猛的印度市场提供本地化个性化 AI 服务。
SpaceX在得克萨斯州巴斯特罗普市新建1100万平方英尺(约102.2万平方米)卫星工厂,生产首款AI卫星AI1。该卫星长70米,峰值算力150千瓦,计划2027年底规模化量产。公司计划2027年底建成1吉瓦太空AI算力,届时每年需发射6000余颗AI1卫星;目标2030年年算力100吉瓦。工厂将垂直整合太阳能硅锭、硅片、电池、电路板等供应链。此外,SpaceX、特斯拉与xAI联合在奥斯汀打造Terafab芯片工厂,年产能可支撑1太瓦算力。
macOS容器机项目在GitHub上公开,获得102个Hacker News热度积分。该项目为macOS提供容器化运行环境,具体实现细节及功能尚未在本次发布中详细披露。
SpaceX 计划在 2027 年底前完成天基 AI 计算基础设施首批示范发射,早于招股书中披露的“最早 2028 年”部署时间。公司已申请发射至多 100 万颗天基数据中心卫星。在 IPO 前投资者推介会上,总裁格温妮・肖特韦尔与 CFO 布雷特・约翰森公布路线图:先期系统用于技术验证,成熟后再商用。IPO 计划募资 750 亿美元,目标估值 1.75 万亿美元,股票代码 SPCX,发行价 135 美元,本周五在纳斯达克挂牌。
研究团队开发了一款兼容开源核心网 Free5GC 的 NWDAF 实现,集成了大语言模型接口,支持操作员通过自然语言与网络交互。系统利用语义嵌入模型将用户意图编码并映射到 7 个预设意图类别,触发分析查询或事件订阅命令,简化传统接口的复杂性。该 NWDAF 支持 AMF 和 SMF 事件订阅、通过 Prometheus 进行实时监控与分析检索,所有功能均可通过对话式界面访问。项目代码与数据集已在 GitHub 开源。
推测解码(SD)通过轻量草稿模型并行生成候选项、由大型验证器校验来降低LLM推理成本。现有方法采用二元决策:接受或完全重算。VIA-SD提出多层级框架,利用模型内路由从完整验证器中提取轻量子模型(slim-verifier),对中等置信度的草稿token进行再生,仅在不确定时调用完整模型。在四个代表性任务和多种模型族上,VIA-SD将拒绝率降低0.10–0.22,相比强SD基线实现10–20%加速,相比非推测解码实现2.5–3倍加速。该方法兼容现有SD框架,无需修改训练过程。
据韩国经济日报报道,三星电子计划在韩国光州建设一座先进半导体封装工厂,以应对AI芯片需求。该投资计划有望于6月29日总统会谈期间公布,三星会长李在镕、SK集团会长崔泰源等将参会。三星拒绝对此置评。先进封装已成为决定芯片性能的关键环节,三星正加码HBM市场,挑战SK海力士领先地位。当前客户涵盖英伟达、AMD及谷歌。今年5月,三星已向客户提供最新12层HBM4E内存样品。
Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库,作者利用 Fable 逆向工程,找到了为该模型设置自定义价格的方法,并展示了 Fable 5 当天在不同本地项目中的使用量树状图。
Thinnernet 是一个正在构建中的并行互联网项目。该帖子在 Hacker News 上获得 100 个点赞。
将Kolmogorov-Arnold Networks(KAN)部署于FPGA,实现超高速机器学习推理。
本文介绍了如何将 GitHub Actions 的 CI 作业迁移到 Hugging Face Jobs 上运行,以解决 GitHub Actions 速度慢、缺乏 GPU 支持等问题。通过使用 huggingface/jobs-actions 桥接,将 GitHub Actions 的 job 转为临时自托管运行器:GitHub App 监听 workflow_job.queued webhook,dispatcher Space 验证后启动对应硬件(CPU 或 t4-small、h200 等 GPU)的 HF Job,由 ephemeral runner 执行 CI 并上报结果。作者基于 Trackio 项目实际落地,CPU 作业时间减少约 30%,并新增了 GPU 测试套件。文章分步说明了复制 dispatcher Space、创建并安装 GitHub App、配置 webhook 和 HF_TOKEN 的具体步骤。
SpaceX 计划将数据中心发射到太空,埃隆·马斯克在公司 IPO 前将其描述为一个近乎简单的工程问题。首颗 AI 卫星的性能将相当于单个 Nvidia GB300 机架。然而,谷歌的研究指出,真正的 AI 训练需要大约 10000 颗紧密联动的卫星。
Gemini 2.5 Flash API 的定价与快速入门指南,指导用户配置 thinking budgets、比较不同提供商,并在 5 分钟内完成首次 API 调用。
同一事件,精选展示《Gemini 2.5 Flash API - 定价、快速入门与提供商比较》中国计划在未来五年投资约2950亿美元建设全国性AI数据中心网络。根据彭博社报道,至少80%的技术将来自华为等国内供应商。与此同时,台湾正考虑首次将向中国走私AI芯片定为刑事犯罪。
Sandstone 完成 3000 万美元 A 轮融资,由 Lightspeed Partners 领投,Sequoia 参投。资金将用于将 AI 技术引入企业内部法务团队,提升法律工作效率。
Cloudflare 在 Project Glasswing 一文中提出,漏洞周围的架构比补丁速度更重要。本文详细阐述了这一架构的设计、它防御的威胁类型,以及 Cloudflare 如何以自家产品作为“客户零”(customer zero)来实际运行这套防御体系。
在无设计稿和后端代码的条件下,Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档,于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付,单端耗时约 4 小时,中途无人工接管。模型不具备图像理解能力,通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统:任务拆分为规划、架构、编码等阶段,验收覆盖静态检查、编译自检(0 error)、路由完整性(Web 端 34 条路由全部可达)、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试,使模型数小时内收敛。移动端产出可安装 APK,Web 端 typecheck 与构建均通过。
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》自主AI智能体在加速软件交付的同时,也大幅缩短了从失误演变为灾难的时间,给安全策略造成盲区。威胁不再仅来自外部勒索软件或恶意内部人员,而是来自被授权的内部工具本身。文章探讨了在DevOps中针对这一风险构建有效防御的做法。
小米与TileRT联合推出MiMo-V2.5-Pro的UltraSpeed模式,在1万亿参数模型上首次达到超1000 tokens/s输出速度。UltraSpeed API同步上线,定价为原版的3倍,输出速度提升约10倍。由于资源有限,采取申请制限时开放,通过用户可在2026年6月9日至6月23日23:59接入API体验,并获限时免费Chat。试用规则:每账号每日最多成功进入队列10次,单次会话上限30分钟,空闲超5分钟自动释放资源。
关联讨论 2 条X:小米 MiMo (@XiaomiMiMo)Hacker News 热门(buzzing.cc 中文翻译)国家数据局《数字中国发展报告》显示,截至2025年底,我国智能算力规模达159万PFLOPS,全球第二;在用算力机架超1373万架,建成万卡集群42个。同期网民规模11.25亿,普及率80.1%;使用AI解答问题、生成图片视频、生活助手的用户分别为4.57亿、2.88亿、1.84亿,中青年用户占74.6%。工信部《算力互联互通行动计划》提出到2026年建立标准,到2028年实现公共算力标准化互联。中国电信研究院预测,到2035年AI将为我国GDP贡献超11万亿元。
AI评估结果规模庞大但报告不一致,导致读者难以跨来源比较、识别遗漏或追溯结论。Evaluation Cards通过整合基准元数据、评估运行数据和模型元数据,形成统一记录。方法包括:(1)从52篇论文和10次利益相关者访谈中推导报告模式;(2)实现四个可解释信号(可复现性、文档完整性、来源与风险、分数可比性),并针对研究与非研究受众提供不同读者模式;(3)部署监控工具,覆盖5816个模型、635个基准和101843个结果,揭示当前报告实践中的系统性缺口。
SpaceX 称轨道 AI 数据中心并非工程难题,现有星链卫星已具备大部分技术。AI 卫星将沿用第三代星链的太阳能电池阵列与热管理系统,结构更简单,无需大型相控阵天线。马斯克展示的 AI1 卫星渲染图显示配备翼展 70 米光伏面板,支持平均 120 千瓦、峰值 150 千瓦计算载荷,相当于单台英伟达 GB300 AI 服务器机架。SpaceX 计划组建约 100 万颗 AI 卫星网络,位于得克萨斯州巴斯特罗普的工厂预计明年年底前实现规模化量产,星舰可重复使用设计将支撑大批量运输。
关联讨论 6 条X:Elon Musk (@elonmusk, xAI)X:Rohan Paul (@rohanpaul_ai)Simon Willison 博客IT之家(RSS)X:Kim (@kimmonismus)The Verge:AI(RSS)小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens);系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放(2026 年 6 月 9 日至 23 日),定价为 MiMo-V2.5-Pro 的 3 倍,速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。
关联讨论 2 条X:小米 MiMo (@XiaomiMiMo)Hacker News 热门(buzzing.cc 中文翻译)2026年全国高考统考科目于6月8日结束,部分省份选考科目仍在进行。海南、山东、山西、重庆、广东、湖北、江西等地已公布查分时间,多数集中在6月25日。教育部将举办“2026年全国普通高等学校招生云咨询周”,并对“阳光高考”平台及“阳光志愿”信息服务系统进行优化升级。此外,多地考场已投入使用AI智能巡查系统,通过视觉分析算法捕捉异常行为并自动标记作弊迹象,供审核员进一步确认。
Apple 为首次 App Store 下载量不足 200 万的开发者免除云 API 费用,以降低 AI 实验门槛。