AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 1386 条
全部一手资讯X论文
标签「部署/工程」清除
6月11日周四
03:47Hacker News 热门(buzzing.cc 中文翻译)59Claude Desktop 启动了一台虚拟机,且无法停止它
03:17Hacker News 热门(buzzing.cc 中文翻译)190.01欧元转账可危及银行AI代理系统,bunq修复安全漏洞
02:47Hacker News 热门(buzzing.cc 中文翻译)64Apache Burr:构建可靠的人工智能代理和应用程序
02:40xAI:News(网页)69精选eToro AI 智能体 Tori 集成 SpaceXAI 文本模型实现实时市场情绪分析
02:10Claude:Blog(网页)75同事件精选智能体表面的演进:使用 Claude Managed Agents 构建同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
00:39Google Developers Blog(RSS)78DiffusionGemma 开发者指南
6月10日周三
22:28IT之家(RSS)67消息称 OpenAI 洽谈租赁俄亥俄州 10GW 数据中心,英伟达或提供资金支持
22:19The Decoder:AI News(RSS)54OpenAI 欲租最大数据中心,Nvidia 提供财务支持
17:20公众号:卡尔的AI沃茨65实测小米MiMo-V2.5-Pro UltraSpeed:万亿参数MoE推理模型输出速度达1000 token/s
16:56HuggingFace Daily Papers(社区热门论文)63BrainSurgery:可重复且可靠的声明式权重操作工具,用于模型编辑与模型升级
16:28IT之家(RSS)64工信部:加强高端光电芯片和器件研发,开展光电混合组网试验
15:28IT之家(RSS)78精选工信部印发《"人工智能+信息通信"创新发展实施意见》
15:14TechCrunch:AI(RSS)52Meta与Reliance签署在印度的首个AI数据中心协议
14:28IT之家(RSS)54Meta 携手信实构建其首个印度 AI 数据中心,一期规模 168MW
10:28IT之家(RSS)69SpaceX将建巨型卫星工厂:占地超100万平方米,明年量产AI卫星
10:11Hacker News 热门(buzzing.cc 中文翻译)63macOS 容器机
09:28IT之家(RSS)57冲刺"太空数据中心":消息称 SpaceX 计划 2027 年底前开展轨道 AI 计算测试
08:00HuggingFace Daily Papers(社区热门论文)42LLM 赋能的 NWDAF:迈向 AI 原生 6G 网络智能的一步
08:00HuggingFace Daily Papers(社区热门论文)63VIA-SD:通过模型内路由实现推测解码的验证
07:27IT之家(RSS)57消息称三星电子计划在韩国光州新建先进半导体封装工厂,强化 AI 芯片产业链布局
06:19Simon Willison 博客71精选在 AgentsView 中为 Claude Fable 5 设置自定义价格
06:10Hacker News 热门(buzzing.cc 中文翻译)1我正在构建一个并行互联网,它被称为"Thinnernet"
06:10Hacker News 热门(buzzing.cc 中文翻译)47基于Kolmogorov-Arnold Networks的FPGA超高速机器学习
05:55Hugging Face:Blog(RSS)74精选将 GitHub CI 迁移到 Hugging Face Jobs
03:13TechCrunch:AI(RSS)65技术公司能学会爱上更便宜的AI模型吗?
00:15The Decoder:AI News(RSS)50SpaceX 计划将数据中心送入轨道,马斯克称这只是个小工程问题
00:00OpenRouter:Announcements(RSS)60同事件精选Gemini 2.5 Flash API:定价、快速入门与提供商对比同一事件,精选展示《Gemini 2.5 Flash API - 定价、快速入门与提供商比较》
6月9日周二
22:14The Decoder:AI News(RSS)70北京2950亿美元AI建设计划要求80%国产芯片,将美国供应商排除在外
22:12TechCrunch:AI(RSS)52Sandstone 获 3000 万美元 A 轮融资,将 AI 引入内部法务团队
21:39Cloudflare Blog51对抗前沿网络模型:Cloudflare 作为"客户零"的架构实践
21:18Ars Technica:AI(RSS)57苹果称其 AI 在谷歌服务器上运行仍保持隐私
17:40公众号:通义实验室(千问)67同事件精选仅凭一份文档,Qwen3.7-Max 从 0 交付双端应用同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
17:19Artificial Intelligence News(RSS)51自主AI智能体在DevOps中的数据丢失风险:构建高效防御
15:26IT之家(RSS)78小米MiMo发布V2.5-Pro-UltraSpeed模式,突破万亿参数模型千tokens/s输出速度
15:26IT之家(RSS)66截至2025年底我国智能算力规模达159万PFLOPS,位居全球第二
12:55HuggingFace Daily Papers(社区热门论文)68评估卡片:AI评估报告的可解读层
12:22IT之家(RSS)74马斯克详解 SpaceX AI 卫星计划:技术成熟,明年规模化量产
11:40公众号:小米 MiMo80精选小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s
09:21IT之家(RSS)39多地公布2026高考查分时间,教育部"阳光志愿"系统将优化升级
05:09TechCrunch:AI(RSS)52Apple 免除小型开发者的 AI 云 API 费用
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月11日
03:47
Hacker News 热门(buzzing.cc 中文翻译)
59
Claude Desktop 启动了一台虚拟机,且无法停止它

Claude Desktop 会在用户无授权的情况下自动启动一台虚拟机,且提供任何停止或关闭该虚拟机的途径。这一行为已在 GitHub 上引发讨论,用户担忧其可能带来的资源占用及隐私安全风险。

智能体Anthropic产品更新部署/工程
03:17
Hacker News 热门(buzzing.cc 中文翻译)
19
0.01欧元转账可危及银行AI代理系统,bunq修复安全漏洞

安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。

安全/对齐部署/工程
02:47
Hacker News 热门(buzzing.cc 中文翻译)
64
Apache Burr:构建可靠的人工智能代理和应用程序

Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架,已在 Apache 基金会下发布。该项目提供工具和抽象,帮助开发者设计、开发和部署可信任的智能体应用,强调可靠性、可观测性和生产级部署能力。

智能体开源/仓库部署/工程
02:40
xAI:News(网页)
精选69
eToro AI 智能体 Tori 集成 SpaceXAI 文本模型实现实时市场情绪分析

6 月 10 日,eToro 宣布其 AI 智能体 Tori 集成来自 SpaceXAI 的文本模型,能够从 X 平台实时读取市场情绪变化、追踪信号并分析信息。Tori 现已在 eToro 的投资流程中嵌入该能力,支持用户以自然语言查询和解读市场情绪。eToro 拥有超过 4000 万注册用户,覆盖 75 个国家。该功能基于 SpaceXAI API 构建,其他开发团队也可通过 API 控制台在数分钟内搭建类似应用,如研究助手或情绪看板。

xAI行业动态部署/工程

推荐理由:xAI 的实时 X 数据能力正式嵌入 eToro 投资助手 Tori,4000 万散户第一次能用上基于社交情绪的智能分析,虽然只是一个 API 集成案例,但把‘市场脉搏’塞进 AI 助手的方向对了。
02:10
Claude:Blog(网页)
同事件精选75
智能体表面的演进:使用 Claude Managed Agents 构建

Anthropic 推出 Claude Managed Agents,一套可组合 API 套件,用于构建和部署生产级智能体。该产品从早期简单 API 演进至 Claude Agent SDK,再到将智能体调度层与代码执行沙箱解耦的 Managed Agents。通过只追加日志的会话机制,Managed Agents 解决了托管伸缩、会话持久化、文件系统管理、执行隔离、凭证安全与可观测性等生产部署挑战。团队借助该方案可在数天内完成从原型到生产环境的转化,无需自建基础设施。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
推荐理由:Claude Managed Agents 把代理部署的复杂基础设施打包成了 API,让团队从原型到上线只需几天而不是几个月,尤其凭证隔离和延迟优化对生产环境很关键,想部署可靠代理的团队可以认真看看。
00:39
Google Developers Blog(RSS)
78
DiffusionGemma 开发者指南

DiffusionGemma 是 Google 基于 Gemma 4 架构的实验性文本生成模型,采用扩散式并行生成替代逐 token 自回归,实现更快推理、双向上下文感知和实时自我修正,并可在消费级 GPU 上部署。模型通过迭代去噪并行生成并细化 256-token 块,在处理数独等复杂约束任务上优于传统语言模型,且微调效果显著。它已集成 vLLM 等推理框架,为开发者提供一种高性能、高效长上下文扩展且易于定制部署的非自回归新方法。

Google推理模型发布部署/工程
关联讨论 6 条Google DeepMind:Blog(RSS)X:Google DeepMind (@GoogleDeepMind)X:Demis Hassabis (@demishassabis)X:Testing Catalog (@testingcatalog)X:Google AI for Developers (@googleaidevs)MarkTechPost(RSS)
6月10日
22:28
IT之家(RSS)
67
消息称 OpenAI 洽谈租赁俄亥俄州 10GW 数据中心,英伟达或提供资金支持

OpenAI 正在深入谈判,计划租赁俄亥俄州一个拟建的 10GW 数据中心园区,并可能获得英伟达的资金支持。项目完全建成后总成本至少 5000 亿美元(约 3.39 万亿元人民币),一期预计 2028 年投产。机房将全部搭载英伟达硬件,英伟达通过资产负债表提供兜底担保,为 OpenAI 的租金偿付和项目融资出具资金保障。

OpenAI行业动态部署/工程
22:19
The Decoder:AI News(RSS)
54
OpenAI 欲租最大数据中心,Nvidia 提供财务支持

OpenAI 正在谈判租赁俄亥俄州一个计划中的 10 吉瓦数据中心,该数据中心可能由 Nvidia 提供财务支持。这是 OpenAI 迄今为止规模最大的数据中心项目。

OpenAI行业动态部署/工程
17:20
公众号:卡尔的AI沃茨
65
实测小米MiMo-V2.5-Pro UltraSpeed:万亿参数MoE推理模型输出速度达1000 token/s

小米MiMo-V2.5-Pro UltraSpeed模式在单8卡节点上实现万亿参数MoE推理模型输出速度1000 token/s,峰值达2140 token/s,是普通版的3倍,且此前已降价99%。接入Claude Code桌面端开启UltraCode模式后,可调度12个Agent在11分钟内完成项目升级报告并打包成Skill;3分钟内生成含灯光、剪影、星光特效的3D吉他英雄网页。技术层面通过FP4混合量化、提前草稿机制及计算/搬数据/通信流水线调度实现高速推理。

智能体教程/实践部署/工程
16:56
HuggingFace Daily Papers(社区热门论文)
63
BrainSurgery:可重复且可靠的声明式权重操作工具,用于模型编辑与模型升级

BrainSurgery是一种针对神经网络checkpoint的“张量手术”工具,通过声明式YAML计划执行复杂的权重变换。它支持结构修改、数学变换、张量重塑,利用正则表达式和结构定位进行精准操作,并内置断言验证张量形状、数据类型和值,防止静默错误。工具覆盖从模型升级(upcycling)到LoRA提取等四个示例和三个案例研究,旨在提供可重复、可验证的模型编辑基础。

开源生态论文/研究部署/工程
16:28
IT之家(RSS)
64
工信部:加强高端光电芯片和器件研发,开展光电混合组网试验

工信部日前印发《“人工智能+信息通信”创新发展实施意见(2026—2028年)》,提出到2028年形成30个以上高价值典型场景,城域算力1毫秒时延圈覆盖率不低于75%;到2030年实现人工智能与信息通信网络融合核心技术突破。意见要求加强高速光电芯片、全光交换器件、光电共封装器件等研发验证,开展光电混合组网试验,并推进广域无损网络、任务式调度、算网运维智能体等技术验证,以降低比特带宽成本。

政策/监管部署/工程
15:28
IT之家(RSS)
精选78
工信部印发《"人工智能+信息通信"创新发展实施意见》

工信部发文,要求加快建设400Gbps/800Gbps骨干传输网络,优化东中西部国家枢纽节点间通道;推进城域400Gbps及以上、全光交叉等高速光传输系统应用,构建城域毫秒级低时延入算能力。同时推动5G-A/6G、新一代光网络、“IPv6+”、工业互联网与AI融合发展,攻关空口智能化、网络高等级自智、智能体互联网等核心技术。鼓励基础电信企业用AI赋能传统业务,深化智慧个人助理、智慧管家、家庭看护、3D观影等新型应用。

政策/监管部署/工程

推荐理由:工信部这次把400G/800G骨干网和AI直接挂钩,意味着算力输送的「血管」要升级了,做AI基建和云服务的可以认真看下落地节奏。
15:14
TechCrunch:AI(RSS)
52
Meta与Reliance签署在印度的首个AI数据中心协议

Meta与印度信实集团(Reliance)签署在印度的首个AI数据中心协议。该设施容量为168兆瓦,将支持Meta全球AI计算需求,并具备未来扩展能力。

Meta行业动态部署/工程
14:28
IT之家(RSS)
54
Meta 携手信实构建其首个印度 AI 数据中心,一期规模 168MW

Meta 与印度信实工业达成合作,以租赁形式建设其首个位于印度的 AI 数据中心。该设施位于古吉拉特邦贾姆讷格尔的信实数据中心园区,使用可再生能源供电并以淡化海水冷却。一期规模 168MW,由 Meta 租赁,后续可进一步扩张。Meta 将承担园区全部能源和用水成本,并在印度签订了近 1GW 的新增可再生能源合同。此举旨在为增长迅猛的印度市场提供本地化个性化 AI 服务。

Meta行业动态部署/工程
10:28
IT之家(RSS)
69
SpaceX将建巨型卫星工厂:占地超100万平方米,明年量产AI卫星

SpaceX在得克萨斯州巴斯特罗普市新建1100万平方英尺(约102.2万平方米)卫星工厂,生产首款AI卫星AI1。该卫星长70米,峰值算力150千瓦,计划2027年底规模化量产。公司计划2027年底建成1吉瓦太空AI算力,届时每年需发射6000余颗AI1卫星;目标2030年年算力100吉瓦。工厂将垂直整合太阳能硅锭、硅片、电池、电路板等供应链。此外,SpaceX、特斯拉与xAI联合在奥斯汀打造Terafab芯片工厂,年产能可支撑1太瓦算力。

xAI数据/训练行业动态部署/工程
10:11
Hacker News 热门(buzzing.cc 中文翻译)
63
macOS 容器机

macOS容器机项目在GitHub上公开,获得102个Hacker News热度积分。该项目为macOS提供容器化运行环境,具体实现细节及功能尚未在本次发布中详细披露。

GitHub产品更新部署/工程
09:28
IT之家(RSS)
57
冲刺"太空数据中心":消息称 SpaceX 计划 2027 年底前开展轨道 AI 计算测试

SpaceX 计划在 2027 年底前完成天基 AI 计算基础设施首批示范发射,早于招股书中披露的“最早 2028 年”部署时间。公司已申请发射至多 100 万颗天基数据中心卫星。在 IPO 前投资者推介会上,总裁格温妮・肖特韦尔与 CFO 布雷特・约翰森公布路线图:先期系统用于技术验证,成熟后再商用。IPO 计划募资 750 亿美元,目标估值 1.75 万亿美元,股票代码 SPCX,发行价 135 美元,本周五在纳斯达克挂牌。

行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
42
LLM 赋能的 NWDAF:迈向 AI 原生 6G 网络智能的一步

研究团队开发了一款兼容开源核心网 Free5GC 的 NWDAF 实现,集成了大语言模型接口,支持操作员通过自然语言与网络交互。系统利用语义嵌入模型将用户意图编码并映射到 7 个预设意图类别,触发分析查询或事件订阅命令,简化传统接口的复杂性。该 NWDAF 支持 AMF 和 SMF 事件订阅、通过 Prometheus 进行实时监控与分析检索,所有功能均可通过对话式界面访问。项目代码与数据集已在 GitHub 开源。

论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
63
VIA-SD:通过模型内路由实现推测解码的验证

推测解码(SD)通过轻量草稿模型并行生成候选项、由大型验证器校验来降低LLM推理成本。现有方法采用二元决策:接受或完全重算。VIA-SD提出多层级框架,利用模型内路由从完整验证器中提取轻量子模型(slim-verifier),对中等置信度的草稿token进行再生,仅在不确定时调用完整模型。在四个代表性任务和多种模型族上,VIA-SD将拒绝率降低0.10–0.22,相比强SD基线实现10–20%加速,相比非推测解码实现2.5–3倍加速。该方法兼容现有SD框架,无需修改训练过程。

推理论文/研究部署/工程
07:27
IT之家(RSS)
57
消息称三星电子计划在韩国光州新建先进半导体封装工厂,强化 AI 芯片产业链布局

据韩国经济日报报道,三星电子计划在韩国光州建设一座先进半导体封装工厂,以应对AI芯片需求。该投资计划有望于6月29日总统会谈期间公布,三星会长李在镕、SK集团会长崔泰源等将参会。三星拒绝对此置评。先进封装已成为决定芯片性能的关键环节,三星正加码HBM市场,挑战SK海力士领先地位。当前客户涵盖英伟达、AMD及谷歌。今年5月,三星已向客户提供最新12层HBM4E内存样品。

行业动态部署/工程
06:19
Simon Willison 博客
精选71
在 AgentsView 中为 Claude Fable 5 设置自定义价格

Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库,作者利用 Fable 逆向工程,找到了为该模型设置自定义价格的方法,并展示了 Fable 5 当天在不同本地项目中的使用量树状图。

智能体教程/实践部署/工程

推荐理由:如果你也用 coding agent 且在乎成本,Simon 这个自定义价格技巧能让你第一时间把新模型纳入追踪,简单但实用。
06:10
Hacker News 热门(buzzing.cc 中文翻译)
1
我正在构建一个并行互联网,它被称为"Thinnernet"

Thinnernet 是一个正在构建中的并行互联网项目。该帖子在 Hacker News 上获得 100 个点赞。

现象/趋势部署/工程
06:10
Hacker News 热门(buzzing.cc 中文翻译)
47
基于Kolmogorov-Arnold Networks的FPGA超高速机器学习

将Kolmogorov-Arnold Networks(KAN)部署于FPGA,实现超高速机器学习推理。

论文/研究部署/工程
05:55
Hugging Face:Blog(RSS)
精选74
将 GitHub CI 迁移到 Hugging Face Jobs

本文介绍了如何将 GitHub Actions 的 CI 作业迁移到 Hugging Face Jobs 上运行,以解决 GitHub Actions 速度慢、缺乏 GPU 支持等问题。通过使用 huggingface/jobs-actions 桥接,将 GitHub Actions 的 job 转为临时自托管运行器:GitHub App 监听 workflow_job.queued webhook,dispatcher Space 验证后启动对应硬件(CPU 或 t4-small、h200 等 GPU)的 HF Job,由 ephemeral runner 执行 CI 并上报结果。作者基于 Trackio 项目实际落地,CPU 作业时间减少约 30%,并新增了 GPU 测试套件。文章分步说明了复制 dispatcher Space、创建并安装 GitHub App、配置 webhook 和 HF_TOKEN 的具体步骤。

Hugging Face教程/实践部署/工程

推荐理由:HF 直接把 CI 桥接器开源了出来,教你把 GitHub Actions 迁到 HF Jobs 上跑 GPU 测试,ML 项目终于可以低成本配上显卡 CI,步骤清晰到能直接抄作业。
03:13
TechCrunch:AI(RSS)
65
技术公司能学会爱上更便宜的AI模型吗?

如果技术公司能用更便宜的模型处理相同AI工作负载且不影响质量,这将意味着AI经济性的巨大转变。

推理现象/趋势部署/工程
00:15
The Decoder:AI News(RSS)
50
SpaceX 计划将数据中心送入轨道,马斯克称这只是个小工程问题

SpaceX 计划将数据中心发射到太空,埃隆·马斯克在公司 IPO 前将其描述为一个近乎简单的工程问题。首颗 AI 卫星的性能将相当于单个 Nvidia GB300 机架。然而,谷歌的研究指出,真正的 AI 训练需要大约 10000 颗紧密联动的卫星。

行业动态部署/工程
00:00
OpenRouter:Announcements(RSS)
同事件精选60
Gemini 2.5 Flash API:定价、快速入门与提供商对比

Gemini 2.5 Flash API 的定价与快速入门指南,指导用户配置 thinking budgets、比较不同提供商,并在 5 分钟内完成首次 API 调用。

Google推理教程/实践部署/工程
同一事件,精选展示《Gemini 2.5 Flash API - 定价、快速入门与提供商比较》
推荐理由:Gemini 2.5 Flash 最值得关注的是 thinking budget,这篇教程把怎么用、怎么省都讲清楚了,但对早已熟悉文档的开发者来说新东西有限。
6月9日
22:14
The Decoder:AI News(RSS)
70
北京2950亿美元AI建设计划要求80%国产芯片,将美国供应商排除在外

中国计划在未来五年投资约2950亿美元建设全国性AI数据中心网络。根据彭博社报道,至少80%的技术将来自华为等国内供应商。与此同时,台湾正考虑首次将向中国走私AI芯片定为刑事犯罪。

政策/监管部署/工程
22:12
TechCrunch:AI(RSS)
52
Sandstone 获 3000 万美元 A 轮融资,将 AI 引入内部法务团队

Sandstone 完成 3000 万美元 A 轮融资,由 Lightspeed Partners 领投,Sequoia 参投。资金将用于将 AI 技术引入企业内部法务团队,提升法律工作效率。

行业动态部署/工程
21:39
Cloudflare Blog
51
对抗前沿网络模型:Cloudflare 作为"客户零"的架构实践

Cloudflare 在 Project Glasswing 一文中提出,漏洞周围的架构比补丁速度更重要。本文详细阐述了这一架构的设计、它防御的威胁类型,以及 Cloudflare 如何以自家产品作为“客户零”(customer zero)来实际运行这套防御体系。

安全/对齐部署/工程
21:18
Ars Technica:AI(RSS)
57
苹果称其 AI 在谷歌服务器上运行仍保持隐私

苹果表示,部分 AI 模型运行在谷歌云服务器上,但谷歌无法以任何方式访问数据,从而确保用户隐私不受影响。

Google产品更新推理部署/工程
17:40
公众号:通义实验室(千问)
同事件精选67
仅凭一份文档,Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下,Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档,于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付,单端耗时约 4 小时,中途无人工接管。模型不具备图像理解能力,通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统:任务拆分为规划、架构、编码等阶段,验收覆盖静态检查、编译自检(0 error)、路由完整性(Web 端 34 条路由全部可达)、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试,使模型数小时内收敛。移动端产出可安装 APK,Web 端 typecheck 与构建均通过。

智能体教程/实践部署/工程
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
推荐理由:通义实验室没有炫技分数,而是把 Agent 逼到了长程交付的极限,约束闭环这套方法论比模型本身更值钱,所有做 Agent 开发的都该读一遍。
17:19
Artificial Intelligence News(RSS)
51
自主AI智能体在DevOps中的数据丢失风险:构建高效防御

自主AI智能体在加速软件交付的同时,也大幅缩短了从失误演变为灾难的时间,给安全策略造成盲区。威胁不再仅来自外部勒索软件或恶意内部人员,而是来自被授权的内部工具本身。文章探讨了在DevOps中针对这一风险构建有效防御的做法。

智能体安全/对齐部署/工程
15:26
IT之家(RSS)
78
小米MiMo发布V2.5-Pro-UltraSpeed模式,突破万亿参数模型千tokens/s输出速度

小米与TileRT联合推出MiMo-V2.5-Pro的UltraSpeed模式,在1万亿参数模型上首次达到超1000 tokens/s输出速度。UltraSpeed API同步上线,定价为原版的3倍,输出速度提升约10倍。由于资源有限,采取申请制限时开放,通过用户可在2026年6月9日至6月23日23:59接入API体验,并获限时免费Chat。试用规则:每账号每日最多成功进入队列10次,单次会话上限30分钟,空闲超5分钟自动释放资源。

推理模型发布部署/工程
关联讨论 2 条X:小米 MiMo (@XiaomiMiMo)Hacker News 热门(buzzing.cc 中文翻译)
15:26
IT之家(RSS)
66
截至2025年底我国智能算力规模达159万PFLOPS,位居全球第二

国家数据局《数字中国发展报告》显示,截至2025年底,我国智能算力规模达159万PFLOPS,全球第二;在用算力机架超1373万架,建成万卡集群42个。同期网民规模11.25亿,普及率80.1%;使用AI解答问题、生成图片视频、生活助手的用户分别为4.57亿、2.88亿、1.84亿,中青年用户占74.6%。工信部《算力互联互通行动计划》提出到2026年建立标准,到2028年实现公共算力标准化互联。中国电信研究院预测,到2035年AI将为我国GDP贡献超11万亿元。

行业动态部署/工程
12:55
HuggingFace Daily Papers(社区热门论文)
68
评估卡片:AI评估报告的可解读层

AI评估结果规模庞大但报告不一致,导致读者难以跨来源比较、识别遗漏或追溯结论。Evaluation Cards通过整合基准元数据、评估运行数据和模型元数据,形成统一记录。方法包括:(1)从52篇论文和10次利益相关者访谈中推导报告模式;(2)实现四个可解释信号(可复现性、文档完整性、来源与风险、分数可比性),并针对研究与非研究受众提供不同读者模式;(3)部署监控工具,覆盖5816个模型、635个基准和101843个结果,揭示当前报告实践中的系统性缺口。

arXiv论文/研究评测/基准部署/工程
12:22
IT之家(RSS)
74
马斯克详解 SpaceX AI 卫星计划:技术成熟,明年规模化量产

SpaceX 称轨道 AI 数据中心并非工程难题,现有星链卫星已具备大部分技术。AI 卫星将沿用第三代星链的太阳能电池阵列与热管理系统,结构更简单,无需大型相控阵天线。马斯克展示的 AI1 卫星渲染图显示配备翼展 70 米光伏面板,支持平均 120 千瓦、峰值 150 千瓦计算载荷,相当于单台英伟达 GB300 AI 服务器机架。SpaceX 计划组建约 100 万颗 AI 卫星网络,位于得克萨斯州巴斯特罗普的工厂预计明年年底前实现规模化量产,星舰可重复使用设计将支撑大批量运输。

行业动态部署/工程
关联讨论 6 条X:Elon Musk (@elonmusk, xAI)X:Rohan Paul (@rohanpaul_ai)Simon Willison 博客IT之家(RSS)X:Kim (@kimmonismus)The Verge:AI(RSS)
11:40
公众号:小米 MiMo
精选80
小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens);系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放(2026 年 6 月 9 日至 23 日),定价为 MiMo-V2.5-Pro 的 3 倍,速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。

开源生态推理模型发布部署/工程
关联讨论 2 条X:小米 MiMo (@XiaomiMiMo)Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:万亿模型首次在通用GPU上突破1000 tokens/s,不是专用硬件的胜利而是模型与系统Codesign的胜利,做实时AI应用的都应该盯紧这一套方案。
09:21
IT之家(RSS)
39
多地公布2026高考查分时间,教育部"阳光志愿"系统将优化升级

2026年全国高考统考科目于6月8日结束,部分省份选考科目仍在进行。海南、山东、山西、重庆、广东、湖北、江西等地已公布查分时间,多数集中在6月25日。教育部将举办“2026年全国普通高等学校招生云咨询周”,并对“阳光高考”平台及“阳光志愿”信息服务系统进行优化升级。此外,多地考场已投入使用AI智能巡查系统,通过视觉分析算法捕捉异常行为并自动标记作弊迹象,供审核员进一步确认。

行业动态部署/工程
05:09
TechCrunch:AI(RSS)
52
Apple 免除小型开发者的 AI 云 API 费用

Apple 为首次 App Store 下载量不足 200 万的开发者免除云 API 费用,以降低 AI 实验门槛。

行业动态部署/工程
‹ 上一页
1…89101112…35
下一页 ›