AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月11日周四
15:30IT之家(RSS)63微软 CEO 纳德拉反思 AI 滥用:并非所有问题都需要最强模型
15:14fofr60恶意软件利用LLM安全拒绝机制逃避分析
14:30IT之家(RSS)46郭明錤:台积电 CoPoS 先进封装预计 2028H2 量产,英伟达 Feynman AI GPU 或率先试水
11:06Greg Brockman61Oracle云承诺可用于OpenAI产品
10:51小互74Google 开源扩散架构模型 DiffusionGemma
10:26郭明錤|Ming-Chi Kuo58台积电下一代先进封装CoPoS关键要点
08:00HuggingFace Daily Papers(社区热门论文)51分离式推理中的无政府代价
07:09Berryxia.AI64Google DiffusionGemma:4倍速文本生成开源模型
06:34OpenAI:官网动态(RSS · 排除企业/客户案例)45通过 Oracle 云承诺访问 OpenAI 模型和 Codex
06:22MarkTechPost(RSS)55Microsoft SkillOpt 编码实现:仪表化提示优化、技能演化分析与基线比较
04:47Chubby♨️58Gartner:电力瓶颈将取代芯片竞赛
04:30IT之家(RSS)51甲骨文 2026 财年年报归母净利润 169.84 亿美元,同比增长 36.50%
04:29OpenRouter:Announcements(RSS)64精选Gemini 2.5 Flash API - 定价、快速入门与提供商比较
03:47Hacker News 热门(buzzing.cc 中文翻译)59Claude Desktop 启动了一台虚拟机,且无法停止它
03:17Hacker News 热门(buzzing.cc 中文翻译)190.01欧元转账可危及银行AI代理系统,bunq修复安全漏洞
02:47Hacker News 热门(buzzing.cc 中文翻译)64Apache Burr:构建可靠的人工智能代理和应用程序
02:40xAI:News(网页)69精选eToro AI 智能体 Tori 集成 SpaceXAI 文本模型实现实时市场情绪分析
02:23Rohan Paul55NVIDIA 展示共封装光学(CPO)交换机视频
02:10Claude:Blog(网页)75同事件精选智能体表面的演进:使用 Claude Managed Agents 构建同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
02:06Fuli Luo74MiMo Code 开源:14天5人vibe-coding缔造
01:53Ethan Mollick49模型层次结构:智能模型协调廉价模型
01:25SemiAnalysis63DeepSeek 走向重资产自建基础设施
01:09Replit ⠕65精选Replit 联合 Socket 推出 Package Firewall
00:39Google Developers Blog(RSS)78DiffusionGemma 开发者指南
00:19Claude72Claude Managed Agents公测定时部署与环境变量
6月10日周三
22:28IT之家(RSS)67消息称 OpenAI 洽谈租赁俄亥俄州 10GW 数据中心,英伟达或提供资金支持
22:19The Decoder:AI News(RSS)54OpenAI 欲租最大数据中心,Nvidia 提供财务支持
17:20公众号:卡尔的AI沃茨65实测小米MiMo-V2.5-Pro UltraSpeed:万亿参数MoE推理模型输出速度达1000 token/s
16:56HuggingFace Daily Papers(社区热门论文)63BrainSurgery:可重复且可靠的声明式权重操作工具,用于模型编辑与模型升级
16:28IT之家(RSS)64工信部:加强高端光电芯片和器件研发,开展光电混合组网试验
15:42Huawei Cloud52华为云发布AgentArts企业级智能体平台
15:28IT之家(RSS)78精选工信部印发《"人工智能+信息通信"创新发展实施意见》
15:14TechCrunch:AI(RSS)52Meta与Reliance签署在印度的首个AI数据中心协议
15:11Huawei Cloud29华为云推出四大Agentic Infra创新
14:28IT之家(RSS)54Meta 携手信实构建其首个印度 AI 数据中心,一期规模 168MW
13:07Berryxia.AI46Smith分享Loop Engineering学习心得
10:28IT之家(RSS)69SpaceX将建巨型卫星工厂:占地超100万平方米,明年量产AI卫星
10:11Hacker News 热门(buzzing.cc 中文翻译)63macOS 容器机
09:28IT之家(RSS)57冲刺"太空数据中心":消息称 SpaceX 计划 2027 年底前开展轨道 AI 计算测试
08:00HuggingFace Daily Papers(社区热门论文)42LLM 赋能的 NWDAF:迈向 AI 原生 6G 网络智能的一步
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月11日
15:30
IT之家(RSS)
63
微软 CEO 纳德拉反思 AI 滥用:并非所有问题都需要最强模型

微软 CEO 萨提亚·纳德拉在《纽约时报》播客《Hard Fork》中承认,公司内部算力堆砌现象普遍,员工习惯用最强模型解决所有问题。他呼吁按实际需求匹配模型,避免浪费,并举例 Copilot 自动模式能按任务自动选择最合适模型。纳德拉还透露自己用 AI 快速开发了一款工具:它能跟踪工作沟通、持续维护软件项目,在员工讨论调整需求时自动生成方案并更新代码,无需他参会。他强调非前沿问题无需用顶尖前沿模型,微软正在收紧 AI 成本管控。去年10月他更换了商业业务负责人,11月聘请新 AI 顾问,推动22万员工向 AI 时代转型。

MicrosoftOpenAI大佬观点部署/工程
15:14
fofr@fofrAI
60
恶意软件开发者通过在间谍软件中添加核武器和生物武器相关文本,主动触发大模型安全拒绝机制,使AI安全扫描器无法分析该恶意软件。这是安全对齐中过度依赖一阶规则导致二阶盲点的典型案例:当闭源与开源模型内置激进拒绝策略时,攻击者会注入这些触发词来逃避检测。SocketSecurity的帖子指出,设计恶意软件分析管道需考虑意图以防范提示词操纵。当前仅是攻击者利用这类特征的早期阶段,未来处理复杂网络安全的用户系统可能需要模型具备更少的安全顿感。

John Scott-Railton: NEW: malware developers added nuclear & biological weapons text to to their spyware. Goal? To trigger LLM safety refusal...

安全/对齐部署/工程
14:30
IT之家(RSS)
46
郭明錤:台积电 CoPoS 先进封装预计 2028H2 量产,英伟达 Feynman AI GPU 或率先试水

台积电 CoPoS(玻璃基板 FOPLP 2.5D 封装)预计 2028 年下半年量产,目标提升 9.5 倍光罩尺寸以上大型异构集成系统的量产经济性。NVIDIA 的 Feynman AI GPU 可能成为首个试水产品。CoPoS 载板由玻璃芯层和两侧 ABF 增层构成,芯片位于 ABF 增层表面,互连由芯片侧 RDL 与 ABF 增层承担,临时载体亦应用玻璃材料。

行业动态部署/工程
11:06
Greg Brockman@gdb
61
将你的Oracle云承诺用于OpenAI产品:https://openai.com/index/openai-on-oracle-cloud/
OpenAI行业动态部署/工程
10:51
小互@xiaohu
74
Google 开源扩散架构模型 DiffusionGemma

Google 开源 DiffusionGemma,基于扩散架构,一次性生成大段文本再逐步优化。H100 上达 1000+ tokens/s,RTX 5090 上 700+ tokens/s。26B 参数仅需 18GB 显存,一次生成 256 tokens。多轮迭代自我纠错,可修改已生成内容。

Google开源/仓库推理模型发布
10:26
郭明錤|Ming-Chi Kuo@mingchikuo
58
台积电下一代先进封装CoPoS关键要点

郭明錤分析,台积电CoPoS预计2028下半年量产,面向9.5倍光罩尺寸以上超大封装,NVIDIA Feynman AI芯片或率先采用。玻璃用于两个位置:310×310mm临时载板,以及250×250mm(试产)/510×515mm(量产)玻璃面板加工成玻璃核心基板。该基板为三层结构——玻璃芯两侧叠加ABF增层,TGV成孔与铜填充等挑战集中于此处。澄清常见误解:玻璃非中介层,互连由RDL、TGV/Cu及ABF共同承担;玻璃与ABF共存而非替代;芯片贴装在ABF增层表面。CoPoS有望延续台积电先进封装领先优势至2032年左右。

行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
51
分离式推理中的无政府代价

分离式推理架构将 prefill 和 decode 阶段分配到不同 GPU 池,形成共享硬件预算的竞争“智能体”。研究首次用博弈论建模该架构,以 NVIDIA Dynamo 为案例,拆解为三个耦合博弈。在 3 节点 B200 集群上用 Nemotron-4-340B 和 Llama-3.1-70B 验证,两模型呈现相同三阶段 PoA-hat 结构。自适应路由可在饱和阶段大幅降低 PoA-hat:70B 1P/5D 拓扑下 PoA-hat 从 66.4 降至 21.5(3.1 倍),吞吐量损失 13%;70B 1P/2D 下 PoA-hat 降 2.2 倍,TTFT P99 降 7.6 倍。

推理论文/研究部署/工程
07:09
Berryxia.AI@berryxia
64
Google DiffusionGemma:4倍速文本生成开源模型

Google 发布实验性开源模型 DiffusionGemma(Apache 2.0),采用并行 diffusion 方式代替传统自回归“逐词预测”,可同时起草、纠错和精炼整块文本,生成速度达 4 倍提升(1000+ token/s)。模型在 18GB 消费级显卡即可本地运行,适用于代码、数学、复杂编辑等任务,已开源权重至 Hugging Face。

Google: Meet DiffusionGemma ⚡ Our latest experimental open model (Apache 2.0) that generates text up to 4x faster. Instead of pr...

Google开源生态模型发布部署/工程
06:34
OpenAI:官网动态(RSS · 排除企业/客户案例)
45
通过 Oracle 云承诺访问 OpenAI 模型和 Codex

OpenAI 与 Oracle 合作,用户可利用现有 Oracle 云服务承诺(commitment)额度,在 Oracle 云上访问 OpenAI 模型和 Codex,用于构建和部署 AI 应用,同时获得企业级安全与治理能力。

OpenAI行业动态部署/工程
06:22
MarkTechPost(RSS)
55
Microsoft SkillOpt 编码实现:仪表化提示优化、技能演化分析与基线比较

实现了一个端到端的 Microsoft SkillOpt 仪表化工作流,包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线,运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环,检查训练历史,可视化准确率、编辑预算行为和 token 用量,并将进化后的技能与基线进行比较。

MCP/工具Microsoft教程/实践部署/工程
04:47
Chubby♨️@kimmonismus
58
最大的瓶颈将是能源--很快。 Gartner 2026年预测显示,全球数据中心电力消耗将达到565 TWh,较去年增长26%。AI服务器已占其中的31%,并将于2027年超越传统服务器。 值得注意的是,Gartner给出的制约因素是电力,而非芯片。他们预计到2030年需求将超过1,200 TWh,并警告电网将无法跟上。 因此,竞赛悄然从谁拥有最佳硅片转向谁能真正获得电力来驱动它。
数据/训练现象/趋势部署/工程
04:30
IT之家(RSS)
51
甲骨文 2026 财年年报归母净利润 169.84 亿美元,同比增长 36.50%

甲骨文发布2026财年(2025年6月–2026年5月)年报及第四财季报告。全年营业总收入673.57亿美元,同比增长17.35%;归母净利润169.84亿美元,同比增长36.50%。云业务总营收340亿美元,同比增长39%,其中云基础设施(IaaS)营收同比增长77%。第四财季营收191.84亿美元,同比增长20.63%,云业务营收99亿美元,同比增长47%。AI驱动下,Multicloud AI数据库第四季度营收同比增长404%。剩余履约义务达6380亿美元。展望2027财年全年,总营收指引为900亿美元,非-GAAP每股收益指引上调至8.05美元,同比增长18%。

行业动态部署/工程
04:29
OpenRouter:Announcements(RSS)
精选64
Gemini 2.5 Flash API - 定价、快速入门与提供商比较

Gemini 2.5 Flash API 支持配置思考预算(thinking budgets),用户可跨提供商进行比较,并在5分钟内完成首次API调用。

Google推理教程/实践部署/工程
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:这是 OpenRouter 上接入 Gemini 2.5 Flash 的保姆级指南,把三家 Google 提供商的延迟和定价差异摆在明面上,需要做模型选型和成本估算的开发者可以直接抄里面的 quickstart 代码。
03:47
Hacker News 热门(buzzing.cc 中文翻译)
59
Claude Desktop 启动了一台虚拟机,且无法停止它

Claude Desktop 会在用户无授权的情况下自动启动一台虚拟机,且提供任何停止或关闭该虚拟机的途径。这一行为已在 GitHub 上引发讨论,用户担忧其可能带来的资源占用及隐私安全风险。

智能体Anthropic产品更新部署/工程
03:17
Hacker News 热门(buzzing.cc 中文翻译)
19
0.01欧元转账可危及银行AI代理系统,bunq修复安全漏洞

安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。

安全/对齐部署/工程
02:47
Hacker News 热门(buzzing.cc 中文翻译)
64
Apache Burr:构建可靠的人工智能代理和应用程序

Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架,已在 Apache 基金会下发布。该项目提供工具和抽象,帮助开发者设计、开发和部署可信任的智能体应用,强调可靠性、可观测性和生产级部署能力。

智能体开源/仓库部署/工程
02:40
xAI:News(网页)
精选69
eToro AI 智能体 Tori 集成 SpaceXAI 文本模型实现实时市场情绪分析

6 月 10 日,eToro 宣布其 AI 智能体 Tori 集成来自 SpaceXAI 的文本模型,能够从 X 平台实时读取市场情绪变化、追踪信号并分析信息。Tori 现已在 eToro 的投资流程中嵌入该能力,支持用户以自然语言查询和解读市场情绪。eToro 拥有超过 4000 万注册用户,覆盖 75 个国家。该功能基于 SpaceXAI API 构建,其他开发团队也可通过 API 控制台在数分钟内搭建类似应用,如研究助手或情绪看板。

xAI行业动态部署/工程

推荐理由:xAI 的实时 X 数据能力正式嵌入 eToro 投资助手 Tori,4000 万散户第一次能用上基于社交情绪的智能分析,虽然只是一个 API 集成案例,但把‘市场脉搏’塞进 AI 助手的方向对了。
02:23
Rohan Paul@rohanpaul_ai
55
NVIDIA 展示共封装光学(CPO)交换机视频

NVIDIA 发布了与 Lambda 合作的共封装光学(CPO)交换机视频。CPO 将光通信部件移至主网络芯片附近,而非独立可插拔模块。官方博客指出,在 GB300 NVL72 规模下,CPO 通过降低网络功耗和消除大量可插拔光学组件来减少故障点,提升每瓦 token 数。一个 128,000 GPU 数据中心传统需约 655,000 个独立收发器,每个都是潜在故障点,CPO 完全移除该类组件。智能体工作负载需要弹性数据移动,CPO 可减少网络功耗和组件数量,避免 GPU 等待数据。

NVIDIA AI Infrastructure: 📣 Get a first look at the NVIDIA Photonics co-packaged optics switch with @LambdaAPI. At NVIDIA GB300 NVL72 scale, the ...

产品更新部署/工程
02:10
Claude:Blog(网页)
同事件精选75
智能体表面的演进:使用 Claude Managed Agents 构建

Anthropic 推出 Claude Managed Agents,一套可组合 API 套件,用于构建和部署生产级智能体。该产品从早期简单 API 演进至 Claude Agent SDK,再到将智能体调度层与代码执行沙箱解耦的 Managed Agents。通过只追加日志的会话机制,Managed Agents 解决了托管伸缩、会话持久化、文件系统管理、执行隔离、凭证安全与可观测性等生产部署挑战。团队借助该方案可在数天内完成从原型到生产环境的转化,无需自建基础设施。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
推荐理由:Claude Managed Agents 把代理部署的复杂基础设施打包成了 API,让团队从原型到上线只需几天而不是几个月,尤其凭证隔离和延迟优化对生产环境很关键,想部署可靠代理的团队可以认真看看。
02:06
Fuli Luo@_LuoFuli
74
强大的模型进化需要坚实的驾驭系统,反之亦然。14天,5人,一次vibe-coding旅程--MiMo Code就此诞生。它已开源:https://github.com/XiaomiMiMo/MiMo-Code
开源/仓库数据/训练部署/工程
01:53
Ethan Mollick@emollick
49
"换更便宜的模型来省钱"是个问题,因为更便宜的模型更差(也许对某个特定用途来说足够好,但依然较差)。 更常见的方法是模型层级结构,由智能模型作为廉价模型的协调者和审核者。
大佬观点部署/工程
01:25
SemiAnalysis@SemiAnalysis_
63
DeepSeek 正走向重资产模式。 6 月 9 日,该公司发布了 IDC 规划工程师的招聘信息,该职位明确涉及兆瓦级到吉瓦级基础设施的设计与交付。这紧随其 4 月在内蒙古乌兰察布招聘数据中心运维工程师。综合来看,这是 DeepSeek 首次完全展露其自持算力基础设施而非仅租赁的意图。
DeepSeek现象/趋势部署/工程
01:09
Replit ⠕@Replit
精选65
大多数人在发布项目前会运行安全扫描以检测恶意包 但风险从安装的那一刻就已开始 今天,我们正式推出 Package Firewall,与 Socket 合作构建 它在恶意软件到达你的应用之前就将其拦截
产品更新部署/工程

推荐理由:Replit 跟 Socket 合作搞了个包防火墙,自动拦截恶意依赖,对经常在 Replit 上跑项目的开发者是个实用补丁,但算不上大版本更新,普通用户可能无感。
00:39
Google Developers Blog(RSS)
78
DiffusionGemma 开发者指南

DiffusionGemma 是 Google 基于 Gemma 4 架构的实验性文本生成模型,采用扩散式并行生成替代逐 token 自回归,实现更快推理、双向上下文感知和实时自我修正,并可在消费级 GPU 上部署。模型通过迭代去噪并行生成并细化 256-token 块,在处理数独等复杂约束任务上优于传统语言模型,且微调效果显著。它已集成 vLLM 等推理框架,为开发者提供一种高性能、高效长上下文扩展且易于定制部署的非自回归新方法。

Google推理模型发布部署/工程
关联讨论 6 条Google DeepMind:Blog(RSS)X:Google DeepMind (@GoogleDeepMind)X:Demis Hassabis (@demishassabis)X:Testing Catalog (@testingcatalog)X:Google AI for Developers (@googleaidevs)MarkTechPost(RSS)
00:19
Claude@claudeai
72
Code with Claude Tokyo 新功能:定时部署和保险库中的环境变量已在 Claude Managed Agents 中进入公测,Claude Code 的动态工作流已正式可用。 Agent 现在可以按计划运行,安全使用你的工具,并承担更大的任务。
AnthropicMCP/工具产品更新部署/工程
关联讨论 1 条Claude:Blog(网页)
6月10日
22:28
IT之家(RSS)
67
消息称 OpenAI 洽谈租赁俄亥俄州 10GW 数据中心,英伟达或提供资金支持

OpenAI 正在深入谈判,计划租赁俄亥俄州一个拟建的 10GW 数据中心园区,并可能获得英伟达的资金支持。项目完全建成后总成本至少 5000 亿美元(约 3.39 万亿元人民币),一期预计 2028 年投产。机房将全部搭载英伟达硬件,英伟达通过资产负债表提供兜底担保,为 OpenAI 的租金偿付和项目融资出具资金保障。

OpenAI行业动态部署/工程
22:19
The Decoder:AI News(RSS)
54
OpenAI 欲租最大数据中心,Nvidia 提供财务支持

OpenAI 正在谈判租赁俄亥俄州一个计划中的 10 吉瓦数据中心,该数据中心可能由 Nvidia 提供财务支持。这是 OpenAI 迄今为止规模最大的数据中心项目。

OpenAI行业动态部署/工程
17:20
公众号:卡尔的AI沃茨
65
实测小米MiMo-V2.5-Pro UltraSpeed:万亿参数MoE推理模型输出速度达1000 token/s

小米MiMo-V2.5-Pro UltraSpeed模式在单8卡节点上实现万亿参数MoE推理模型输出速度1000 token/s,峰值达2140 token/s,是普通版的3倍,且此前已降价99%。接入Claude Code桌面端开启UltraCode模式后,可调度12个Agent在11分钟内完成项目升级报告并打包成Skill;3分钟内生成含灯光、剪影、星光特效的3D吉他英雄网页。技术层面通过FP4混合量化、提前草稿机制及计算/搬数据/通信流水线调度实现高速推理。

智能体教程/实践部署/工程
16:56
HuggingFace Daily Papers(社区热门论文)
63
BrainSurgery:可重复且可靠的声明式权重操作工具,用于模型编辑与模型升级

BrainSurgery是一种针对神经网络checkpoint的“张量手术”工具,通过声明式YAML计划执行复杂的权重变换。它支持结构修改、数学变换、张量重塑,利用正则表达式和结构定位进行精准操作,并内置断言验证张量形状、数据类型和值,防止静默错误。工具覆盖从模型升级(upcycling)到LoRA提取等四个示例和三个案例研究,旨在提供可重复、可验证的模型编辑基础。

开源生态论文/研究部署/工程
16:28
IT之家(RSS)
64
工信部:加强高端光电芯片和器件研发,开展光电混合组网试验

工信部日前印发《“人工智能+信息通信”创新发展实施意见(2026—2028年)》,提出到2028年形成30个以上高价值典型场景,城域算力1毫秒时延圈覆盖率不低于75%;到2030年实现人工智能与信息通信网络融合核心技术突破。意见要求加强高速光电芯片、全光交换器件、光电共封装器件等研发验证,开展光电混合组网试验,并推进广域无损网络、任务式调度、算网运维智能体等技术验证,以降低比特带宽成本。

政策/监管部署/工程
15:42
Huawei Cloud@HuaweiCloud1
52
没有合适的平台,你就无法扩展智能体。在华为云INSPIRE 2026上,华为董事、华为云CEO张平安介绍了AgentArts,一个企业级平台,旨在帮助企业更快地扩展智能体。 https://tinyurl.com/5cjcph9d #INSPIRE2026 #HuaweiCloud #AI
智能体产品更新部署/工程
15:28
IT之家(RSS)
精选78
工信部印发《"人工智能+信息通信"创新发展实施意见》

工信部发文,要求加快建设400Gbps/800Gbps骨干传输网络,优化东中西部国家枢纽节点间通道;推进城域400Gbps及以上、全光交叉等高速光传输系统应用,构建城域毫秒级低时延入算能力。同时推动5G-A/6G、新一代光网络、“IPv6+”、工业互联网与AI融合发展,攻关空口智能化、网络高等级自智、智能体互联网等核心技术。鼓励基础电信企业用AI赋能传统业务,深化智慧个人助理、智慧管家、家庭看护、3D观影等新型应用。

政策/监管部署/工程

推荐理由:工信部这次把400G/800G骨干网和AI直接挂钩,意味着算力输送的「血管」要升级了,做AI基建和云服务的可以认真看下落地节奏。
15:14
TechCrunch:AI(RSS)
52
Meta与Reliance签署在印度的首个AI数据中心协议

Meta与印度信实集团(Reliance)签署在印度的首个AI数据中心协议。该设施容量为168兆瓦,将支持Meta全球AI计算需求,并具备未来扩展能力。

Meta行业动态部署/工程
15:11
Huawei Cloud@HuaweiCloud1
29
你无法在不牢靠的根基上扩展智能。因此,在华为云INSPIRE 2026上,我们夯实了它脚下的大地。 硬件-软件协同。四项Agentic Infra创新。一种新范式。 了解更多:https://tinyurl.com/3yukj4wm #INSPIRE2026 #HuaweiCloud #AI
智能体行业动态部署/工程
14:28
IT之家(RSS)
54
Meta 携手信实构建其首个印度 AI 数据中心,一期规模 168MW

Meta 与印度信实工业达成合作,以租赁形式建设其首个位于印度的 AI 数据中心。该设施位于古吉拉特邦贾姆讷格尔的信实数据中心园区,使用可再生能源供电并以淡化海水冷却。一期规模 168MW,由 Meta 租赁,后续可进一步扩张。Meta 将承担园区全部能源和用水成本,并在印度签订了近 1GW 的新增可再生能源合同。此举旨在为增长迅猛的印度市场提供本地化个性化 AI 服务。

Meta行业动态部署/工程
13:07
Berryxia.AI@berryxia
46
Smith分享Loop Engineering学习心得

Berry Xia表示,学完Harness后接触Loop Engineering,认为理解其底层逻辑对Vibe Coding和产品架构设计帮助很大。他原计划写文章分享,但Smith(@smithandai)已发表相关文章,推荐阅读。

Smith铜匠・十点睡觉: http://x.com/i/article/2064229409247358976

智能体教程/实践部署/工程
10:28
IT之家(RSS)
69
SpaceX将建巨型卫星工厂:占地超100万平方米,明年量产AI卫星

SpaceX在得克萨斯州巴斯特罗普市新建1100万平方英尺(约102.2万平方米)卫星工厂,生产首款AI卫星AI1。该卫星长70米,峰值算力150千瓦,计划2027年底规模化量产。公司计划2027年底建成1吉瓦太空AI算力,届时每年需发射6000余颗AI1卫星;目标2030年年算力100吉瓦。工厂将垂直整合太阳能硅锭、硅片、电池、电路板等供应链。此外,SpaceX、特斯拉与xAI联合在奥斯汀打造Terafab芯片工厂,年产能可支撑1太瓦算力。

xAI数据/训练行业动态部署/工程
10:11
Hacker News 热门(buzzing.cc 中文翻译)
63
macOS 容器机

macOS容器机项目在GitHub上公开,获得102个Hacker News热度积分。该项目为macOS提供容器化运行环境,具体实现细节及功能尚未在本次发布中详细披露。

GitHub产品更新部署/工程
09:28
IT之家(RSS)
57
冲刺"太空数据中心":消息称 SpaceX 计划 2027 年底前开展轨道 AI 计算测试

SpaceX 计划在 2027 年底前完成天基 AI 计算基础设施首批示范发射,早于招股书中披露的“最早 2028 年”部署时间。公司已申请发射至多 100 万颗天基数据中心卫星。在 IPO 前投资者推介会上,总裁格温妮・肖特韦尔与 CFO 布雷特・约翰森公布路线图:先期系统用于技术验证,成熟后再商用。IPO 计划募资 750 亿美元,目标估值 1.75 万亿美元,股票代码 SPCX,发行价 135 美元,本周五在纳斯达克挂牌。

行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
42
LLM 赋能的 NWDAF:迈向 AI 原生 6G 网络智能的一步

研究团队开发了一款兼容开源核心网 Free5GC 的 NWDAF 实现,集成了大语言模型接口,支持操作员通过自然语言与网络交互。系统利用语义嵌入模型将用户意图编码并映射到 7 个预设意图类别,触发分析查询或事件订阅命令,简化传统接口的复杂性。该 NWDAF 支持 AMF 和 SMF 事件订阅、通过 Prometheus 进行实时监控与分析检索,所有功能均可通过对话式界面访问。项目代码与数据集已在 GitHub 开源。

论文/研究部署/工程
‹ 上一页
1…1415161718…50
下一页 ›