AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月29日周一
13:27宝玉56福特召回350名退休/离职资深工程师重新调教AI质检系统
13:01IT之家(RSS)54北京太空算力创新中心揭牌成立
12:01IT之家(RSS)52"硅仙人"吉姆·凯勒回复旗下公司Tenstorrent收购传闻:已与英特尔、高通CEO会面
12:01IT之家(RSS)65芬兰计划到2031年用AI全面改造公共部门,将取代部分员工
11:01IT之家(RSS)44破解代码迁移难题,国产"异算方舟"全栈计算平台发布
10:01IT之家(RSS)50澳企 Firmus 将为印尼峇淡 360MW AI 工厂导入 17 万颗 NVIDIA GPU
09:47向阳乔木52腾讯云 EdgeOne 发布 EdgeOne Makers,3 行命令部署 AI Agent 框架
08:03OpenAI:官网动态(RSS · 排除企业/客户案例)41惠普与OpenAI启动Frontier战略合作伙伴关系
07:52🚨 AI News | TestingCatalog16Grok iOS Tasks 更名为 Automations
07:27DogeDesigner33Cybercabs 无人出租车占领奥斯汀
05:33Hacker News 热门(buzzing.cc 中文翻译)55由于AI表现未达预期,福特重新聘用"灰胡子"工程师
04:57Rohan Paul52FT:Google限制Meta使用Gemini
03:24TechCrunch:AI(RSS)49福特因AI未达预期重新雇佣"灰胡子"工程师
01:03Hacker News 热门(buzzing.cc 中文翻译)75精选Wayfinder Router:在本地和托管的大语言模型之间进行确定性查询路由
00:54TechCrunch:AI(RSS)65美光因AI内存短缺股价飙升236%,市值一度超越Meta和特斯拉
00:27Rohan Paul56美光成为华尔街新AI基础设施押注,HBM短缺带来定价权
00:23Berryxia.AI50DeepSeek 开源 DSpark 投机解码框架
00:21Ethan Mollick56模型路由器低估非数学任务难度
6月28日周日
21:51🚨 AI News | TestingCatalog52Google限制Meta使用Gemini致项目延迟
20:40The Decoder:AI News(RSS)65Coinbase 转向中国 AI 模型,西方实验室面临定价压力测试
15:03Hacker News 热门(buzzing.cc 中文翻译)66两节点 AMD Strix Halo RDMA 集群设置指南
15:00IT之家(RSS)61谷歌因算力限制对 Meta 调用 Gemini 大模型实施限制
14:33Hacker News 热门(buzzing.cc 中文翻译)67福特公司雇佣了人工智能,解雇了人类员工。结果适得其反。
14:26Rohan Paul29离职创业:仓库AI月租4-6千
12:00IT之家(RSS)61M-Robots OS 完整捐献至开放原子开源基金会
07:26Rohan Paul50中国对冲基金警告AI股票超级泡沫即将破裂
05:26Rohan Paul54福特AI检测缺陷遇瓶颈,召回350名专家补漏
04:50TechCrunch:AI(RSS)54软银CEO并非唯一对马斯克轨道数据中心炒作有疑问的人
03:26Rohan Paul71Gallup民调:71%美国人反对本地建设AI数据中心
03:25Hugging Face:Blog(RSS)62精选一条命令在HF Jobs上启动vLLM服务器
01:55Rohan Paul58美国AI基础设施建设瓶颈从GPU转为许可:300多项数据中心禁令,但水耗与电费担忧被数据驳斥
01:44凡人小北49医疗AI的真正壁垒:工作流而非答题准确率
01:16AYi62Cloudflare免费使用GLM 5.2有每日限制
01:06MarkTechPost(RSS)79精选DeepSeek 开源 DSpark 投机解码框架,加速 DeepSeek-V4 生成速度 60-85%
00:03Hacker News 热门(buzzing.cc 中文翻译)81精选一次失败的(民族国家?)攻击的剖析
6月27日周六
23:25宝玉51AI基建中的老登与新登:从讨厌到理解
18:59IT之家(RSS)51鹏城云脑III登顶IO500双榜:依托华为OceanStor A800存储
15:59IT之家(RSS)66DeepSeek 联合北大发布 DSpark 推理加速框架,速度提升 60% 至 85%
15:24meng shao46API中转站惊现Claude Fable 5,调用竟成功
13:59IT之家(RSS)51美满升级 Structera CXL 控制器:内联压缩最高 3.64x,缓解 AI 场景内存压力
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月29日
13:27
宝玉@dotey
56
福特召回350名退休/离职资深工程师重新调教AI质检系统

福特过去三年召回350名退休/离职资深工程师(gray beard),负责带新人并重新调教未达预期的AI质检系统。整车工程副总裁Charles Poon承认曾错误认为引入AI就能产出高质量产品。效果立竿见影:福特时隔16年重返JD Power新车质量榜主流品牌第一(从第10升至第1),F-150、Super Duty、Mustang分别拿下品类冠军,预计今年节省约10亿美元质保和召回成本。福特未抛弃AI,正新增约10万项评估模拟更多路况。

TechCrunch: Ford rehires 'gray beard' engineers after AI falls short https://techcrunch.com/2026/06/28/ford-rehires-gray-beard-engin...

数据/训练行业动态部署/工程
13:01
IT之家(RSS)
54
北京太空算力创新中心揭牌成立

北京太空算力创新中心今日在2026全球数字经济大会太空算力论坛上正式揭牌成立,落地海淀中关村。该中心采用“公司+联盟”双轮驱动模式,运营主体为北京天算星联科技有限公司,承担共性技术攻关(星载AI芯片、太空大模型等)、公共平台服务、标准制定与生态引领、成果转化与场景变现四类职能。此前4月业界首个“太空算力专业委员会”在京成立,该中心同步启动筹建。工信部副部长张云明表示将支持太空算力技术前瞻性研究,有序推动产业发展。

行业动态部署/工程
12:01
IT之家(RSS)
52
"硅仙人"吉姆·凯勒回复旗下公司Tenstorrent收购传闻:已与英特尔、高通CEO会面

吉姆·凯勒6月25日受访回应Tenstorrent收购传闻,确认已与英特尔、高通CEO会面,希望达成重大合作,因其RISC-V CPU IP优秀。谈及对手Cerebras近期IPO,他表示不在意,并称将全面击败他们。Cerebras WSE-CS3系统可近1000 Tokens/s推理Kimi K2.6模型。另有一家超大规模云服务商正评估Tenstorrent AI IP,用于开发小型AI芯片。

行业动态部署/工程
12:01
IT之家(RSS)
65
芬兰计划到2031年用AI全面改造公共部门,将取代部分员工

芬兰财政部常务秘书Juha Majanen宣布,计划到2031年将公共部门改造为以AI为基础的模式。核心是为各级政府搭建共享AI平台,导入最强AI模型,目标生产力至少提升20%。此举旨在节省人力开支,为福利制度腾出预算。裁员将部分通过自然退休实现,仍有部分员工将被AI智能体取代。工会代表批评政府不应将AI作为裁员借口,警告可能削弱公共服务、加重员工压力。

政策/监管部署/工程
11:01
IT之家(RSS)
44
破解代码迁移难题,国产"异算方舟"全栈计算平台发布

由中国科学院计算机网络信息中心等单位联合研发的“异算方舟”国产计算系统软件生态全栈平台今日上线。平台底层搭载“九衍枢算法库”,汇集16款高性能计算工具,核心运算性能可实现十倍以上提速;代码转换大模型BoundX可自动适配多种国产算力环境,替代人工改写。平台实现算法、代码、应用全链条打通,解决国产算力下软件适配难、代码迁移难等痛点。

产品更新部署/工程
10:01
IT之家(RSS)
50
澳企 Firmus 将为印尼峇淡 360MW AI 工厂导入 17 万颗 NVIDIA GPU

澳大利亚 Neocloud 服务商 Firmus 与 DayOne 合作,在印尼峇淡建设一座由 NVIDIA 芯片驱动的 360MW 液冷 AI 工厂。根据持续至 2034 年的战略合作,NVIDIA 将在明后两年交付覆盖 Grace Blackwell、Vera Rubin、Vera 的多代 GPU,总计 17 万颗。Firmus 预计合作前六年从承购协议中获得 250~300 亿美元收入。NVIDIA 也是 Firmus 今年四月股权融资的有条件参与方。

行业动态部署/工程
09:47
向阳乔木@vista8
52
腾讯云 EdgeOne 发布 EdgeOne Makers,3 行命令部署 AI Agent 框架

腾讯云 EdgeOne 今日发布「EdgeOne Makers」,通过 npm install -g edgeone 等几行命令即可部署 AI Agent 开发框架,自动处理上下文、并发、沙箱环境等问题,支持绑定域名、关联 GitHub 持续迭代。产品处于 Beta 内测,注册可免费领取 50 万 Token。该工具大幅降低 Agent 部署门槛,利好中小企业。Vista 指出,当开发部署不再是问题,关键转向如何理解企业需求用 AI 解决问题,近期 FDE(前沿部署工程师)岗位走热,正是推动 AI 与业务场景结合、实现落地的具体实践。

向阳乔木: 3行命令搭一个 AI Agent 框架,腾讯云给力啊! 很多人想开发 AI Agent,除了选框架开发,其实更麻烦的事情是部署。 本地运行没问题,一上线就翻车。 需要解决上下文问题,并发问题,为了安全还要搭沙箱环境,全都自己搞非常麻烦。 腾...

智能体现象/趋势部署/工程
08:03
OpenAI:官网动态(RSS · 排除企业/客户案例)
41
惠普与OpenAI启动Frontier战略合作伙伴关系

惠普宣布与OpenAI达成Frontier战略合作伙伴关系,此前试点中一名工程师数周内用OpenAI模型处理了43个项目中的122个pull requests,安全团队一天修复多个软件bug(原估计需一个月)。惠普将把Frontier作为统一平台整合访问、上下文、部署与评估,覆盖定价、合作伙伴门户、客户支持、员工体验平台(WXP)及网络安全等场景,同时使用ChatGPT支持知识工作、Codex加速软件现代化与交付。Frontier提供从试点到生产环境的治理型运营模型。

智能体OpenAI行业动态部署/工程
07:52
🚨 AI News | TestingCatalog@testingcatalog
16
Grok for iOS 上的 Tasks 已更名为 Automations。 目前看来,这似乎只是名称变更,外加 UI 略有不同。我们最终还能看到 Grok 桌面版吗?
xAI产品更新部署/工程
07:27
DogeDesigner@cb_doge
33
Cybercabs 正在占领奥斯汀。
行业动态部署/工程
05:33
Hacker News 热门(buzzing.cc 中文翻译)
55
由于AI表现未达预期,福特重新聘用"灰胡子"工程师

福特重新聘用350名资深工程师(部分为前员工,部分来自供应商),原因是AI和自动化质量系统未达预期效果。首席运营官Kumar Galhotra表示公司此前过度依赖自动化质量系统,结果令人失望,因此召回技术专家在零件进入工厂前排查故障点。福特并未放弃AI,而是让这些“灰胡子”工程师培训年轻员工并重新编程AI工具。此举预计今年将节省10亿美元成本,福特本周还在JD Power初始质量调查中位列主流品牌榜首。

行业动态部署/工程
04:57
Rohan Paul@rohanpaul_ai
52
FT:Google限制Meta使用Gemini

Google限制了Meta对Gemini模型的使用,原因是Meta要求的计算容量超出Google供应能力。Meta在安全自动化、客服、广告工具、编程及内部工作流中均依赖Gemini。Google面临自身云客户、Gemini产品与有限数据中心容量之间的资源竞争。Google Cloud 3月季度收入增至200亿美元,CEO Sundar Pichai表示计算容量短缺制约了增长,并导致未交付订单较前一季度近乎翻倍。

GoogleMeta推理行业动态
03:24
TechCrunch:AI(RSS)
49
福特因AI未达预期重新雇佣"灰胡子"工程师

福特汽车在AI和自动化系统未达到预期质量后,重新雇佣了350名资深工程师,其中部分为前员工,部分来自供应商。首席运营官Kumar Galhotra表示,福特此前“越来越依赖自动化质量系统”但结果令人失望,因此请回技术专家在零部件进入工厂前查找故障点。负责车辆硬件工程的副总裁Charles Poon承认,“错误地认为只要引入AI并吸收设计需求就能产出高质量产品”。福特并未完全放弃AI,而是让返聘工程师培训年轻员工并重新编程AI工具。此举预计今年将节省10亿美元成本。福特还在本周发布的JD Power初始质量调查中位列主流品牌榜首。

行业动态部署/工程
01:03
Hacker News 热门(buzzing.cc 中文翻译)
精选75
Wayfinder Router:在本地和托管的大语言模型之间进行确定性查询路由

Wayfinder Router 通过分析提示词的结构(长度、标题、列表、代码)和措辞(证明、数学、硬约束),在微秒级完成路由决策,完全离线且无需调用其他模型。默认仅使用结构特征,词汇线索因盲测未泛化而默认为关闭。对比依赖模型调用的路由器(如 RouteLLM、NotDiamond),它避免了延迟、成本和随机性。用户可在自有数据上校准评分阈值。支持任何 OpenAI 兼容 API(含 Ollama、Anthropic、Groq、vLLM 等),可自托管。提供终端和网页演示(--dry-run 无需密钥),以及基准测试和 FAQ。

开源/仓库部署/工程

推荐理由:Wayfinder Router 把 prompt 路由变成了离线文本分析,无需额外模型调用,对希望节省成本同时保持私密的开发者很实用,比现有方案更轻量和确定,但纯语义难题仍是短板。
00:54
TechCrunch:AI(RSS)
65
美光因AI内存短缺股价飙升236%,市值一度超越Meta和特斯拉

内存芯片制造商美光受益于AI数据中心建设导致的DRAM和NAND(尤其是HBM)供应短缺,股价过去一个月飙升236%,市值接近1.27万亿美元,一度超越Meta和特斯拉。第三季度营收同比增至414.5亿美元,利润从18.8亿美元暴涨至282亿美元,并预测第四季度营收490至510亿美元。美光已与英伟达、Anthropic等签订16项长期战略客户协议。分析认为需求增长持续超过新产线投产速度,缺货(RAMageddon)预计持续至2027年。

数据/训练行业动态部署/工程
00:27
Rohan Paul@rohanpaul_ai
56
美光成为华尔街新AI基础设施押注,HBM短缺带来定价权

美光是美国唯一高带宽内存(HBM)制造商,因AI服务器需求激增成为华尔街新宠。Q3营收414.6亿美元,毛利率84.6%,Q4指引490-510亿;利润同比增长15倍,调整后毛利率84.9%(去年39%)。全球DRAM市场高度集中,三星、SK海力士、美光合计占约90%收入;HBM细分领域SK海力士占58%,美光占21%。为打破内存行业周期性,美光签下16个价值220亿美元的战略客户协议,通过定金、价格下限和照付不议条款稳定需求。

Rohan Paul: FT: Micron just reported a 15-fold profit jump because AI servers are now short of high-bandwidth memory, the stacked me...

行业动态部署/工程
00:23
Berryxia.AI@berryxia
50
DeepSeek 开源 DSpark 投机解码框架

DeepSeek 开源 DSpark,一个面向生产环境的投机解码框架。核心解决传统投机解码中 draft 模型猜测后期 token 错误率高、浪费算力的问题。DSpark 采用并行 backbone + 顺序 Markov head 混合架构,消除后缀衰减;并引入置信度 head 和负载感知调度器,动态控制验证数量。在 DeepSeek-V4 生产系统中,单用户生成速度比 MTP-1 基线快 60-85%,吞吐提升 1.5x 至 5x。开源内容包括基于 V4 权重的 DeepSeek-V4-Pro-DSpark/Flash-DSpark checkpoint,以及 MIT 协议的 DeepSpec 训练代码,与北京大学联合开发。

Dmytro Dzhulgakov: DSpark from @deepseek_ai ingeniously integrates many speculative decoding ideas to achieve 1.5x to 5x higher throughput ...

DeepSeek开源/仓库推理部署/工程
00:21
Ethan Mollick@emollick
56
根据我的经验,所有模型路由器都低估了非数学/编码任务的难度,并为它们分配了过少的智能。这是一个值得解决的问题,因为非可验证任务(创新、营销、定性分析)通常从使用"更聪明"的 AI 模型中获益最多。
大佬观点部署/工程
6月28日
21:51
🚨 AI News | TestingCatalog@testingcatalog
52
Google vs Meta 🤖 > 据《金融时报》报道,Google因容量短缺对Meta使用Gemini施加限制。 > 据报道,这负面影响了Meta内部与客户支持和内容审核相关的项目,导致项目延期。 我敢打赌,从长远来看,token效率将成为一个巨大的市场,其商业模式非常透明且可预测。
GoogleMeta行业动态部署/工程
20:40
The Decoder:AI News(RSS)
65
Coinbase 转向中国 AI 模型,西方实验室面临定价压力测试

Coinbase CEO Brian Armstrong 已将公司迁移至中国 AI 模型,采用智谱 GLM 5.2 和月之暗面 Kimi 2.7,token 用量攀升但支出减半。91% 的开发者从未触及旧用量上限。初创公司 Lindy 近期转向 DeepSeek V4,Snowflake 也在测试中国模型作为廉价替代品。Coinbase 部署自动路由系统,根据任务、价格和缓存潜力选择模型,缓存命中率从 5% 提升至 60%。开发者被要求保持上下文精简并开启新会话。公司让每位开发者用量透明但不设上限,Armstrong 表示“AI 支出越多,预期影响越大”。这些举措使 AI 总支出减半。同时,OpenAI 的 GPT-5.6-Sol 与 GPT-5.5 定价相同但更省 token,并推出两个廉价变体,加剧与 Anthropic 的价格战。

DeepSeekOpenAI行业动态部署/工程
15:03
Hacker News 热门(buzzing.cc 中文翻译)
66
两节点 AMD Strix Halo RDMA 集群设置指南

本文介绍如何配置两节点 AMD Strix Halo 集群,通过 Intel E810 (RoCE v2) 网卡实现 RDMA 互联,用于分布式 vLLM 推理(Tensor Parallelism)。硬件采用两块 Framework Desktop 主板(AMD Ryzen AI MAX+ "Strix Halo",128GB 统一内存)及 E810-CQDA1 100GbE 网卡,直连无需交换机。软件栈基于 Fedora 43,使用 Ray 编排集群、RCCL 通信。RDMA 延迟约 5µs(TCP/IP 为 70‑100µs)。涵盖 BIOS 设置、网络配置、工具箱安装及启动集群的详细步骤。

推理教程/实践部署/工程
15:00
IT之家(RSS)
61
谷歌因算力限制对 Meta 调用 Gemini 大模型实施限制

Meta 向谷歌申请的 Gemini 算力规模超出后者供给能力,谷歌现已对 Meta 调用其 Gemini 大模型实施使用限制。Alphabet 约在今年 3 月告知 Meta 无法满足所需算力,导致 Meta 多项内部 AI 项目受阻延期。Meta 已要求员工节约使用模型 token。谷歌一季度云营收达 200 亿美元,CEO 皮查伊表示算力供给瓶颈制约云业务增速,同时令云部门积压订单量环比近乎翻倍。

GoogleMeta行业动态部署/工程
14:33
Hacker News 热门(buzzing.cc 中文翻译)
67
福特公司雇佣了人工智能,解雇了人类员工。结果适得其反。

福特因激进采用AI质检系统导致成本损失数十亿美元,三年内返聘350多名资深工程师(内部称“gray beards”),负责质量审查并帮助改进AI。首席运营官Kumar Galhotra承认自动化系统未达预期,经验丰富的工程师能预先发现故障点。返聘后,福特在J.D. Power年度新车质量调查中16年来首次获得主流品牌排名第一。公司表示不会放弃AI,但未来将结合人类监督与经验使用该技术。

行业动态部署/工程
14:26
Rohan Paul@rohanpaul_ai
29
某人辞去了数据中心的工作,租了一个空仓库。 里面摆满了成排的
行业动态部署/工程
12:00
IT之家(RSS)
61
M-Robots OS 完整捐献至开放原子开源基金会

深圳开鸿数字产业发展有限公司 CEO 王成录宣布,全国首个开源鸿蒙机器人操作系统 M-Robots OS 正式完整捐献至开放原子开源基金会,专属一级根社区同步启动运营。该系统 1.0 版本于 2025 年 4 月发布,今年 5 月升级至 2.0 版本。2.0 版本具备积木式框架、混合部署、自研 M-DDS 分布式通信、硬件能力及算法共享、AI 原生及中间件生态兼容等核心能力,其中本体间音视频时延低至 4 毫秒,应用迁移成本降低 80%。

具身智能开源/仓库部署/工程
07:26
Rohan Paul@rohanpaul_ai
50
中国对冲基金警告AI股票超级泡沫即将破裂

彭博社报道,两家中国对冲基金警告全球AI股票繁荣已从强劲需求转为超级泡沫。许多AI相关股票的定价已包含多年完美增长预期,但企业尚未证明能捍卫利润。最薄弱环节是AI基础设施——公司必须持续在芯片、服务器、电力和数据中心上巨额投入以维持竞争力。Wealspring称部分热门中国AI股可能下跌超80%;Banxia指出Anthropic的收入运行率是压力点,因为token成本上升速度可能超过客户预算。

行业动态部署/工程
05:26
Rohan Paul@rohanpaul_ai
54
福特AI检测缺陷遇瓶颈,召回350名专家补漏

福特汽车的AI自动化缺陷检测遇到硬限制:汽车制造中存在大量边缘案例,微小设计、材料、供应商和装配变化相互作用,导致基于规则的系统与训练模型容易遗漏故障。福特因此召回350名经验丰富的工程师(“gray beards”),利用他们多年积累的隐性工程知识(即故障模式记忆),在零件到达工厂前审查设计,同时帮助改进AI系统的训练数据。

行业动态部署/工程
04:50
TechCrunch:AI(RSS)
54
软银CEO并非唯一对马斯克轨道数据中心炒作有疑问的人

软银CEO孙正义在股东大会上批评马斯克的轨道数据中心构想,认为其成本高、周期长,而AI竞赛未来几年比十年后的可能性更重要。SpaceX目前占据全球发射市场80-90%份额,主要依赖Starlink业务;建设需要每隔几年更换卫星的轨道数据中心将为SpaceX带来更多发射业务。同期,芯片公司Groq完成6.5亿美元融资,OpenAI推进定制芯片计划。

大佬观点数据/训练部署/工程
03:26
Rohan Paul@rohanpaul_ai
71
Gallup民调:71%美国人反对本地建设AI数据中心

Gallup民调显示,71%美国人反对在本地建设AI数据中心,女性(55%)强烈反对比例高于男性(43%)。反对主因并非恐惧AI,而是资源压力(50%反对者提及,其中水、电各占18%);支持者则看重经济(66%)和就业(55%)。政治风险广泛,多数民主党、独立派、共和党均反对,民主党最强烈(56%强烈反对)。自2023年以来,美国已出现300+州及地方数据中心禁令/暂停。但现代数据中心已能缓解担忧:微软新一代芯片级闭环冷却零水耗;谷歌全球PUE 1.09低于行业平均1.56;数据中心未推高居民电价;"自带电力"成趋势,Google、微软、Meta纷纷签订核电合同。

Rohan Paul: The U.S. AI buildout is running into a harder constraint than GPUs: permission. The Information's new map finds 300+ sta...

政策/监管行业动态部署/工程
03:25
Hugging Face:Blog(RSS)
精选62
一条命令在HF Jobs上启动vLLM服务器

HuggingFace Jobs 支持一条命令启动 vLLM 服务器,用于测试、评估或批量生成。使用 hf jobs run 命令,指定官方 vllm/vllm-openai 镜像、GPU flavor(如 a10g-large)、暴露端口 8000 并设置超时。服务器启动后可通过 OpenAI 兼容 API 访问,每次请求需携带 HF token 作为 bearer token(仅限有读权限的用户)。示例部署了 Qwen/Qwen3-4B(多 GPU 需 --tensor-parallel-size)。a10g-large 价格为 $1.50/小时,按分钟计费,可通过 hf jobs cancel 停止。

Hugging Face教程/实践部署/工程

推荐理由:这是一条命令在HF上启动vLLM的完整教程,适合快速测试模型的开发者,但方案完全绑定Hugging Face平台,通用性有限。
01:55
Rohan Paul@rohanpaul_ai
58
美国AI基础设施建设瓶颈从GPU转为许可:300多项数据中心禁令,但水耗与电费担忧被数据驳斥

美国AI基础设施建设最大瓶颈已从GPU变为许可。《The Information》地图显示2023年以来有300多项州级和地方数据中心禁令或暂停,今年通过275项,还有75项在审,中西部和南部抵制最强。但现实数据反超担忧:微软新一代AI数据中心采用芯片级闭环冷却,每站每年避免超1.25亿升水,全舰队用水效率自2021年提升39%至0.30升/kWh;谷歌86%淡水来自低中风险源,全球PUE 1.09(行业均值1.56)。2015–2024年研究表明数据中心通过分摊固定电网成本适度降低了居民平均电价。趋势已转为“自带电源”:谷歌500 MW核电、微软835 MW三哩岛、Meta 1121 MW核电协议。

GoogleMicrosoft政策/监管部署/工程
01:44
凡人小北@frxiaobei
49
医疗AI的真正壁垒:工作流而非答题准确率

医疗AI常被简化为“模型答题准确率”的竞争,但真正的难点在于进入实际工作流——包括医生自然语言处理、病历结构化、患者上下文理解、支付方对接、院内系统集成以及审计责任。产品壁垒最终大概率不是一个 chatbox,而是与医疗场景的深度融合。

现象/趋势部署/工程
01:16
AYi@AYi_AInotes
62
在Cloudflare Workers AI上配置GLM 5.2免费使用:登录后创建API Token,在Chatbox中设置OpenAI API兼容的自定义API,填入API Key和拼接了Account ID的Host地址,模型名选@cf/zai-org/glm-5.2即可。但实测每日有使用限制,并非真正无限。冲!

珠音こころ: ClaudeflareでGLM5.2無料で使えるヤツ、秒で設定できた。クレカもなんもいらんから楽。 Claudeflareログイン Workers AIクリック REST APIクリック Create a Workers AI APITok...

教程/实践部署/工程
01:06
MarkTechPost(RSS)
精选79
DeepSeek 开源 DSpark 投机解码框架,加速 DeepSeek-V4 生成速度 60-85%

DeepSeek 发布 DSpark 投机解码框架并开源检查点与训练代码。该框架不是新模型,而是在 DeepSeek-V4 权重上附加草稿模块,通过半自回归生成(并行骨干 + 轻量级顺序头)实现无损加速。生产环境下,DeepSeek-V4-Flash 和 V4-Pro 每用户生成速度较 MTP-1 基线分别提升 60–85% 和 57–78%。离线测试中,接受长度比 Eagle3 高 26–31%,比 DFlash 高 16–18%。配套 DeepSpec 训练代码库采用 MIT 许可证。

DeepSeek推理论文/研究部署/工程

推荐理由:DeepSeek 开源的这个投机解码框架让 V4 生成提速 60% 以上,关键在于不换模型就能加速,对用 API 做产品的人是立即可用的性能提升。代码和权重都给了,值得一试。
00:03
Hacker News 热门(buzzing.cc 中文翻译)
精选81
一次失败的(民族国家?)攻击的剖析

作者收到伪装成新加坡VC Lua Ventures的虚假面试邮件,要求完成一个TypeScript仓库的“测试”。作者将仓库交给Claude扫描,在typescript+5.9.2.patch中发现base64混淆载荷,该载荷在patch-package安装时触发,向~/.cache-等目录写入payload.js和mutex.js,构成后门(命名PinpinRAT)。攻击者使用虚构身份和空洞LinkedIn资料,目标是作者在crates.io上的Rust包。相关信息已报告加拿大CCCS等机构。

安全/对齐开源生态部署/工程

推荐理由:这是一次近乎完美的开发者定向攻击复盘,虚假面试加上精心构造的补丁注入 RAT,手法隐蔽到连作者都差点中招,所有靠开源吃饭的人都该认真看看 Ioc 并重新审视自己的代码审查盲区。
6月27日
23:25
宝玉@dotey
51
推文围绕AI行业"老登"与"新登"展开讨论。老登指注重基建、有认知思辨的专业程序员,被认为能支撑AI健康稳定迭代,是专业尊严的最后阵地;新登则概念强、快速落地、吹牛忽悠投资后砍掉产研,导致裁员频发(有朋友一年被三家AI创业公司裁)。主推文以"讨厌老登,理解老登,成为老登"概括了从对立到认同的态度转变。

i5ting: 我喜欢老登,有认知和思辨。 我一直的观点:ai构建在好的基建上,才能健康稳定的快速迭代。 基建能做好的基本都是老登。这是专业程序员最后的尊严。 新登往往概念强,快速落地,然后吹牛忽悠投资,砍掉产研,钱到手就完事。有朋友说一年时间,被三家ai...

大佬观点部署/工程
18:59
IT之家(RSS)
51
鹏城云脑III登顶IO500双榜:依托华为OceanStor A800存储

华为宣布,基于OceanStor A800存储搭建的“鹏城云脑Ⅲ”系统登顶IO500 Full List与Research List榜首,总分603,334.58分,带宽8,291.11 GiB/s,元数据性能43,903,983.64 kIOP/s,整体性能较此前最高纪录提升2.8倍。测试部署664个计算节点、79,680个并行进程,历经13项测试用例。OceanStor A800采用对等全互联架构与数控分离架构,DPU直通SSD,单框吞吐量500GB/s,支持双向扩展,单集群最多512个控制器,聚合带宽超100TB/s,并内置DataTurbo加速引擎与智能缓存换出机制。

行业动态部署/工程
15:59
IT之家(RSS)
66
DeepSeek 联合北大发布 DSpark 推理加速框架,速度提升 60% 至 85%

DeepSeek 联合北京大学发布 DSpark 推理加速框架,已部署于 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 预览版。DSpark 采用半自回归架构与置信度调度验证机制,在同等吞吐量下将单用户生成速度提升 60% 至 85%。在 Qwen3 系列和 Gemma4-12B 的离线测试中,DSpark 平均每轮接受长度优于 Eagle3 和 DFlash。生产环境下,V4-Flash 引擎在 80 token/s SLA 下吞吐量提升 51%,120 token/s 时提升 661%。相关论文、训练代码已在 GitHub 开源。

DeepSeek开源/仓库推理部署/工程
15:24
meng shao@shao__meng
46
API中转站惊现Claude Fable 5,调用竟成功

作者在垃圾箱发现一封LLM API中转站的合作邮件,网站首页声称提供「Claude Fable 5」模型。作者用邀请码注册后,通过Codex调用该模型,居然成功返回结果。作者质疑该站是背景过硬还是虚假宣传。

现象/趋势部署/工程
13:59
IT之家(RSS)
51
美满升级 Structera CXL 控制器:内联压缩最高 3.64x,缓解 AI 场景内存压力

美满电子(Marvell)6月24日发布Structera X和Structera A两款CXL控制器,集成CDB压缩-解压硬件模块,实现内联LZ4无损压缩。压缩比最高3.64x(Database nci数据),全零页面达64:1。Structera X定位CXL内存扩展,支持DDR5/DDR4,最大6TB/4TB容量,200 GB/s带宽,配备4个ARM Cortex-M7核心;Structera A面向近内存加速,集成16个Arm Neoverse V2核心、64MB末级缓存及4个DDR5-6400通道。两者均支持内联XTS-AES 256位加密,为首批将硬件内联内存压缩写入OCP规格的产品。

产品更新部署/工程
‹ 上一页
123456…50
下一页 ›