AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月25日周四
00:17xAI47Grok Build 集成 MongoDB 官方插件
00:17Greg Brockman64OpenAI 发布首款 AI 芯片 Jalapeño
00:05向阳乔木58字节火山引擎大会:洪定坤谈AI开发新范式
6月24日周三
23:18Rohan Paul65OpenAI与Broadcom合作推出首款自研AI芯片Jalapeño,推动全栈战略
23:13AYi61Notion 大规模招聘:AI 集成草莽时代结束
23:03TechCrunch:AI(RSS)65OpenAI 发布首款自研推理芯片 Jalapeño,由 Broadcom 制造
23:01Chubby♨️55OpenAI 发布首款自研 AI 芯片 Jalapeño
21:58IT之家(RSS)39首款搭载宁德时代电池的重载人形机器人上岗
21:58IT之家(RSS)52高通官宣将收购 AI 软件栈企业 Modular,交易预计 2026H2 完成
21:48meng shao66OpenAI 发布首款自研推理芯片 Jalapeño
21:30Chubby♨️60OpenAI 发布首款自研 AI 芯片 Jalapeño,专为大语言模型推理设计
21:20SemiAnalysis53NVIDIA GB300 NVL72 固件 bug 每 66.5 天需重启
21:03The Decoder:AI News(RSS)57OpenAI 部署负责人谈 Codex 增长、AI 价格下降与 ROI 问题
21:01OpenAI:官网动态(RSS · 排除企业/客户案例)61精选OpenAI 与 Broadcom 联合发布 LLM 推理芯片 Jalapeño
20:58IT之家(RSS)44中科曙光 ParaStor F9000 包揽 IO500 双榜冠军,刷新全球存储性能纪录
18:50IT之家(RSS)34日月光投控:预计先进封测营收 2026 年翻倍增长,集团今年开发 15 座新厂
18:31公众号:火山引擎66精选火山引擎推出Agent Ready基础设施,AgentKit与ArkClaw企业版升级
18:29Artificial Intelligence News(RSS)47三星开放ChatGPT Enterprise和Codex访问权限
17:50公众号:火山引擎56三大Agent开发运营产品升级,帮企业建好"1+N+X"Agent体系
17:47Kimi.ai50Kimi API上线AWS Marketplace
17:21Alibaba Cloud49阿里云DSC用AI实现800+数据类型自动识别
16:44IT之家(RSS)57公司历来规模最大:消息称字节跳动寻求 200 亿美元海外贷款
16:11公众号:百度智能云(文心)56百度千帆Token Plan企业版发布,接入GLM-5.2
15:51Alibaba Cloud38阿里云×LVMH获创新转型奖
15:42IT之家(RSS)58马斯克官宣 Starmind 太空 AI 算力项目名称,规划 100 万颗计算卫星
15:37MarkTechPost(RSS)74精选DFlash:块扩散草稿模型实现最高15倍吞吐量提升
15:20公众号:蚂蚁百灵(Ling)49Ling-2.6-1T TPU 推理优化:用 Pallas Kernel 隐藏 MoE 数据搬运
14:15OpenClaw🦞46OpenClaw 2026.6.10 版本发布,多项改进
13:42IT之家(RSS)38华为将在 WAIC 2026 首次展出业界最大规模超节点 Atlas 950 SuperPoD 真机
12:42IT之家(RSS)45阿里云:QoderWork 推出"峰谷 Token",错峰使用 Qwen 3.7 低至 2 折
09:47Rohan Paul55Andrew Ng谈AI时代团队组织:1-10通才加速
09:19AK42hf-claude 与 GLM 5.2 兼容良好
06:17Rohan Paul41NVIDIA Rubin AI 服务器采用 45°C 液冷技术,大幅降低水耗
06:09OpenRouter41GLM 5.2 供应商汇总:含超 125 TPS
03:16Rohan Paul69甲骨文裁员13%并归因AI部署,重组及资本支出激增
02:42Ethan Mollick45康奈尔大学用Claude技能追回10万美元欠款
02:26Hugging Face:Blog(RSS)64精选在 Transformers.js 中实验提议的跨源存储 API
02:08🚨 AI News | TestingCatalog56Anthropic推出Claude Tag:Slack AI同事
01:50elvis61Latitude:开源AI智能体可观测性工具
01:14Claude:Blog(网页)42Claude Tag 的 Agent Identity 访问模型
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月25日
00:17
xAI@xai
47
在 Grok Build 中使用官方 @MongoDB 插件来查询数据、优化索引和管理数据库。
xAI产品更新部署/工程
00:17
Greg Brockman@gdb
64
OpenAI 联合 Greg Brockman 正式推出其首款 AI 芯片 Jalapeño,专为大语言模型推理任务从头设计,历时九个月。芯片已与 Broadcom 合作投入量产,将加速 ChatGPT、Codex、API 及未来智能体产品。Jalapeño 利用 OpenAI 自身模型进行加速,官方称其每瓦性能"令人难以置信"。这标志着 OpenAI 从产品到模型再到基础设施的全栈平台扩展,旨在规模化智能并扩大 AI 可及性。

OpenAI: We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...

OpenAI产品更新推理部署/工程
00:05
向阳乔木@vista8
58
字节火山引擎大会:洪定坤谈AI开发新范式

字节火山引擎大会上,洪定坤分享了AI开发的三个核心方法论:1. 原型驱动开发——用AI生成可交互原型替代PRD,提前暴露分歧。2. AI Development系统化——AI写Spec→功能实现→Browser Use验证→自动提交上线。3. Harness基建——上下文工程、架构约束、团队知识Memory、技术债梳理,能将可交付性从40~60分提升至80分。

大佬观点编码部署/工程
6月24日
23:18
Rohan Paul@rohanpaul_ai
65
OpenAI与Broadcom合作推出首款自研AI芯片Jalapeño,推动全栈战略

OpenAI与Broadcom合作推出首款自研AI芯片Jalapeño(ASIC),专为ChatGPT、Codex、API及未来AI智能体产品的LLM工作负载设计。在已知工作负载下,Jalapeño比NVIDIA GPU更便宜、更快,通过减少数据移动、均衡计算/内存/网络资源实现更接近理论峰值的实际利用率,能效更优。该芯片从设计到流片仅用9个月,OpenAI自己的模型加速了部分设计工作。这标志着OpenAI从购买算力转向构建完整堆栈(模型、软件、服务器、网络、芯片)的战略转变。

OpenAI: We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...

OpenAI产品更新推理部署/工程
23:13
AYi@AYi_AInotes
61
Notion 大规模招聘:AI 集成草莽时代结束

Notion 发布招聘帖,职位列表中找不到传统 Prompt Engineer,取而代之的是模型行为工程师、AI 评估师、AI 治理专员、客户体验知识架构师等工程化岗位,负责调优模型行为边界、评估输出质量、设计权限与审计体系。Notion 认为 AI 负责执行,人类负责定义价值,因此同步扩招销售、客户成功、知识架构师。实习生要求对艺术、历史、社会科学有兴趣,强调判断力。招聘帖采用 ASCII 艺术设计,获得高传播。

Notion: ______ | We're hiring | |______| \ (•◡•) / \ / -- | | |_ |_ Open roles: → AI Applications Engineer → AI Conversation Des...

现象/趋势部署/工程
23:03
TechCrunch:AI(RSS)
65
OpenAI 发布首款自研推理芯片 Jalapeño,由 Broadcom 制造

OpenAI 周三公布其首款自研推理处理器 Jalapeño,由 Broadcom 设计制造,专为推理系统优化,OpenAI 自身 AI 模型参与了芯片开发。早期测试显示能效比显著优于当前顶尖替代方案。该芯片旨在降低实时编码模型的运行成本,但预训练等高性能任务仍将依赖 Nvidia GPU。OpenAI 称此举使其能全栈优化芯片架构、内核、内存系统、调度等基础设施,以提升模型速度、可靠性和经济性。

OpenAI产品更新部署/工程
23:01
Chubby♨️@kimmonismus
55
OpenAI 发布首款自研 AI 芯片 Jalapeño

OpenAI 推出首款自研 AI 芯片 Jalapeño,专为 LLM 推理从零设计。从初始设计到流片仅用 9 个月,ChatGPT 参与了芯片设计,堪称高性能先进半导体领域最快的 ASIC 开发周期。该芯片由 Broadcom 和 Celestica 代工,针对 ChatGPT、Codex、API 及未来 Agent 产品的实际负载优化。早期样片已在实验室达到目标频率和功耗,成功运行 GPT-5.3-Codex-Spark 等 ML 负载;性能功耗比显著优于当前 SOTA,详细基准后续公布。部署计划于 2026 年底启动,战略上旨在减少对外部 GPU 依赖,加强对算力经济的控制。

Chubby♨️: OpenAI just unveiled Jalapeño, its first custom AI chip designed from scratch for LLM inference- It is OpenAI moving dee...

OpenAI产品更新推理部署/工程
21:58
IT之家(RSS)
39
首款搭载宁德时代电池的重载人形机器人上岗

6月24日,宁德时代与银河通用机器人签署全球战略合作协议,银河通用研发的重载人形机器人Galbot S1成为全球首款搭载宁德时代电池的具身智能常态化运营机器人。该机器人具备双臂50公斤级载重、纯视觉厘米级定位、360°全向避障能力;宁德时代电芯失效率达PPB级别,保障8小时超长续航与产线高安全性。目前Galbot S1已在宁德时代智慧产线中替代物料搬运、拣选等高强度人工。

具身智能行业动态部署/工程
21:58
IT之家(RSS)
52
高通官宣将收购 AI 软件栈企业 Modular,交易预计 2026H2 完成

高通宣布收购Modular,交易预计2026H2完成。Modular并非AI芯片硬件企业,而是为AI XPU提供高效软件堆栈的软件公司,其AI原生软件平台可在各类XPU上以业界领先性能运行AI模型,开发者和企业仅需一次构建,无需针对每种架构重写代码。高通将结合硬件领先地位与Modular的软件专业知识,帮助客户将AI从端侧迁移到云上,构建速度更快、效率更高、更易扩展的系统。

端侧行业动态部署/工程
21:48
meng shao@shao__meng
66
OpenAI 发布首款自研推理芯片 Jalapeño

OpenAI 联合 Broadcom 与 Celestica 从零设计首款自研推理芯片 Jalapeño,9 个月完成流片,专为 LLM 推理优化,能效优于当前 SOTA。计划 2026 年底起以吉瓦级规模部署,用于 ChatGPT、Codex、API 及未来智能体产品。OpenAI 称这是“全栈优势”关键环节,通过自研芯片构建飞轮:更好基础设施→更高算力效率→更好训练与推理→更强模型→更好产品→更多使用与收入→再投入。推理芯片直接改善成本、速度与可靠性,是 AI 触达用户的环节。

OpenAI: We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...

OpenAI产品更新推理部署/工程
21:30
Chubby♨️@kimmonismus
60
OpenAI 发布首款自研 AI 芯片 Jalapeño,专为大语言模型推理设计

OpenAI 推出其首款自研 AI 芯片 Jalapeño,与 Broadcom 和 Celestica 合作构建,针对 ChatGPT、Codex、API 及未来智能体产品的工作负载优化。早期样品已在实验室以目标频率和功耗运行 ML 工作负载,包括 GPT-5.3-Codex-Spark。OpenAI 称每瓦性能显著优于当前最先进水平,详细基准稍后公布。部署计划于 2026 年底启动。此举旨在减少对外部 GPU 的依赖,增强对计算经济的控制,并强化模型、产品、收入与基础设施之间的飞轮效应。

OpenAI: https://openai.com/index/openai-broadcom-jalapeno-inference-chip/

OpenAI产品更新推理部署/工程
21:20
SemiAnalysis@SemiAnalysis_
53
NVIDIA 驱动质量警告:GB300 NVL72 存在固件 bug,机架每 66.5 天需重启一次。虽然人们通常认为 NVIDIA 拥有顶级软件,但事实证明其驱动和固件仍存在许多问题。关键在于,在竞争对手中,NVIDIA 只是软件质量最不差的那个。
行业动态部署/工程
21:03
The Decoder:AI News(RSS)
57
OpenAI 部署负责人谈 Codex 增长、AI 价格下降与 ROI 问题

OpenAI 部署负责人 Arnaud Fournier 在采访中透露,DeployCo 团队正通过派驻自家工程师将 AI 深度嵌入大型企业。他称 Codex 正经历爆发式增长,客户反馈已直接回传至模型开发环节,并指出 AI 智能价格已大幅下降。

OpenAI编码行业动态部署/工程
21:01
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选61
OpenAI 与 Broadcom 联合发布 LLM 推理芯片 Jalapeño

OpenAI 与 Broadcom 发布首款自研推理加速器 Jalapeño,专为当前及未来 LLM 从头设计。早期测试显示,其性能功耗比大幅优于现有 SOTA。工程样片已在实验室以目标频率和功耗运行 GPT‑5.3‑Codex‑Spark 等负载。芯片从设计到流片仅用 9 个月,并利用 OpenAI 模型加速部分流程。OpenAI 计划从 2026 年起与 Microsoft 等合作伙伴部署千兆瓦级数据中心,推出多代计算平台。

OpenAI产品更新推理部署/工程

推荐理由:OpenAI 首次亲自设计芯片,和 Broadcom 联手推出专为 LLM 推理优化的 Jalapeño,从设计到流片仅 9 个月。虽然还只是早期测试,但性能功耗比大幅领先,一旦大规模部署,推理成本可能跳水,用 ChatGPT 的每个人都能感知到更快更便宜。
20:58
IT之家(RSS)
44
中科曙光 ParaStor F9000 包揽 IO500 双榜冠军,刷新全球存储性能纪录

中科曙光 ParaStor F9000 分布式全闪存储系统在 ISC High Performance 2026 上包揽 IO500 生产型总榜与 10 节点挑战榜双项冠军,刷新世界纪录。该系统已在数万卡集群中稳定运行超一年,支持千亿参数大模型部署时间缩短 1 倍、训练效率提升 50%。联合龙讯旷腾 MatPL 及 scaleX 万卡算力平台,完成 414.7 亿原子规模的液态水分子动力学模拟(第一性原理级精度),超越此前 290 亿原子纪录,在 4096 张异构加速卡并行下完成。同期展出 scaleX AI 超集群、全栈自研 400G 无损高速网络 scaleFabric 等产品。

行业动态部署/工程
18:50
IT之家(RSS)
34
日月光投控:预计先进封测营收 2026 年翻倍增长,集团今年开发 15 座新厂

日月光投控 COO 吴田玉在股东会上透露,2025 年先进封装营收 502 亿新台币,封测占比从 6% 升至 13%;预计今年先进封测营收翻倍。2026-2027 年支出维持高位,旗下日月光、矽品今年共开发 15 个厂区(含 2 个外购)。业界首条 310mm PLP 先进封装自动化产线最快 2026 年底量产。

其他部署/工程
18:31
公众号:火山引擎
精选66
火山引擎推出Agent Ready基础设施,AgentKit与ArkClaw企业版升级

火山引擎在FORCE大会推出面向企业智能应用的Agent Ready基础设施,构建AI云与Agent三层架构。AgentKit升级提供Identity、Runtime、Sandbox、Evaluation等模块,实现Agent可靠、可控、可衡量。Identity已接入数千家身份体系,Runtime支持长程任务和分钟级12万沙箱并发。ArkClaw企业版集成Agent广场、技能中心与企业知识库,支持IDP/SSO/OAuth及飞书、钉钉等IM入口统一管控。实践案例:海底捞门店经营Agent将小时级工作压缩到分钟级,人工跟进时长缩减70%,巡检满意度提升50%;创维酷开借助ArkClaw终端版打造AIOS,Token消耗节省50%,支撑百万级终端。

智能体产品更新部署/工程

推荐理由:Agent 从聊天机器人到企业生产工具,缺的不是模型能力而是基础设施。火山引擎这套 AgentReady 架构把身份、沙箱、评测串了起来,是企业 AI 落地的关键一步。
18:29
Artificial Intelligence News(RSS)
47
三星开放ChatGPT Enterprise和Codex访问权限

三星电子扩大员工对ChatGPT Enterprise和Codex的访问权限,使员工更广泛地将AI工具用于技术与非技术工作。该部署覆盖韩国所有三星电子员工及全球所有Device eXperience员工,DX部门涵盖智能手机、消费电子和家电。

OpenAI行业动态部署/工程
17:50
公众号:火山引擎
56
三大Agent开发运营产品升级,帮企业建好"1+N+X"Agent体系

火山引擎在FORCE大会上提出企业Agent落地“1+N+X”体系:“1”是AgentSphere数字员工派遣站,“N”是开箱即用应用,“X”是基于TRAE、扣子、HiAgent持续进化的业务应用。TRAE企业版上线TRAE Work,实现一个账号切换IDE与办公端、一个后台统一管理,内部开发94%代码由AI贡献。亚信科技应用后单人日均节省约1.8小时,代码贡献率提升42%,千行代码缺陷率降低35%。扣子升级3.0,强化多端协同与行业知识沉淀。HiAgent 3.0构建开发-运行-管理闭环,引入Learning Loop实现Agent持续进化。某车企经AgentSphere统一纳管后,活动筹备周期从4周压缩至5个工作日,效率提升约3.5倍。

智能体产品更新部署/工程
17:47
Kimi.ai@Kimi_Moonshot
50
Kimi API 现已上线 AWS Marketplace。🚀 如果你的团队已经在使用 AWS,现在可以通过合并计费访问 Kimi。此外,符合条件的客户可将 Kimi API 使用量直接计入其 AWS EDP 承诺。 立即使用 Kimi 构建和扩展:https://aws.amazon.com/marketplace/pp/prodview-rfjb2elzc5jp4
产品更新部署/工程
17:21
Alibaba Cloud@alibaba_cloud
49
阿里云DSC用AI实现800+数据类型自动识别

阿里云数据安全中心(DSC)采用AI基础模型+专家模型+正则表达式的融合架构,取代传统规则驱动的数据分类。新方案支持800+种数据类型自动识别,具备上下文感知的准确率与召回率,实现毫秒级合规响应,并支持无缝云原生集成。

产品更新部署/工程
16:44
IT之家(RSS)
57
公司历来规模最大:消息称字节跳动寻求 200 亿美元海外贷款

字节跳动正与多家银行磋商,寻求一笔约 200 亿美元(约合 1360.08 亿元人民币)的海外贷款,期限 3 年并附带延长期权,最长可至 5 年。若传闻属实,这将是字节跳动历史上规模最大的离岸融资项目,资金将为其 AI、云计算扩展提供支持。

行业动态部署/工程
16:11
公众号:百度智能云(文心)
56
百度千帆Token Plan企业版发布,接入GLM-5.2

百度千帆发布企业级AI生产力订阅服务Token Plan企业版,采用“席位制+企业共享积分包”模式,支持按需采购席位、统一额度池共享调度,并提供成员管理、用量统计、告警等运营能力。模型方面聚合DeepSeek-V4系列、GLM-5系列、Kimi-K2.6等,已率先接入智谱GLM-5.2,开箱即用。提供轻享版、标准版、高级版等多档位,承诺不使用用户数据训练,支持企业级SLA。

产品更新部署/工程
15:51
Alibaba Cloud@alibaba_cloud
38
阿里云于5月29日参加了2026年中法工商会晚宴。 LVMH x 阿里云,我们共同赢得创新转型奖--"负责任生成式AI应用于中国奢侈零售"。 这一里程碑式的合作将阿里的通义千问和阿里云Model Studio嵌入LVMH零售生态,提供负责任的、由生成式AI驱动的奢侈品体验。 感谢信任与支持! #AlibabaCloud #Qwen #LVMH #CCIFranceChine
行业动态部署/工程
15:42
IT之家(RSS)
58
马斯克官宣 Starmind 太空 AI 算力项目名称,规划 100 万颗计算卫星

马斯克在 X 平台确认,SpaceX 轨道 AI 数据中心项目正式定名为 Starmind,xAI 已注册该商标。SpaceX 于 2026 年 1 月 30 日向美国联邦通信委员会提交申请,计划发射最多 100 万颗计算卫星部署于近地轨道。首代硬件 AI1 卫星高 20 米、翼展 70 米,单颗平均提供 120 kW 算力、峰值 150 kW,接近地面现代 AI 服务器机架。Starmind 卫星通过高速光学链路连接 Starlink,再由星链中继数据到地面站。

xAI行业动态部署/工程
15:37
MarkTechPost(RSS)
精选74
DFlash:块扩散草稿模型实现最高15倍吞吐量提升

DFlash 由 UC San Diego 团队提出,是一种用于投机解码的轻量块扩散草稿模型。它一次前向推理生成整块 token,再由目标模型并行验证,保证输出无损。相比 EAGLE-3,DFlash 实现最高 2.5 倍加速,在 Qwen3-8B 等多种模型上平均无损加速超过 6 倍(MATH-500 达 6.08×)。在 NVIDIA Blackwell 上(TensorRT-LLM),gpt-oss-120b 模型吞吐量提升最高 15 倍,约为 EAGLE-3 的 1.5 倍。核心创新是将目标模型多层隐藏特征注入草稿模型每一层的 Key-Value 投影,使接受长度随草稿深度增长。

推理论文/研究部署/工程

推荐理由:DFlash把扩散模型引入推测解码草案阶段,一次并行生成整块token,单流加速最高6倍,NVIDIA实测吞吐量提升15倍,推理成本下降幅度很大,部署大模型的团队可以立刻关注。
15:20
公众号:蚂蚁百灵(Ling)
49
Ling-2.6-1T TPU 推理优化:用 Pallas Kernel 隐藏 MoE 数据搬运

蚂蚁 ASystem Core 与 SGLang-JAX 团队在 TPU v7x 上优化了 1T 参数稀疏 MoE 模型 Ling-2.6-1T 的推理性能。核心是 Fused MoE V2 Pallas kernel,将 scatter、expert FFN 和 gather 合并,通过计算与数据搬运重叠降低延迟。相比 V1,MoE prefill latency 从 5.16 ms 降至 2.42 ms(降 53%),decode kernel latency 从 0.249 ms 降至 0.211 ms。仅替换 MoE kernel 即可使 prefill throughput 提升 24.8%,decode throughput 提升 18.5%–35.3%。在 SGLang decode benchmark 下,16 颗 TPU v7x 的 output throughput 达到 16 张 H200 的 1.29x–1.77x。该工作还完整支持 hybrid backbone,包括 hybrid KV/recurrent memory pools、GLA linear attention 及 single-controller data parallelism。

推理教程/实践部署/工程
14:15
OpenClaw🦞@openclaw
46
🦞 OpenClaw 2026.6.10 刚刚发布。 只是一个小型发布,保持进展: ⚡ 短对话自动快速模式 🧠 更可靠的模型路由 🔒 更安全的会话状态 + 受信任的策略 🛠️ 更好的提供商接入 帮助交付坚如磐石的龙虾。🦞
GitHub产品更新开源生态部署/工程
13:42
IT之家(RSS)
38
华为将在 WAIC 2026 首次展出业界最大规模超节点 Atlas 950 SuperPoD 真机

华为宣布将在 WAIC 2026(7 月 17 日-7 月 20 日)首次展出业界最大规模超节点 Atlas 950 SuperPoD 真机,该产品以单柜 64 卡为基本单元,最大支持 8192 张 NPU 卡高速互联,全局统一内存编址,加速万亿参数大模型训练与推理。同期展示 Atlas 850E 风冷超节点真机,采用升级 VCE 散热技术,为 Agentic 推理提供高吞吐、低时延体验。昇腾 AI 基础软件开源开放,兼容第三方训练加速库等;超节点已在互联网、运营商等 11 大行业规模部署。

行业动态部署/工程
12:42
IT之家(RSS)
45
阿里云:QoderWork 推出"峰谷 Token",错峰使用 Qwen 3.7 低至 2 折

阿里云公告称,QoderWork 推出“峰谷 Token”,每晚 22:00 至次日 08:00 运行可自动享受优惠,其中 Qwen3.7-Max 模型低至 2 折。夜间折扣覆盖 QoderWork、QoderDesktop、CLI 等产品。用户可白天设置定时任务或睡前提交长程指令,由 Agent 在夜间自动执行,积分消耗仅为白天的 20%-40%。QoderWork 是阿里于 2026 年 1 月推出的桌面 AI 智能体工具,支持自然语言操作本地应用和文件,已服务全球超 500 万用户。

行业动态部署/工程
09:47
Rohan Paul@rohanpaul_ai
55
Andrew Ng谈AI时代团队组织:1-10通才加速

Andrew Ng分享了AI时代如何组织工程团队以加速:1到10人的团队由高度授权的通才组成,保持高语境。当代码生成速度大幅提升后,组织反而成为瓶颈——功能从想法到原型只需一天,迫使产品、设计、营销、法务等所有环节同步加速。他的解决方案是让少数高语境通才团队独立决策,避免跨部门翻译带来的延迟。源自LangChain YouTube频道。

大佬观点部署/工程
09:19
AK@_akhaliq
42
hf-claude 与 GLM 5.2 兼容良好 hf extensions 安装 hf-claude
Hugging Face教程/实践部署/工程
06:17
Rohan Paul@rohanpaul_ai
41
NVIDIA Rubin AI 服务器采用 45°C 液冷技术,大幅降低水耗

NVIDIA Rubin AI 服务器用 45°C 水-乙二醇冷却液直接冷却芯片和网络部件,取代传统空气冷却。在适宜气候下,干式冷却器可替代冷却塔,设施冷却水用量从约 260 万加仑/MW/年降至接近零。液冷为闭环循环,不持续蒸发水。一个 50MW AI 设施每年可节省超 400 万美元冷却能源和水费。全液冷 Rubin 服务器还将系统从 6 个机架单元缩减至 2 个,在相同空间内容纳更多计算。引用 NVIDIA 数据称,数据中心用水仅占美国日常用水量的 0.2%,液冷却正大幅降低水耗并创造热量再利用机会。

NVIDIA: Water usage has been a hot topic in the AI data center world, but the numbers may surprise you. According to the Manhatt...

产品更新部署/工程
06:09
OpenRouter@OpenRouter
41
在一个地方访问 GLM 5.2 的所有供应商。 包括一个服务速率超过 125 TPS:https://openrouter.ai/z-ai/glm-5.2

Zhu Liang: the number of providers for glm 5.2 is insane. i count 20 of them.

产品更新部署/工程
03:16
Rohan Paul@rohanpaul_ai
69
甲骨文裁员13%并归因AI部署,重组及资本支出激增

甲骨文(Oracle)在最近12个月内裁员13%,员工数从16.2万降至14.1万,并在年度SEC 10-K文件中将AI部署列为部分原因。同期重组费用从3.74亿美元飙升至18亿美元,资本支出增长162%至557亿美元,自由现金流转为负237亿美元。

行业动态部署/工程
02:42
Ethan Mollick@emollick
45
一个案例研究,说明为什么组织既应激励员工探索对他们有帮助的AI用途,又应设立专门的AI构建者实验室。这里,康奈尔大学的财务和AI团队创建了一个/treasury Claude技能,收回了10万美元的欠款。
行业动态部署/工程
02:26
Hugging Face:Blog(RSS)
精选64
在 Transformers.js 中实验提议的跨源存储 API

Transformers.js 在浏览器中运行 AI 模型时,不同来源的 Web 应用会重复下载并缓存相同的模型资源(如 Xenova/whisper-tiny.en)和 Wasm 运行时文件(如 4,733 kB 的 ort-wasm-simd-threaded.asyncify.wasm),即使资源 URL 相同,浏览器因 Network Isolation Key 隔离缓存,单次 demo 就产生 177 MB 冗余下载和存储。Cross-Origin Storage API 是一项早期提案,旨在让跨来源应用共享缓存的模型和运行时资源。目前该 API 尚未在浏览器原生实现,但可通过 Chrome 扩展注入 polyfill 进行实验。

Hugging Face开源生态教程/实践部署/工程

推荐理由:这个Chrome提案让不同网站的AI模型共享缓存,对用Transformers.js的Web开发者是切实的性能改进,但还只是早期实验。
02:08
🚨 AI News | TestingCatalog@testingcatalog
56
Anthropic 为团队和企业用户推出了 Claude Tag。 Claude Tag 在 Slack 中运行,能够处理更复杂的任务、将其分解为更小的里程碑,并与已连接的工具集成。 一位新的 AI 同事 👀

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体Anthropic产品更新部署/工程
01:50
elvis@omarsar0
61
DAIR.AI 创始人 Elvis Saravia 推荐开源(MIT 许可)工具 Latitude,用于 AI 智能体可观测性。将 Latitude 指向 Claude Code 配置后,可实时查看哪些任务消耗 token 预算,观察智能体行为、捕获重复失败及其频率与原因,并在编辑器中直接修复。引用推文指出:公司最被低估的数据源是 AI 智能体对话,Latitude 能捕捉这些被浪费的数据。免费试用地址:latitude.so。

cesar.wtf: Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...

智能体教程/实践部署/工程
01:14
Claude:Blog(网页)
42
Claude Tag 的 Agent Identity 访问模型

Claude Tag 推出 agent identity(智能体身份)访问模型,让 Claude 在共享频道中以独立身份工作,而非模拟某个用户。管理员在工作区级配置连接器、仓库访问、技能插件和固定指令等权限,每个频道可覆盖继承的基线设置。私有频道拥有独立身份,记忆和访问不跨频道流转;公共频道共享工作区级身份。该模型为自主多玩家 AI 场景设计,允许频道成员通过 Claude 访问已授权工具和数据,同时通过按身份撤销简化权限管理。

智能体Anthropic教程/实践部署/工程
‹ 上一页
1…56789…50
下一页 ›