AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
6月5日周五
10:21Alibaba Cloud56阿里云EventHouse破解Agent上下文瓶颈
10:14IT之家(RSS)54AMD 展示其首个机架级 AI 平台 Helios,对垒英伟达 NVL72 VR200
10:06DogeDesigner65马斯克:太空AI数据中心比星链卫星更简单
09:06ginobefun59BestBlogs早报:ChatGPT记忆升级、AI研发自动化、SpaceX资本版图
08:54meng shao69OpenAI Codex 新增"Build iOS Apps"插件
08:54meng shao57Cursor 发布类似 Codex Sites 的 Canvases
08:50SenseTime47商汤SenseTime计划在港运营高效计算中心
08:05DogeDesigner75精选马斯克谈SpaceX上市:正处大规模资本扩张期
07:14IT之家(RSS)62LM Studio 上线 LM Link,让 iPhone 直连 Mac 本地 AI 模型
06:54Berryxia.AI60LM Studio 手机版发布,可本地跑大模型
06:45Sam Altman80同事件精选用ChatGPT构建并发布网页应用同一事件,精选展示《Codex 赋能每一种角色、工具和工作流》
06:17Hacker News 热门(buzzing.cc 中文翻译)69KVarN:华为开发的用于 KV-cache 量化的原生 vLLM 后端
03:49TechCrunch:AI(RSS)57Meta 借鉴特斯拉策略,用帐篷搭建数据中心以削减成本
00:53LMSYS:Blog(Chatbot Arena 团队)77精选Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务
00:20The Decoder:AI News(RSS)55贝恩研究:近四成公司AI成本节省目标未达成,人类干预是主因
00:12IT之家(RSS)54全球首台机器人塔吊式3D打印平台Ascend发布:最高可建100米
00:03Replit ⠕19Replit 直播:实时构建你的业务
6月4日周四
23:42Hugging Face:Blog(RSS)66精选Hugging Face 为编码智能体重塑 hf CLI 输出格式
22:12IT之家(RSS)53撼与 Sparkle 展出首款 Arc Pro B70 单槽显卡,8 卡可组 256GB 显存工作站
20:36HuggingFace Daily Papers(社区热门论文)49IR3DE:大语言模型的线性路由器
18:18The Verge:AI(RSS)50亚马逊开发出工人可与之对话的仓库机器人 Proteus
15:11Hacker News 热门(buzzing.cc 中文翻译)66Anthropic 发布文章:我们在各产品中对克劳德的管控措施
12:27SemiAnalysis38Cerebras重写机械工程规则防晶圆破裂
12:11IT之家(RSS)48北京 19 个路口上线 AI 红绿灯,拥堵指数下降约 19%
11:10IT之家(RSS)61三星展示适用于 HBM5 的 HPB 封装散热结构,对线 SK 海力士的 iHBM
11:10IT之家(RSS)65GitLab 裁员约 14% 并退出 22 国,称 AI 智能体压垮基础设施
10:51Chubby♨️66社区反数据中心情绪高涨:加州蒙特利公园市以86%赞成票永久禁止数据中心
10:10IT之家(RSS)61SK集团崔泰源和台积电魏哲家会面,同意深化在HBM和先进封装领域的合作
10:10IT之家(RSS)57台积电董事长魏哲家称已购入High-NA EUV但暂不量产,全年营收预计增长超30%
09:10IT之家(RSS)75精选联合国报告:2030年AI数据中心水电消耗将翻倍
09:10IT之家(RSS)61欧盟将出台数据中心最低能效标准,应对 AI 浪潮下的能耗激增
08:51Berryxia.AI70MLX 框架 Day0 同步支持 Gemma 4
08:10IT之家(RSS)41Uber 人力资源部门裁员 23%,称与人工智能无关
08:00HuggingFace Daily Papers(社区热门论文)62LatentSkill:用于LLM智能体的权重空间技能框架
07:26OpenAI:官网动态(RSS · 排除企业/客户案例)39Wasmer 使用 Codex 构建边缘 Node.js 运行时
07:25SemiAnalysis57Google推出TPUv8t与Virgo网络架构
06:09xAI69精选Grok模型登陆Cloudflare AI Gateway
03:18MarkTechPost(RSS)62如何使用Workers、Functions和Cron Triggers通过iii构建文档智能后端
01:45StepFun56Step 3.7 Flash 部署至 Modal 平台
00:58Replit ⠕67同事件精选Replit上线SEO Agent助应用被发现同一事件,精选展示《Replit Agent 联手 Shopify 快速建店》
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月5日
10:21
Alibaba Cloud@alibaba_cloud
56
为什么行业智能体举步维艰,而AI编程却蓬勃发展?瓶颈在于上下文。🚀 了解阿里云EventHouse如何通过简化多源实时上下文供给来弥合差距。从信息完整性到知识协调,学习如何将Agent从演示可靠地迁移到生产。 👉🏻https://int.alibabacloud.com/m/1000414048/ #EventHouse #EventBridge #AI #Agents
智能体产品更新部署/工程
10:14
IT之家(RSS)
54
AMD 展示其首个机架级 AI 平台 Helios,对垒英伟达 NVL72 VR200

AMD 在 2026 台北国际电脑展展示其首个机架级 AI 平台 Helios,核心配置包括第 6 代 EPYC Venice 处理器与 72 颗 Instinct MI455X 加速器,总计 31TB HBM4 显存、1400TB/s 带宽,计划 2026 年内供货。FP4 稠密精度下理论算力达 2900 PFLOPS,略落后于英伟达 NVL72 VR200,但显存容量占优,适合大语言模型等任务。72 颗加速器通过 UALink-over-Ethernet 互连,scale-up 带宽最高 260TB/s;配备 Pensando Vulcano 网卡,支持 Ultra Ethernet 规范的 800GbE,scale-out 带宽 43TB/s。

产品更新部署/工程
10:06
DogeDesigner@cb_doge
65
马斯克:太空AI数据中心比星链卫星更简单

在摩根大通直播中,Elon Musk 谈到在太空建设 AI 数据中心时表示,这并非难事,甚至比 Starlink V3 通信卫星更简单。AI 数据中心只需太阳能供电、散热器及基本卫星设备,通过激光链接接入 Starlink 通信星座,再传回地面;由于 Starlink 使用可穿透云层甚至屋顶的频率,地面链接不受天气影响。

J.P. Morgan: Live from our global headquarters: Jamie Dimon and Elon Musk discuss SpaceX and more. https://x.com/i/broadcasts/1NGarrM...

xAI大佬观点数据/训练部署/工程
09:06
ginobefun@hongming731
59
BestBlogs早报:ChatGPT记忆升级、AI研发自动化、SpaceX资本版图

本期早报聚焦三则动态:OpenAI发布ChatGPT dreaming V3,记忆架构重写为“写入时合成”,效率提升5倍,免费用户可用个性化记忆摘要;阿里云工程师落地LLM-Wiki模式,从传统RAG转向“写入时合成”知识库,封装五大研发技能包实现PRD到全自动研发;SpaceX招股书披露与Anthropic签订450亿美元算力合同,每月12.5亿美元至2029年5月,年收入增加80%,并持有18712枚比特币。记忆与知识库的“写入时合成”成共同范式。

AnthropicOpenAI检索增强现象/趋势
08:54
meng shao@shao__meng
69
OpenAI Codex 新增"Build iOS Apps"插件

OpenAI Codex 推出“Build iOS Apps”官方插件,将 iOS 应用开发闭环引入 Codex 工作流。用户可在 Codex 内直接查看和测试 iOS 应用、打开 SwiftUI previews 并进行代码热重载,无需切换到 Xcode 或模拟器。底层基于 XcodeBuildMCP 构建自动化工作流,支持构建、测试、模拟器运行、UI 检查、日志与调试状态采集。值得关注的两个开源项目:serve-sim(提供 streaming simulator 能力)和 SnapshotPreviews(用于提取 SwiftUI previews 集成工具链)。

OpenAI Developers: More of the iOS app loop, now inside Codex. The Build iOS Apps plugin lets Codex view and test your iOS app in the in-ap...

MCP/工具OpenAI产品更新编码
08:54
meng shao@shao__meng
57
Cursor 发布类似 Codex Sites 的 Canvases

Cursor 也发布了类似 Codex Sites 的「Canvases」 这个方向就对了,Coding Agent 本来就能完全吃掉 Lovable、v0、http://bolt.new 的 AI 建站功能,再结合在 Coding 和 Design、Debug、Deploy 等方面的闭环能力,从产品定义、设计、开发、测试到部署运维,完整覆盖。

Cursor: With canvases, Cursor can create apps like dashboards, reports, and internal tools. Now you can publish a canvas and sha...

智能体产品更新编码部署/工程
08:50
SenseTime@SenseTime_AI
47
商汤SenseTime计划在港运营高效计算中心

商汤香港总经理Lewis Fung在TVB新闻中指出,当每个行业都使用AI时,算力会成为瓶颈,而算力背后是电力。作为扎根香港的总部和创新枢纽,商汤计划在当地运营高效计算中心,以支撑城市的AI发展雄心,并公开招募相关人才。

行业动态部署/工程
08:05
DogeDesigner@cb_doge
精选75
马斯克谈SpaceX上市:正处大规模资本扩张期

马斯克在JPMorgan活动上回应SpaceX上市问题:他已被建议上市近10年,自2014-2015年起SpaceX就已实现正现金流并自筹资金,之前的私募轮次实际是面向投资者和员工的流动性/回购轮次。当前不同之处在于SpaceX正进入显著资本增长阶段,计划发射约10万颗通信卫星(可能超10万颗),AI和机器人对带宽需求巨大,还将在太空中建设AI数据中心,马斯克认为这将成为AI扩张的主要手段。

J.P. Morgan: Live from our global headquarters: Jamie Dimon and Elon Musk discuss SpaceX and more. https://x.com/i/broadcasts/1NGarrM...

大佬观点部署/工程
关联讨论 1 条X:cb_doge (@cb_doge)
推荐理由:Elon Musk在摩根大通对话中首提太空AI数据中心,用100,000颗卫星支撑AI扩张,这不仅是SpaceX的上市前奏,更是AI基础设施从地面延伸到轨道的信号。
07:14
IT之家(RSS)
62
LM Studio 上线 LM Link,让 iPhone 直连 Mac 本地 AI 模型

6 月 5 日,LM Studio 更新 Mac 版 Locally 应用,新增 LM Link 功能,用户可直接在 iPhone 上调用 Mac 本地运行的大语言模型。需两端登录同一 LM Studio 账号,通过定制 Tailscale 网状虚拟专用网络建立端到端加密连接。支持 Mac 上任意模型,包括 Apple Intelligence 基础模型,体验取决于 Mac 性能。预览阶段免费,后续将推出付费方案,具体未公布。

产品更新端侧部署/工程
06:54
Berryxia.AI@berryxia
60
😂 LM Studio 手机版也发布了,这下你可以"烧"你的iPhone 在本地跑大模型了……😆
产品更新端侧部署/工程
06:45
Sam Altman@sama
同事件精选80
用ChatGPT构建并发布网页应用! 我真希望我小时候就有这个,但我确实怀念HyperCard。

OpenAI: Building apps has never been easier. With Sites, Codex can turn your work, ideas, and plans into an interactive website ...

OpenAI产品更新编码部署/工程
同一事件,精选展示《Codex 赋能每一种角色、工具和工作流》
推荐理由:Sam Altman 说希望小时候有这玩意,但企业版首发普通人还得等。把聊天直接变成可发布的网页 app,这方向让非开发者也能造工具。
06:17
Hacker News 热门(buzzing.cc 中文翻译)
69
KVarN:华为开发的用于 KV-cache 量化的原生 vLLM 后端

华为发布 KVarN,一个原生 vLLM 后端,专门用于键值缓存(KV-cache)量化。项目已在 GitHub 上公开,在 Hacker News 上获得 100 点热度。

开源/仓库推理部署/工程
03:49
TechCrunch:AI(RSS)
57
Meta 借鉴特斯拉策略,用帐篷搭建数据中心以削减成本

Meta 为削减巨额数据中心成本,借鉴特斯拉的做法,用帐篷搭建数据中心。该方案旨在降低基础设施支出。

Meta行业动态部署/工程
00:53
LMSYS:Blog(Chatbot Arena 团队)
精选77
Boson AI 与 LMSYS 发布基于 SGLang-Omni 的 Higgs Audio v3 TTS 端到端服务

Boson AI 与 LMSYS 联合推出基于 SGLang-Omni 推理框架的 Higgs Audio v3 TTS 端到端服务。该模型约 4B 参数,基于 Qwen3-4B 骨干,支持 100 种语言(内部评测覆盖 111 种),在 Seed-TTS、CV3、MiniMax-Multilingual 及 Higgs-Multilingual 零样本语音克隆任务中达到单字级 WER/CER。开发者可通过文本内控制标签实时调整情感(20+种)、风格、韵律(语速/音高/停顿)及音效。模型支持流式合成,文本未完整时即可开始生成语音并保持一致性。SGLang-Omni 专为多阶段生成模型设计,统一调度 AR 解码与轻量计算,实现低延迟推理。

开源/仓库教程/实践语音部署/工程

推荐理由:Higgs v3 把多语言和实时可控制整合进一个流式 TTS 模型,SGLang-Omni 为它搭好了多阶段推理的底座,做语音 Agent 的可以直接抄作业,这比多数论文落地快半拍。
00:20
The Decoder:AI News(RSS)
55
贝恩研究:近四成公司AI成本节省目标未达成,人类干预是主因

贝恩咨询对951家公司的调查显示,近40%的企业AI成本节省幅度不足10%,而大多数公司原定目标为11%至20%。原因之一是仅有7%的企业实际运行完全自主的AI智能体,其商业案例却假设了全自动化。

智能体现象/趋势部署/工程
00:12
IT之家(RSS)
54
全球首台机器人塔吊式3D打印平台Ascend发布:最高可建100米

澳大利亚Luyten公司发布全球首款机器人塔吊式起重机平台Ascend,将塔吊结构、机器人技术、3D混凝土打印及AI整合。系统工作半径45米,支撑结构最高100米,安装调试仅需1-2天。通过AI生成打印路径、优化流程并实时监控,配合专用Ultimatecrete打印混凝土,旨在减少人工依赖和模板需求,提升材料利用率。

产品更新具身智能部署/工程
00:03
Replit ⠕@Replit
19
实时构建你的业务 https://x.com/i/broadcasts/1qGoNNngZkyKv
教程/实践部署/工程
6月4日
23:42
Hugging Face:Blog(RSS)
精选66
Hugging Face 为编码智能体重塑 hf CLI 输出格式

Hugging Face 重新设计 hf CLI,使其同时服务人类用户和编码智能体(Claude Code、Codex 等)。CLI 通过环境变量自动检测智能体驱动,输出紧凑无截断的 TSV 格式,避免 ANSI 和交互提示,大幅降低 token 消耗。复杂多步任务中,不使用 CLI 的智能体 token 消耗最高达 hf CLI 的 6 倍。2026 年 4 月起,Hugging Face 追踪 Hub 智能体流量,Claude Code 约 4 万用户、近 4900 万次请求,Codex 紧随其后。

Hugging FaceMCP/工具产品更新编码

推荐理由:HF CLI 现在会自动检测 agent 并切换输出,复杂任务上 token 消耗比 curl/SDK 节省 2-6 倍。如果你在用 Claude Code 或 Codex 操作 Hugging Face Hub,这是必读的升级指南。
22:12
IT之家(RSS)
53
撼与 Sparkle 展出首款 Arc Pro B70 单槽显卡,8 卡可组 256GB 显存工作站

撼与 Sparkle 在台北电脑展展示单槽 Intel Arc Pro B70 32GB 显卡,型号 Sparkle Intel Arc Pro B70 32 GB Blower 1S。该卡搭载完整 BMG-G31 GPU,配备 32 个 Xe2 核心与 32GB 显存,采用涡轮散热和单 16pin 供电,加速频率 2800 MHz。单槽设计使工作站可同时安装 8 块,总显存 256GB,支持本地运行参数超 2000 亿的 AI 大语言模型。相比双槽版(230W TGP),单槽版 TGP 降至 160W。售价尚未公布,预计近期上市。

产品更新端侧部署/工程
20:36
HuggingFace Daily Papers(社区热门论文)
49
IR3DE:大语言模型的线性路由器

IR3DE是一个基于岭回归的线性路由器,为每个提示选择最合适的领域专家大语言模型。在两个因果语言建模(CLM)任务中,IR3DE性能与其他基线相当;在推理任务中,归一化性能达到98.4%,超越其他方法。该路由器支持动态添加或移除领域专家,无需重新训练,代码已开源。

推理论文/研究部署/工程
18:18
The Verge:AI(RSS)
50
亚马逊开发出工人可与之对话的仓库机器人 Proteus

亚马逊宣布了新版本的完全自主仓库机器人 Proteus,新增语言交互能力。借助 AI 升级,人类员工可以像与同事交谈一样向 Proteus 分配任务,无需再使用专用软件指挥这款用于搬运重物和大推车的地面机器人。此前工人必须通过代码操作该乌龟型系统。

产品更新具身智能部署/工程
15:11
Hacker News 热门(buzzing.cc 中文翻译)
66
Anthropic 发布文章:我们在各产品中对克劳德的管控措施

Anthropic 在其官方博客发布文章,介绍其在各产品中管控 Claude 的具体方式。该文章在 Hacker News 上获得 103 个点赞。

智能体Anthropic安全/对齐部署/工程
12:27
SemiAnalysis@SemiAnalysis_
38
垂直功率传输、柔性移动引脚中介层和直接冲击水冷。Cerebras 不得不重写机械工程手册,仅仅是为了防止单个晶圆自裂。
大佬观点部署/工程
12:11
IT之家(RSS)
48
北京 19 个路口上线 AI 红绿灯,拥堵指数下降约 19%

北京作为全国首批“双智”城市,在海淀区19个路口正式上线AI红绿灯系统。该系统通过3D空间轨迹连续拼接技术生成全息路口,利用大模型实时分析交通流量、排队长度和拥堵状况,50秒内生成约200套配时方案,并自动延长绿灯1-15秒。四道口地区13个交叉路口上线后,整体车速提升约21%,拥堵指数下降约19%。北京计划进一步推广基于交通流量的实时智能交通管控。

行业动态部署/工程
11:10
IT之家(RSS)
61
三星展示适用于 HBM5 的 HPB 封装散热结构,对线 SK 海力士的 iHBM

三星在2026台北国际电脑展展示面向HBM5内存的HPB(热阻断路径)封装散热结构,通过在封装内部加入独立热柱降低散热压力。HPB已在HBM4E上验证,HBM4E首批12层样品已出货,速率14Gbps,可扩展至16Gbps,每堆叠带宽3.6TB/s。三星确认HBM5基底芯片将从4nm转向自家2nm工艺。SK海力士采用不同路线,其iHBM方案将冷却元件嵌入D2D PHY层,可较现有产品降低超过30%热阻。

行业动态部署/工程
11:10
IT之家(RSS)
65
GitLab 裁员约 14% 并退出 22 国,称 AI 智能体压垮基础设施

GitLab 裁员约 14%(约 350 人),作为重组一部分,退出 22 个国家/地区并精简管理层级。CEO Bill Staples 称 AI 智能体以机器规模运行,给开发者基础设施带来超出设计承受能力的压力;公司已启动 Git 代际重构以支持 100 倍增长,并与一家未透露名称的 AI 实验室合作,构建面向智能体优化的 API 和编排工具。2026 年 Q1 营收 2.64 亿美元,同比增 23%,毛利率 88%,预计产生 3000 万至 3500 万美元重组费用。

行业动态部署/工程
10:51
Chubby♨️@kimmonismus
66
社区反数据中心情绪高涨:加州蒙特利公园市以86%赞成票永久禁止数据中心

加州蒙特利公园市以约86%赞成票通过永久禁止数据中心的法案,成为首个通过投票禁令而非市议会临时叫停的美国城市。这反映全国性反AI数据中心浪潮:盖洛普民调显示70%美国人反对本地建设,至少十几个州正考虑暂停。微软纳德拉在Build大会花较大篇幅回应相关偏见与担忧。背后除了电力、水耗、房价等可解决忧虑,还混合了对AI的恐惧及人类优越感受损(弗洛伊德所谓“对人类自恋的第四次打击”)。作者担心抵制会愈演愈烈,但数据中心对AI带来的科学黄金时代不可或缺。

政策/监管部署/工程
10:10
IT之家(RSS)
61
SK集团崔泰源和台积电魏哲家会面,同意深化在HBM和先进封装领域的合作

SK集团董事长崔泰源与台积电董事长魏哲家会面,双方同意拓展下一代HBM开发和先进封装领域合作。SK海力士在Computex 2026展出HBM4E 48GB 12Hi样品,引脚速率16.0Gbps,单堆栈带宽4.0TB/s,带宽提升38%,单Die容量提升33%。此外,SK海力士展示了基于V9 TLC的PCIe Gen5客户端固态硬盘PVF01,为其首款DRAM-less架构cSSD。

行业动态部署/工程
10:10
IT之家(RSS)
57
台积电董事长魏哲家称已购入High-NA EUV但暂不量产,全年营收预计增长超30%

台积电董事长魏哲家在股东会上披露,一季度合并营收约11341亿元新台币,税后净利润5724.8亿元新台币,每股净利润22.08元新台币。第二季度合并营收预计390亿至402亿美元,毛利率65.5%-67.5%。AI需求转向智能体模式,推升token消耗支撑先进半导体。预计全年营收增长超30%,现金股利提升超30%。针对High-NA EUV传言,魏哲家澄清公司早已购入,但暂不量产,正努力降本。他还重申保障员工权益,因多数员工也是股东。

行业动态部署/工程
09:10
IT之家(RSS)
精选75
联合国报告:2030年AI数据中心水电消耗将翻倍

联合国大学水、环境与健康研究所报告指出,受AI需求驱动,去年全球数据中心耗电448太瓦时(AI占五分之一),耗水4.5万亿升,碳排放1.89亿吨。预计到2030年,年耗电量将翻倍至945太瓦时(AI占40%),耗水增至9.3万亿升,碳排放升至3.99亿吨,占地面积从6900平方公里扩展至14500平方公里。报告警告若忽视环境成本,AI落地还将加剧土地紧张与电子废弃物问题。

行业动态部署/工程

推荐理由:这份联合国报告把算力繁荣的隐性账单摊开了,2030年数据中心要喝掉9.3万亿升水,做AI基建的人该看看,别光比参数。
09:10
IT之家(RSS)
61
欧盟将出台数据中心最低能效标准,应对 AI 浪潮下的能耗激增

欧盟宣布将对新建及存量数据中心制定最低能效标准,配套需求评估需在2027年前完成。目前欧盟数据中心装机容量为12吉瓦,预计2030年增至28吉瓦,届时用电量占比将突破2.5%。欧盟还在制定可持续性标签,考核水资源消耗、清洁能源供电比例等指标,大型数据中心须对外公示。此举隶属于一揽子科技扶持法案,旨在壮大本土云计算与AI产业,并包括用生成式AI简化新能源项目审批、划拨专项资金研发电网AI管控工具。

政策/监管部署/工程
08:51
Berryxia.AI@berryxia
70
MLX 框架 Day0 同步支持 Gemma 4

我擦! 我发现现在Apple的MLX框架和模型都可以Day0发布了? 这看来是同步进行操作的,MLX框架以及和模型厂商直接第一时间进行了对接啊! 强烈建议Mac的同学直接上MLX框架的模型,速度一般至少10-20%还是有的。

Dmitry Lyalin: If you're waiting Gemma 4 12b through @ollama, its here: gemma4:12b gemma4:12b-it-q4_K_M gemma4:12b-it-q8_0 gemma4:12b-i...

Google模型发布端侧部署/工程
08:10
IT之家(RSS)
41
Uber 人力资源部门裁员 23%,称与人工智能无关

Uber 在新任总裁黑泽尔贝克主导下裁减人力资源部门 23% 的员工,波及招聘等岗位,占 3.4 万全体员工总数的远不足 1%。CEO 科斯罗萨西称此举旨在提升人力团队效率,并明确裁员与 AI 无关。Uber 证实已对员工使用的 AI 智能体工具设置分级消费限额,基础档月额度 1500 美元(约 10168 元人民币),更高档位逐级上调。据《The Information》报道,Uber 仅用四个月即耗尽 2026 年度全部 AI 项目预算。

行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
62
LatentSkill:用于LLM智能体的权重空间技能框架

LatentSkill通过预训练超网络将文本技能转换为即插即用的LoRA适配器,将技能知识存储在权重空间而非上下文空间,消除每步推理中的技能token开销。在ALFWorld上,seen和unseen分割成功率分别比上下文技能基线高出21.4和13.4个百分点,预填充token减少64.1%;Search-QA精确匹配提高3.0点,技能token开销降低72.2%。生成的技能LoRA形成结构化语义几何,可通过缩放系数精确控制,对齐后能通过参数空间算术组合。该方法提供了高效、模块化且暴露度更低的权重空间技能基底。

智能体论文/研究部署/工程
07:26
OpenAI:官网动态(RSS · 排除企业/客户案例)
39
Wasmer 使用 Codex 构建边缘 Node.js 运行时

Wasmer 借助 Codex(基于 GPT-5.5)构建了一个用于边缘计算的 Node.js 运行时,将开发速度提升 10 到 20 倍,交付周期从数月缩短至数周。

OpenAI编码行业动态部署/工程
07:25
SemiAnalysis@SemiAnalysis_
57
随着TPUv8t(其新型训练专用TPU)的推出,Google公布了一种名为Virgo的全新横向扩展网络架构。Virgo能够将多达134,400个芯片互联,提供高达47 Pbps的无阻塞双向带宽。(1/4)🧵
Google产品更新部署/工程
06:09
xAI@xai
精选69
在 @Cloudflare 的 AI Gateway 上尝试 Grok 模型!

Cloudflare Developers: We're partnering with @xai to bring Grok to @Cloudflare AI Gateway. • Grok LLMs, audio, image, and video models are now ...

xAI产品更新部署/工程
关联讨论 1 条X:Elon Musk (@elonmusk, xAI)
推荐理由:xAI把Grok全模态模型塞进了Cloudflare AI Gateway,开发者不用再单独搞定API Key和计费,想试grok-imagine-video的可以直接开跑。
03:18
MarkTechPost(RSS)
62
如何使用Workers、Functions和Cron Triggers通过iii构建文档智能后端

一篇教程介绍如何通过注册模块化函数,并在Workers、Functions和Cron Triggers等多个触发器间复用这些函数,使用iii构建文档智能后端。该文章展示了模块化注册与跨触发器复用的核心方法。

教程/实践部署/工程
01:45
StepFun@StepFun_ai
56
在 @modal 上用 SGLang 部署 Step 3.7 Flash 🚀 Modal 是一个无服务器 AI 平台,用于部署和扩展计算密集型工作负载,无需管理基础设施。 他们的新指南展示了如何在 Modal 上使用 SGLang 服务我们的开源权重 Step 3.7 Flash,采用 8×H100 GPU、Modal Volumes 以及兼容 OpenAI 的聊天补全端点。 很高兴与 Modal 合作,让 StepFun 模型更易于构建者使用。 https://modal.com/docs/examples/stepfun_inference
教程/实践部署/工程
00:58
Replit ⠕@Replit
同事件精选67
你发布了你的应用。然后呢? 你的应用可能看起来很棒,但如果没人能找到它,它就依然不可见。 发布只是开始。 认识一下SEO Agent。它会为你运行一次扫描,并建议修复措施,帮助你的应用在网页搜索和AI搜索中被发现。
产品更新部署/工程
同一事件,精选展示《Replit Agent 联手 Shopify 快速建店》
推荐理由:Replit 把 SEO 优化做进了开发流程,对于靠内容获客的产品人,部署完直接跑一遍 SEO Agent 可能比手动改 meta 标签省心十倍。虽然不是什么底层突破,但解决的是真痛点。
‹ 上一页
1…1819202122…50
下一页 ›