AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
4月28日周二
01:20SemiAnalysis38谷歌TPU 8t HBM配置有误,应为12层堆叠
00:55Hacker News 热门(buzzing.cc 中文翻译)71精选GitHub Copilot 将转为按使用量计费
00:46CMU:Machine Learning Blog58精选介绍ARFBench:基于真实事件的时间序列问答基准
00:33elvis69AI智能体编码任务成本高昂且难预测
00:24凡人小北34频繁发版暴露测试环节缺失
4月27日周一
23:58GitHub Blog79精选GitHub Copilot 将转向基于使用量的计费模式
22:28Hugging Face:Blog(RSS)53如何利用OpenAI的Privacy Filter构建可扩展的Web应用
22:27SemiAnalysis50InferenceX支持DeepSeekv4 MTP,性能显著提升
21:56Jeff Dean56谷歌TPU v8t与v8i芯片深度对话视频上线
21:26The Decoder:AI News(RSS)36Meta 计划用太空太阳能为 AI 数据中心供电
21:20IT之家(RSS)55谷歌"独霸一方":截至 2025 年 Q4 掌握全球近 1/4 的 AI 算力
20:53Chubby♨️68Google打破十年传统,推出训练与推理专用TPU芯片
20:20IT之家(RSS)48AI 芯片需求激增,ASML 计划今年生产至少 60 台极紫外光刻机
18:53Chubby♨️63谷歌TPU v8与华为昇腾平台:全球AI芯片竞赛开启新阶段
18:20IT之家(RSS)26广汽星源插混官宣:传祺越 7 / 向往 E8 PHEV 首搭,MPV 车型百公里亏电油耗不到 4 升
18:20IT之家(RSS)51Ubuntu 未来一年将逐渐"AI 化":从增强现有功能开始,不会变成 AI 产品
17:54Hacker News 热门(buzzing.cc 中文翻译)55谷歌寄望于人工智能边缘计算,以追赶云计算领域的竞争对手亚马逊和微软
17:25阿绎 AYi54这个日本老哥做的这款应用太酷了,自家的胖猫会出来强制你休息, 等我研究下给自家的几只猫都安排上哈哈哈
17:24The Decoder:AI News(RSS)69OpenAI 据称正与 MediaTek 和 Qualcomm 合作开发自己的智能手机芯片
17:24The Decoder:AI News(RSS)53垄断AI最关键机器的公司正竞相建造更多
17:24Hacker News 热门(buzzing.cc 中文翻译)68Prompt API
16:19IT之家(RSS)39华为乾崑 | 奕境 X9 大六座 SUV 官宣行业首发后排吸顶柔光屏
15:19IT之家(RSS)57中国信通院正式启动 DeepSeek V4 国产化适配测试工作
14:19IT之家(RSS)52OpenAI 发布 Privacy Filter:1.5B 参数 PII 脱敏模型,Apache 2.0 开源上线
13:18Peter Steinberger 🦞34切换至Blacksmith测试平台,CPU限制迎刃而解
12:00向阳乔木48全模态测试遇阻,开发者改造开源UI适配多模型
10:18IT之家(RSS)66Gartner 预测:全球数据中心系统支出将连续 2 年增长 50+%
10:18IT之家(RSS)52消息称南亚科技打入英伟达 Vera Rubin 平台 LPDDR 内存供应链
09:18阿绎 AYi57说个扎心的真相,90%的AI工程师,其实什么都没做出来
08:18IT之家(RSS)38IT早报 0427:追觅 CEO 炮轰小红书;苹果新CEO将主持折叠iPhone发布;华为尊界新车将达200万级
08:00OpenRouter:Announcements(RSS)46Opus 4.7 的新 Tokenizer:它到底花了多少钱
08:00HuggingFace Daily Papers(社区热门论文)48用于可微分图像表示的软各向异性图
08:00OpenRouter:Announcements(RSS)57精选Opus 4.7新分词器对成本的实际影响
08:00HuggingFace Daily Papers(社区热门论文)54GoClick:用于自主GUI交互的轻量级元素定位模型
06:24Rohan Paul60中国在AI关键资源领域占据优势
04:59elvis64阿里发布智能体训练新方法:双强化学习飞轮催生高效工具使用模型
00:53DeepSeek62精选DeepSeek输入缓存价格骤降 全系列降至原价1/10
00:00Mistral AI:News(网页)51为运营业务的工作打造的工作流 Workflows 现已进入公开预览。2026年4月27日 Mistral AI
4月26日周日
23:52Hacker News 热门(buzzing.cc 中文翻译)42Eden AI--OpenRouter的欧洲替代方案
23:20meng shao64Claude Platform即将登陆AWS平台
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月28日
01:20
SemiAnalysis@SemiAnalysis_
38
很棒的框图,@GoogleCloudTech。这里有个错误。根据图示,HBM3E 是 12 层而非 8 层。对于 TPU 8t 的 6 个 HBM 堆栈容量,必须是 12 层才能达到所引用的 216GB HBM 容量。

Google Cloud Tech: Zoom in on this TPU 8t ASIC block diagram. Optimized for massive-scale pre-training and embedding-heavy workloads, TPU 8...

行业动态部署/工程
00:55
Hacker News 热门(buzzing.cc 中文翻译)
精选71
GitHub Copilot 将转为按使用量计费

GitHub Copilot 宣布将转向按使用量计费模式。这一变化意味着用户的付费方式将从现行的固定订阅制,转变为根据实际使用量来计算费用。具体计费细节和转换时间表尚未公布,但此举旨在为不同使用强度的用户提供更灵活的付费选项。该消息在技术社区引发关注,在Hacker News上获得了111个讨论点数。

产品更新编码部署/工程

推荐理由:GitHub Copilot 从固定订阅转向按量计费,这不是小调整而是定价范式切换,所有重度用户和企业采购方都得重新算账,Cursor 和 Windsurf 的定价战终于把 GitHub 逼到了牌桌上。
00:46
CMU:Machine Learning Blog
精选58
介绍ARFBench:基于真实事件的时间序列问答基准

每年系统故障导致损失超万亿美元,工程师需通过分析时间序列数据快速定位问题。时间序列问答(TSQA)是关键运维任务,对AI模型构成挑战。为此,研究团队推出ARFBench基准,基于Datadog真实内部事件及遥测数据构建。测试显示,当前领先的大型语言模型、视觉语言模型和时间序列基础模型在ARFBench上表现均有较大改进空间。团队提出混合TSFM-VLM模型,其整体性能接近前沿水平,为TSQA任务提供了新评估框架和改进方向。

论文/研究评测/基准部署/工程

推荐理由:CMU 和 Datadog 联手搞了个基于真实事故的时序问答基准,结论很诚实,现有模型全拉胯。做 SRE Agent 的团队该看看,这比合成数据的 benchmark 有说服力得多。
00:33
elvis@omarsar0
69
一项针对AI智能体在编码任务中token消耗成本的系统性研究发现,其消耗量可达聊天或代码推理的约1000倍,且相同任务在不同运行中的消耗差异高达30倍。更高的token支出并不直接带来更高的准确性,性能在中等成本时达到峰值后趋于饱和。模型自身也难以预测其token使用量,自我预测相关性最高仅0.39。不同模型在相同任务上可能多消耗150万token而并无质量提升。这表明智能体的运行时成本具有高方差、与质量关联弱、甚至模型自身也无法预测的特性,这将影响团队的预算规划、模型间路由策略以及终止任务运行的决策。

DAIR.AI: How do AI Agents spend your money? Most teams treat agent token costs as a rounding error even though the data says they...

智能体论文/研究部署/工程
00:24
凡人小北@frxiaobei
34
OpenClaw 这么频繁的发版,我一开始以为他们掌握了什么自动化测试的黑科技,直到我最近做了两次升级。 😤 虽然 AI 时代讲究一个快,但好歹咱尊重下测试环节。

OpenClaw🦞: OpenClaw 2026.4.25 🦞 🔊 TTS got serious 🧩 Plugins start faster 📊 OTEL can see the weird stuff 🛠️ Browser + install/u...

开源/仓库行业动态部署/工程
4月27日
23:58
GitHub Blog
精选79
GitHub Copilot 将转向基于使用量的计费模式

自6月1日起,GitHub Copilot 的使用将开始消耗 GitHub AI Credits,计费模式正式从固定订阅制转变为基于实际使用量的计费。这一变化意味着用户的费用将与 AI 助手的具体调用量直接挂钩,而非统一的月费或年费。

编码行业动态部署/工程

推荐理由:GitHub Copilot 从订阅制转向按量计费,这是 AI 编程工具定价范式的标志性拐点,所有重度用户和竞品都得重新算账。
22:28
Hugging Face:Blog(RSS)
53
如何利用OpenAI的Privacy Filter构建可扩展的Web应用

OpenAI正致力于通过开源与开放科学推动人工智能的进步与民主化。这一举措旨在降低AI技术的使用门槛,促进更广泛的创新与合作。其Privacy Filter工具为开发者提供了构建可扩展Web应用的关键支持,帮助在保障用户数据隐私的同时,高效集成AI能力。这一方向强调了技术开放性与负责任开发并重的理念。

OpenAI教程/实践部署/工程
22:27
SemiAnalysis@SemiAnalysis_
50
PALISADES TAHOE,2026年4月26日 - InferenceX 已为 @sgl_project 的 B300 添加了 DeepSeekv4 MTP 支持及聊天模板!感谢 @radixark @liin1211 的工程贡献!交互性大幅提升,在同等交互性下吞吐量提高7倍!
产品更新推理部署/工程
21:56
Jeff Dean@JeffDean
56
视频记录了在Cloud Next大会上与Amin Vahdat及AcquiredFM主持人的对话,核心围绕谷歌最新发布的TPU v8t和v8i芯片展开讨论。对话内容基于官方博客公布的芯片细节,探讨了其在"智能体时代"的基础设施意义与技术亮点。

Jeff Dean: I had a good time discussing yesterday's Google TPU v8t and v8i announcement at Cloud Next with Amin Vahdat along with @...

Google行业动态部署/工程
21:26
The Decoder:AI News(RSS)
36
Meta 计划用太空太阳能为 AI 数据中心供电

Meta 已与初创公司 Overview Energy 签署协议,计划采购高达 1 吉瓦的太空太阳能电力,旨在为其人工智能数据中心提供清洁能源。这项合作的核心挑战在于,相关的太空太阳能技术目前尚未实现商业化应用。协议凸显了科技巨头对大规模可再生能源的前瞻性布局,但实际供电仍需等待技术突破。

Meta行业动态部署/工程
21:20
IT之家(RSS)
55
谷歌"独霸一方":截至 2025 年 Q4 掌握全球近 1/4 的 AI 算力

根据 Epoch AI 机构基于 AI Chip Owners 数据库的估算,截至 2025 年第四季度,谷歌凭借其大规模部署的自研 TPU 芯片,成为全球最大的单一 AI 算力持有者,掌握了全球累计 AI 算力的大约四分之一,其规模超过了微软、Meta 和亚马逊。该统计覆盖了英伟达、AMD、谷歌、亚马逊及华为的主要 AI 芯片,据信已涵盖全球绝大多数专用 AI 算力。微软与 Meta 的自研芯片虽未纳入此次统计,但对整体估算影响甚微。

Google现象/趋势部署/工程
20:53
Chubby♨️@kimmonismus
68
Google打破十年传统,推出训练与推理专用TPU芯片

Google在Cloud Next 2026上首次将定制芯片拆分为专用架构,推出训练芯片TPU 8t与推理芯片TPU 8i。TPU 8t超级模块配备9600个液冷芯片,峰值算力达121 FP4 ExaFlops,较前代提升约3倍;TPU 8i的性价比提升80%,片上内存增至三倍,并通过新拓扑结构将网络延迟减半。Anthropic、Meta及OpenAI均已采购千兆瓦级TPU算力,其中OpenAI首次采用Google芯片,动摇了NVIDIA在前沿AI训练市场的垄断地位。两款芯片分别由Broadcom和MediaTek共同设计,TSMC代工。尽管NVIDIA仍占据81%的AI芯片市场份额,但实质性的竞争时代已拉开序幕。

Google产品更新推理部署/工程
20:20
IT之家(RSS)
48
AI 芯片需求激增,ASML 计划今年生产至少 60 台极紫外光刻机

受全球AI基础设施投资热潮推动,阿斯麦(ASML)正加速扩产极紫外(EUV)光刻机。公司计划今年量产至少60台EUV光刻机,并计划将年产能进一步提升至80台。为突破产能瓶颈,阿斯麦已在美国、德国、韩国等地扩建无尘车间,并投入约22亿美元资本开支。尽管面临供应链与人才挑战,市场需求依然旺盛,公司预计年营收将达420亿至470亿美元。

行业动态部署/工程
18:53
Chubby♨️@kimmonismus
63
谷歌TPU v8与华为昇腾平台:全球AI芯片竞赛开启新阶段

谷歌在Cloud Next 2026上首次将TPU v8拆分为训练芯片TPU 8t和推理芯片TPU 8i,宣称训练速度提升2.8倍,推理性价比提高80%,并通过自研Arm架构Axion CPU实现全栈垂直控制。同时,DeepSeek V4-Pro成为首个在华为昇腾NPU平台上完成训练与推理验证的前沿大模型,其定价与昇腾950芯片量产计划挂钩,输出成本远低于主流西方模型。这标志着美国制裁试图阻止的硬件脱钩可能已不可逆转,全球AI芯片竞争进入新阶段。

DeepSeekGoogle现象/趋势行业动态
18:20
IT之家(RSS)
26
广汽星源插混官宣:传祺越 7 / 向往 E8 PHEV 首搭,MPV 车型百公里亏电油耗不到 4 升

在2026北京车展,广汽传祺推出越7越野车和向往E8 PHEV MPV,首次搭载星源插混技术。越7配备GMC 3.0雷霆版,驱动电机峰值功率205kW,1.5T发动机最大功率125kW,综合功率达400kW,轮端扭矩10000N·m,支持单轮脱困。向往E8 PHEV采用GMC 3.0疾风版,DHT重98.5kg,电控效率99.2%,传动效率98.7%,发动机热效率提升3%,AI能量控制平台节油率提高15%。该车百公里亏电油耗3.98升,纯电续航281km,综合续航1537km。

其他部署/工程
18:20
IT之家(RSS)
51
Ubuntu 未来一年将逐渐"AI 化":从增强现有功能开始,不会变成 AI 产品

Ubuntu 未来一年将逐步整合 AI 功能,从增强现有系统能力入手,让 AI 模型在后台运行以辅助操作。开发方向偏向本地推理,并计划整合智能体工作流。AI 应用扩展至服务器端,例如帮助分析系统日志。Canonical 目标是将 Ubuntu 打造成更懂上下文的操作系统,但强调不会变成 AI 产品,而是通过审慎、安全的整合提升整体能力。

端侧行业动态部署/工程
17:54
Hacker News 热门(buzzing.cc 中文翻译)
55
谷歌寄望于人工智能边缘计算,以追赶云计算领域的竞争对手亚马逊和微软

谷歌正依靠人工智能边缘计算战略,以追赶云计算市场的领先者亚马逊和微软。该公司通过将AI技术整合到边缘设备,旨在提升云服务性能、降低延迟并扩大市场份额。这一举措针对亚马逊AWS和微软Azure的主导地位,谷歌希望借助边缘AI的实时数据处理和隐私优势吸引企业客户,加速缩小竞争差距。目前,云计算市场竞争激烈,谷歌的AI边缘布局被视为关键追赶手段。

Google端侧行业动态部署/工程
17:25
阿绎 AYi@AYi_AInotes
54
这个日本老哥做的这款应用太酷了,自家的胖猫会出来强制你休息, 等我研究下给自家的几只猫都安排上哈哈哈
产品更新部署/工程
17:24
The Decoder:AI News(RSS)
69
OpenAI 据称正与 MediaTek 和 Qualcomm 合作开发自己的智能手机芯片

分析师郭明錤报告指出,OpenAI 正与 MediaTek 和 Qualcomm 合作开发定制智能手机处理器,Luxshare 担任系统设计和制造的独家合作伙伴。这一合作旨在为 OpenAI 的人工智能技术提供专用硬件支持,可能优化芯片性能并减少对外部供应商的依赖,标志着该公司向硬件领域的战略扩展。

OpenAI端侧行业动态部署/工程
17:24
The Decoder:AI News(RSS)
53
垄断AI最关键机器的公司正竞相建造更多

ASML计划大幅提升其极紫外(EUV)光刻机的产量,以应对AI芯片需求的快速增长。该公司在EUV光刻机市场占据垄断地位,该设备是制造先进AI芯片的核心机器。根据《华尔街日报》报道,增产旨在跟上市场对AI芯片的激增需求,确保供应链稳定,支持人工智能技术的持续发展。这一举措将直接推动全球AI芯片产能扩张,缓解当前供应压力。

行业动态部署/工程
17:24
Hacker News 热门(buzzing.cc 中文翻译)
68
Prompt API

Chrome 开发者文档推出了 Prompt API,这是一个用于 AI 提示管理的应用程序编程接口,帮助开发者以编程方式处理提示词,提升开发效率。该 API 的发布信息在 Hacker News 上获得102点积分,反映出技术社区对此工具的关注和积极评价。开发者可通过官方文档进一步了解其功能和应用场景。

MCP/工具产品更新部署/工程
16:19
IT之家(RSS)
39
华为乾崑 | 奕境 X9 大六座 SUV 官宣行业首发后排吸顶柔光屏

在2026北京车展上,东风汽车与华为乾崑联合打造的奕境品牌首秀,并全球首发了旗舰大六座SUV奕境X9。该车行业首发具备强光不反光特性的后排吸顶柔光屏,并首发搭载华为乾崑智驾ADS 5系统与鸿蒙座舱Harmony Space 6。车身尺寸为长5301mm、轴距3120mm,预计售价约50万元。品牌计划未来三年推出5款新车,并已在全国80城布局超300家体验门店。

产品更新多模态部署/工程
15:19
IT之家(RSS)
57
中国信通院正式启动 DeepSeek V4 国产化适配测试工作

中国信通院宣布启动DeepSeek V4国产化适配测试,旨在推动该模型与国产软硬件的深度协同及产业应用。测试将依托重点实验室和AISHPerf基准体系,面向芯片、服务器、一体机、集群、开发框架及工具链等产品系统展开。评估覆盖模型全系列,聚焦推理、微调等流程,从适配易用性、功能完备性、性能及成本多维度进行,并新增长序列处理、代码生成与理解等测评方向,以构建立体化评测体系。此前,多家国产硬件厂商已在模型发布当日完成了“0day适配”。

DeepSeek行业动态部署/工程
14:19
IT之家(RSS)
52
OpenAI 发布 Privacy Filter:1.5B 参数 PII 脱敏模型,Apache 2.0 开源上线

OpenAI开源了15亿参数的PII脱敏模型Privacy Filter,采用混合专家设计,每次仅激活约5000万参数,可在笔记本电脑等设备上运行。它能根据上下文识别姓名、地址等八类敏感信息,在基准测试中F1分数达97.43%。该模型作为本地预过滤层,帮助用户在文本发送至云端AI前脱敏数据,但高敏感场景仍需结合人工审核。

OpenAI开源生态模型发布部署/工程
13:18
Peter Steinberger 🦞@steipete
34
在OpenClaw工作上一直受到CPU限制。将本地测试切换到@useblacksmith后,效果极佳。codex真的能启动多达32个vCPU实例并快速运行我们的测试套件。https://docs.blacksmith.sh/blacksmith-testbox/overview
其他部署/工程
12:00
向阳乔木@vista8
48
全模态测试遇阻,开发者改造开源UI适配多模型

开发者在测试多个Chatbot客户端时,发现普遍不支持上传音视频文件进行对话,这给全模态大模型的测试带来了不便。因此,他选择了一个开源Chatbot UI项目,并计划用Codex对其进行改造以适配需求。该开源项目参考了ChatGPT、Grok、Gemini和Perplexity等主流产品的界面,设计了多个不同的机器人对话界面,目前在GitHub上已获得近1万颗星。

多模态开源/仓库部署/工程
10:18
IT之家(RSS)
66
Gartner 预测:全球数据中心系统支出将连续 2 年增长 50+%

高德纳预测,2026年全球数据中心系统支出将达7879.9亿美元,连续第二年增速超过50%。同期,全球整体IT支出预计为6.31655万亿美元,同比增长13.5%,较今年2月的预测上调了2.7个百分点。增长主要由人工智能基础设施和先进存储需求驱动,AI工作负载的扩展推高了高性能计算及相关处理器、加速器的投资,并使高带宽内存等领域利润显著提升。

数据/训练现象/趋势部署/工程
10:18
IT之家(RSS)
52
消息称南亚科技打入英伟达 Vera Rubin 平台 LPDDR 内存供应链

据报道,DRAM制造商南亚科技在台积电的协助下,成功打入英伟达下一代Vera Rubin平台的内存供应链,有望为其供应LPDDR5X SOCAMM2内存模组。此举为英伟达在三大原厂外引入了第四家供应商,有助于保障供应稳定;同时也能助力南亚科技切入高利润的企业级DRAM市场。不过,该平台设计需要9600MT/s的高速内存,而南亚科技官网目前公示的最高规格仅为7500MT/s,其产品能否满足要求仍是未知数。

行业动态部署/工程
09:18
阿绎 AYi@AYi_AInotes
57
说个扎心的真相,90%的AI工程师,其实什么都没做出来

Cluely的CEO Roy Lee在NYU活动中,以500美元现金询问在场AI学生和工程师是否上线过公开项目,几乎无人举手。这揭示了AI圈的普遍现象:工程师们热衷讨论大模型、Agent等理论,却缺乏将知识转化为公开产品的执行力。LLM虽能解决大部分技术问题,但部署、用户体验和成本控制等实际工作才是关键。知识在AI时代已泛滥,真正稀缺的是执行力。呼吁工程师立即实践,做出哪怕不完美的公开产品。

现象/趋势编码部署/工程
08:18
IT之家(RSS)
38
IT早报 0427:追觅 CEO 炮轰小红书;苹果新CEO将主持折叠iPhone发布;华为尊界新车将达200万级

追觅科技创始人俞浩发文炮轰小红书价值观与盈利模式“有毒”。苹果新任CEO特努斯将于9月主持可折叠iPhone发布会,公司未来计划进入约10个新产品类别。华为余承东透露,尊界品牌一款高定新车价格将达200万元级别,计划6月底发布。此外,人类马拉松成绩首次突破2小时大关;砺算科技GPU通过微软WHQL认证,成为国内首家;DeepSeek宣布其API输入缓存命中价格大幅下调。

DeepSeek行业动态部署/工程
08:00
OpenRouter:Announcements(RSS)
46
Opus 4.7 的新 Tokenizer:它到底花了多少钱

Anthropic 在 Opus 4.7 中更换了 tokenizer。OpenRouter 通过对比用户从 Opus 4.6 迁移到 4.7 的实际使用数据,精确测量了 tokenizer 变更对成本的影响。

Anthropic现象/趋势部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
48
用于可微分图像表示的软各向异性图

本文提出软各向异性图(SAD),一种基于图像平面自适应站点参数化的显式可微分图像表示方法。SAD通过各站点定义各向异性度量与加权距离,并依据像素前K个站点的softmax混合计算颜色,形成具有可学习温度的软加权Voronoi划分,在保持清晰边界的同时保留有效梯度。该方法支持基于前K映射的高效渲染,并采用受跳转扩散启发的传播方案更新站点。在Kodak数据集上,SAD以2.2秒编码时间达到46.0 dB PSNR,训练速度比先进基线快4-19倍,且在相同码率下性能更优。SAD还能无缝集成至可微分流程,并具备快速随机访问与紧凑存储优势。

图像生成论文/研究部署/工程
08:00
OpenRouter:Announcements(RSS)
精选57
Opus 4.7新分词器对成本的实际影响

Anthropic在Claude Opus 4.7版本中更新了分词器。通过对比4.6到4.7版本的实际使用数据,分析发现这一技术调整改变了文本转换为令牌的方式,直接影响API计价。相同的文本输入可能产生不同数量的令牌,从而导致用户的实际使用成本发生可量化的变化。这一调整虽不改变模型能力,但关乎运营开销,是开发者和企业用户需评估的关键因素。

Anthropic评测/基准部署/工程

推荐理由:Opus 4.7 换了 tokenizer,大多数人只知道模型变强了,不知道计费逻辑也变了。OpenRouter 用真实流量数据算了一笔账,做成本预算的产品人值得扫一眼。
08:00
HuggingFace Daily Papers(社区热门论文)
54
GoClick:用于自主GUI交互的轻量级元素定位模型

本文提出GoClick,一个仅含2.3亿参数的轻量级视觉语言模型,用于图形用户界面元素定位。针对资源受限设备,模型采用编码器-解码器架构,在小参数量下优于仅解码器架构。通过渐进式数据精炼流程,从1080万原始数据中筛选出380万高质量样本进行训练,显著提升定位精度。实验表明,GoClick在多项基准测试中达到与大型模型相当的准确度,同时保持小体积和高推理速度。集成于设备-云端协作框架时,能有效协助云端任务规划器精确定位元素,提升任务成功率。

智能体端侧论文/研究部署/工程
06:24
Rohan Paul@rohanpaul_ai
60
大规模人工智能受限于物理投入,而中国在电力方面拥有更大的余裕,并且主导控制着数据中心和芯片所依赖的多种矿物及磁体供应链。
现象/趋势部署/工程
04:59
elvis@omarsar0
64
阿里发布智能体训练新方法:双强化学习飞轮催生高效工具使用模型

阿里巴巴提出一种通过双强化学习飞轮训练智能体的新方法,并基于此推出了AgenticQwen-30B-A3B模型。该模型总参数量为300亿,但每次推理仅激活30亿参数,在TAU-2和BFCL-V4多轮工具使用基准测试中取得了50.2的平均分,性能与参数量达2350亿的Qwen3-235B相当。其核心在于并行运行两个飞轮:推理循环将模型自身错误转化为更难训练问题;智能体循环则将简单工具使用轨迹扩展为多分支行为树,并通过模拟用户误导主动增加训练难度。该方法意味着开发者无需为常规工具任务支付高昂的尖端模型成本,且飞轮配方可复用,能从智能体自身失败中生成困难样本。

智能体推理论文/研究部署/工程
00:53
DeepSeek@deepseek_ai
精选62
🔥DeepSeek 输入缓存价格下调! 即刻起,整个 DeepSeek API 系列的输入缓存命中价格降至原价的十分之一!以更少成本,更高效地构建。 📌提醒:DeepSeek-V4-Pro 七五折优惠活动持续有效至 2026 年 5 月 5 日 15:59(UTC 时间)。
DeepSeek产品更新部署/工程

推荐理由:输入缓存命中价格直接打一折,对高频调用 API 的开发者来说是实打实的成本减负,配合 V4-Pro 的七五折促销,DeepSeek 在用价格战抢开发者心智。
00:00
Mistral AI:News(网页)
51
为运营业务的工作打造的工作流 Workflows 现已进入公开预览。2026年4月27日 Mistral AI

Mistral AI 宣布其产品 Workflows 进入公开预览阶段。这是该公司提供的一款用于构建、测试和运行AI智能体与应用的工具,面向需要执行业务工作流的用户。

产品更新部署/工程
4月26日
23:52
Hacker News 热门(buzzing.cc 中文翻译)
42
Eden AI--OpenRouter的欧洲替代方案

Eden AI 作为 OpenRouter 的欧洲替代方案正式上线,该平台聚合了多家 AI 提供商的模型,旨在为欧洲用户提供符合本地数据法规的 AI 服务。其在 Hacker News 上获得 100 点赞,显示出社区对该替代方案的关注。此举为欧洲市场提供了更多元、合规的 AI 模型接入选择。

产品更新开源生态部署/工程
23:20
meng shao@shao__meng
64
Claude Platform on AWS 即将推出 和之前的 Claude on Amazon Bedrock 完全不同,Claude Platform on AWS 让开发者在 AWS 账户体系内直接使用 Anthropic 的原生产品。 Claude Platform on AWS 提供: · Anthropic 原生控制台 + API 完整体验 · AWS 账户(但背后是 Anthropic 原生平台) · Claude Platform 全功能,未来新功能也会同步 · Anthropic 原生风格,账单/认证归 AWS https://aws.amazon.com/claude-platform/
Anthropic产品更新部署/工程
‹ 上一页
1…4445464748…50
下一页 ›