AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 1392 条
全部一手资讯X论文
标签「部署/工程」清除
5月19日周二
02:34Hacker News 热门(buzzing.cc 中文翻译)61Anthropic 收购 Stainless
01:04Hacker News 热门(buzzing.cc 中文翻译)40"玻璃翅膀"项目:Mythos向我们展示了什么
5月18日周一
21:45Cloudflare Blog59精选玻璃翼项目:Mythos向我们展示了什么
20:01公众号:百度智能云(文心)47百度Q1财报:智能云增长势头强劲
18:45IT之家(RSS)56OpenAI为"星际之门"高薪招聘社区事务负责人以缓解建设阻力
18:00公众号:小红书技术(dots.llm)49小红书引擎架构团队ICDE 2026新成果:CCD感知编排突破多核CPU向量搜索性能天花板
16:45IT之家(RSS)55必胜客强推 AI 配送系统致门店业绩暴跌,遭加盟商索赔超 1 亿美元
09:45IT之家(RSS)48消息称英伟达领投:印度 AI 公司 Simplismart 融资 2000 万美元,估值约 1 亿美元
5月17日周日
23:44IT之家(RSS)42上海移动宣布 5G-A 超级上行网络能力规模商用,推出 1 元 40 万 Tokens 通用服务
22:32Hacker News 热门(buzzing.cc 中文翻译)60我不认为人工智能会让你的流程变得更快
22:32Hacker News 热门(buzzing.cc 中文翻译)61每一份 AI 订阅对企业而言都是一颗定时炸弹
22:32Hacker News 热门(buzzing.cc 中文翻译)64Apple Silicon本地运行LLM成本高于云端API
18:44IT之家(RSS)63长鑫科技:一季度营收同比增 719.13%,净利润 330 亿元
15:44IT之家(RSS)66美国最大电网电价一年间近乎翻倍,数据中心成罪魁祸首
14:44IT之家(RSS)53无锡将建立一座大规模 Token 工厂,首批部署 4 台华为昇腾 384 超节点服务器
08:00HuggingFace Daily Papers(社区热门论文)73精选从可运行到可交付:基于多智能体测试驱动的开发范式用于从需求生成全栈Web应用
03:54Dwarkesh Patel:Podcast & Blog(RSS)50关于预训练并行化与失败训练运行的笔记
00:01Hacker News 热门(buzzing.cc 中文翻译)62欧洲建设主权云以摆脱美国的控制,却忽略了处理器的问题
5月16日周六
22:43IT之家(RSS)70精选杭州基地启用,机器人有了国家级职业技能训练场
22:01Hacker News 热门(buzzing.cc 中文翻译)70精选Δ-Mem:适用于大型语言模型的高效在线内存
16:25The Decoder:AI News(RSS)56研究人员训练出仅需12.5%专家模块即可实现近乎全性能的AI模型
11:42IT之家(RSS)63上海电信发布 Token 资费套餐:1 元对应 25 万额度点,支持手机账单付
08:57Simon Willison 博客58datasette-llm-limits 0.1a0 发布
08:42IT之家(RSS)53供不应求:国产光纤光模块卖爆全球,部分特种光纤价格一年涨10倍
08:00HuggingFace Daily Papers(社区热门论文)57全注意力反击:百步训练内实现高效稀疏注意力
08:00HuggingFace Daily Papers(社区热门论文)54S-Bus:用于多智能体LLM状态协调的自动读集重建
08:00HuggingFace Daily Papers(社区热门论文)61E-PMQ:基于合并权重锚定的专家指导后合并量化框架
08:00HuggingFace Daily Papers(社区热门论文)56CompactAttention:基于块联合键值选择的分块预填充加速
01:01Claude:Blog(网页)67精选在法律行业全面部署Claude:产品指南与实施路线图
01:01Hacker News 热门(buzzing.cc 中文翻译)62英国主权LLM推理
00:31Hacker News 热门(buzzing.cc 中文翻译)54面临提高人工智能使用率压力的亚马逊员工正在编造工作任务
5月15日周五
22:42IT之家(RSS)54高德推出"华为鸿蒙 HarmonyOS 首个生成式 UI 开源框架"AGenUI,利用通用协议适配多终端界面
21:33公众号:百度智能云(文心)38让 Agent 真正跑起来,百度智能云升级了什么?
20:30Hacker News 热门(buzzing.cc 中文翻译)78精选Show HN: 根据基准测试排名,为您的硬件寻找最适合的本地 LLM
11:30Hacker News 热门(buzzing.cc 中文翻译)49除了配重之外,GGUF里还包含什么--又还缺少什么?
09:30Anthropic:Newsroom(网页)75精选普华永道全球部署Claude,助力客户构建技术、执行交易并重塑企业职能
08:41IT之家(RSS)21美国陆军揭晓 NGC2 战场网络,让直升机、无人机与地面部队实现数据互联
08:41IT之家(RSS)57不用守电脑:手机端 ChatGPT 解锁 Codex,能实时远程控制 Mac 端 AI 任务
08:00HuggingFace Daily Papers(社区热门论文)62面向数据流的代理式大语言模型强化学习系统AstraFlow
08:00HuggingFace Daily Papers(社区热门论文)53开放大语言模型中最大激活值的度量研究
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月19日
02:34
Hacker News 热门(buzzing.cc 中文翻译)
61
Anthropic 收购 Stainless

AI公司Anthropic宣布收购软件开发工具提供商Stainless,交易细节未披露。此次收购旨在增强Anthropic在开发者工具与API基础设施方面的能力,进一步巩固其在AI应用生态中的布局。Stainless以生成和管理API客户端代码库而闻名,其加入有望提升Anthropic模型的易用性与集成效率。

Anthropic行业动态部署/工程
01:04
Hacker News 热门(buzzing.cc 中文翻译)
40
"玻璃翅膀"项目:Mythos向我们展示了什么

Cloudflare推出“玻璃翅膀”项目(Project Glasswing),通过Mythos展示了网络安全前沿模型的创新突破。该项目在Hacker News上获得108点热议,标志着在防护技术和模型效率方面的显著提升。Mythos作为核心组件,揭示了未来网络防御的智能化趋势,推动行业向更高安全标准演进。

安全/对齐现象/趋势部署/工程
5月18日
21:45
Cloudflare Blog
精选59
玻璃翼项目:Mythos向我们展示了什么

近期,团队将Mythos及其他聚焦安全的大语言模型应用于关键基础设施的实时代码测试。测试揭示了模型在识别漏洞和代码审计方面的优势,例如在复杂逻辑中发现潜在风险的能力,同时也暴露了其存在的局限性,包括产生误报以及对上下文理解的不稳定。文章指出,在将这些安全LLM的能力扩展到更大规模之前,必须围绕其建立一套可靠的工作流程,包括持续验证和人工复核机制。

教程/实践部署/工程

推荐理由:Cloudflare 用安全 LLM 扫自家代码这事,比很多安全厂商的营销稿实在得多。虽然还没到能规模化的时候,但哪些模型好用、哪里会踩坑,做 DevSecOps 的可以直接抄作业。
20:01
公众号:百度智能云(文心)
47
百度Q1财报:智能云增长势头强劲
行业动态部署/工程
18:45
IT之家(RSS)
56
OpenAI为"星际之门"高薪招聘社区事务负责人以缓解建设阻力

OpenAI近日为“星际之门”数据中心项目招聘“社区事务负责人”,年薪12.96万至23.6万美元并含股权激励。该岗位核心目标是与项目所在地社区沟通,“减少社区阻力”。此举源于当前美国多地居民担忧数据中心会消耗水资源、推高电费及产生噪音,进而引发抵制。“星际之门”是OpenAI联合甲骨文、软银等投入5000亿美元的大型AI基础设施项目,目前已选址五个州。OpenAI表示,该岗位工作关乎其核心使命,需确保社区理解项目意义并获得实际收益。

OpenAI行业动态部署/工程
18:00
公众号:小红书技术(dots.llm)
49
小红书引擎架构团队ICDE 2026新成果:CCD感知编排突破多核CPU向量搜索性能天花板

小红书引擎架构团队在ICDE 2026提出一种面向多核CPU的CCD级负载感知和线程编排向量检索框架,通过感知CCD(Core Complex Die)层级负载并优化线程编排,突破多核CPU向量搜索的性能天花板。

搜索论文/研究部署/工程
16:45
IT之家(RSS)
55
必胜客强推 AI 配送系统致门店业绩暴跌,遭加盟商索赔超 1 亿美元

必胜客母公司百胜餐饮集团强制推行名为“龙尾(Dragontail)”的AI配送管理系统后,引发门店配送延误与业绩大幅下滑。其头部加盟商Chaac Pizza Northeast运营的111家门店销售额严重下降,纽约市同比增速从10.19%转为-9.78%。骑手通过系统实时查看后厨进度,导致囤积订单、选择性接单,拉长配送时间并降低顾客满意度。该加盟商因此索赔超1亿美元(约合6.82亿元人民币)。与此同时,百胜餐饮集团正计划关闭250家必胜客门店,并面临市场竞争加剧与同店销售持续下滑的困境。

行业动态部署/工程
09:45
IT之家(RSS)
48
消息称英伟达领投:印度 AI 公司 Simplismart 融资 2000 万美元,估值约 1 亿美元

英伟达正处高级谈判阶段,准备领投印度生成式AI公司Simplismart的2000万美元融资轮,该公司估值约1亿美元。Simplismart由前甲骨文和谷歌工程师于2022年创立,在班加罗尔和旧金山设有办事处,帮助企业构建和部署生产级AI系统,无需编写代码。其AI推理平台将在英伟达基础设施上提供,双方正就推理微服务(NIM)展开合作,以增强企业AI模型的部署与管理能力。此举标志着英伟达加大对印度AI基础设施生态的投入。

行业动态部署/工程
5月17日
23:44
IT之家(RSS)
42
上海移动宣布 5G-A 超级上行网络能力规模商用,推出 1 元 40 万 Tokens 通用服务

上海移动在世界电信日宣布其5G-A超级上行网络能力正式规模商用,通过三项关键技术实现上行峰值1Gbps、泛在覆盖20Mbps,已覆盖核心城区等重点区域。同时,公司推出Token通用服务,支持一号通用、跨平台使用和话费支付,并以1元40万Tokens的价格联合腾讯提供AI原生工作台。此外,上海移动完成了天地一体化海洋通信专网验证,实现国产邮轮5G+卫星通信首呼,智算能力达11.2EFLOPS,并构建了以Token运营为核心的新数智服务生态。

产品更新部署/工程
22:32
Hacker News 热门(buzzing.cc 中文翻译)
60
我不认为人工智能会让你的流程变得更快

作者认为人工智能未必能加速工作流程,反而可能因引入新的复杂性和决策环节而拖慢进程。关键在于AI改变了工作性质,将重心从执行转向监督与调整,这需要额外的时间投入。文章指出,盲目追求流程速度可能忽略AI在提升质量、减少错误方面的真正价值。真正的效率提升应来自对流程的重新设计,而非简单地将AI嵌入现有步骤。

推理现象/趋势部署/工程
22:32
Hacker News 热门(buzzing.cc 中文翻译)
61
每一份 AI 订阅对企业而言都是一颗定时炸弹

企业广泛采用AI订阅服务正成为潜在运营风险源,这些订阅可能引发隐藏成本激增、数据安全漏洞和技术依赖问题。随着使用量扩大,费用失控和合规性挑战如同定时炸弹般威胁企业财务与稳定。业界警示需建立严格管理机制,以防范未来危机爆发。

数据/训练现象/趋势部署/工程
22:32
Hacker News 热门(buzzing.cc 中文翻译)
64
Apple Silicon本地运行LLM成本高于云端API

分析显示,在Apple Silicon芯片(如M2 Ultra)上本地运行Llama 3.1 405B等大型语言模型,其成本高于使用OpenRouter等云端API服务。具体而言,本地运行每百万tokens成本约为0.73美元,而通过OpenRouter仅需0.59美元,成本高出约24%。这突显了对于大规模模型推理,云端服务目前可能比高端本地硬件更具经济性。

端侧评测/基准部署/工程
18:44
IT之家(RSS)
63
长鑫科技:一季度营收同比增 719.13%,净利润 330 亿元

长鑫科技提交科创板IPO招股书。2026年第一季度,公司营收达508亿元,同比大幅增长719.13%;净利润为330.11亿元。业绩暴涨主要受全球算力需求增长及DRAM产品供不应求、价格自2025年下半年持续上涨驱动,同时公司产销规模扩大、产品结构优化。公司预计2026年上半年营业收入将达1100亿至1200亿元,净利润预计为660亿至750亿元。

行业动态部署/工程
15:44
IT之家(RSS)
66
美国最大电网电价一年间近乎翻倍,数据中心成罪魁祸首

美国最大电网PJM互联电网的批发电价在过去一年从每兆瓦时77.78美元飙升至136.53美元,近乎翻倍。市场监测机构报告指出,电价暴涨的主要原因是数据中心用电需求激增,而电网运营方应对不力。PJM电网在2022年数据中心建设热潮时暂停受理新增发电项目,导致供电缺口持续扩大,现有产能已无法满足需求。报告还批评其决策缺乏透明度,系统升级拖延,且近期发展规划未获主要电力公司认可。

行业动态部署/工程
14:44
IT之家(RSS)
53
无锡将建立一座大规模 Token 工厂,首批部署 4 台华为昇腾 384 超节点服务器

弘信电子与无锡高新区合作,在无锡启动建设大规模Token工厂。首批部署4台华为昇腾384超节点服务器,每台服务器拥有384卡算力,总计1536张GPU连接成超级集群。该项目旨在打造规模化、高性能的“国芯国模”算力基础设施,未来将成为行业新样板。

行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
精选73
从可运行到可交付:基于多智能体测试驱动的开发范式用于从需求生成全栈Web应用

针对编码智能体生成的Web应用超70%不满足需求的问题,本文提出TDDev框架。该框架通过三阶段实现自动化闭环:先将需求转化为结构化测试,再通过浏览器模拟交互验证应用,最后将故障转化为修复报告。首次针对Web应用生成的TDD实证研究发现,引入TDD基础设施可提升质量34-48个百分点。关键结论是最佳协议需与模型生成风格匹配,不匹配将完全抵消TDD优势并最多增加25倍Token消耗。用户研究证实,该框架使人工干预降为零,开发转向自主反馈优化。

智能体arXiv编码论文/研究

推荐理由:把TDD塞进多智能体代码生成,直接把Web应用的正确率从不到30%拉到70%以上,更重要的是他们发现给不同模型配错了开发协议反而会雪崩,做Agent工程的必读。
03:54
Dwarkesh Patel:Podcast & Blog(RSS)
50
关于预训练并行化与失败训练运行的笔记

近期访谈揭示了大规模语言模型预训练中的并行化策略与失败案例。关键变化包括从数据并行转向更复杂的模型并行、流水线并行及混合策略,以应对万亿参数模型的内存与计算挑战。具体指标显示,某些失败训练运行因硬件故障或超参数设置不当,导致数百GPU小时损失。成功案例则通过优化通信开销与负载均衡,将训练效率提升约15-30%。这些经验为GPT、Claude、LLaMA等模型的稳定训练提供了重要技术参考。

OpenAI教程/实践数据/训练部署/工程
00:01
Hacker News 热门(buzzing.cc 中文翻译)
62
欧洲建设主权云以摆脱美国的控制,却忽略了处理器的问题

欧洲为摆脱美国技术控制而推动建设主权云,但其依赖的处理器仍主要来自美国公司。这一战略忽略了底层硬件自主性的关键问题,导致数据主权目标存在根本性漏洞。当前欧洲云基础设施严重依赖英特尔、AMD等美国芯片,使所谓“主权云”在核心技术层面仍受制于美国供应链。这一矛盾凸显了欧洲在追求数字主权过程中,未能实现从软件到硬件的全面自主。

现象/趋势部署/工程
5月16日
22:43
IT之家(RSS)
精选70
杭州基地启用,机器人有了国家级职业技能训练场

国家人工智能应用中试基地(具身智能)5月16日在浙江杭州挂牌启用,为机器人提供国家级职业技能训练场。该基地是集场景体验、技术展示、研发合作、产业赋能于一体的综合性平台,旨在推动具身智能技术从实验室迈向现实应用。杭州市于5月1日施行首部具身智能机器人地方性法规,支持核心研发、平台建设和场景开放。目前杭州已集聚机器人产业相关企业700余家,2025年具身智能产业集群产值达1068亿元。

具身智能行业动态部署/工程

推荐理由:杭州这个国家级具身智能训练场不是「又一个基地」,它是把散点技术拢成产业链标准化的关键一步,做机器人的可以盯着政策红利和开放场景了。
22:01
Hacker News 热门(buzzing.cc 中文翻译)
精选70
Δ-Mem:适用于大型语言模型的高效在线内存

研究人员提出了Δ-Mem,一种专为大型语言模型设计的高效在线内存系统。该系统通过仅存储和更新模型激活的增量变化,而非完整的激活状态,显著降低了内存占用。实验表明,Δ-Mem能将内存使用量减少高达70%,同时保持模型输出的质量基本无损。这一方法有助于在资源受限的环境中部署和运行大规模语言模型,提升其在线推理和持续学习场景下的可行性。

推理论文/研究部署/工程

推荐理由:Δ-Mem 把 LLM 的在线记忆开销压得够低,如果实验结果稳得住,长上下文推理的成本结构又要改写了。
16:25
The Decoder:AI News(RSS)
56
研究人员训练出仅需12.5%专家模块即可实现近乎全性能的AI模型

艾伦人工智能研究所和加州大学伯克利分校的研究团队开发了名为EMO的混合专家模型。该模型创新性地让专家模块专注于内容领域而非词汇类型,从而在移除75%专家模块的情况下,性能损失仅约1个百分点。这一突破使混合专家模型首次有望应用于内存受限的实际场景,大幅提升了部署效率。

arXiv论文/研究部署/工程
11:42
IT之家(RSS)
63
上海电信发布 Token 资费套餐:1 元对应 25 万额度点,支持手机账单付

上海电信率先推出Token算力资费套餐,成为上海首个提供此类服务的运营商。套餐支持按量订购,1元对应25万额度点,以Kimi K2.5大模型为例,约可支持调用25万输入Tokens。用户可按需购买,多买享折扣,并支持话费账单支付。上海电信手机用户可获2500万额度点免费体验一个月。6月起,“美好家”用户家庭数字空间将上线Token会员权益。用户购买额度点后,可通过API接口调用30余款主流大模型,集成AI能力至自有应用或流程中。

行业动态部署/工程
08:57
Simon Willison 博客
58
datasette-llm-limits 0.1a0 发布

新插件 datasette-llm-limits 0.1a0 发布,需与 datasette-llm 及 datasette-llm-accountant 配合使用。该插件允许在 Datasette 内为每位用户或全局配置大语言模型(LLM)使用的支出限额。配置示例显示,可为用户设置滚动24小时窗口内的使用额度,金额上限为1.00美元。这为团队管理LLM调用成本提供了细粒度的控制工具。

MCP/工具产品更新部署/工程
08:42
IT之家(RSS)
53
供不应求:国产光纤光模块卖爆全球,部分特种光纤价格一年涨10倍

国产光纤光模块全球需求激增,供不应求。一季度相关产品出口量实现两位数增长,企业订单排至2028年。特种光纤G.657.A2价格一年内上涨10倍,核心原材料光纤预制棒产能缺口高达46%。同时,光模块出口同比增长约30%,1.6T产品在北美市场需求旺盛。面对供需失衡,中国企业正加速布局空芯光纤等下一代技术,以保持竞争优势。

现象/趋势行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
57
全注意力反击:百步训练内实现高效稀疏注意力

针对大型语言模型长上下文推理中全注意力机制的计算瓶颈,本文提出RTPurbo方法。研究发现全注意力模型本身具有内在稀疏性:仅少数注意力头需要完整长上下文处理;长程检索主要依赖低维子空间,可通过轻量级索引器实现;且有用令牌预算高度依赖查询。基于此,RTPurbo仅对检索类注意力头保留完整KV缓存,并引入16维令牌索引器实现高效稀疏注意力。通过利用模型内在稀疏性,该方法仅需数百步训练即可完成稀疏化。实验显示,RTPurbo在1M上下文长度下实现9.36倍预填充加速与约2.01倍解码加速,同时保持近乎无损的推理准确率。

推理论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
54
S-Bus:用于多智能体LLM状态协调的自动读集重建

针对多智能体共享状态时因并发写入和过时读取导致的结构化竞态条件,本研究提出S-Bus,一种无需修改现有框架SDK的HTTP中间件。其核心是服务端的DeliveryLog机制,能自动重建智能体的读集,提供“可观测读隔离”一致性模型。实验在427,308次并发冲突场景中,与PostgreSQL及Redis均实现零数据腐败;形式化验证覆盖超2076万状态无违规。同时指出,该机制的适用性与系统拓扑相关,在单分片协作写入中可能传播矛盾。

智能体arXiv论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
61
E-PMQ:基于合并权重锚定的专家指导后合并量化框架

针对模型量化与合并结合时,量化偏差与合并偏差相互耦合导致性能下降的难题,本文提出了E-PMQ框架。该框架在逐层校准过程中,利用源模型的权重提供专家指导的输出目标,并引入合并权重锚定机制以稳定校准过程,从而有效整合合并模型的行为。实验结果表明,E-PMQ显著提升了量化后模型的性能:在CLIP-ViT-B/32的8任务合并中,4位GPTQ的准确率在Task Arithmetic和TIES-Merging方法下分别从65.0%和69.1%提升至73.6%和74.8%;在更具挑战性的20任务CLIP-ViT-L/14设置上,准确率从34.8%大幅跃升至76.7%。这证明了E-PMQ能够实现高效的后合并量化与低比特部署。

数据/训练论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
56
CompactAttention:基于块联合键值选择的分块预填充加速

现有稀疏注意力方法难以高效适配长上下文大语言模型的分块预填充。CompactAttention机制将二维块稀疏掩码转化为适用于分组查询注意力的键值块表,通过联合选择生成最小化块表,实现所选键值块的原地访问,避免了显式压缩开销。该方法在LLaMA-3.1-8B-Instruct模型上,在128K上下文中实现了接近密集注意力的精度,同时带来最高2.72倍的注意力计算加速。

arXiv推理论文/研究部署/工程
01:01
Claude:Blog(网页)
精选67
在法律行业全面部署Claude:产品指南与实施路线图

2026年报告显示,法律团队生成式AI使用率已从44%跃升至87%。为应对日益复杂的工作,法律行业正将Claude应用于合同审阅、并购尽调及诉讼准备等核心流程,并通过多款产品组合提升效率:Chat用于即时研究,Claude Cowork处理跨文件协作,Microsoft 365插件集成办公套件,Platform支持定制应用开发。Anthropic同步发布法律行业部署指南,涵盖产品矩阵、12个预设业务领域插件及三阶段实施路线图,并解答数据托管与权限保护等关键问题。

智能体Anthropic教程/实践部署/工程

推荐理由:Anthropic法律团队亲自下场写路线图,从合同红笔到隐私评估,把Claude全家桶怎么用、什么时候用讲透了,律所和法务部可以直接照着推。
01:01
Hacker News 热门(buzzing.cc 中文翻译)
62
英国主权LLM推理

英国发布了主权大型语言模型推理服务relax.ai。该服务旨在提供基于英国本土基础设施的AI推理能力,确保数据主权和合规性。其核心变化在于将模型推理过程完全保留在英国境内,以满足对数据安全和隐私有严格要求的政府与企业客户。目前该服务已上线,相关技术文档可通过其官方网站获取。

产品更新部署/工程
00:31
Hacker News 热门(buzzing.cc 中文翻译)
54
面临提高人工智能使用率压力的亚马逊员工正在编造工作任务

亚马逊员工因面临提高人工智能使用率的压力,开始编造虚假工作任务。公司内部指标要求员工将60%的日常工作与AI工具结合,部分员工为达成目标,不得不为AI生成无意义的任务,例如要求AI总结已完成的会议记录或生成已知答案的问题。这一现象揭示了企业在强制推行AI应用过程中可能引发的效率悖论和形式主义问题。

行业动态部署/工程
5月15日
22:42
IT之家(RSS)
54
高德推出"华为鸿蒙 HarmonyOS 首个生成式 UI 开源框架"AGenUI,利用通用协议适配多终端界面

高德发布鸿蒙系统首个生成式UI开源框架AGenUI。该框架基于谷歌A2UI协议,以C++为核心,能将AI大模型生成的界面意图直接转化为鸿蒙原生组件,实现手机、平板、车机等多终端无缝适配。它深度适配鸿蒙全场景架构,直连系统渲染与分布式能力,无中间层损耗。性能上,相比iOS和Android版本,其渲染性能提升20%,内存占用降低18%。AGenUI已全面开源,旨在推动生成式UI成为鸿蒙生态的系统级标准能力。

开源/仓库部署/工程
21:33
公众号:百度智能云(文心)
38
让 Agent 真正跑起来,百度智能云升级了什么?

百度智能云对Agent相关功能进行了升级,旨在推动Agent从概念走向实际运行。具体升级内容尚未披露。

智能体产品更新部署/工程
20:30
Hacker News 热门(buzzing.cc 中文翻译)
精选78
Show HN: 根据基准测试排名,为您的硬件寻找最适合的本地 LLM

一个名为“WhichLLM”的开源工具已在GitHub发布,可根据用户硬件配置推荐最适合的本地大语言模型。该工具通过基准测试对各类模型进行排名,帮助用户依据自身设备的性能指标选择最优模型。项目在Hacker News上获得116点热度,显示出社区对本地化AI部署效率工具的积极关注。

开源/仓库端侧部署/工程

推荐理由:选本地 LLM 不再靠猜,这个工具把基准测试和硬件匹配做得像查配置表,刚接触端侧的人也能立刻上手。
11:30
Hacker News 热门(buzzing.cc 中文翻译)
49
除了配重之外,GGUF里还包含什么--又还缺少什么?

GGUF 文件格式在存储机器学习模型权重的基础上,还包含了模型架构、超参数配置、分词器信息等关键元数据,提升了模型部署的便利性。然而,该格式目前仍缺乏标准化验证工具、完善的版本控制机制以及跨平台兼容性支持,限制了其广泛应用。文章在 Hacker News 上获得 101 点关注,反映了开发者对模型格式标准化与改进的持续讨论。

开源生态教程/实践部署/工程
09:30
Anthropic:Newsroom(网页)
精选75
普华永道全球部署Claude,助力客户构建技术、执行交易并重塑企业职能

普华永道与Anthropic宣布扩大战略联盟,将在全球数十万员工中部署Claude AI工具。双方将联合建立卓越中心,并培训认证3万名专业人员。合作聚焦三大高杠杆领域:智能体技术构建、AI原生交易执行以及企业职能重塑。普华永道已率先成立基于Claude的财务业务组。实际应用显示,Claude在保险承保、网络安全等多个领域能将交付时间缩短最高达70%,例如将保险承保周期从十周压缩至十天。

Anthropic行业动态部署/工程

推荐理由:PwC要把Claude推到数十万员工手里,从保险核保到网络安全都在跑生产,企业级AI落地的硬骨头这次真被啃动了,金融医疗的合规高墙破了个大洞。
08:41
IT之家(RSS)
21
美国陆军揭晓 NGC2 战场网络,让直升机、无人机与地面部队实现数据互联

美国陆军在“常春藤集丛”演习中测试了下一代指挥与控制(NGC2)战场网络系统。该系统旨在通过云计算软件取代旧网络,实现直升机、地面部队、无人机及后勤单位间的近实时数据共享。演习模拟了电子干扰与远程攻击环境,验证了AH-64E阿帕奇直升机与分布式小规模单位在共享侦察与目标数据下的协同作战能力。NGC2将作为多域作战的数字骨干,整合陆、空、网络、电子及天基系统,并探索利用人工智能辅助指挥官决策。

行业动态部署/工程
08:41
IT之家(RSS)
57
不用守电脑:手机端 ChatGPT 解锁 Codex,能实时远程控制 Mac 端 AI 任务

OpenAI于5月15日宣布,用户现可通过手机端ChatGPT应用远程控制Mac桌面端的Codex。用户升级应用后,可在手机上实时查看对话线程、审批请求、插件状态及项目上下文,并直接审批任务、发起新指令或更换模型。所有文件与权限仍保留在原电脑,但截图、终端输出等更新内容会实时推送至手机。连接时,Mac端Codex会生成二维码供手机扫描配对。目前该功能仅支持Mac版,Windows版将在未来推出。

智能体OpenAI产品更新部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
62
面向数据流的代理式大语言模型强化学习系统AstraFlow

为解决强化学习应用于代理式大语言模型时成本高、扩展难的问题,我们提出AstraFlow。该系统采用数据流导向的组件化架构,替代了传统以训练器为中心的控制模式,将服务、数据流与训练解耦为自治组件。这使系统能原生支持多策略协同训练,并高效利用弹性、异构的跨区域计算资源。在数学、编程、搜索等多类任务评估中,AstraFlow无需修改系统代码即可运行复杂工作负载。实验表明,在多策略协同训练下,它相比现有框架能达到相当或更好的任务准确率,并将训练速度提升2.7倍。

智能体数据/训练论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
53
开放大语言模型中最大激活值的度量研究

本研究对8个开源模型系列的27个检查点进行了统一的激活值动态范围测量。研究发现:在相近参数规模下,全局最大激活值跨幅近四个数量级,其中混合专家模型峰值较稠密模型低14.0-23.4倍,且全局最大值多出现在残差流中。激活值大小并非简单的规模缩放产物,而是由模型系列、架构和训练阶段共同决定。研究建议在模型部署前应测量并公开该特性。代码已开源。

论文/研究部署/工程
‹ 上一页
1…1718192021…35
下一页 ›