AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
4月28日周二
23:37Chubby♨️42当巨头竞逐AI智能体时,Base44专注于构建其运行的基础平台
23:09The Decoder:AI News(RSS)55Mistral AI 通过 Workflows 进军企业AI编排领域
22:33IT之家(RSS)37三星 Exynos 2600 芯片支持 ENSS 技术,号称"手机版 DLSS"
22:33IT之家(RSS)36NVIDIA 正式发布 GeForce RTX 5070 笔记本电脑 GPU 12GB 版本
22:33Mistral AI57Workflows发布公开预览版,为企业AI提供编排层
20:40Alibaba Cloud34AI视频闪烁降低60% 阿里云合作成果显著
20:33IT之家(RSS)31全球最低能耗 C 级轿车:比亚迪汉 EV 闪充版发布,续航 705 公里、9 分钟充饱,17.98 万元起
19:33IT之家(RSS)42国内首个内置 PCIe Switch 的 400G 智能网卡,阿里平头哥发布"磐脉 920"
19:33IT之家(RSS)29紫光股份2026年一季度净利润7.88亿元,同比增长126.06%
19:14Alibaba Cloud39阿里云AI网关支持DeepSeek V4部署
19:07Qwen:Blog Retrieval(API)57精选FlashQLA: 面向GDN的CP-/Bwd友好型融合线性注意力内核
18:33IT之家(RSS)49宇树 G1 人形机器人将进日本羽田机场,协助人类搬运行李货物
18:33IT之家(RSS)49谷歌 Google Cloud 推出 A5X 裸金属实例,多站点集群可支持 96 万个 Rubin GPU
18:33IT之家(RSS)45工业富联 2026 年一季度净利润 105.95 亿元,同比增长 102.55%
18:01Alibaba Cloud33阿里云媒体AI平台助力内容管理智能化
17:36The Decoder:AI News(RSS)61GitHub Copilot 将于 2026 年 6 月切换至基于令牌的计费模式
17:33IT之家(RSS)49谷歌印度人工智能中心破土动工,五年投资超百亿美元
15:33IT之家(RSS)49AI 算法可消除大气畸变,地面望远镜图像清晰度堪比太空拍摄
15:33IT之家(RSS)41元戎启行:业界首个高通 Snapdragon Ride Elite 量产 ADAS 方案面向量产项目出货
15:12Alibaba Cloud36阿里云发布基于大语言模型的DDoS安全运维代理
14:07SiliconFlow43SiliconFlow成第三方模型日调用量榜首
14:06Alibaba Cloud35企业AI生产力未来展望:QoderWork与Quick BI集成演示
13:33Simon Willison 博客60pip 26.1 新特性:锁文件与依赖冷却期
13:33IT之家(RSS)46DeepSeek-V4-Pro 旗舰模型限时 2.5 折优惠官宣延期,活动持续至今年 5 月 31 日
12:34Tomer Tunguz 博客(VC 分析)64精选GPU现货价格六周内暴涨114%
12:33Runway:News(网页)58精选无闲置GPU:Runway的研究计算管理
12:02Baidu Inc.49GenFlow 4.0正式发布,月活用户超1亿,处理任务达2亿
11:16IT之家(RSS)68阿里达摩院 AI 全球首次实现肠癌"无感"检测,登上国际肿瘤学顶刊
10:49SemiAnalysis57DeepSeek V4 Pro在vLLM性能测试中展现8倍加速
08:28Hugging Face:Blog(RSS)58精选Adaptive Ultrasound Imaging with Physics-Informed NV-Raw2Insights-US AI
08:00HuggingFace Daily Papers(社区热门论文)66真实资本下链上语言模型代理的操作层控制研究
08:00HuggingFace Daily Papers(社区热门论文)35非独立同分布数据下基于多任务自动编码器的联邦学习样本选择方法
07:52TestingCatalog News 🗞75精选OpenAI模型将登陆AWS Bedrock,亚马逊与OpenAI高管将对话AI未来
07:34Berryxia.AI54Minmax Music-2.6限时免费开放体验
07:28TestingCatalog News 🗞55Meta合作部署太空太阳能与存储,对阵SpacexAI
06:15Hacker News 热门(buzzing.cc 中文翻译)56在长达十小时的航班上离线运行本地大型语言模型
05:00SemiAnalysis44Intel弃用EMIB转向UCIe,外部客户仍受益
04:30Rohan Paul56为精确性优化RAG可能悄然损害检索效果,危及智能体流程
03:39宝玉74精选GitHub Copilot 将于6月1日起改为基于用量的计费模型
03:29François Chollet60Keras Kinetic发布新版Alpha 0.0.2
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月28日
23:37
Chubby♨️@kimmonismus
42
在OpenAI和Anthropic等公司专注于开发AI模型本身的同时,Base44另辟蹊径,致力于构建这些智能体实际运行所需的基础设施平台。该平台最新推出了一键迁移功能,支持用户将项目从Salesforce、Shopify、WordPress、Lovable、Bolt和Replit这六大平台快速迁移至Base44。迁移过程不仅包含数据转移,还提供数据结构重建、自定义界面生成服务,并允许用户在自身数据之上构建智能体工作流。为庆祝功能发布,在5月5日东部时间零点前完成迁移的用户可获得25个免费积分。Base44此举凸显了其在AI技术栈中专注于可能更为关键的基础层。

Base44: Introducing: Base44's new platform migration feature. If your needs have outgrown your current software, you can now bri...

智能体产品更新部署/工程
23:09
The Decoder:AI News(RSS)
55
Mistral AI 通过 Workflows 进军企业AI编排领域

Mistral AI 正式推出了名为 Workflows 的编排层。该产品旨在帮助企业将人工智能驱动的流程转化为可用于生产环境的成熟系统,标志着 Mistral AI 正式进入企业级AI流程编排与自动化市场。

智能体产品更新部署/工程
22:33
IT之家(RSS)
37
三星 Exynos 2600 芯片支持 ENSS 技术,号称"手机版 DLSS"

三星 Exynos 2600 芯片支持 ENSS 技术,利用 AI 将低分辨率渲染画面升频,提升画质和流畅度,号称“手机版 DLSS”。该技术通过 AI 超分使画面更清晰,并插帧优化运动表现,降低 GPU 负担。同时改善手机散热和能效,实测图形性能比竞争对手高 15%。目前仅 Exynos 2600 芯片支持 ENSS,三星计划未来扩展此技术。

产品更新端侧部署/工程
22:33
IT之家(RSS)
36
NVIDIA 正式发布 GeForce RTX 5070 笔记本电脑 GPU 12GB 版本

NVIDIA正式发布GeForce RTX 5070笔记本电脑GPU的12GB显存版本,该版本将与现有的8GB版本同步销售。新版本采用24Gb(3GB)GDDR7显存颗粒,旨在缓解当前显存供应紧张的压力。目前多数RTX 50系列显卡标配16Gb(2GB)GDDR7显存,此次新增的12GB版本将为合作厂商提供额外的显存资源,有助于推出更多样化的RTX 5070笔记本电脑产品。

产品更新部署/工程
22:33
Mistral AI@MistralAI
57
Workflows发布公开预览版,为企业AI提供编排层

企业AI编排平台Workflows发布公开预览版,旨在解决企业团队将AI模型可靠投入生产环境的难题。该平台专注于为AI赋能的业务流程提供生产环境所需的持久性、可观测性和容错能力,帮助其从原型阶段过渡到实际生产。包括ASML、ABANCA、CMA-CGM在内的多家领先机构已使用Workflows来自动化其关键流程。

智能体产品更新部署/工程
20:40
Alibaba Cloud@alibaba_cloud
34
@AkoolInc x 阿里云:AI视频闪烁减少60%!⚡️ ● 集成Wan、Qwen-Image & Qwen-VL ● 通过灵活部署实现40-60%成本降低 ● 支持180+种语言分钟级翻译 规模化商用AI视频。 阅读成功案例:https://int.alibabacloud.com/m/1000412139/
行业动态视频部署/工程
20:33
IT之家(RSS)
31
全球最低能耗 C 级轿车:比亚迪汉 EV 闪充版发布,续航 705 公里、9 分钟充饱,17.98 万元起

比亚迪正式发布汉EV闪充版,起售价17.98万元。新车搭载第二代刀片电池与闪充技术,电池容量69.07千瓦时,CLTC续航里程达705公里,充电9分钟即可充满,并宣称是全球能耗最低的C级轿车,百公里电耗10.8度。车辆配备“天神之眼”5.0辅助驾驶系统,新增后排座椅通风加热功能。用户可享11项权益,包括1年免费闪充、金融方案等,并可选装价值1.2万元的进阶辅助驾驶或限时特惠3999元的“汉纳百川”生活套装。

产品更新端侧部署/工程
19:33
IT之家(RSS)
42
国内首个内置 PCIe Switch 的 400G 智能网卡,阿里平头哥发布"磐脉 920"

阿里平头哥发布首款智能网卡“磐脉 920”,这是国内首个内置 PCIe Switch 的 400G 智能网卡,已量产并率先部署于阿里云数据中心。该产品专为应对AI算力增长和“通信墙”难题设计,搭载自主芯片,采用PCIe 5.0与112G PAM4以太网技术,支持400Gbps带宽和400Mpps收发包效率。其通过支持多路径RDMA缩短训练时间,并借助内置PCIe Switch实现GPU与SSD的低时延直连,使系统成本降低30%。

产品更新行业动态部署/工程
19:33
IT之家(RSS)
29
紫光股份2026年一季度净利润7.88亿元,同比增长126.06%

紫光股份2026年第一季度报告显示,公司营业总收入279.85亿元,同比增长34.61%;归母净利润7.88亿元,同比大幅增长126.06%。但经营现金流为-30.93亿元,同比下降267.96%。控股子公司新华三集团表现突出,营业收入达221.89亿元,增长45.08%。公司正积极抢抓人工智能市场机遇,推进“算力×联接”战略,加速智算和国产化业务落地。

行业动态部署/工程
19:14
Alibaba Cloud@alibaba_cloud
39
🚀 阿里云AI网关现已支持DeepSeek V4! ☁️ 通过OpenAI/Anthropic兼容API即插即用 ☁️ 智能路由 + 自动回退(例如,Qwen) ☁️ 全面支持100万上下文、工具调用及思考模式 ☁️ 统一管理安全性、配额与可观测性 🧠 安全、可靠、大规模地部署DeepSeek V4至生产环境! 🔗 了解更多:https://int.alibabacloud.com/m/1000412507/
产品更新开源生态部署/工程
19:07
Qwen:Blog Retrieval(API)
精选57
FlashQLA: 面向GDN的CP-/Bwd友好型融合线性注意力内核

FlashQLA 发布了一组专为梯度下降网络优化的融合线性注意力内核。新内核在设计上对计算模式和后向传播更加友好,旨在提升训练效率。该技术通过优化内核融合策略,改进了注意力机制的计算性能,是提升大规模模型训练速度的关键底层优化。

数据/训练论文/研究部署/工程

推荐理由:Qwen 团队发了一篇 fused linear attention 内核的工程论文,目标是把 GDN 架构的推理和反向传播都跑快。做底层优化的工程师值得看一眼,普通开发者可以略过。
18:33
IT之家(RSS)
49
宇树 G1 人形机器人将进日本羽田机场,协助人类搬运行李货物

为应对游客增长与劳动力短缺,日本航空将于5月起在羽田机场试点部署宇树科技G1人形机器人。该机器人将协助地勤人员搬运行李和货物,演示中已能完成将货物搬运至飞机传送带等任务。此次试点由GMO Internet Group协助,利用英伟达Isaac Simulator在虚拟环境中训练机器人并创建数字孪生,优化后迁移至实体机器以实现顺畅操作。日本面临老龄化挑战,预计到2040年需要超过650万外国劳动力以维持经济增长。

具身智能行业动态部署/工程
18:33
IT之家(RSS)
49
谷歌 Google Cloud 推出 A5X 裸金属实例,多站点集群可支持 96 万个 Rubin GPU

谷歌云在Google Cloud Next大会上推出由英伟达Vera Rubin系统驱动的A5X裸金属实例。该实例采用英伟达ConnectX-9 SuperNIC和谷歌Virgo Network AI数据中心架构,单站点集群可扩展至8万个Rubin GPU,多站点集群更可支持多达96万个GPU,旨在运行超大规模AI工作负载,为客户提供高性能、低延迟的物理服务器解决方案。

Google产品更新部署/工程
18:33
IT之家(RSS)
45
工业富联 2026 年一季度净利润 105.95 亿元,同比增长 102.55%

工业富联2026年第一季度业绩大幅增长,营业总收入2510.78亿元,归母净利润105.95亿元,同比分别增长56.52%和102.55%。业绩爆发主要受AI算力需求驱动,云计算业务收入翻倍,AI GPU机柜和AI ASIC服务器出货量分别增长3.8倍和3.2倍。此外,800G及以上高速交换机出货量同比增长1.6倍,CPO全光交换机样机开始出货。公司经营活动现金流净额达250.24亿元,同比激增1826.20%。

行业动态部署/工程
18:01
Alibaba Cloud@alibaba_cloud
33
您的媒体库应成为宝贵资产,而非负担。阿里云媒体AI解决方案提供统一的AI平台,通过自动标记和总结视频内容、帧级内容审核以及支持跨模态内容的AI搜索,来理解、组织并加速您的整个媒体工作流程。让您的内容最终为您所用。 🔗 https://int.alibabacloud.com/m/1000412499/
产品更新多模态部署/工程
17:36
The Decoder:AI News(RSS)
61
GitHub Copilot 将于 2026 年 6 月切换至基于令牌的计费模式

自 2026 年 6 月 1 日起,GitHub Copilot 的计费方式将从基于高级请求次数改为基于实际使用量(令牌)计算。这一调整意味着用户将为其消耗的计算资源付费,而非固定的请求套餐,使计费更直接地关联到具体使用规模。

产品更新编码部署/工程
17:33
IT之家(RSS)
49
谷歌印度人工智能中心破土动工,五年投资超百亿美元

谷歌在印度安得拉邦维沙卡帕特南启动人工智能中心建设,计划未来五年投资150亿美元(约1025亿元人民币)构建综合AI生态系统。该项目将与印度企业Nxtra by Airtel、AdaniConneX合作,建成印度国内首个千兆瓦级AI数据中心,以支持先进AI部署和数字服务扩展。同时,谷歌将通过“美印互联”计划扩展光纤网络,并优先接入清洁能源,助力印度在2030年实现500吉瓦非化石能源目标。

Google行业动态部署/工程
15:33
IT之家(RSS)
49
AI 算法可消除大气畸变,地面望远镜图像清晰度堪比太空拍摄

加州大学圣克鲁兹分校研究团队开发出一款名为Neo的人工智能算法,可有效消除地面望远镜因大气湍流导致的图像畸变。该算法基于条件生成对抗网络,通过训练使地面观测图像的清晰度提升至太空望远镜水准,天体形态参数测量准确度提高2至10倍。目前该技术已应用于智利薇拉・C・鲁宾天文台,该台配备8.4米口径反射镜,造价约8亿美元。此前类似AI算法已将詹姆斯・韦布空间望远镜的数据分析时间从数年缩短至数日,助力多项天文发现。

图像生成论文/研究部署/工程
15:33
IT之家(RSS)
41
元戎启行:业界首个高通 Snapdragon Ride Elite 量产 ADAS 方案面向量产项目出货

元戎启行与高通共同宣布,基于高通Snapdragon Ride平台至尊版(骁龙8797)芯片打造的ADAS方案已开始面向量产项目出货。这是业界首款基于该平台的量产ADAS解决方案,将搭载于中国智能网联汽车品牌的旗舰车型。该方案推动了VLA模型在车端的实际部署,使系统具备理解、推理与决策能力,提升驾驶安全性与体验。双方还正基于同一平台开发舱驾融合方案,以实现驾驶辅助与车内智能交互的协同。

具身智能行业动态部署/工程
15:12
Alibaba Cloud@alibaba_cloud
36
🚀 阿里云发布DDoS安全运维代理(Anti-DDoS SecOps Agent) 该云原生安全代理由大语言模型驱动,支持自然语言交互并自动生成防护策略。 了解更多:https://int.alibabacloud.com/m/1000412296/
智能体产品更新部署/工程
14:07
SiliconFlow@SiliconFlowAI
43
开发者们正在用他们的代币投票 🔥 SiliconFlow 现已成为日使用代币量排名第一的第三方模型提供商 在 @OpenRouter 上, • 每日约 2800 亿代币 • 每月约 1.9 万亿代币 • 33 个前沿模型:DeepSeek V4 系列、GLM 5.1、Kimi K2.6 等 衷心感谢每一位与我们共同构建的开发者 更多精彩即将到来 🚀
开源生态行业动态部署/工程
14:06
Alibaba Cloud@alibaba_cloud
35
🚀 Claw Talks 第二期 | 携手 QoderWork 与 Quick BI,将 Claw 带入工作场景 ⏰ 2026年4月29日 | 下午5点(UTC+8) 👉 直播链接:https://youtu.be/cK3qfRTjgWE 了解 QoderWork 如何让 AI 成为真正的工作伙伴--实现安全的桌面自动化,并与 Quick BI 无缝集成,助力分析、报告、内容创作和工作流。 📌 加入直播,见证企业生产力的未来! #AlibabaCloud #ClawTalks #QoderWork #QuickBI #EnterpriseAI
智能体产品更新部署/工程
13:33
Simon Willison 博客
60
pip 26.1 新特性:锁文件与依赖冷却期

Python 包管理工具 pip 发布 26.1 版本,引入两项关键功能。一是新增 pip lock 命令,可生成记录所有依赖精确版本的锁文件(如 pylock.toml)。二是提供 --uploaded-prior-to PXD 选项以实现依赖冷却期,可强制安装指定天数前发布的旧版本包,例如使用 P4D 安装至少 4 天前的 LLM 版本 0.30,有助于提升供应链安全。该版本已停止对 Python 3.9 的支持。

开源生态教程/实践部署/工程
13:33
IT之家(RSS)
46
DeepSeek-V4-Pro 旗舰模型限时 2.5 折优惠官宣延期,活动持续至今年 5 月 31 日

DeepSeek宣布将其旗舰模型DeepSeek-V4-Pro的API限时2.5折优惠活动延长至2026年5月31日。同时,公司进行了多项价格与模型调整:全系列模型的输入缓存命中价格降至首发价的十分之一;deepseek-chat与deepseek-reasoner两个模型名将被弃用,其功能分别由deepseek-v4-flash的非思考与思考模式承接。目前,DeepSeek-V4-Pro的缓存命中输入价格低至每百万tokens 0.025元。该模型采用混合专家架构,总参数量达1.6万亿,支持百万级上下文窗口。官方表示,受高端算力限制,当前Pro版本服务吞吐有限,预计下半年昇腾950超节点批量上市后,其价格还将大幅下调。

DeepSeek行业动态部署/工程
12:34
Tomer Tunguz 博客(VC 分析)
精选64
GPU现货价格六周内暴涨114%

根据Ornn Compute Price Index数据,NVIDIA B200 GPU的现货租赁价格在六周内飙升114%,从三月初的2.31美元涨至本周的4.95美元/小时。此次价格暴涨与GPT-5.5等前沿模型发布带来的需求冲击紧密相关,这些模型需要Blackwell架构提供的内存支持。与此同时,B200与上一代H200的价差从0.28美元大幅扩大至1.80美元,不同云服务商之间的报价差距也扩大了一倍以上,反映出市场供应紧张。预计夏季B200价格将维持在5美元以上,云端推理成本持续上升。

现象/趋势行业动态部署/工程

推荐理由:Tomer Tunguz 用 Ornn 真实价格指数拆出 B200 六周涨 114% 的供需逻辑,做 AI infra 选型或算力采购的人该把这张图存下来,夏天 B200 破 5 刀基本板上钉钉。
12:33
Runway:News(网页)
精选58
无闲置GPU:Runway的研究计算管理

Runway通过采用Kueue作为Kubernetes准入控制器,将GPU利用率提升超过20%,同时保障团队容量。其核心机制是为关键工作预留配额,并设立共享队列借用闲置容量,当配额所有者需要时通过抢占回收资源。该系统运行于昂贵的多租户GPU集群,支持多节点训练的拓扑感知调度和弹性工作负载。具体实现中,团队拥有专用预留队列,而默认队列作为共享机会池,可借用闲置配额运行可中断工作负载。当预留队列需资源时,Kueue基于优先级和运行时间抢占默认队列中的任务,实现资源高效管理。

教程/实践部署/工程

推荐理由:Runway 把 Kueue + Kubernetes 的 GPU 调度实战写成了保姆级工程笔记,利用率翻倍的方案和踩坑细节都有,做大规模训练集群调度的团队可以直接抄作业。
12:02
Baidu Inc.@Baidu_Inc
49
GenFlow 4.0正式发布,月活用户超1亿,处理任务达2亿

百度文库与百度网盘联合推出的GenFlow 4.0已正式上线,每月服务超过1亿活跃用户并处理2亿项任务。此次升级的核心是全新的Office Agent,用户可通过单一提示并行调用PowerPoint、Excel和Word代理。该版本深度集成OpenClaw,支持从百度网盘PC端或移动应用一键部署,将网盘转化为个人AI工作空间。更多进展将于2026年5月13日至14日在北京举行的百度Create大会上公布,大会主题为“Agents at Scale”。

智能体产品更新部署/工程
11:16
IT之家(RSS)
68
阿里达摩院 AI 全球首次实现肠癌"无感"检测,登上国际肿瘤学顶刊

阿里巴巴达摩院联合广东省人民医院等机构,研发出肠癌筛查AI模型DAMO COCA。该模型基于平扫CT影像,采用两阶段深度学习架构,在国际上首次实现了无需肠道准备、患者“无感”的肠癌机会性筛查。在回顾2.7万人影像的试验中,模型精准识别出5例漏诊肠癌,敏感性达86.6%,特异性高达99.8%。与10名影像科医生相比,其敏感性显著高出20.4%,并能辅助医生将敏感性提升14.5%。相关成果已发表于顶级期刊《肿瘤学年鉴》。

多模态论文/研究部署/工程
10:49
SemiAnalysis@SemiAnalysis_
57
DeepSeek V4 Pro在vLLM性能测试中展现8倍加速

InferenceX已将DeepSeek V4 Pro集成至vLLM项目,在B200、B300、H200和GB200等硬件上的性能测试显示,B300的推理速度比H200快达8倍。团队正在基于vLLM 0.20版本进行基准测试,该版本引入了全新的DeepGEMM MegaMoE技术,将专家并行调度、组合、通用矩阵乘法及SwiGLU激活函数融合为单一巨型内核,预计将带来更优性能。文中感谢了来自NVIDIA AI、社区贡献者及相关团队的开发人员对开源项目的投入与努力。

产品更新开源生态部署/工程
08:28
Hugging Face:Blog(RSS)
精选58
Adaptive Ultrasound Imaging with Physics-Informed NV-Raw2Insights-US AI

NVIDIA 在 Hugging Face 上发布了一款名为 NV-Raw2Insights-US 的物理信息人工智能模型,专门用于自适应超声成像。该模型能够直接处理原始超声射频数据,实时生成高质量的诊断图像。它通过结合物理定律与深度学习,显著提升了图像分辨率和对比度,同时将传统处理流程中的多个步骤整合为单一前向传播,大幅提高了计算效率。这一进展有望推动超声设备向更便携、智能和精准的方向发展。

具身智能论文/研究部署/工程

推荐理由:NVIDIA 把物理先验塞进超声成像管线,从原始射频数据直接出诊断结果,跳过传统重建步骤。做医疗 AI 的值得拆一下这个端到端思路,但离通用场景太远。
08:00
HuggingFace Daily Papers(社区热门论文)
66
真实资本下链上语言模型代理的操作层控制研究

本研究通过一项为期21天的真实资本链上交易实验,探讨了自主语言模型代理的可靠性。在受控市场中,3,505个用户注资的代理交易真实ETH,产生了750万次调用、约30万次链上操作及2000万美元交易量,提交交易的结算成功率达99.9%。研究发现,可靠性不仅依赖于基础模型,更源于操作层设计,包括提示编译、策略验证与执行防护等。上线前测试揭示了纯文本基准难以评估的故障模式,如伪造交易规则和手续费瘫痪,通过针对性框架调整,相关故障率显著下降,受影响测试群体的资本部署率从42.9%提升至78.0%。研究表明,管理真实资本的代理需在从用户指令到结算的完整路径上进行评估。

智能体论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
35
非独立同分布数据下基于多任务自动编码器的联邦学习样本选择方法

本文针对联邦学习中冗余或噪声样本导致模型性能下降的问题,提出一种基于多任务自动编码器的样本选择方法。该方法通过中央服务器协调,采用OCSVM、隔离森林和自适应损失阈值等无监督异常检测技术过滤客户端噪声样本,并引入中央服务器控制的多类深度支持向量数据描述损失以增强特征选择。在CIFAR10和MNIST数据集上的实验表明,在非独立同分布设置及高达40%的噪声水平下,基于损失的样本选择能显著提升模型精度,其中CIFAR10上最高提升7.02%。联邦SVDD损失进一步优化了特征选择,额外带来最高0.99%的精度提升。

数据/训练论文/研究部署/工程
07:52
TestingCatalog News 🗞@testingcatalog
精选75
OpenAI模型将在未来几周内通过AWS Bedrock向客户提供。此举旨在为开发者提供更多模型选择,以适配不同任务需求。同时,亚马逊将于4月28日举办直播活动,AWS高管Matt Garman、Colleen Aubrey、Julia White将与OpenAI领导人进行对话,探讨智能体AI(agentic AI)的未来发展方向。相关详细信息将在旧金山的AWS活动中公布。

Andy Jassy: Very interesting announcement from OpenAI this morning. We're excited to make OpenAI's models available directly to cust...

OpenAI行业动态部署/工程

推荐理由:OpenAI 模型上 AWS Bedrock,意味着企业级部署多了一条官方直连通道,做 ToB 产品选型的人该把这条放进下周的 checklist 里。
07:34
Berryxia.AI@berryxia
54
Minmax 的 Music-2.6 本周在 Cloudflare 上免费使用! 从文本提示生成完整长度的歌曲或器乐作品,并可选自动生成歌词。 直接开整吧!!!

Cloudflare Developers: Music-2.6 from @MiniMax_AI is free on Cloudflare this week! Generate full-length songs or instrumentals from a text prom...

产品更新多模态部署/工程
07:28
TestingCatalog News 🗞@testingcatalog
55
Meta与Overview Energy合作,将高达1吉瓦的空间太阳能输送至地球! Meta还与Noon Energy合作,部署高达1吉瓦/100吉瓦时的储能系统。 现在是Meta对阵SpacexAI了 👀 【引用 @Meta_Engineers】:这些与Overview和Noon的合作延续了我们的一贯策略,即通过多元可靠的解决方案助力电网强化,并为我们的AI基础设施供电。 了解更多:https://go.meta.me/635755

Engineering at Meta: These partnerships with Overview and Noon build on our approach to helping strengthen the grid and power our AI infrastr...

行业动态部署/工程
06:15
Hacker News 热门(buzzing.cc 中文翻译)
56
在长达十小时的航班上离线运行本地大型语言模型

一篇技术文章分享了在长达十小时的航班上离线运行本地大型语言模型的实验。作者通过优化,成功在配备Apple Silicon芯片的笔记本电脑上运行了70亿参数的Llama 2模型。关键变化在于通过量化等技术大幅降低了模型对内存和算力的需求,使其能在无网络环境下持续工作。实验实现了约每秒5个token的生成速度,证明了在移动设备上进行实用级离线AI推理的可行性。

教程/实践端侧部署/工程
05:00
SemiAnalysis@SemiAnalysis_
44
Intel弃用EMIB转向UCIe,外部客户仍受益

Intel的EMIB封装技术被外部客户如Google的TPU采用,但Intel自身产品正转向UCIe技术。Diamond Rapids预计使用UCIe over substrate实现长距离die-to-die互连。在ISSCC上,Intel展示了UCIe-S D2D链接,在22nm工艺下达到48 Gb/s/lane,距离达30mm,数据率和带宽密度优于3nm设计。substrate配置为5-2-5,而EMIB为11-2-11。由于substrate短缺,Intel的“最佳”封装技术对除Intel外的客户更具优势。

行业动态部署/工程
04:30
Rohan Paul@rohanpaul_ai
56
为精确性优化RAG可能悄然损害检索效果,危及智能体流程

最新研究发现,企业为提升精确性而微调RAG嵌入模型,可能导致检索质量下降高达40%。其核心矛盾在于,单个密集嵌入向量被同时要求承担广泛主题召回和精确语义判别的双重任务。当强制模型区分细微结构差异(如否定、语序颠倒)时,会损害其跨领域聚合相关材料的能力。解决方案是采用两阶段检索:先用嵌入模型快速召回,再通过能感知结构的词元级比对来验证候选结果。这揭示了“几乎相同的句子”与“相同含义”本质不同,在合同、合规等高精度领域混淆二者将导致系统关键失效。

检索增强论文/研究部署/工程
03:39
宝玉@dotey
精选74
GitHub Copilot 将于6月1日起改为基于用量的计费模型

GitHub Copilot 将于6月1日起改用基于AI积分的用量计费模型,以支持更多Agent和高级工作流。各档订阅价格不变,每月赠送等额积分,代码补全等基础功能不消耗积分。新规则按Token消耗计费,积分用尽后无降级选项,代码审查会额外消耗Actions时长。企业用户有三个月过渡期及积分池福利。5月初将上线账单预览功能,年付和轻度用户受影响小,但重度用户需关注成本变化。

GitHub: Starting June 1st, GitHub Copilot will move to a usage-based billing model as GitHub Copilot supports more agentic and a...

编码行业动态部署/工程

推荐理由:Copilot 从固定订阅转向按量计费,本质是 GitHub 扛不住 Agent 模式的推理成本了。重度用户得重新算账,轻度用户反而没影响,6 月前值得先跑一下预览账单。
03:29
François Chollet@fchollet
60
Keras Kinetic 发布了新的 alpha 版本:v0.0.2!包括新的文档网站:http://kinetic.readthedocs.io Kinetic 是我最喜欢的 Keras 团队新发布:一个超级简单的类 Modal API,用于在 TPU 上运行训练任务。
产品更新开源生态部署/工程
‹ 上一页
1…4344454647…50
下一页 ›