AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「部署/工程」清除
4月26日周日
23:20meng shao77精选【论文分享】 深入解析 Claude Code 架构:生产级 Coding Agent 的设计哲学与实现
23:17IT之家(RSS)63降至原有价格 1/10,DeepSeek API 输入缓存降价
21:22Rohan Paul40AWS芯片供不应求 A100服务器持续热销
17:21阿绎 AYi42印度开发者详解Claude代码功能,推荐聚合平台Zenmux
14:21阿绎 AYi58说个暴论,现在90%的AI Agent记忆,全都是假的。
11:20IT之家(RSS)45Momenta R7 强化学习世界模型北京车展量产首发
11:20IT之家(RSS)47英特尔财报超预期股价暴涨,陈立武称一年前外界还在担心我们能否活下去
08:00HuggingFace Daily Papers(社区热门论文)50RaV-IDP:基于重建验证的可靠智能文档处理框架
05:51SemiAnalysis36DeepSeekv4获InferenceX GB200首日支持
01:02elvis63微软论文揭示AI长文档编辑工作流普遍损坏内容
01:01SemiAnalysis50紧急救援:GB300集群宕机之际,CoreWeave助力DeepSeek-V4基准测试
4月25日周六
23:59DeepSeek60精选DeepSeek-V4-Pro API限时75折优惠
23:26IT之家(RSS)53DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠,活动持续至 5 月 6 日前
23:26IT之家(RSS)36我国科学家发布"灵境造物"智能科研工具,面向全球科研主体开放
23:26Hacker News 热门(buzzing.cc 中文翻译)56开源内存层,让任何AI代理都能实现Claude.ai和ChatGPT的功能
22:44meng shao60Obscura:专为AI Agent与规模化爬取设计的轻量级无头浏览器引擎
21:37阿绎 AYi50AI一键生成App Store截图,颠覆应用上架流程
21:17Chubby♨️46GLM-5.1上线BytePlus,性能媲美Opus成本降五倍
20:42Hacker News 热门(buzzing.cc 中文翻译)46Show HN: 由您的代理维护的卡帕西风格大语言模型维基(支持 Markdown 和 Git)
20:14IT之家(RSS)35中紫星 NEU 智能原生芯片 Q4 流片:速度达顶级 GPU 百倍,且功耗降低九成
19:14IT之家(RSS)36破局 1.6T 量产瓶颈:万里眼 65GHz 采样示波器正式发布
19:11阿绎 AYi67长篇小说AI创作工具autonovel发布,基于Ling-2.6-flash实现极速生成
18:14IT之家(RSS)41元戎启行宣布已有超 30 万辆汽车搭载其高级驾驶辅助系统,预计今年新增 100 万辆
16:14IT之家(RSS)63英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user
14:46Rohan Paul40AI模型选择正演变为后端基础设施问题
13:30阿绎 AYi49大厂为何疯魔自研芯片?AI硬件路线变革揭秘
12:18SemiAnalysis49台积电A14节点推出NanoFlex Pro技术提升芯片密度
08:00HuggingFace Daily Papers(社区热门论文)40AnalogRetriever:用于模拟电路检索的跨模态表征学习框架
08:00HuggingFace Daily Papers(社区热门论文)36非独立同分布联邦学习中结合自适应量化与差分隐私的通信与隐私增强方法
08:00HuggingFace Daily Papers(社区热门论文)53For-Value:一种面向大模型微调的高效前向传播数据估值方法
08:00HuggingFace Daily Papers(社区热门论文)54ProEval:面向生成式AI评估的主动故障发现与高效性能估计框架
4月24日周五
21:08IT之家(RSS)49阿里云百炼上线 DeepSeek-V4 模型,API 价格与官网一致
20:08IT之家(RSS)28光学器件供应商腾景科技 2026 年一季度净利润 1443.38 万元,同比增长 10.74%
19:08IT之家(RSS)43英特尔合作开发 ZAM 内存获日本政府补贴:号称功耗比传统 HBM 低约 40%,目标 2029 年左右实现量产
18:08IT之家(RSS)39摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配
17:08IT之家(RSS)37腾讯面向汽车行业发布全场景智能体开放平台,可化身专属 AI 导游、提供选品下单取餐全链路服务等
17:08IT之家(RSS)37MINIX 发布英伟达 Jetson Thor 平台 GenAI 迷你主机,搭载双万兆网口
16:08IT之家(RSS)51小马智行宣布 Robotaxi 成本降至 23 万元内,2026 北京车展首发 L4 级无人轻卡
16:08IT之家(RSS)55华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务
15:08IT之家(RSS)65特斯拉赛博无人驾驶电动车 Cybercab 在北美投产:无需方向盘、踏板、后视镜
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月26日
23:20
meng shao@shao__meng
精选77
【论文分享】 深入解析 Claude Code 架构:生产级 Coding Agent 的设计哲学与实现

论文通过分析 Claude Code 泄露源码,揭示其生产级 Coding Agent 架构的核心是“最小 AI 决策+最大确定性环境”设计。仅约 1.6% 代码为 AI 逻辑,其余 98.4% 用于构建安全、可靠的操作框架。架构围绕人类决策权、安全等五种价值驱动,采用七层独立防御体系保障工具调用安全,并通过五层渐进压缩策略高效管理上下文窗口。其扩展机制按上下文成本分级,子 Agent 采用隔离设计,整体强调透明性与用户可控性,与依赖状态图或显式规划的主流路径形成鲜明对比。

BURKOV: A must read for anyone interested in building practical AI systems in 2026: Dive into Claude Code: The Design Space of T...

智能体Anthropic编码论文/研究

推荐理由:这篇论文逆向拆解了 Claude Code 的完整架构,最值钱的不是那 13 条设计原则,而是 1.6% vs 98.4% 这个数字——它直接回答了「agent 系统该把工程重心放在哪」,做 coding agent 的人应该把这当设计参考书来读。
23:17
IT之家(RSS)
63
降至原有价格 1/10,DeepSeek API 输入缓存降价

DeepSeek宣布全系API服务的输入缓存命中价格即日起降至原有价格的十分之一。其中,DeepSeek-V4-Pro模型的输入缓存命中价格从每百万tokens 1元降至0.025元,输入缓存未命中价格从12元降至3元,输出价格从24元降至6元。DeepSeek-V4-Flash模型的输入缓存命中价格从0.2元降至0.02元。此外,Pro模型在5月5日前还可叠加享受2.5折限时优惠。

DeepSeek行业动态部署/工程
21:22
Rohan Paul@rohanpaul_ai
40
AWS CEO Matt Garman: "由于需求远超供给,实际上通常对旧芯片仍有需求。例如,如今我们的A100服务器实际上已完全售罄,且从未退役过任何一台。"
行业动态部署/工程
17:21
阿绎 AYi@AYi_AInotes
42
印度开发者详解Claude代码功能,推荐聚合平台Zenmux

一位印度开发者详细介绍了Claude的12个关键代码功能,包括CLAUDE.md、Plan Mode、MCP等,并建议开发者使用AI模型聚合平台。针对Claude可能封号的风险,推荐使用Zenmux平台,该平台集成了包括Claude Opus、GPT-5.4和DeepSeek V4 Pro在内的多种最新大模型,国内可直连。平台提供PK对比模式、保险赔付机制和详细的可观测性工具。特别指出,DeepSeek V4 Pro在Zenmux上目前有免费额度,经测试能处理大部分Claude的工作流,建议用户自行测试以进行模型选型。

阿绎 AYi: 兄弟们,DeepSeek V4 Pro在ZenMux上免费放开了,登录就能跑,实测能替掉你80%的Claude活。视频是我早上实测的和Claude opus 4.7同时跑一个昨SaaS产品网站的任务,效果真的炸裂! 说个前情,老朋友都知道我...

大佬观点评测/基准部署/工程
14:21
阿绎 AYi@AYi_AInotes
58
说个暴论,现在90%的AI Agent记忆,全都是假的。

作者指出,当前多数AI Agent将历史记录堆砌成Markdown文件充当“记忆”的方案实为将Prompt当RAM用,存在无法去重、衰减、排名及性能低下等根本缺陷。真正的长期记忆应基于图结构,通过节点、嵌入和遍历来建立关联与因果关系,实现记忆的链式提取与动态管理。主流生产级框架已转向图记忆。随着应用规模扩大,仅扩展上下文窗口无法解决记忆漂移和污染问题,动态图记忆架构是Agent能否投入实际应用的关键。

AI Edge: http://x.com/i/article/2044531930671288320

智能体大佬观点部署/工程
11:20
IT之家(RSS)
45
Momenta R7 强化学习世界模型北京车展量产首发

在北京车展上,Momenta正式宣布其强化学习世界模型R7实现量产首发。该模型通过“World Model Prediction”预测物理世界未来状态与交互逻辑,旨在让AI理解物体物理属性、运动因果关系及交互可能性。其技术架构分为三层:基于海量驾驶数据的世界模型预训练、用于自动驾驶闭环仿真的世界模型仿真,以及在模型内进行的强化学习虚拟训练。目前,Momenta已交付超70款量产车型,累计定点车型超200款,本次车展有超过20个品牌的60余款车型搭载了其智驾方案。

产品更新具身智能部署/工程
11:20
IT之家(RSS)
47
英特尔财报超预期股价暴涨,陈立武称一年前外界还在担心我们能否活下去

英特尔第一季度营收达136亿美元,同比增长7%,远超预期,推动其股价盘后暴涨超22%。公司预计本季度营收将继续增长。CEO陈立武指出,市场焦点已从一年前担忧其生存,转向关注其如何快速扩大产能以满足需求。他强调,在AI时代,CPU正重新确立基石地位,特别是在模型推理环节,GPU与CPU的配比正从训练时的1:7-8向推理时的1:3-4转变。不过,公司仍面临英伟达、AMD及ARM架构的竞争,其晶圆代工业务与先进制程的前景也存在不确定性。

行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
50
RaV-IDP:基于重建验证的可靠智能文档处理框架

智能文档处理管道常因缺乏验证机制,导致提取错误无声传递至下游系统。RaV-IDP框架创新性地引入重建作为核心组件,在提取每个实体后,通过专用重建器将结果渲染回与原文档区域可比的形式,并由比较器评估重建与原始截图的保真度,生成无需标注的质量信号。若保真度低于实体类型阈值,系统触发基于GPT-4.1 Vision的结构化回退机制并重复验证循环,始终以原始文档区域为锚点,避免循环依赖。该框架还提供了每阶段评估方法,将管道组件与基准配对,相关代码已在GitHub开源供实验使用。

检索增强论文/研究部署/工程
05:51
SemiAnalysis@SemiAnalysis_
36
DAVIS, 2026年4月25日 - InferenceX 已为 @vllm_project 添加了 DeepSeekv4,以支持 GB200 分解的 day 0 支持!感谢 @flowpow123 @rogerw0108 @NVIDIAAIDev @inferact 的快速支持和工程工作!
开源生态行业动态部署/工程
01:02
elvis@omarsar0
63
微软论文揭示AI长文档编辑工作流普遍损坏内容

微软新论文引入DELEGATE-52基准,模拟52个专业领域的长文档编辑工作流。测试19个模型,包括Gemini 3.1 Pro、Claude 4.6 Opus和GPT-5.4等前沿模型,发现在长工作流结束时平均损坏25%的文档内容。代理工具使用未能改善表现。论文还提供了其他相关见解。

论文/研究评测/基准部署/工程
01:01
SemiAnalysis@SemiAnalysis_
50
在DeepSeek发布的关键时刻,原GB300集群意外宕机。云服务商CoreWeave在计算资源危机中紧急调配,找到了两套备用的GB300开发机架,使团队得以顺利运行DeepSeek-V4进行InferenceX基准测试。据引用推文,InferenceX已实现对DeepSeek-V4的Day 0支持,并利用Blackwell B300获得了相比Hopper架构5倍的性能提升。目前,InferenceX团队正全力扩展对更多新硬件架构的即时支持。

SemiAnalysis: SAN FRANCISCO, April 24, 2026 - InferenceX has added Day 0 DeepSeek v4 support for @sgl_project's amazing Blackwell B300...

产品更新开源生态部署/工程
4月25日
23:59
DeepSeek@deepseek_ai
精选60
🔥DeepSeek-V4-Pro API 限时75折优惠,截止至2026年5月5日15:59(UTC时间)!切勿错过此次大幅折扣。 🛠️集成更新: 🔹Claude Code:将模型设置为 deepseek-v4-pro【1m】 即可解锁100万上下文! 🔹OpenCode:请更新至 v1.14.24+ 🔹OpenClaw:请更新至 v2026.4.24+ 查看最新官方API文档获取完整详情:https://api-docs.deepseek.com/quick_start/pricing
DeepSeek产品更新部署/工程

推荐理由:DeepSeek-V4-Pro 限时 75% off,配合 Claude Code 1M 上下文接入,对正在跑 coding agent 的开发者来说是真金白银的省钱窗口,错过这波下次不知道什么时候。
23:26
IT之家(RSS)
53
DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠,活动持续至 5 月 6 日前

DeepSeek宣布为其旗舰模型DeepSeek-V4-Pro的API提供限时2.5折优惠,活动持续至2026年5月5日。调价后,输入价格(缓存命中)低至每百万tokens 0.25元,缓存未命中为3元,输出价格为6元。该模型采用混合专家架构,拥有1.6万亿总参数,支持百万级上下文。官方表示,受当前高端算力限制,服务吞吐有限,预计下半年昇腾950超节点批量上市后,Pro版本价格还将大幅下调。

DeepSeek行业动态部署/工程
23:26
IT之家(RSS)
36
我国科学家发布"灵境造物"智能科研工具,面向全球科研主体开放

中国科学技术大学在合肥发布“灵境造物”智能科研工具,面向全球科研人员、机构及企业开放。该系统基于昇腾、鲲鹏、华为云等全栈国产化软硬件生态构建,整合了科学大模型、科研机器人、自动计算与实验等能力,形成操作系统级入口。它依托千余台科研机器人和万余台智能工作站,深度整合千余个科研技能,旨在实现自主科研与物质创制,以破解传统科研成本高、周期长、转化难等痛点。此举标志着人工智能驱动的科学研究正向工程化、平台化与开放共享迈进。

产品更新开源生态部署/工程
23:26
Hacker News 热门(buzzing.cc 中文翻译)
56
开源内存层,让任何AI代理都能实现Claude.ai和ChatGPT的功能

开源项目Stash发布,为AI代理提供长期记忆与上下文管理能力。它通过独立存储和检索对话历史,使开发者无需依赖特定API即可为应用添加持久化记忆功能。该项目已在GitHub开源,并获Hacker News社区关注,降低了构建复杂AI代理的门槛。

智能体开源/仓库部署/工程
22:44
meng shao@shao__meng
60
Obscura:专为AI Agent与规模化爬取设计的轻量级无头浏览器引擎

Obscura是一个用Rust编写的轻量级无头浏览器引擎,专为AI Agent自动化和大规模网络爬取优化。其核心优势在于极致的性能与资源效率,内存占用仅30MB,页面加载约85毫秒,远超Headless Chrome。项目采用务实架构,复用Servo的DOM与V8引擎,并构建独立网络层。关键特性包括深度反检测的“隐身模式”,能随机化指纹并拦截追踪域名;通过兼容Chrome DevTools Protocol,实现与Puppeteer/Playwright生态无缝对接。此外,它内置了DOM转Markdown等专为AI Agent优化的功能,旨在作为高效的常驻网页感知端点。

Chris Laub: A Rust dev just killed Headless Chrome. It's called Obscura. The open-source headless browser purpose-built for AI agent...

智能体开源/仓库部署/工程
21:37
阿绎 AYi@AYi_AInotes
50
AI一键生成App Store截图,颠覆应用上架流程

工具Anything推出新功能,能一键生成设计师级别的App Store截图。用户仅需15秒即可从空白状态获得4张完美适配官方规格的截图,系统会自动生成包含图标、评分和下载按钮的完整画面。修改文案也只需输入一句话并点击生成。此举解决了应用开发中制作和适配多尺寸截图的传统痛点,该过程以往需耗费数百美元聘请设计师或投入大量时间自行设计。AI正将开发者从繁琐的“脏活累活”中解放出来,大幅降低了从创意到应用上架全流程的门槛,尽管最终审美把关仍需人工,但已节省约90%的精力。

Anything: BREAKING: the screenshot bottleneck is gone! Anything now generates designer grade App Store screenshots

产品更新图像生成部署/工程
21:17
Chubby♨️@kimmonismus
46
GLM-5.1现已登陆BytePlus的Coding Plan--情况很简单:Opus级别的性能,8小时自主任务循环,原生支持Cursor和Claude Code,6个顶级模型配备智能路由。所有这一切的成本大约比http://Z.ai官方定价低5倍。难以忽视。
产品更新编码部署/工程
20:42
Hacker News 热门(buzzing.cc 中文翻译)
46
Show HN: 由您的代理维护的卡帕西风格大语言模型维基(支持 Markdown 和 Git)

项目“Wuphf”是一个受卡帕西风格启发的大语言模型维基系统,支持Markdown格式和Git版本控制。其核心特点是可由用户设定的AI代理自动维护和更新内容,实现了知识库的持续自主管理。该项目已在GitHub开源,并在Hacker News上获得了100点热度。

智能体开源/仓库部署/工程
20:14
IT之家(RSS)
35
中紫星 NEU 智能原生芯片 Q4 流片:速度达顶级 GPU 百倍,且功耗降低九成

上海中紫星公司研发的智能原生芯片NEU将于今年第四季度流片。该芯片采用以存储为中心的创新设计,避免了传统架构中数据频繁搬运的能耗与带宽瓶颈,并直接在硬件拓扑上支持神经网络连接。实测数据显示,NEU在执行同等AI推理任务时,速度可达顶级GPU方案的近100倍,同时能耗降低90%。公司创始人翟四通拥有海思EDA框架建设背景,团队汇聚了来自英特尔、英伟达等企业的跨学科人才,实现了从架构到编译器的全体系自研。

行业动态部署/工程
19:14
IT之家(RSS)
36
破局 1.6T 量产瓶颈:万里眼 65GHz 采样示波器正式发布

在2026九峰山论坛上,新凯来旗下万里眼公司发布了65GHz采样示波器,旨在破解1.6T高速光模块的量产测试瓶颈。该产品面向AI算力驱动下光互连技术向1.6T演进的需求,实现了三大突破:500kHz采样率将测试效率提升100%;65GHz带宽支持单波200G测量,为1.6T通信奠定基础;12μW超低光功率噪声保障了高精度生产。此举贯通了1.6T研发与量产的全流程测试。

产品更新部署/工程
19:11
阿绎 AYi@AYi_AInotes
67
长篇小说AI创作工具autonovel发布,基于Ling-2.6-flash实现极速生成

autonovel是基于Ling-2.6-flash的AI写作工具,专为长篇小说创作优化。它能以200+ tokens/s的速度生成文本,大幅提升创作效率,并在上下文一致性、伏笔回收和人物性格保持方面表现突出,帮助作者从繁琐的码字劳动中解放,更专注于故事构思。目前提供免费体验额度。

阿绎 AYi: 后续来了兄弟们,卧槽真的太炸了,同样的任务,同样的配置,速度比Claude Sonnet 4.6还快 6 倍,成本低约 50 倍, openrouter 和 官方 API 均限时免费 1 周使用时间,白嫖的机会,冲啊兄弟们! 我上周那条讲E...

智能体模型发布部署/工程
18:14
IT之家(RSS)
41
元戎启行宣布已有超 30 万辆汽车搭载其高级驾驶辅助系统,预计今年新增 100 万辆

在2026北京车展上,元戎启行宣布其高级辅助驾驶系统已在国内超30万辆汽车上搭载,预计今年将新增100万辆。公司已与长城、吉利、Smart等品牌超过15款车型合作,覆盖15万至30万元主流价格区间。技术层面,公司已全面转向大模型自动驾驶路线,多模态大模型能力在2026年初取得突破,目标是实现千公里级MPCI。此外,公司正从多个小模型转向统一基座大模型架构,并将模型单次迭代周期从100余小时压缩至10余小时。

具身智能行业动态部署/工程
16:14
IT之家(RSS)
63
英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user

英伟达宣布其Blackwell平台已适配DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型。DeepSeek-V4-Pro拥有1.6T总参数量与49B激活参数,定位高级推理;DeepSeek-V4-Flash则为284B总参数量与13B激活参数,主打高效场景。两款模型均支持100万Token上下文窗口与最高38.4万Token输出长度。实测显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72上开箱性能超过150 tokens/sec/user。开发者可通过NVIDIA NIM微服务下载部署,或利用SGLang与vLLM框架进行定制化推理,vLLM支持扩展至100个以上GPU。

DeepSeek产品更新开源生态部署/工程
14:46
Rohan Paul@rohanpaul_ai
40
AI模型选择日益成为一个后端基础设施问题,其核心解决方案是通过统一网关将模型视为可互换组件。AI/ML API提供了一个OpenAI兼容的单一端点,能将请求路由至OpenAI、Anthropic、Google、MiniMax、Alibaba等提供的400多个模型,覆盖对话、视觉、视频、音频、3D等多种类型。这种方法显著减少了针对特定供应商的粘合代码,实现了推理、图像、语音等多功能统一接入。相关推文证实,GPT-5.5 API已通过该平台实时上线,体现了其敏捷性。

AI/ML API: GPT-5.5 API live = it's already live on AI/ML API Faster than a squid on espresso 🦑

现象/趋势行业动态部署/工程
13:30
阿绎 AYi@AYi_AInotes
49
大厂为何疯魔自研芯片?AI硬件路线变革揭秘

大厂自研芯片源于AI硬件根本变革:从GPU比拼转向混合架构竞争。Amazon、Tesla等将通用CPU核心与定制Tensor核心集成,以最大化每美元每瓦特的算力效率,在云服务与模型训练中形成优势。这不仅是成本问题,更是争夺AI时代生产工具的战略举措。

Amazon News: http://x.com/i/article/2047653617310498816

现象/趋势部署/工程
12:18
SemiAnalysis@SemiAnalysis_
49
台积电A14节点推出NanoFlex Pro技术提升芯片密度

在台积电北美技术研讨会上,卢博士介绍了A14节点中的NanoFlex Pro技术。相较于N2节点的NanoFlex技术使用双倍高度的“Merged OD”高单元来提升性能,但会因现代标准单元布局中的交替阱偏移要求而产生不可用的“半单元”间隙。A14的NanoFlex Pro将高单元高度降至短单元的1.5倍,使得两个高单元恰好能放入三个短单元的高度,从而消除了部分单元类型间的间隙,提高了布局密度和OD效率。该技术也将作为可选方案于2028年应用于新的N2U工艺,以提供更好性能和2-3%的逻辑密度增益。

行业动态部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
40
AnalogRetriever:用于模拟电路检索的跨模态表征学习框架

针对模拟电路设计中跨SPICE网表、原理图和功能描述等异构表示检索的难题,本研究提出了统一的三模态检索框架AnalogRetriever。该工作基于Masala-CHAI构建高质量数据集,并通过两阶段修复流程将网表编译率提升至100%。框架采用视觉语言模型编码原理图和描述,使用端口感知关系图卷积网络编码网表,并通过课程对比学习将三者映射到共享嵌入空间。实验表明,其在所有六个跨模态检索方向上的平均Recall@1达到75.2%,显著优于基线。集成至AnalogCoder智能体框架后,能持续提升功能通过率并完成此前无法解决的任务。代码与数据集将开源。

开源生态论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
36
非独立同分布联邦学习中结合自适应量化与差分隐私的通信与隐私增强方法

本研究针对联邦学习中的通信瓶颈与隐私风险,提出一种结合拉普拉斯差分隐私与自适应量化的方法。该方法采用基于轮次的余弦退火策略进行全局比特调度,并依据客户端数据集熵动态分配量化比特数。在CIFAR10、MNIST及医学影像数据集上的实验表明,相比32位浮点训练,该方法在保持模型精度的同时,将通信数据总量最高减少了52.64%(MNIST)、45.06%(CIFAR10)以及31%至37%(医学影像数据集),并通过差分隐私机制提供了严格的隐私保护。

数据/训练论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
53
For-Value:一种面向大模型微调的高效前向传播数据估值方法

为应对大语言模型和视觉语言模型数据估值中的计算瓶颈,研究团队提出了For-Value框架。该方法基于理论分析,利用预训练模型的表征能力,通过最终隐藏层表征与预测误差的对齐关系来捕获数据价值。For-Value采用封闭表达式计算,仅需单次前向传播即可完成估值,无需昂贵的反向传播,支持高效的大规模批量计算。实验表明,该方法在识别关键数据和错误标注数据方面达到或超越了基于梯度的基线方法,同时实现了显著的效率提升。

数据/训练论文/研究部署/工程
08:00
HuggingFace Daily Papers(社区热门论文)
54
ProEval:面向生成式AI评估的主动故障发现与高效性能估计框架

针对生成式AI模型评估成本高昂的问题,本文提出主动评估框架ProEval。该框架利用迁移学习与预训练高斯过程代理模型,将性能估计建模为贝叶斯积分,将故障发现建模为超水平集采样,从而主动选择高信息量的测试输入。理论证明其估计器具有无偏性与有界性。在推理、安全对齐和分类任务上的实验表明,ProEval仅需8-65倍更少的样本即可实现误差在1%以内的性能估计,同时在严格评估预算下能发现更多样化的故障案例,效率显著优于基线方法。

论文/研究评测/基准部署/工程
4月24日
21:08
IT之家(RSS)
49
阿里云百炼上线 DeepSeek-V4 模型,API 价格与官网一致

阿里云百炼平台宣布首发上线DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型,其API定价与DeepSeek官网完全一致。其中,Flash版本输入价格低至每百万Tokens 1元,输出价格为每百万Tokens 2元。两款模型均支持100万Tokens的超长上下文,V4-Pro专为复杂任务设计,V4-Flash侧重高效经济。此次接入进一步丰富了百炼平台作为“AI模型超市”的生态,为开发者提供了一站式调用各类顶尖模型的灵活选择。

产品更新开源生态部署/工程
20:08
IT之家(RSS)
28
光学器件供应商腾景科技 2026 年一季度净利润 1443.38 万元,同比增长 10.74%

腾景科技发布2026年第一季度报告,营业总收入达1.71亿元,同比大幅增长51.17%;归母净利润为1443.38万元,同比增长10.74%。业绩增长主要受AI算力需求驱动,公司高速光通信元器件及新兴领域光学模组业务快速扩张。报告期内,公司综合毛利率提升至37.22%,研发投入大幅增长84.19%至2366.12万元。不过,因业务规模扩大导致备货及采购增加,经营现金流为-518.85万元,同比由正转负。

行业动态部署/工程
19:08
IT之家(RSS)
43
英特尔合作开发 ZAM 内存获日本政府补贴:号称功耗比传统 HBM 低约 40%,目标 2029 年左右实现量产

软银旗下SAIMEMORY与英特尔正合作开发面向AI的下一代内存技术ZAM。该技术采用垂直架构与非接触式层间互连,宣称相比传统HBM内存功耗降低约40%,并具备更高密度和带宽。项目已获得日本政府NEDO的研发补贴,计划在2027财年前投入约80亿日元开发原型,目标在2029年左右实现量产。若成功,ZAM有望与HBM竞争,降低AI数据中心成本并缓解供应瓶颈,但目前技术仍处早期原型阶段。

行业动态部署/工程
18:08
IT之家(RSS)
39
摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配

摩尔线程与智源FlagOS合作,成功为MTT S5000 GPU完成了DeepSeek-V4-Flash模型的Day-0适配。该模型采用混合专家架构,总参数量284B,并首次运用“FP4+FP8”混合精度策略。MTT S5000 GPU凭借原生FP8支持及内置硬件级FP8 Tensor Core,能将数据位宽减半,显著降低显存带宽压力并提升计算吞吐量。双方团队通过编译优化与自动调优,重点攻克了FP8算子与Sparse Attention算子,实现了高效适配。

产品更新开源生态部署/工程
17:08
IT之家(RSS)
37
腾讯面向汽车行业发布全场景智能体开放平台,可化身专属 AI 导游、提供选品下单取餐全链路服务等

腾讯正式发布面向汽车行业的“出行全场景智能体开放平台”。该平台围绕通勤、出游、娱乐等高频率场景,提供开箱即用的智能体产品,例如随行点单智能体可完成从选品、下单到取餐的全链路服务;随行向导智能体能化身专属AI导游,并新增车队协同管理功能。底层技术方面,平台升级了端云协同座舱大模型架构,端侧采用0.8B轻量化VLM模型确保毫秒级响应,云端则率先接入混元最新大模型Hy3 preview。目前腾讯已服务超过100家车企及出行科技公司。

智能体行业动态部署/工程
17:08
IT之家(RSS)
37
MINIX 发布英伟达 Jetson Thor 平台 GenAI 迷你主机,搭载双万兆网口

硬件制造商MINIX于4月23日发布了两款基于英伟达Jetson Thor平台的GenAI迷你工作站T4000/T5000。该系列产品搭载Arm Neoverse-V3AE CPU和英伟达“Blackwell”GPU,配备最高128GB LPDDR5X统一内存,具备高达2070 TFLOPS的FP4稀疏算力,可支持70亿至700亿参数的大语言模型本地推理。主机尺寸紧凑,内置双涡轮风扇散热,预装1TB PCIe Gen4固态硬盘,并提供了双10GbE万兆网口、Wi-Fi 6E、蓝牙5.3、多个HDMI和USB接口等丰富的外部连接选项。

产品更新端侧部署/工程
16:08
IT之家(RSS)
51
小马智行宣布 Robotaxi 成本降至 23 万元内,2026 北京车展首发 L4 级无人轻卡

在2026北京车展上,小马智行宣布其2027版L4级Robotaxi整车总成本将降至23万元以内,低于入门级特斯拉Model 3,并计划推出海外版本以实现千台以上部署。公司预计到2026年,其Robotaxi将落地全球超20座城市,总规模突破3000台。同时,小马智行发布了全球首款全车规、全冗余的L4级无人驾驶轻卡,该车型单公里货运成本比人工降低40-50%,货箱容积是低速无人配送车的2.6倍。

具身智能行业动态部署/工程
16:08
IT之家(RSS)
55
华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务

DeepSeek-V4预览版正式上线并开源。华为云宣布首发适配,在其MaaS平台上为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。该服务通过适配分层注意力压缩机制、提供多种昇腾高性能融合算子等优化,支持原生100万Token长上下文的高性能推理。V4系列包含1.6万亿参数的旗舰版Pro和2840亿参数的经济型Flash两个MoE架构版本,均原生支持100万Token上下文。新技术大幅降低了长上下文下的计算和显存需求。官方表示V4-Pro体验优于Anthropic Sonnet 4.5,但仍落后于GPT-5.4等前沿闭源模型。

DeepSeek产品更新部署/工程
15:08
IT之家(RSS)
65
特斯拉赛博无人驾驶电动车 Cybercab 在北美投产:无需方向盘、踏板、后视镜

特斯拉宣布其AI驱动的无人驾驶电动车Cybercab在北美正式投产。该车型最大特点是完全取消了方向盘、踏板和后视镜,专为自动驾驶设计。首辆无方向盘版本已于今年2月下线,连续量产于本月启动,目前生产线同时制造无方向盘和带方向盘的两种版本。马斯克将其定位为特斯拉未来的核心走量车型。不过,完全无监督的自动驾驶技术尚未攻克,其FSD功能时间表曾多次延迟。

具身智能行业动态部署/工程
‹ 上一页
1…454647484950
下一页 ›