AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「端侧」清除
5月28日周四
17:15IT之家(RSS)15全新吉利星愿纯电小车正式上市,限时权益价6.18万元起
16:15IT之家(RSS)21消息称澎湃 OS 4 将在 7 / 8 月发布,正式版有望由年度重量级"大会师"产品或小米 18 系列首发
16:15IT之家(RSS)35雷神布局 AMD Medusa Point / Medusa Point 芯片 AI 迷你工作站
16:15IT之家(RSS)38联发科天玑 8550 处理器发布:全大核 8 核架构,最高 3.4GHz
15:15IT之家(RSS)13比预计时间早:华为 Mate X7 推送鸿蒙 HarmonyOS 6.1.0.125 SP9 版本,实装超空间内存技术
11:35公众号:面壁智能(MiniCPM)61精选PilotDeck 开源:以 WorkSpace 为核心的智能体操作系统
11:31Berryxia.AI58Google发布新一代Coral板,本地AI进入生产力时代
10:14IT之家(RSS)74同事件精选人民日报专访华为何庭波:今年秋季的新麒麟手机芯片,性能等相比去年是"跳跃性"提升同一事件,精选展示《华为何庭波“韬定律”论文发布,逻辑折叠技术提升芯片性能》
08:00HuggingFace Daily Papers(社区热门论文)64内存主导但非带宽受限:批量1大语言模型解码在物理AI推理中的差距
01:34Google Research:Blog(网页)70精选通过零信任聚合实现的隐私分析
5月27日周三
23:05Rohan Paul40华为LogicFolding芯片技术:垂直堆叠实现性能提升
22:14IT之家(RSS)34蔚来 ES9 旗舰 SUV 正式上市:整车购买 49.8 万-62.8 万起,租电 39 万-52 万元起
22:14IT之家(RSS)54【IT之家实拍】雷鸟 GT Max 智能眼镜图赏:突破光学痛点,把 267 吋巨幕戴在头上
21:14IT之家(RSS)52雷鸟V4 AI拍摄眼镜发布:首发方形传感器,售价2199元起
21:14IT之家(RSS)40【IT之家评测室】把 267 吋巨幕戴在头上、将 AI 融入日常:雷鸟 GT Max / V4 智能眼镜评测
21:14IT之家(RSS)32雷鸟发布旗舰 AR 眼镜 GT / GT Max:最大 59 度视场角,1899 元起
19:50公众号:面壁智能(MiniCPM)59面壁智能发布 MiniCPM5-1B 端侧基座模型,FlagOS 完成云到端跨芯片 Day-0 适配
18:14IT之家(RSS)51龙芯中科首款 GPU 芯片 9A1000 即将回片进入测试阶段
17:14IT之家(RSS)26联想上架 2026 款 ThinkPad X13 笔记本:锐龙 AI 7 445 + 32GB RAM,10999 元起
17:14IT之家(RSS)24零刻推出三款基于酷睿 3 304 处理器的迷你主机
16:14IT之家(RSS)62联想推出"AI 童伴机"智能硬件:可翻折 5MP 摄像头、2 英寸面板 + 实体 SOS 按键,599 元
16:14IT之家(RSS)40华为手机 / 平板 / 电脑同源设计:余承东发布全新一代鸿蒙智行 HarmonyOS 专属座舱
15:14IT之家(RSS)28精英电脑将在台北国际电脑展 2026 展出多款迷你主机,含 "WCL" 平台产品
14:14IT之家(RSS)629.4 秒生成 512×512 图像,Bonsai Image 4B 生图 AI 登陆苹果 iPhone 17 Pro Max
14:14IT之家(RSS)21理想汽车产品线负责人汤靖:自 L9 Livis 发布后几乎看不到说"理想没技术"这种观点
12:19HuggingFace Daily Papers(社区热门论文)67MobileMoE:扩展设备端混合专家系统
11:13IT之家(RSS)44消息称华为协同认证功能正在逐步适配上线,可在锁屏状态下免解锁使用小艺部分语音指令
10:27Berryxia.AI62PrismML iOS应用'Bonsai Studio'上线:本地跑FLUX.2 Klein图像模型
10:13IT之家(RSS)47新一代华为鸿蒙智家官宣 6 月 1 日发布,主打"全生态 AI 进化"
10:13IT之家(RSS)56蔚来 ES9 官宣首发蔚来世界模型全新版本,6 月同步推送至 Banyan、Cedar、Cedar S 系统全量车型
09:27Berryxia.AI72Bonsai Studio:iPhone端侧离线图像生成应用上线
09:13IT之家(RSS)52微软 Win11 今年 AI 规划曝光:图片表格转 Excel、任务栏 Ask Copilot
08:27Berryxia.AI56oMLX发布v0.3.11:专注稳定性,打造"开箱即用"的本地AI体验
08:13IT之家(RSS)58消息称马斯克讨论过合并 Tesla 与 SpaceX 的可能
07:37Artificial Analysis67OpenBMB发布1B参数模型MiniCPM5-1B,在小规模开源模型中表现最优
07:27Berryxia.AI71PrismML发布Bonsai Image 4B极致压缩版本
00:13IT之家(RSS)63首个被纳入的 AI 训练推理芯片,摩尔线程 MTT S5000(PH100 芯片)通过国家《安全可靠测评》
5月26日周二
22:00Hacker News 热门(buzzing.cc 中文翻译)69荷兰阻止美国收购一家关键数字供应商
19:13IT之家(RSS)42存内 AI 计算企业 TetraMem 完成 22nm SoC 验证,瞄准低功耗低延迟应用
19:13IT之家(RSS)55卢伟冰:小米不会把内存涨价成本转嫁给消费者,今年七八月将发布新一代 OS
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月28日
17:15
IT之家(RSS)
15
全新吉利星愿纯电小车正式上市,限时权益价6.18万元起

全新吉利星愿纯电小车上市,提供310km、410km、480km三种续航版本共6款车型,限时权益价6.18万元起至9.18万元。新车搭载Flyme Auto 2.0智能座舱与千里浩瀚H3辅助驾驶系统,支持CarPlay互联、高速高架NOA及全场景自动泊车等功能。车身尺寸为4135×1805×1570mm,轴距2650mm,全系标配宁德时代电芯,提供三种电池容量与两种电机功率选择。

其他端侧
16:15
IT之家(RSS)
21
消息称澎湃 OS 4 将在 7 / 8 月发布,正式版有望由年度重量级"大会师"产品或小米 18 系列首发

小米澎湃 OS 4 系统预计将于 7 月或 8 月发布,发布前会启动 Beta 版测试,小米 17 系列与红米 K90 系列将是首批测试机型。该系统的正式版首发权,有望交由集成了自研芯片与自研 AI 大模型的年度“大会师”新品,或小米 18 系列新机。

产品更新端侧
16:15
IT之家(RSS)
35
雷神布局 AMD Medusa Point / Medusa Point 芯片 AI 迷你工作站
产品更新端侧
16:15
IT之家(RSS)
38
联发科天玑 8550 处理器发布:全大核 8 核架构,最高 3.4GHz
产品更新端侧
15:15
IT之家(RSS)
13
比预计时间早:华为 Mate X7 推送鸿蒙 HarmonyOS 6.1.0.125 SP9 版本,实装超空间内存技术

华为 Mate X7 折叠屏手机已开启鸿蒙 HarmonyOS 6.1.0.125 SP9 版本推送,系统包大小约 4.95GB。更新主要新增图库智能清理与贴纸功能、全面升级游戏助手,并实装了“超空间内存技术”,可在保持前台流畅的同时大幅提升后台保活效率。该技术原计划于 6 月推送,此次实装时间更早。此前发布的 Pura 90 Pro Max 也支持此技术,宣称可实现“12G 的内存 16G 的保活体验”。

产品更新端侧
11:35
公众号:面壁智能(MiniCPM)
精选61
PilotDeck 开源:以 WorkSpace 为核心的智能体操作系统

清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9stars 联合研发并开源的智能体操作系统 PilotDeck,以 WorkSpace(工作舱)替代传统对话框,每个工作舱拥有独立文件系统、记忆和技能,实现项目隔离。三大核心能力:记忆白盒化,全链路可见可控,支持一键修改和回滚;智能路由,自动识别任务难度动态分配模型,开启后成本节省近 70%,复杂任务仅用 1/6 成本即可反超顶级模型方案;Always-on 常驻任务,AI 主动发现并持续推进工作。支持端云协同,可调用端侧模型作为子 Agent,自动部署 VoxCPM 等模型完成多语言播客等任务。

智能体产品更新端侧部署/工程

推荐理由:PilotDeck把Agent从对话框解放进「工作舱」,记忆可见、成本锐减、能无人值守运行。已开源,值得所有被多任务折磨的开发者试试。
11:31
Berryxia.AI@berryxia
58
Google发布新一代Coral板,本地AI进入生产力时代

Google发布最新Coral开发板,搭载Gemma系列模型,实现高效的本地设备端AI。核心演示包括板载实时语音翻译、通过自然语言控制硬件,以及利用视觉与声音生成音乐。此次升级的关键在于无需云端联网,解决了传统本地AI在延迟、隐私和成本方面的痛点。通过硬件与模型的深度结合,Google将AI的应用场景从云端拉回设备本地,计划于今年夏天推出。

Google Gemma: Introducing the newest Coral board, for efficient, on-device AI! Check out the demos in the video: - On-board speech tra...

Google产品更新端侧语音
10:14
IT之家(RSS)
同事件精选74
人民日报专访华为何庭波:今年秋季的新麒麟手机芯片,性能等相比去年是"跳跃性"提升

华为何庭波提出半导体新演进路径“韬(τ)定律”,以“时间缩微”(如逻辑折叠)替代“几何缩微”作为新指导原则。她表示,过去6年华为已基于此自主研发381款芯片。今年秋季将发布新的麒麟手机芯片,这是首个完整的“韬芯片”,其性能、集成度相比去年是“跳跃性”提升。

大佬观点端侧
同一事件,精选展示《华为何庭波"韬定律"论文发布,逻辑折叠技术提升芯片性能》
推荐理由:华为提出「韬定律」替代摩尔定律,不是空谈,何庭波说新麒麟芯片性能跳跃提升,证明了这条路的可行性。对半导体行业是一次认知冲击。
08:00
HuggingFace Daily Papers(社区热门论文)
64
内存主导但非带宽受限:批量1大语言模型解码在物理AI推理中的差距

研究表明,物理AI系统中的批量1大语言模型解码是内存主导的,但更快的内存并不带来比例性的延迟收益。通过对三款7-8B级别的GQA Transformer模型在四款NVIDIA GPU上的测量发现,例如在Qwen-2.5-7B(上下文长度2048)场景下,L4能达到其内存地板的81%,而H100仅为27%。CUDA Graphs优化在H100上将解码延迟提升1.259倍,在L4上仅为1.028倍。部署方面,常见的量化路径未能完全兑现预期的4倍权重流量削减,例如AutoAWQ+Marlin在bf16基线62.32 ms/step上优化至45.24 ms/step,而GPTQ+ExLlamaV2能达到17.36 ms/step。

推理端侧论文/研究部署/工程
01:34
Google Research:Blog(网页)
精选70
通过零信任聚合实现的隐私分析

Google Research 推出了一种新的隐私分析解决方案。该方案结合了一种新的密码学安全聚合协议与可信执行环境(TEE)的透明性,旨在实现前沿的隐私与安全保证。其核心是基于零信任原则,通过密码学与硬件保护的结合,确保系统仅能获取群体的匿名化聚合洞察。

Google安全/对齐端侧论文/研究

推荐理由:Google 的隐私聚合新方案把多轮交互砍成一次提交,对做设备端联邦分析的人来说是工程上的一大步,而且结合 TEE 做双层防护,这个思路值得抄。
5月27日
23:05
Rohan Paul@rohanpaul_ai
40
华为LogicFolding芯片技术:垂直堆叠实现性能提升

华为推出“LogicFolding”芯片设计技术,旨在不依赖单纯缩小晶体管制程,以缩小与竞争对手的差距。其核心思想是通过垂直堆叠活跃电路层,将关键信号路径“折叠”向上,从而缩短导线长度、减少寄生延迟并收紧时钟偏差,最终在不改变器件节点的情况下提升芯片频率。此技术并非传统3D封装,其深层创新在于将芯片拓扑结构本身变为一种性能缩放工具。华为指出,该技术能大幅压缩相邻触发器间的传播时间,收紧关键路径。预计其高端芯片将在2031年实现等效于14 Å(1.4 nm)工艺的晶体管密度。

Huawei: What is LogicFolding? For circuit design, it aggressively compresses propagation time between adjacent flip-flops, tight...

端侧行业动态
22:14
IT之家(RSS)
34
蔚来 ES9 旗舰 SUV 正式上市:整车购买 49.8 万-62.8 万起,租电 39 万-52 万元起
端侧行业动态
22:14
IT之家(RSS)
54
【IT之家实拍】雷鸟 GT Max 智能眼镜图赏:突破光学痛点,把 267 吋巨幕戴在头上

雷鸟推出两款AR眼镜:主打观影的GT Max采用孔雀光引擎3.0 Max与PWG光学结构,搭载视涯5.5代Micro-OLED双层面板,提供267英寸巨幕体验与1200nits峰值亮度,售价2599元(国补后2209元)。另一款AI拍摄眼镜V4仅重38g,具备IP67防水,首发OG09B方形传感器,支持2.5K画质与11.5小时续航,售价2199元(国补后1869元)。

产品更新多模态端侧
21:14
IT之家(RSS)
52
雷鸟V4 AI拍摄眼镜发布:首发方形传感器,售价2199元起

雷鸟创新发布雷鸟V4 AI拍摄眼镜,标准版售价2199元,国补后1869元起,5月30日交付。该机型聚焦AI响应速度优化,采用高通骁龙AR1与恒玄BES2800BP双芯架构,引入通义千问模型,AI最快响应0.2秒,较上一代提升超138%。电池容量提升57%,连续视频录制可达约47分钟。影像方面,首次搭载1/2.9英寸、1:1方形传感器OG09B,单像素尺寸2.09微米。防护等级提升至IP67,整机重量约38克。

产品更新多模态端侧
21:14
IT之家(RSS)
40
【IT之家评测室】把 267 吋巨幕戴在头上、将 AI 融入日常:雷鸟 GT Max / V4 智能眼镜评测
多模态端侧评测/基准
21:14
IT之家(RSS)
32
雷鸟发布旗舰 AR 眼镜 GT / GT Max:最大 59 度视场角,1899 元起

雷鸟发布旗舰AR眼镜GT系列。旗舰GT Max具备59度FOV视场角,搭载“孔雀光学引擎 3.0 Max”与5.5代Micro OLED屏幕,支持杜比视界与AI HDR功能,配备双芯片,整机重量78克,售价2599元。轻量化版本GT视场角为46度,重量68克,售价1899元。两款产品已开启预售。雷鸟还预告将于2026年Q3推出AI眼镜新系列“雷鸟 iO”。

产品更新端侧
19:50
公众号:面壁智能(MiniCPM)
59
面壁智能发布 MiniCPM5-1B 端侧基座模型,FlagOS 完成云到端跨芯片 Day-0 适配

5月25日,面壁智能发布并开源端侧基座模型MiniCPM5-1B。该模型以1B参数在AA-Index获17.9分,超越所有4B以下开源基座模型。INT4量化后权重仅0.5GB,可在90%以上终端运行。FlagOS社区通过vLLM-plugin-FL推理插件完成跨芯片适配,覆盖英伟达、华为昇腾等8类AI芯片及ARM端侧,支持int8、bf16、fp32精度。多款芯片首token延迟低于NVIDIA H20原生基线;平头哥真武810E在长序列场景下单位算力token吞吐量达H20的93.3%和95.3%。

开源生态教程/实践端侧
18:14
IT之家(RSS)
51
龙芯中科首款 GPU 芯片 9A1000 即将回片进入测试阶段
端侧行业动态
17:14
IT之家(RSS)
26
联想上架 2026 款 ThinkPad X13 笔记本:锐龙 AI 7 445 + 32GB RAM,10999 元起
产品更新端侧
17:14
IT之家(RSS)
24
零刻推出三款基于酷睿 3 304 处理器的迷你主机

零刻(Beelink)推出三款基于英特尔酷睿 3 304 处理器(属于“Wildcat Lake”平台)的迷你主机,型号涵盖 EQ mini、EQi 和 ME Pro 系列。三款产品均采用板载 UFS 3.1 存储,配备至少双 USB4 40Gbps 接口和 10GbE 有线网口。其中,EQi 和面向 NAS 应用的 ME Pro 机型还提供了第二个 2.5GbE 网口。性能方面,酷睿 3 304 相较于酷睿 i3-N305,在 CPU 单核与多核性能上分别提升 120% 和 60%,并依托 GPU 和 NPU 提供合计 24TOPS 的 AI 算力。

端侧行业动态
16:14
IT之家(RSS)
62
联想推出"AI 童伴机"智能硬件:可翻折 5MP 摄像头、2 英寸面板 + 实体 SOS 按键,599 元
产品更新多模态端侧
16:14
IT之家(RSS)
40
华为手机 / 平板 / 电脑同源设计:余承东发布全新一代鸿蒙智行 HarmonyOS 专属座舱

在鸿蒙智行问界 M9 系列新品发布会上,华为发布全新一代鸿蒙智行 HarmonyOS 专属座舱。该座舱采用华为手机/平板/电脑同源设计,支持卡片/应用/文件夹自由组合布局,操作效率提升 70%,并支持 3D 空间极简控车。此外,座舱配备专属小艺,具备类人思考架构、跨设备协同及模糊目的地导航等功能。

产品更新端侧语音
15:14
IT之家(RSS)
28
精英电脑将在台北国际电脑展 2026 展出多款迷你主机,含 "WCL" 平台产品
端侧行业动态
14:14
IT之家(RSS)
62
9.4 秒生成 512×512 图像,Bonsai Image 4B 生图 AI 登陆苹果 iPhone 17 Pro Max
图像生成模型发布端侧
14:14
IT之家(RSS)
21
理想汽车产品线负责人汤靖:自 L9 Livis 发布后几乎看不到说"理想没技术"这种观点

理想汽车产品线负责人汤靖表示,自L9 Livis发布后,“几乎看不到说‘理想没技术’的观点了”。该车搭载三大技术:首个“完全体”线控底盘(含EMB线控机械制动)、行业首款5nm车规级AI芯片马赫100(算力2560TOPS,号称是英伟达Thor-U的3倍)及800V全独立主动悬架。新车售价50.98万元。

端侧行业动态
12:19
HuggingFace Daily Papers(社区热门论文)
67
MobileMoE:扩展设备端混合专家系统

MobileMoE是一系列面向设备端部署的大语言模型,采用混合专家架构,其活动参数规模为0.3-0.9B,总参数量为1.3-5.3B。该研究在移动设备内存与算力约束下,确定了“中等稀疏度结合细粒度共享专家”的最优架构设计。通过涵盖预训练、中期训练、指令微调与量化感知训练的四阶段流程,MobileMoE在14个基准测试中,以2-4倍更少的推理FLOPs达到或超越了领先的设备端密集模型性能,并以最多60%更少的参数量匹配或超过了先进的OLMoE-1B-7B模型。在商用智能手机上,其预填充和解码速度分别比密集基线MobileLLM-Pro快1.8-3.8倍和2.2-3.4倍。

推理端侧论文/研究
11:13
IT之家(RSS)
44
消息称华为协同认证功能正在逐步适配上线,可在锁屏状态下免解锁使用小艺部分语音指令

华为协同认证功能正在逐步适配上线。该功能允许用户在设备锁屏时,通过附近协同设备(如华为AI眼镜)确认身份后,直接使用小艺的部分语音指令,无需手动解锁。目前华为AI眼镜已完成适配,后续将逐步支持更多耳机、手表等设备。

产品更新端侧语音
10:27
Berryxia.AI@berryxia
62
PrismML推出官方iOS应用"Bonsai Studio",允许用户在iPhone或iPad上完全本地运行Bonsai Image 4B图像生成模型。该模型基于FLUX.2 Klein,通过1-bit/3-bit量化将权重从7.75GB压缩至0.93GB。在iPhone 15 Pro及以上设备,生成一张512×512图片约占1.5GB内存,1024×1024约占2GB,全程离线推理,无需联网或支付token费用。应用免费,支持多种风格,可用于教学素材等轻量场景,但生成中文文字存在乱码。此外,M芯片的Mac电脑也可下载该iOS客户端使用,不过需要重启并降低设备安全策略。Android端暂无官方App,可通过网页版体验。

Berryxia.AI: iPhone 上直接用 App Store 下载就行: 👉 Bonsai Studio - PrismML 官方 iOS 应用,免费安装,模型在手机本地跑 我觉得给学校老师做一些素材展示,或者幼儿园小朋友教学还是可以的。 不需要额外的TO...

图像生成教程/实践端侧
10:13
IT之家(RSS)
47
新一代华为鸿蒙智家官宣 6 月 1 日发布,主打"全生态 AI 进化"

华为宣布将于6月1日的nova 16系列及全场景新品发布会推出新一代华为鸿蒙智家,主打“全生态 AI 进化”。该品牌依托AI语音、PLC连接、星闪连接等技术,提供涵盖照明、安防等场景的智慧解决方案。此前发布的鸿蒙智家小艺管家6.0版本已接入AI大模型,支持3D方位控灯。

端侧行业动态
10:13
IT之家(RSS)
56
蔚来 ES9 官宣首发蔚来世界模型全新版本,6 月同步推送至 Banyan、Cedar、Cedar S 系统全量车型
产品更新具身智能端侧
09:27
Berryxia.AI@berryxia
72
Bonsai Studio:iPhone端侧离线图像生成应用上线

PrismML发布官方iOS应用Bonsai Studio,用户可免费下载,在iPhone上本地离线运行其Bonsai Image 4B扩散模型。该模型基于FLUX.2 Klein,其1-bit压缩版仅0.93GB,比全精度版小8.3倍。在iPhone 15 Pro及以上机型生成512×512图像耗时约几十秒,内存占用约1.5GB。应用支持多种风格,但中文文字生成目前为乱码。Android用户可通过WebGPU网页版体验。

Berryxia.AI: 兄弟们,端侧生图模型又有新东西了! 之前有客户端Drawthing 客户端也是支持iPad 手机进行文生图~ 今天PrismML也来了一个好玩的... 他们发布了1-bit和Ternary版本的Bonsai Image 4B扩散模型。 1-...

图像生成端侧评测/基准
09:13
IT之家(RSS)
52
微软 Win11 今年 AI 规划曝光:图片表格转 Excel、任务栏 Ask Copilot

微软计划于 2026 年为 Windows 11 推出两项 AI 功能。一项是将 Ask Copilot 集成至任务栏,通过升级的 Composer 体验接入 Microsoft 365 Copilot 及后台 AI 智能体,便于用户直接查询公司政策与任务信息。另一项是为 Click to Do 功能整合 Excel 表格提取工具,该功能在 Windows 11 AI+ PC 上可利用本地视觉模型,将图片或网页中不可复制的静态表格数据识别并转换为可编辑的 Excel 文件。

Microsoft产品更新端侧
08:27
Berryxia.AI@berryxia
56
oMLX发布v0.3.11:专注稳定性,打造"开箱即用"的本地AI体验

oMLX项目发布了v0.3.11版本,这是一个基于Apple MLX框架、旨在提升Apple设备端侧模型性能的项目。本次及前几轮更新均以在高内存压力下的稳定性为首要目标,开发者正呼吁用户对此进行更多测试。该项目由一位有全职工作的独立开发者维护,其核心目标是提供“开箱即用”的本地AI体验——让用户无需阅读文档或调整参数,甚至在模型下载过程中即可开始对话,从而降低本地AI的使用门槛。

Jun Kim: Just released oMLX v0.3.11. The last few updates have focused on stability as my top priority, and I'm planning to ship ...

GitHub产品更新开源/仓库端侧
08:13
IT之家(RSS)
58
消息称马斯克讨论过合并 Tesla 与 SpaceX 的可能

据美媒报道,埃隆·马斯克已与同事讨论过合并旗下Tesla与SpaceX两家公司的可能性。尽管业务领域不同,但受汽车行业智能化加速及对xAI合并的影响,这两家企业正逐步蜕变为“AI驱动型企业”,在构建强大算力基础设施方面目标一致。双方存在长期资源共享与交易基础,例如SpaceX采购Tesla的Cybertruck、Megapack等产品,Tesla则委托SpaceX开发合金材料。合并面临的主要财务阻力包括存续公司选择、估值设定及少数股东权益保护等问题。

端侧行业动态
07:37
Artificial Analysis@ArtificialAnlys
67
OpenBMB发布1B参数模型MiniCPM5-1B,在小规模开源模型中表现最优

OpenBMB发布了MiniCPM5-1B(Non-reasoning),一款1B参数的稠密大语言模型。该模型在Artificial Analysis Intelligence Index上获得17.9分,成为1B及以下开源模型中得分最高者。其得分领先同规模模型Qwen3.5 0.8B(10.5分)和Qwen3.5 2B(16.3分),性能超越前代模型MiniCPM-V 4.6 1.3B(12.7分)。MiniCPM5-1B为纯文本模型,上下文窗口128K,采用Apache 2.0许可证。在AA-Omniscience测试中,其通过选择“拒绝回答”而非猜测,避免了模型幻觉惩罚,获得了同尺寸类别的最高分。

开源生态模型发布端侧
07:27
Berryxia.AI@berryxia
71
PrismML发布Bonsai Image 4B极致压缩版本

PrismML发布了Bonsai Image 4B扩散模型的1-bit和Ternary两个极致压缩版本。1-bit版本仅0.93GB,比全精度模型缩小8.3倍;Ternary版本为1.21GB,采用-1、0、+1三元权重。两者在Mac M4 Pro上的生成速度最高可提升5.6倍,且生成质量可与更大模型相媲美。同时,PrismML推出了配套的iOS应用Bonsai Studio,支持在iPhone上完全离线、本地生成图像。

PrismML: Today we're releasing 1-bit and Ternary Bonsai Image 4B. A new family of image-generation models designed to run high-qu...

图像生成模型发布端侧
00:13
IT之家(RSS)
63
首个被纳入的 AI 训练推理芯片,摩尔线程 MTT S5000(PH100 芯片)通过国家《安全可靠测评》

摩尔线程 MTT S5000(基于 PH100 芯片)成为首款通过国家《安全可靠测评》的人工智能训练推理芯片。该芯片单卡 AI 算力(稠密)达 1000 TFLOPS,配备 80GB 显存(带宽 1.6TB/s),卡间互联带宽为 784GB/s。

推理政策/监管端侧
5月26日
22:00
Hacker News 热门(buzzing.cc 中文翻译)
69
荷兰阻止美国收购一家关键数字供应商

荷兰政府罕见阻止了美国对一家关键数字供应商的收购,此举旨在保护其数字基础设施。收购涉及的美国公司名称未公开,但荷兰认为该交易可能威胁其经济安全与技术主权。

政策/监管端侧
19:13
IT之家(RSS)
42
存内 AI 计算企业 TetraMem 完成 22nm SoC 验证,瞄准低功耗低延迟应用

硅谷AI芯片初创企业TetraMem完成22nm SoC MLX200在台积电制程上的芯片验证,评估套件预计2026H2推出。该芯片采用存内计算技术,通过模拟内存计算直接在内存中完成向量矩阵乘法,瞄准可穿戴设备、边缘IoT等低功耗低延迟应用场景。

推理端侧行业动态
19:13
IT之家(RSS)
55
卢伟冰:小米不会把内存涨价成本转嫁给消费者,今年七八月将发布新一代 OS

小米集团总裁卢伟冰在财报电话会上表示,小米手机全球市场份额连续 23 个季度稳居前三,手机均价及海外均价创历史新高,毛利率超预期。他强调将坚定推进高端化与全球化,并用 AI 重塑手机业务,今年超级小爱与 miclaw 合体是关键节点。面对存储涨价,小米表示不会简单地将成本转嫁消费者,将通过产品矩阵升级与软件优化平衡规模与利润,并透露今年七八月将发布带来新交互体验的新一代 OS。

端侧行业动态语音
‹ 上一页
1…1415161718…31
下一页 ›