AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「端侧」清除
5月5日周二
01:18Chubby♨️72精选KroWork:将对话转化为本地桌面应用的AI智能体
00:14IT之家(RSS)29倍耐力把传感器塞进轮胎,力图让车辆知道自身精确位置、应对周边环境
5月4日周一
16:14IT之家(RSS)37三星新一代 AI 家电获得新技能:冰箱能帮你整理食材购物清单
13:13IT之家(RSS)48AMD 锐龙 AI Max+ PRO 495 处理器现身:8065S 核显,192GB 内存
07:13IT之家(RSS)45曝英伟达提前终止部分 Jetson 产品供应,LPDDR4 内存短缺成主因
5月3日周日
23:50Hacker News 热门(buzzing.cc 中文翻译)67Show HN: 苹果的Sharp通过ONNX Runtime Web在浏览器中运行
23:13Berryxia.AI60兄弟们!苹果又在偷偷干一件大事
09:12IT之家(RSS)34消息称第二代豆包 AI 手机有机会上半年发布,搭载骁龙 8 Elite Gen 5 芯片
07:12IT之家(RSS)25苹果 iOS 27 系统前瞻:卫星通信新增多项功能、全新虚拟键盘,预计 WWDC 26 亮相
06:19Orange AI34做马桶的 Toto 也是 AI 概念股了 但做智能马桶的做芯片好像也挑不出毛病?
5月2日周六
21:12IT之家(RSS)7影石 GO Ultra x Hello Kitty 限定版口袋相机 5 月 14 日发布
16:14-Zho-48基于iPod改造的AI硬件iA设计构想
15:11IT之家(RSS)36威联通推出 GPU-Ready 边缘 AI 存储服务器 QAI-h1290FX
14:48宝玉52为省25美元WiFi费,开发者在跨洋航班上用笔记本离线运行AI处理工作11小时
14:11IT之家(RSS)36AMD 第一方迷你主机锐龙 AI Halo 实物现身,消息称 6 月推出
11:11IT之家(RSS)21微软 Win11 预览版 Beta 和 Experimental 四大版本集体更新,全新运行对话框、支持 ISO 下载(更新日志一览)
5月1日周五
22:11IT之家(RSS)27瑞莎 5 月 30 日联手高通举行 AI 开发者日,将发布飞牛 AI NAS
20:11IT之家(RSS)42安克首款神经网络存算一体 AI 音频芯片"ANKER Thus"5 月 22 日发布,同期推出旗舰耳机产品
14:11IT之家(RSS)51三星官宣停产 LPDDR4/X 内存,产能聚焦 LPDDR5/X 与 HBM 等 AI 需求产品
11:11IT之家(RSS)55苹果 FY2026Q2 研发支出 114 亿美元创新高,同比增长 34% 加码 AI
11:11IT之家(RSS)34流畅度最高提升 30%:华硕 ROG Xbox Ally X 掌机"自动超分"功能预览上线
10:00公众号:面壁智能(MiniCPM)46面壁智能与瑞芯微达成战略合作,端侧"芯片+模型"协同驱动座舱智能升级
07:10IT之家(RSS)50苹果 CEO 库克:Mac Studio 和 Mac Mini 将在未来数月内供不应求
01:44TestingCatalog News 🗞55苹果内部测试AFM Plus 150B大模型
4月30日周四
22:43Hacker News 热门(buzzing.cc 中文翻译)43Meta因目睹智能眼镜用户发生性行为的员工遭解雇而陷入争议
20:42The Decoder:AI News(RSS)49Tencent 发布 440 MB AI 模型,可在手机上离线翻译 33 种语言
17:10IT之家(RSS)62快手推出 AI 桌面智能体 KroWork,支持通过自然语言生成本地应用
15:09IT之家(RSS)24华硕 2026 款 ProArt 创 13 笔记本新增"AI Max+ 395 处理器、128GB RAM 1TB SSD 版本",28999 元
15:09IT之家(RSS)51英特尔携手 AMD 发布 ACE 架构提升 AI 性能,x86 矩阵计算密度提升 16 倍
10:34IT之家(RSS)46三星 Galaxy Glasses 智能眼镜曝光:骁龙 AR1 芯片、1200 万像素相机、重约 50 克
10:34IT之家(RSS)31ASUSTOR 预热 Flashstor Gen3 全闪 NAS,用上 8640U
10:00公众号:面壁智能(MiniCPM)53面壁智能与安波福达成战略合作,端侧AI座舱方案走向全球市场
10:00公众号:面壁智能(MiniCPM)20端侧智舱启新程 面壁智能以技术创新赋能汽车智能化变革
08:00HuggingFace Daily Papers(社区热门论文)62MiniCPM-o 4.5:迈向实时全双工全模态交互
07:34IT之家(RSS)45苹果 AI 眼镜曝光:内置 2 颗摄像头、支持 Siri 智能交互、可手势控制
00:36Tomer Tunguz 博客(VC 分析)57精选AI推理市场的专业化分化
4月29日周三
23:34IT之家(RSS)35倍耐力买下 Univrses 30% 股份,加码 AI 轮胎技术
22:17Tencent Hy67精选腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型,440MB体积支持手机离线运行
20:33Qwen60精选闪存QLA:基于TileLang构建的高性能线性注意力内核
20:33Qwen66精选闪速QLA:基于TileLang构建的高性能线性注意力内核
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月5日
01:18
Chubby♨️@kimmonismus
精选72
KroWork是一款创新的桌面AI智能体,其核心在于"应用固化"能力,能将对话直接转化为持久可用的本地软件。它不止于生成代码建议,而是端到端自主执行任务,并将完整工作流保存为名为"Kro App"的独立应用。用户一键安装后,该应用即可像常规软件一样运行,无需重复消耗tokens或重建流程。所有操作均在本地设备完成,无需编程背景,且数据完全脱离云端。这标志着AI从对话助手向能构建并交付实体软件的工具转变。

KroWork: Your AI chatbot can't ship. It answers. It suggests. It generates code you still have to wire up yourself. Close the tab...

智能体MCP/工具产品更新端侧

推荐理由:当别人还在帮你写代码,KroWork 直接把对话冻成 App 放在你桌面上。不建仓库不费 token,跟用 Excel 一样打开,这种 chat-to-software 的思路比所有 coding agent 都更接近普通人想要的 AI。
00:14
IT之家(RSS)
29
倍耐力把传感器塞进轮胎,力图让车辆知道自身精确位置、应对周边环境

倍耐力与瑞典科技公司Univrses合作,持有其30%股权,以强化Cyber Tyre智能轮胎技术。该系统将传感器集成于轮胎内部,结合外部摄像头和AI计算机视觉,使车辆能精确感知自身位置并实时应对环境变化。2025年,双方在意大利普利亚大区启动道路监测试点,利用轮胎数据与视觉技术构建持续更新的道路地图。该技术仍处概念验证阶段,但已进入深入开发,未来轮胎有望成为互联出行中的重要数据源。

端侧行业动态
5月4日
16:14
IT之家(RSS)
37
三星新一代 AI 家电获得新技能:冰箱能帮你整理食材购物清单

三星为其新一代AI家电推出多项智能功能。冰箱搭载Vision AI技术,可自动识别内部食材、推荐菜谱,并将缺少的食材加入Instacart购物清单,用户还能通过手机远程查看库存。AI烤箱能识别菜品并推荐烹饪时间,支持录制烹饪过程。部分功能由谷歌Gemini支持,高级食物识别等更新计划于5月推送。同时,Bixby助手升级为个性化家庭助手,可通过Voice ID识别不同用户。不过,相关产品售价较高,AI冰箱起售价为2799美元。

产品更新端侧
13:13
IT之家(RSS)
48
AMD 锐龙 AI Max+ PRO 495 处理器现身:8065S 核显,192GB 内存

AMD 锐龙 AI Max+ PRO 495 处理器近日现身基准测试数据库,预计将成为锐龙 AI Max 400 “Gorgon Halo”商用系列的旗舰型号。该处理器采用16核心32线程设计,并集成了Radeon 8065S核显。测试信息显示其配备了高达192GB的LPDDR5X内存,测试平台疑似为惠普笔记本电脑。相比前代锐龙AI Max+ PRO 395(搭载Radeon 8060S核显,最大内存128GB),新款在CPU与GPU频率以及官方标称内存速度上均有所提升。

产品更新端侧
07:13
IT之家(RSS)
45
曝英伟达提前终止部分 Jetson 产品供应,LPDDR4 内存短缺成主因

据供应商Connect Tech消息,因LPDDR4内存短缺,英伟达将提前终止部分Jetson产品线供应。受影响型号包括Jetson TX2 NX、TX2i、AGX Xavier 32GB工业版及Xavier NX(8GB/16GB)。相关型号已被标记为“不可取消、不可退货”,新订单须在7月1日前提交,现有订单将于7月15日转为不可退状态,最后发货日期为2025年7月15日。采用LPDDR5内存的新款Orin和Thor产品仍可采购,但价格已上涨。

端侧行业动态
5月3日
23:50
Hacker News 热门(buzzing.cc 中文翻译)
67
Show HN: 苹果的Sharp通过ONNX Runtime Web在浏览器中运行

苹果的图像处理库Sharp现可通过ONNX Runtime Web在浏览器中直接运行。该项目已在GitHub开源,实现了将原本依赖本地Node.js环境的Sharp功能迁移至Web平台,用户无需本地安装即可在浏览器中进行图像处理。该发布在Hacker News上获得了103点关注度,展示了Web端机器学习与本地工具融合的新进展。

开源/仓库端侧
23:13
Berryxia.AI@berryxia
60
兄弟们!苹果又在偷偷干一件大事

苹果近期悄然调整Mac产品线内存配置与定价。Mac mini取消599美元256GB入门款,起售价升至799美元/512GB;Mac Studio也移除了512GB统一内存选项,且256GB升级价暴涨400美元。这并非简单存储升级,而是因AI数据中心导致全球DRAM供应紧张、价格飙升。Tim Cook指出AI需求超预期,导致Mac供货紧张数月。苹果通过砍掉低配和高配、整体上移配置阶梯变相提价,对依赖统一内存进行本地大模型推理的用户而言,高性价比硬件窗口期可能快速关闭。

stevibe: The Mac mini price hike doesn't look like a one-off. It looks like a pattern, and if you run local LLMs, you should pay ...

现象/趋势端侧
09:12
IT之家(RSS)
34
消息称第二代豆包 AI 手机有机会上半年发布,搭载骁龙 8 Elite Gen 5 芯片

据博主爆料,第二代豆包AI手机有望于今年上半年发布,预计将搭载高通骁龙8 Elite Gen 5芯片。此前,中兴通讯已在业绩说明会上确认,正与字节跳动深化合作,共同推进新一代豆包AI手机的研发与落地。作为前代参考,首款搭载豆包手机助手技术预览版的工程样机努比亚M153已于2025年12月少量发售。豆包手机助手是豆包大模型与手机厂商在操作系统层面合作的AI助手。

端侧行业动态
07:12
IT之家(RSS)
25
苹果 iOS 27 系统前瞻:卫星通信新增多项功能、全新虚拟键盘,预计 WWDC 26 亮相

苹果 iOS 27 系统预计于 WWDC 26 大会亮相,9月正式推送。新系统将推出独立 Siri 应用,支持类 ChatGPT 的交互,并新增灵动岛界面。卫星通信功能迎来重大升级,包括通过卫星使用 Apple Maps、收发 iMessage 图片等四项新功能,可能为搭载 C2 基带的 iPhone 18 Pro 系列机型独占。系统将效仿“雪豹”策略,专注于质量修复与性能提升。此外,还正在测试具备增强自动纠错功能的全新虚拟键盘,并可能引入系统级 UI 透明度调整滑块等智能新功能。

产品更新端侧
06:19
Orange AI@oran_ge
34
做马桶的 Toto 也是 AI 概念股了 但做智能马桶的做芯片好像也挑不出毛病?
端侧行业动态
5月2日
21:12
IT之家(RSS)
7
影石 GO Ultra x Hello Kitty 限定版口袋相机 5 月 14 日发布

影石宣布将于5月14日20:00发布GO Ultra x Hello Kitty限定版口袋相机。该限定版基于2025年8月发布的Insta360 GO Ultra相机打造,原版售价2598元,重53克,支持4K60fps视频拍摄。其核心配置包括1/1.28英寸传感器和5nm AI芯片,并支持4K两倍无损变焦。续航上,结合拓展舱可实现最长200分钟(1080p)录制,单相机则支持70分钟(1080p)。此外,该产品还具备SD卡自由替换、智能音频降噪、2.5英寸翻转触屏、FlowState防抖、360°水平矫正以及10米防水(单相机)等功能特性。

产品更新端侧
16:14
-Zho-@ZHO_ZHO_ZHO
48
作者提出一种名为iA的AI硬件设计构想,其核心是手机与专用AI硬件配合使用的过渡方案。该硬件主体设计灵感来源于iPod Shuffle,具备小巧、可夹持的特性,并设有语音交互按键和调用手机功能的按键。作者认为,未来手机与AI硬件终将融合,但目前阶段分离设计有助于避免增加手机复杂度。此次构想是继经典的iPod shuffle方案后,结合iPod Nano 4进行的新尝试。

-Zho-: 简单基于Apple已有产品p了一下自己目前理想的 AI 硬件设计:iA 最基础想法:手机+AI硬件配合使用,因为离不开手机,同时不想增加手机复杂度(过渡时期想法,未来一定会合一) iA 主体:来自iPod Shuffle,可独立交互,小巧且...

大佬观点端侧
15:11
IT之家(RSS)
36
威联通推出 GPU-Ready 边缘 AI 存储服务器 QAI-h1290FX

威联通发布专为边缘AI设计的存储服务器QAI-h1290FX。该服务器搭载AMD EPYC 7302P处理器(16核32线程),预装128GB内存,提供12个2.5英寸U.2/SATA SSD盘位、4条PCIe Gen4插槽以及2个25GbE和2个2.5GbE网络端口。其关键特性是支持安装NVIDIA RTX PRO 6000 Blackwell Max-Q工作站显卡,并配备750W电源。产品旨在提供开箱即用的本地AI计算体验,让用户无需复杂配置即可在本地运行AI模型并完全掌控数据。

产品更新端侧部署/工程
14:48
宝玉@dotey
52
一位中国开发者在跨大西洋航班上,为节省25美元机上WiFi费用,利用MacBook Pro M4本地离线运行Llama 3.3 70B大模型,自主处理客户任务长达11小时。他编写了一个具备资源感知能力的编排器,该系统明确知晓自身处于离线状态,且受限于电池和内存。它能自动从队列获取任务,通过本地推理服务处理,并定期保存检查点。当电池低于5%时,系统会暂停并等待切换至充电宝后恢复运行,最终在无人干预下清空所有任务。这一案例展示了完整的"自我感知计算"离线AI工作流。

huangserva: 这个也太屌了! 这个中国开发者在飞机上用 MacBook 本地跑 Llama 70B,整整 11 小时没有网络,处理了完整的客户项目。 他坐在跨大西洋航班的靠窗位置,设备是 MacBook Pro M4,64GB 内存。机上 WiFi 要价...

Meta推理教程/实践端侧
14:11
IT之家(RSS)
36
AMD 第一方迷你主机锐龙 AI Halo 实物现身,消息称 6 月推出

AMD第一方迷你主机锐龙 AI Halo实物照片在Reddit上被分享,确认了设备设计。该主机基于AMD锐龙 AI Max+ 395处理器,最高支持128GB统一内存,造型方正,顶部有AMD企业徽标,四周环绕ARGB灯带,后置接口包括多个USB-C、HDMI和有线网口。消息称这款设备将在今年6月正式推出。

产品更新推理端侧
11:11
IT之家(RSS)
21
微软 Win11 预览版 Beta 和 Experimental 四大版本集体更新,全新运行对话框、支持 ISO 下载(更新日志一览)

微软发布了四个Windows 11内部测试预览版本更新。Beta预览版为AAD用户带来了更智能的共享菜单,可直接在共享位置发现和安装应用;创建Dev Drive时现支持以GB为单位指定大小。Experimental预览版推出了全新设计的运行对话框,拥有更现代的界面;小组件默认设置更安静,默认禁用鼠标悬停打开和任务栏徽章;文件资源管理器修复了加载闪烁和重复显示问题;Windows放大镜支持直接输入精确缩放百分比。此外,微软承诺将在Beta和Experimental渠道的定期版本中提供可下载的ISO文件。

Microsoft其他端侧
5月1日
22:11
IT之家(RSS)
27
瑞莎 5 月 30 日联手高通举行 AI 开发者日,将发布飞牛 AI NAS

Radxa(瑞莎)将于5月30日在深圳与高通联合举办AI开发者日活动,主题为“AI共进·开源新生”。活动上将正式发布与飞牛深度合作的AI NAS产品,该产品基于高通平台。此外,瑞莎还将推出多款基于高通平台的新品,包括迷你主板、核心板和Cluster计算集群等,旨在为终端侧AI部署提供灵活可扩展的硬件支持。

产品更新开源生态端侧
20:11
IT之家(RSS)
42
安克首款神经网络存算一体 AI 音频芯片"ANKER Thus"5 月 22 日发布,同期推出旗舰耳机产品

安克将于5月22日发布其首款神经网络存算一体AI音频芯片“ANKER Thus”。该芯片采用CPU与存储合一的架构,旨在提升算力,以实现端侧实时音频AI功能。同期,安克将推出搭载此芯片的旗舰耳机产品。根据海报信息,该耳机为入耳式设计,充电盒外观圆润,且正面可能配备一块屏幕,具体规格尚未公布。

产品更新端侧语音
14:11
IT之家(RSS)
51
三星官宣停产 LPDDR4/X 内存,产能聚焦 LPDDR5/X 与 HBM 等 AI 需求产品

三星官方已确认停产LPDDR4与LPDDR4X内存,并将产能全面转向LPDDR5、LPDDR5X及HBM等面向AI需求的高利润产品。AI浪潮正驱动内存市场,三星2026年第一季度利润同比飙升约50倍,但供应仍远不能满足需求,预计2027年供需缺口将进一步扩大。这一转型将影响消费市场,入门级手机将被迫采用成本更高的LPDDR5内存,可能导致终端产品价格上涨。

端侧行业动态
11:11
IT之家(RSS)
55
苹果 FY2026Q2 研发支出 114 亿美元创新高,同比增长 34% 加码 AI

苹果2026财年第二财季研发支出达114亿美元,创历史新高,同比增长34%。自2022年约60亿美元起,其研发投入持续陡峭攀升,本季度首次突破百亿美元大关。公司CEO蒂姆·库克表示正大幅增加AI研发投入,资金重点用于产品与服务的全栈AI建设,且研发费用增速远超公司整体增速。然而,与同期Alphabet的170亿美元、Meta的176亿美元研发支出相比,苹果在绝对投入规模上仍存差距,于AI竞争中面临追赶压力。

端侧行业动态
11:11
IT之家(RSS)
34
流畅度最高提升 30%:华硕 ROG Xbox Ally X 掌机"自动超分"功能预览上线

微软面向Xbox Insider成员,在ROG Xbox Ally X掌机推出“自动超分”功能预览版。该AI技术类似DLSS/FSR,通过调用锐龙AI Z2 Extreme处理器的NPU,将720P等低分辨率游戏画面实时提升至1080P或更高,性能最高可提升30%,建议在帧率低于60fps的游戏中使用。功能支持DirectX 10及以上游戏,可按游戏单独开关。同时,微软优化了底座连接体验,连接电视时可自动转移画面并支持VRR,并改进了手柄配对、光标导航及震动反馈等交互细节。

产品更新其他端侧
10:00
公众号:面壁智能(MiniCPM)
46
面壁智能与瑞芯微达成战略合作,端侧"芯片+模型"协同驱动座舱智能升级

面壁智能与瑞芯微宣布达成战略合作,双方将围绕端侧“芯片+模型”协同方案,推动座舱智能化升级。此次合作聚焦于将面壁智能的端侧大模型能力与瑞芯微的芯片平台结合,提升车载场景下的推理效率与响应速度,实现更低延迟、更高隐私保护的本地智能交互体验。合作具体涉及模型部署优化与芯片适配,旨在加速智能座舱产品的落地应用。

端侧行业动态
07:10
IT之家(RSS)
50
苹果 CEO 库克:Mac Studio 和 Mac Mini 将在未来数月内供不应求

苹果CEO蒂姆·库克在财报电话会议上表示,Mac mini和Mac Studio将在未来数月内持续供不应求,预计需几个月才能达到供需平衡。苹果低估了两款产品的需求,因其作为AI和智能体工具的优秀平台,客户认知速度快于预期。目前部分型号发货延迟已达数月,苹果已停售512GB RAM版Mac Studio,并停止接受某些大内存型号订单,基础款Mac mini在美国官网已显示缺货。

端侧行业动态
01:44
TestingCatalog News 🗞@testingcatalog
55
苹果 🍎: "AFM Plus 150B Instruct" Apple Foundation Model 在内部的 AFM Playground 应用中被发现。 这个应用正在被苹果员工内部使用,以测试 Apple Foundation 模型。 WWDC26 将会很火爆 🔥

MWR: ( #appleinternal ) Apple Internally uses an application that looks pretty similar to ChatGPT named AFM Playground, which...

端侧行业动态
4月30日
22:43
Hacker News 热门(buzzing.cc 中文翻译)
43
Meta因目睹智能眼镜用户发生性行为的员工遭解雇而陷入争议

Meta公司因解雇通过智能眼镜看到用户性行为内容的审核员工而引发争议。这些员工负责审查Ray-Ban Stories智能眼镜用户上传的视频,工作中会接触到此类私密内容。部分员工因心理压力提出投诉后遭解雇,引发对Meta工作条件与员工权益的质疑。该事件涉及约200名内容审核员,凸显了科技公司在处理用户生成内容时面临的伦理与劳工保护问题。

Meta端侧行业动态
20:42
The Decoder:AI News(RSS)
49
Tencent 发布 440 MB AI 模型,可在手机上离线翻译 33 种语言

腾讯发布了一款紧凑型开源 AI 翻译模型,其大小仅为 440 MB。该模型支持 33 种语言的互译,并能在智能手机上完全离线运行。腾讯声称,其性能超越了谷歌翻译。这一轻量化设计使得高质量的神经机器翻译无需依赖网络连接即可在移动设备上实现。

开源生态模型发布端侧
17:10
IT之家(RSS)
62
快手推出 AI 桌面智能体 KroWork,支持通过自然语言生成本地应用

快手于4月30日发布AI桌面智能体KroWork。用户可通过自然语言指令驱动AI完成文件处理、浏览器自动化等任务,并能将重复性工作流固化为本地桌面应用,实现零token消耗、输出稳定且保障数据安全。该产品面向市场营销、财务等非技术用户,集成Qwen、Kimi等主流模型,支持沙箱执行和权限管控,旨在降低软件开发门槛,让个人能将日常需求转化为桌面工具。

智能体产品更新端侧部署/工程
15:09
IT之家(RSS)
24
华硕 2026 款 ProArt 创 13 笔记本新增"AI Max+ 395 处理器、128GB RAM 1TB SSD 版本",28999 元

华硕为其2026款ProArt创13笔记本推出了高配新版本,售价28999元。该机型搭载16核心32线程的AMD锐龙AI Max+ 395处理器,配备128GB LPDDR5X内存和1TB PCIe 4.0 SSD。笔记本采用13英寸2880x1800分辨率触控屏,支持360度翻转,机身厚度为15.8mm,重量1.39千克,并配备三热管四出风口散热系统。接口方面提供了HDMI 2.1、两个USB4、一个USB-A 3.2 Gen 2以及MicroSD读卡器等。

产品更新端侧
15:09
IT之家(RSS)
51
英特尔携手 AMD 发布 ACE 架构提升 AI 性能,x86 矩阵计算密度提升 16 倍

英特尔与AMD联合发布人工智能计算扩展(ACE)白皮书,将其确立为x86架构的标准矩阵加速方案。该扩展旨在突破现有SIMD扩展在计算密度与扩展性上的局限,通过引入基于外积运算的矩阵加速机制,无缝集成AVX10。据白皮书数据,在消耗相同数量输入向量的前提下,ACE的计算密度比等效的AVX10乘加运算高出16倍。它支持INT8、FP8、BF16等主流AI数据格式,并计划适配PyTorch、TensorFlow等机器学习框架,目标是为从笔记本电脑到超级计算机的全场景提供高效的矩阵加速支持。

推理端侧行业动态部署/工程
10:34
IT之家(RSS)
46
三星 Galaxy Glasses 智能眼镜曝光:骁龙 AR1 芯片、1200 万像素相机、重约 50 克

三星智能眼镜 Galaxy Glasses 产品信息近日曝光。该眼镜外观类似太阳镜,重量约50克,搭载高通骁龙AR1处理器和1200万像素索尼IMX681传感器,支持Wi-Fi与蓝牙5.3,内置155mAh电池。设备一侧设有摄像头,另一侧有LED指示灯,并集成麦克风、扬声器及触控区,支持快速配对与电量查询。据悉,它未配备内置显示屏,主打音频与AI体验,预计运行Android XR系统并集成Gemini AI助手,可通过语音唤醒。

产品更新端侧语音
10:34
IT之家(RSS)
31
ASUSTOR 预热 Flashstor Gen3 全闪 NAS,用上 8640U

ASUSTOR宣布将推出新一代全闪存NAS产品Flashstor Gen3系列,包括Flashstor 6 Gen3和Flashstor 12 Pro Gen3两款型号。新品均搭载AMD锐龙5 PRO 8640U处理器,提供16 TOPS的NPU AI算力,支持本地边缘计算和智能影像识别。该系列分别提供6个和12个M.2 NVMe SSD盘位,最高支持PCIe Gen4,并配备USB4、HDMI等接口。其支持双USB网络直连,传输效率可超越10GbE。同期推出的还有12盘位存储扩充设备Xpanstor 12R Gen2,配备550W白金效率冗余电源和热插拔风扇,可为特定NAS系列提供额外存储空间。

产品更新端侧
10:00
公众号:面壁智能(MiniCPM)
53
面壁智能与安波福达成战略合作,端侧AI座舱方案走向全球市场

面壁智能与安波福达成战略合作,双方将共同推动面壁智能的端侧AI座舱方案进入全球市场,助力该方案在全球范围落地。

端侧行业动态
10:00
公众号:面壁智能(MiniCPM)
20
端侧智舱启新程 面壁智能以技术创新赋能汽车智能化变革

面壁智能(MiniCPM)通过技术创新推动汽车智能化变革,重点布局端侧智能座舱(智舱)领域,旨在提升车载AI的本地化处理能力与响应效率。

端侧行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
62
MiniCPM-o 4.5:迈向实时全双工全模态交互

当前多模态大语言模型在交互范式上存在瓶颈,感知与响应分离且缺乏主动性。MiniCPM-o 4.5 通过 Omni-Flow 统一流式框架,将多模态输入输出对齐到共享时间轴,实现实时全双工全模态交互,支持同时感知与响应,并能基于对动态场景的连续理解主动发出提醒或评论。该模型参数量为 90 亿,在视觉语言能力上接近 Gemini 2.5 Flash,在全模态理解上超越 Qwen3-Omni-30B-A3B,且语音生成更优、计算效率显著更高。得益于高效的架构设计和推理优化,模型可在内存小于 12GB 的边缘设备上实现实时全双工全模态交互。

多模态模型发布端侧论文/研究
07:34
IT之家(RSS)
45
苹果 AI 眼镜曝光:内置 2 颗摄像头、支持 Siri 智能交互、可手势控制

据报道,苹果正加速研发其首款智能眼镜,预计与Meta Ray-Bans等产品竞争。该产品定位并非完整AR设备,核心聚焦于拍摄、语音助手和手势控制。硬件上配备两颗摄像头:高分辨率主摄用于拍照录像,低分辨率广角镜头则用于手势识别并为Siri提供环境视觉。为保障续航与轻薄,眼镜不内置显示屏及LiDAR等模块,并采用醋酸纤维材料提升佩戴舒适度。系统将搭载更智能的Siri,支持拍照、通话及环境交互。产品可能于2026年晚些时候预览,2027年正式上市。

多模态端侧行业动态
00:36
Tomer Tunguz 博客(VC 分析)
精选57
AI推理市场的专业化分化

AI推理市场正快速分化,各模态如文本、图像、视频和音频发展出独立推理技术栈。自ChatGPT发布后,NVIDIA数据中心收入三年内增长17倍,凸显市场爆发。分化根本原因在于工作负载差异:图像视频生成需高计算力,长上下文消耗更多内存,边缘设备则受功耗限制。市场按延迟分为实时、近实时和批量三层;按模态分为文本、图像视频音频;按部署分为云端和边缘。Hugging Face上已有超9万个图像生成模型,整个AI推理市场规模预计约1000亿美元,这种专业化趋势正为各细分领域创造领导者机会。

多模态大佬观点推理端侧

推荐理由:Tomer 把推理市场跟数据库市场做类比,碎片化的逻辑讲得很透,做 AI 基础设施的朋友能直接用来梳理自己的赛道,普通人知道这么回事就行。
4月29日
23:34
IT之家(RSS)
35
倍耐力买下 Univrses 30% 股份,加码 AI 轮胎技术

意大利轮胎制造商倍耐力收购瑞典公司Univrses 30%的股份,并获得未来增持至控股权的选择权。双方合作旨在将Univrses的三维人工智能计算机视觉技术整合进倍耐力的智能轮胎系统。该技术结合轮胎内置传感器,可提升车辆安全与自动驾驶能力,并为交通管理部门提供实时道路监测数据。2025年,双方技术已在意大利普利亚大区的道路监测项目中联合应用。交易具体财务细节未披露。

端侧行业动态
22:17
Tencent Hy@TencentHunyuan
精选67
腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型,440MB体积支持手机离线运行

腾讯开源了Hy-MT1.5-1.8B-1.25bit翻译模型,其参数量为18亿,经量化后仅440MB,可在手机上完全离线运行。该模型支持33种语言、5种方言及1056个翻译方向,包括藏语、蒙古语等少数语言。在标准测试中,其性能媲美商业翻译API和2350亿参数的大模型。通过量化至1.25比特,模型内存占用从FP16格式的3.3GB大幅降低,比之前的1.67比特方法体积缩小25%、速度提升约10%,且无精度损失。该模型已在国际机器翻译竞赛中获得30项第一,并部署于腾讯多个产品中。

Hugging Face开源生态模型发布端侧

推荐理由:440MB的模型能在手机上跑33种语言翻译,还宣称比谷歌翻译强,这个量化技术让离线翻译不再是‘能看不能用’,出差党可以试试看。
20:33
Qwen@Alibaba_Qwen
精选60
闪存QLA:基于TileLang构建的高性能线性注意力内核

FlashQLA是基于TileLang构建的高性能线性注意力内核,专为个人设备上的智能体AI设计。其核心创新包括门控驱动的自动片内计算并行、硬件友好的代数重构以及TileLang融合的Warp专用内核,通过提升流处理器利用率,在前向传播上实现2-3倍加速,反向传播实现2倍加速。该技术在小模型、长上下文工作负载和张量并行设置中效果显著,虽然在大批次处理时内存I/O开销略高,但在边缘设备和长上下文场景中实际性能更优。反向传播通过16级Warp专用流水线在严格片上内存限制下实现了核心级加速。相关资源已开源。

开源/仓库推理端侧

推荐理由:2 倍加速的背后是 Warp 特化流水线和自动 Copy 策略,像给手机 GPU 开了条专用跑道,做端侧 Agent 的可以直接拉代码试试。
20:33
Qwen@Alibaba_Qwen
精选66
闪速QLA:基于TileLang构建的高性能线性注意力内核

FlashQLA是基于TileLang开发的高性能线性注意力内核,专为提升个人设备上智能体AI性能而设计。它实现了2-3倍的前向传播加速和2倍的反向传播加速。其核心技术包括门控驱动的片上自动计算与通信重叠、硬件友好的代数重构,以及TileLang融合的Warp专用内核。该设计通过自动片上通信重叠显著提升了流处理器利用率,在张量并行、小模型和长上下文任务中效果突出。尽管在大批量处理时,其将GDN流程拆分为两个内核的策略会带来额外内存开销,但在边缘设备和长上下文实际场景中性能更优。反向传播部分通过构建16级、严格片上内存限制下的Warp专用流水线,实现了超过2倍的内核级加速。

GitHub开源/仓库推理端侧

推荐理由:Qwen 把线性注意力的推理效率压到了新台阶,2-3 倍加速对想做本地 Agent 的开发者是实打实的,不是论文灌水,是能跑在设备上的代码。
‹ 上一页
1…2324252627…31
下一页 ›