AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「端侧」清除
6月8日周一
12:20IT之家(RSS)41Livis Day理想汽车软件与人工智能发布会定档6月15日,将探讨具身智能
10:20IT之家(RSS)51YPlasma 展示全球首款无风扇固态冷却 NVIDIA Jetson 模组
09:08Rohan Paul61SK海力士与英伟达达成多年内存合作,为下一代AI超级计算机和PC联合开发内存
08:59Berryxia.AI54Mac-1模型:6.6B本地运行,487个Mac原生工具
08:19IT之家(RSS)69英伟达与 SK 海力士宣布多年期技术合作,共同开发下一代 AI 内存
08:00HuggingFace Daily Papers(社区热门论文)42iOSWorld:面向个人化智能手机智能体的基准
6月7日周日
19:37Chubby♨️66WWDC 2026 苹果将重构 Siri:底层集成 Google Gemini 混合 AI 系统
19:27AYi78精选"我在田里雇了一名工程师,它叫 Codex" -- 北海道一个西兰花农的 8 个真实 AI 用法
16:19IT之家(RSS)56AMD:统一内存架构良机无限,未来将重点投入
16:19IT之家(RSS)29极摩客 EVO-X3 迷你主机发布在即,高端版本将搭载 192GB 内存
15:19IT之家(RSS)53OpenAI 芯片团队元老 Clive Chan 出走,跳槽 Anthropic
11:19IT之家(RSS)452026 高考今日开考,vivo 上线"AI 志愿助手"功能提供一站式全程服务
09:19IT之家(RSS)20smart 精灵 5 号 OTA 升级 2.3.1 CN 版本:电子后视镜、华为 HiCar 等上线
09:19IT之家(RSS)51特斯拉 Grok 车载 AI 助手全球扩容,新增智利、马来西亚等市场
09:19IT之家(RSS)31红魔姜超:新品PAD本月上市目标未变,受成本影响必涨价;和平精英封号正研判调整
6月6日周六
21:17IT之家(RSS)49东风发布无人物流车品牌 OpenVAN,四款车型 8 月交付
18:17IT之家(RSS)462026 款小鹏 X9 获推 AIOS 6.2.0:新增辅助驾驶车道级渲染、终点车位选项等
16:40凡人小北48懒猫AI摄像头预售,NAS界首款智能摄像头
14:17IT之家(RSS)62黄仁勋谈未来计算:收敛为面向 AI 智能体的统一架构,覆盖云端到机器人
09:16IT之家(RSS)31iOS 27 版 Siri 上线初期采用候补名单机制
07:59Rohan Paul68Google 发布 Gemma 4 QAT 检查点,最小模型从 11.4GB 压缩至 1.1GB
06:57MarkTechPost(RSS)57Qualcomm AI Hub实战教程:使用MobileNet-V2和YOLOv7进行分类、目标检测与硬件感知部署
03:27MarkTechPost(RSS)50Google DeepMind 发布 Gemma 4 QAT 检查点:Q4_0 和新的移动格式降低设备端内存
03:21Hacker News 热门(buzzing.cc 中文翻译)69Gemma 4 QAT 模型:优化压缩以提升移动设备和笔记本电脑的能效
03:12ChatGPT54日本农户Hiroki Tomiyasu用ChatGPT和Codex自行搭建工具运营100公顷农场
02:30Chubby♨️71Gemma 4 QAT 模型发布:本地设备内存需求低至 1GB
01:41jason63北海道前公务员用 Codex 打造 100 公顷西兰花农场自动化系统
00:59Google AI Developers72同事件精选谷歌发布 Gemma 4 QAT 检查点,支持消费级 GPU 和移动设备本地运行同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
00:56The Verge:AI(RSS)56AI笔记本电脑:Nvidia 黄仁勋描绘全新使用方式,微软 Google 相继推出相关产品
00:38Tomer Tunguz 博客(VC 分析)68精选AI的微型钢厂
6月5日周五
23:15IT之家(RSS)39谷歌 Chrome 149 稳定版发布,允许用户删除已下载的端侧 AI 模型
23:15IT之家(RSS)47加南 Kannan K2 智能眼镜发布:25.8g 重、32MP 摄像头,2350 元
22:15IT之家(RSS)59英特尔与鸿海战略合作,携手推动AI机柜、边缘与物理AI发展
22:15IT之家(RSS)76同事件精选Meta 智能眼镜 App 暗藏人脸识别代码,NameTag 功能已推送至超 5000 万设备同一事件,精选展示《Meta 在智能眼镜上搭载人脸识别功能》
20:54公众号:面壁智能(MiniCPM)39面壁智能推出端侧座舱产品SuperMate,基于MiniCPM-o4.5全双工大模型
20:15IT之家(RSS)47荣耀MagicOS六月升级:YOYO新增排队码提醒,灵动胶囊支持赛事比分等
19:27MarkTechPost(RSS)54Perplexity AI 推出混合本地-服务器推理编排器:自动在设备端与云端间路由 AI 任务
19:15IT之家(RSS)63高通宣布车端人工智能 Claw 生态计划,将智能体 AI 引入智能座舱
16:15IT之家(RSS)352GB内存以上的入门级手机就能用上,谷歌为Android Go系统带来Gemini
15:55Berryxia.AI60Locally AI被LM Studio纳入,退出手机端客户端
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月8日
12:20
IT之家(RSS)
41
Livis Day理想汽车软件与人工智能发布会定档6月15日,将探讨具身智能

理想汽车6月8日宣布,Livis Day软件与人工智能发布会将于6月15日16:30举行,探讨具身智能及未来方向。全新理想L9 Livis搭载自研5nm马赫M100芯片(算力1280TOPs),配备3D ViT感知模型与马赫VLA2.1系统,多模态计算量提升10倍,支持自动驾驶、自主泊车、智能交互。理想AI眼镜Livis重量36克,售价1999元起,续航18.8小时,支持控车、听歌。

具身智能端侧行业动态
10:20
IT之家(RSS)
51
YPlasma 展示全球首款无风扇固态冷却 NVIDIA Jetson 模组

YPlasma在COMPUTEX 2026展示首款适用于NVIDIA Jetson的无风扇固态冷却方案。该方案基于Jetson Orin Nano开发板,整合介质阻挡放电(DBD)等离子制动器散热系统,包含200μm制动器和87×60×2mm散热板,自身功耗低于1W,产生的“离子风”可覆盖7~25W功率范围。整个散热系统高度不足6mm,可贴合弯曲表面,支持灵活拼贴,兼容防尘防水外壳,且臭氧释放近乎为零。

产品更新端侧
09:08
Rohan Paul@rohanpaul_ai
61
SK海力士与英伟达达成多年内存合作,为下一代AI超级计算机和PC联合开发内存

SK海力士与英伟达达成多年内存合作,将为英伟达下一代AI超级计算机Vera Rubin、Vera CPU、RTX Spark PC及Jetson Thor平台联合开发内存。合作强调内存设计需提前数年与GPU协同设计、制造规划及资本投入,不能再于GPU完成后才设计。双方还将把AI引入芯片制造,利用NVIDIA CUDA-X、PhysicsNeMo、Omniverse、OpenUSD、cuOpt加速芯片设计和半导体仿真,并计划建立工厂数字孪生,在软件中模拟机器人、晶圆和物流后再投入产线。该合作进一步巩固了SK海力士在AI硬件供应链中的关键地位。

端侧行业动态部署/工程
08:59
Berryxia.AI@berryxia
54
Mac-1模型:6.6B本地运行,487个Mac原生工具

CJ Zafir团队发布Mac-1模型(6.6B参数),可在任何Mac本地运行,仅需7GB内存(12GB更佳)。它支持487个MacOS原生工具,能执行多工具链式调用,推理开启,输出速度约65 tok/s。应用层基于Mac原生UI/UX设计。作者认为这种本地小模型+原生工具的组合直接挑战云端SaaS agent,甚至可能抢了苹果Siri的活儿。

CJ Zafir: Here's a teaser of our Mac-1 model. > 6.6B model > runs locally (on any Mac) > requires 7GB RAM (12GB ideal) > can use 4...

智能体MCP/工具模型发布端侧
08:19
IT之家(RSS)
69
英伟达与 SK 海力士宣布多年期技术合作,共同开发下一代 AI 内存

英伟达与 SK 海力士宣布多年期技术合作,围绕 AI 工厂下一代内存联合研发。SK 海力士将为英伟达 Vera Rubin 超级计算机、Vera CPU、RTX Spark PC 及 Jetson Thor 机器人平台开发专用内存,进入 AI 基础设施、个人 AI 及物理 AI 市场。协议保障高端内存延长开发周期。制造方面,SK 海力士将采用英伟达 CUDA-X 库及 PhysicsNeMo 框架加速芯片仿真和光刻计算,并借助 Omniverse 和 cuOpt 构建晶圆厂数字孪生,推动自主化运营。

端侧行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
42
iOSWorld:面向个人化智能手机智能体的基准

iOSWorld 是首个基于持久用户身份构建的原生 iOS 模拟器基准,包含 26 个新开发的互联应用及 133 个任务,分为单应用(27 个)、多应用(60 个,跨 2–8 个应用)和记忆与个性化(46 个,需从个人数据推断模式)三类。在纯视觉和特权视觉+XML 设置下评估前沿及开源模型,最佳准确率 52%(多应用仅 37%);特权 XML 使前沿模型提升最多 26 个百分点,小模型未受益。基准已开源发布。

智能体端侧论文/研究
6月7日
19:37
Chubby♨️@kimmonismus
66
WWDC 2026 苹果将重构 Siri:底层集成 Google Gemini 混合 AI 系统

据传 WWDC 2026 苹果将彻底重构 Siri,底层集成 Google Gemini 模型(约 1.2 万亿参数)作为云端智能层,与自有 3B 参数设备端模型组成混合系统。Siri 担任编排层,控制 UI、隐私和应用权限。预期新 Siri 支持更自然对话、跨应用上下文、屏幕感知、应用内操作、专用 Siri app、语音/文件/多模态交互、动态岛增强,并可选接入 ChatGPT/Claude 等第三方 AI。同时可能推出 AI 修图、智能相机、写作工具、自然语言快捷指令等新 Apple Intelligence 功能。

Google端侧行业动态语音
19:27
AYi@AYi_AInotes
精选78
"我在田里雇了一名工程师,它叫 Codex" -- 北海道一个西兰花农的 8 个真实 AI 用法

日本北海道农民富安弘毅用 ChatGPT 和 Codex 解决农场实际问题,涵盖 8 个用法:拍照识别西兰花病害、卫星监测获取 NDVI 数据、用 ESP32 和 LINE 机器人远程控制温室卷帘、为农场群聊开发机器人管理温度与排期、从聊天记录追踪播种数量、学习 RTK-GPS 自动转向原理并评估自建成本、设计基于 Airtable 的农场管理数据库。他说 AI 让传统昂贵的自动化变得低成本可及,“如同身边有一位超级工程师”。

OpenAI教程/实践端侧部署/工程

推荐理由:一个北海道农民把 ChatGPT 和 Codex 用成了农场的‘外挂工程师’,从病害诊断到温室远程控制,每个用法都附原始提示词——农业从业者可以直接抄作业。
16:19
IT之家(RSS)
56
AMD:统一内存架构良机无限,未来将重点投入

AMD 表示统一内存架构(UMA)正迅速崛起,未来几年将成为行业重点。其第一代锐龙 AI MAX 支持 128GB 内存,最多 112GB 可分配给 GPU;新一代锐龙 AI MAX 400 Series 最高支持 192GB 统一内存,GPU 可用 160GB,能本地运行 300B+ 参数大模型。英伟达 RTX Spark 也采用类似动态内存分配思路,AMD 高管认为这是对其理念的认可。

端侧行业动态
16:19
IT之家(RSS)
29
极摩客 EVO-X3 迷你主机发布在即,高端版本将搭载 192GB 内存

极摩客 EVO-X3 迷你主机即将推出,首发搭载锐龙 AI Max+ 395(Strix Halo)处理器。新机新增 OCuLink 接口用于外接显卡,支持 Wi-Fi 7 和双 PCIe 4.0 SSD,上市标配 128GB 内存。同时极摩客正在开发锐龙 AI Max+ 495 高端版本,配备 192GB LPDDR5X 统一内存和 2TB 硬盘,可运行更大规模 AI 大语言模型,计划今年晚些时候发售,售价尚未公布。

端侧行业动态
15:19
IT之家(RSS)
53
OpenAI 芯片团队元老 Clive Chan 出走,跳槽 Anthropic

Clive Chan 今天宣布离开 OpenAI 并于本周加入 Anthropic。他是 OpenAI 的 002 号芯片员工,曾深度参与定制芯片项目。他解释离职原因是想再次从底层攀爬新高峰,并称赞 Anthropic 的人才、价值观和雄心。OpenAI 此前与博通联合公告自研芯片项目预计 2026 年下半年启动。Chan 的跳槽凸显 AI 公司间人才竞争愈演愈烈。

AnthropicOpenAI端侧行业动态
11:19
IT之家(RSS)
45
2026 高考今日开考,vivo 上线"AI 志愿助手"功能提供一站式全程服务

vivo 在高考开考日上线高考通“AI 志愿助手”功能。考生可通过 vivo 浏览器或桌面搜索框进入,查询高考日程、真题答案、院校专业信息、高校排名、同分去向、一分一段及省控线。该功能引入 AI 大模型实现科学预测志愿方案和提前估分,支持一键生成、导出志愿表。

产品更新端侧
09:19
IT之家(RSS)
20
smart 精灵 5 号 OTA 升级 2.3.1 CN 版本:电子后视镜、华为 HiCar 等上线

Smart 精灵 5 号 OTA 升级至 2.3.1 CN 版本,整合豆包 AI 大模型,新增电子后视镜、AR HUD 高度自动调节、高德导航升级、Carlink、苹果钱包钥匙、华为 HiCar 与记忆泊车闸机通行。NSP 领航辅助新增左转待转区与环岛通行能力。新增文生图、闲聊视频 AI 新闻、全民 K 歌 App,用 QQ 音乐替代爱趣听,并优化趣味喇叭及解锁车辆音效自定义。

产品更新多模态端侧
09:19
IT之家(RSS)
51
特斯拉 Grok 车载 AI 助手全球扩容,新增智利、马来西亚等市场

根据特斯拉 2026.20 版本软件更新日志,由 xAI 研发的 Grok 聊天机器人已在车载系统应用近一年,现扩展至智利、马来西亚、菲律宾及中国香港等市场。Grok 支持开放式问答、导航指令、语音唤醒“嘿,Grok”及地理位置提醒功能。用户可通过应用启动栏、方向盘语音按键或语音唤醒使用,并可自定义语音音色与对话风格。部分功能需订阅特斯拉高级联网服务。Grok 仍处于早期测试版阶段,未来计划支持控制空调、车灯及 FSD 等核心功能。

xAI产品更新端侧语音
09:19
IT之家(RSS)
31
红魔姜超:新品PAD本月上市目标未变,受成本影响必涨价;和平精英封号正研判调整

红魔游戏手机产品总经理姜超表示,新品PAD上市日期内部未定,但本月上市目标不变;价格因存储及供应链成本剧增必然上涨。关于和平精英封号,团队正与游戏工作室研判调整策略,硬件无问题,误封用户可向腾讯或红魔客服反馈。此外,型号NP06J的努比亚平板已入网,据博主透露为红魔游戏平板5 Pro,搭载9英寸185Hz OLED屏、骁龙8 Elite Gen5、液冷散热、8300mAh电池,最高24GB+1TB存储,支持RGB灯和透明设计,内置豆包大模型。

端侧行业动态
6月6日
21:17
IT之家(RSS)
49
东风发布无人物流车品牌 OpenVAN,四款车型 8 月交付

东风汽车6日发布无人物流车品牌“东风 OpenVAN”,推出四款车型:DF-2(容量2方/载重1吨/续航120公里)、DF-8(8方/2.8吨/150-195公里)、DF-25(25方/4吨/300公里)、DF-60(60方/13.6吨/200公里)。车辆搭载九识智驾 Zelos Inside 大模型,经1.3亿公里真实路况验证,刹车/转向/供电均为双套系统,支持5G超低时延线上管控上百台车辆。发布会签约订单超4000台,预计8月交付。

产品更新端侧
18:17
IT之家(RSS)
46
2026 款小鹏 X9 获推 AIOS 6.2.0:新增辅助驾驶车道级渲染、终点车位选项等

6月6日,2026款小鹏X9启动AIOS 6.2.0推送。本轮升级中,Ultra和Ultra SE车主收到VLA 2.0的第二个版本,Max版VLA 2.0蒸馏版仍在开发。新增功能包括:园区地库无导航NGP漫游、全场景原地起步、终点车位选项、车位被占漫游找车位、效率泊车风格(本轮Max可用)、辅助驾驶车道级渲染、熟路智能推荐、手机App车内遥控器、后视镜展开时机设置、车窗拨杆控制方式、间歇雨刮灵敏度调节、停止模式指示灯、自动连接媒体音频开关、车辆信息及辅助驾驶战绩。

产品更新具身智能端侧
16:40
凡人小北@frxiaobei
48
懒猫发布第三款智能硬件--懒猫AI摄像头,星际太空人科幻外观,从零开模打磨一年半,头围与蔚来Nomi一致,可互换头饰。后期将结合懒猫AI算力舱,支持用户自定义AI大模型,实现100%隐私的家庭AI摄像头。该摄像头为NAS界第一款智能摄像头,扫码即用,无需破解Token。正式售价399元,预售价360元。将抽取10台免费赠送。

Andy Stewart: 懒猫摄像头开始预售啦! 继懒猫微服,懒猫 AI 算力舱后,第三款懒猫智能硬件发布啦! 星际太空人,科幻外观设计,从零开模打磨了一年半,头围和蔚来汽车的 Nomi 一样大,意味着买了摄像头后,所有 Nomi 的头饰都可以随意搭配 后期会让懒猫...

产品更新端侧
14:17
IT之家(RSS)
62
黄仁勋谈未来计算:收敛为面向 AI 智能体的统一架构,覆盖云端到机器人

在2026台北国际电脑展上,黄仁勋指出未来计算将收敛为一套面向AI智能体的统一模式,从云端延伸至PC、汽车、机器人及各类边缘设备。该模式覆盖AI训练与推理,使所有边缘设备具备自主运行能力。自动驾驶、类人机器人和通信基站本质上是同类智能体系统。英伟达驾驶系统基于语言推理,未来可通过读取“技能文件”和教程视频操作陌生设备。数据中心方面,新推的88核Arm处理器Vera已全面量产,专为AI智能体生成词元设计,侧重单线程速度和内存带宽。

智能体具身智能大佬观点端侧
09:16
IT之家(RSS)
31
iOS 27 版 Siri 上线初期采用候补名单机制

据 IT 之家引述 9to5Mac 报道,iOS 27 版 Siri 上线初期将引入候补名单机制,苹果按批次开放体验资格,内部将其定义为“测试版”与“预览版”。官方可能在 2026 年 WWDC 宣布新功能,但并非所有用户能第一时间参与。苹果将边上线边打磨,收集用户反馈改进 Siri 表现。此前 Apple Intelligence 在 iOS 18.1 早期版本也曾采用类似机制。新版 Siri 采用全新架构并首次接入谷歌 Gemini 模型,系统稳定性、响应质量、兼容性与隐私体验需更谨慎观察。

产品更新端侧语音
07:59
Rohan Paul@rohanpaul_ai
68
Google 发布 Gemma 4 QAT 检查点,最小模型从 11.4GB 压缩至 1.1GB

Google 发布 Gemma 4 的 QAT(量化感知训练)检查点,将最小模型从 11.4GB 缩小至 1.1GB(纯文本版 0.84GB),便于手机和笔记本运行。常规 PTQ(训练后量化)因模型未学会应对舍入而损伤质量;QAT 在训练中模拟压缩,让模型在权重被挤压时学习,压缩版不易丢失推理能力。Google 还构建了移动端优化格式,包含静态激活、通道量化、定向 2-bit 量化及 KV 缓存优化,减少手机缩放计算并防止长对话过快消耗内存。

Google开源/仓库模型发布端侧
06:57
MarkTechPost(RSS)
57
Qualcomm AI Hub实战教程:使用MobileNet-V2和YOLOv7进行分类、目标检测与硬件感知部署

该教程演示如何配置Qualcomm AI Hub Models,运行MobileNet-V2推理与YOLOv7目标检测,并在真实设备上完成模型编译。

教程/实践端侧部署/工程
03:27
MarkTechPost(RSS)
50
Google DeepMind 发布 Gemma 4 QAT 检查点:Q4_0 和新的移动格式降低设备端内存

Google DeepMind 推出 Gemma 4 量化感知训练(QAT)检查点,包含 Q4_0 格式和一种新的移动端格式,旨在降低设备端内存占用。对比 BF16、Q4_0 QAT 和移动版 QAT 三种边缘端格式,官方公布了各格式的内存数据与设计权衡。

DeepMindGoogle多模态模型发布
03:21
Hacker News 热门(buzzing.cc 中文翻译)
69
Gemma 4 QAT 模型:优化压缩以提升移动设备和笔记本电脑的能效

Google 发布 Gemma 4 QAT 模型,该模型通过量化感知训练(QAT)技术优化压缩,旨在提升移动设备和笔记本电脑上的运行效率与能效。文章来源于 Google 官方博客,介绍了这一面向移动端和笔记本端的模型优化方案。

Google推理模型发布端侧
03:12
ChatGPT@ChatGPTapp
54
日本北海道农户Hiroki Tomiyasu(@tomiyasu16)从未学过农业、未继承土地,曾是公务员。他用ChatGPT和Codex自行构建工具运营100公顷农场:通过聊天APP远程控制温室通风口(ESP32板+电机驱动+Cloudflare Workers);自动检测温度并开窗的机器人;卫星作物健康数据叠加农田地图;Airtable关联地块、任务、物料、传感器;从照片生成电控柜布线图。这些以前只有大型农企才能负担。

Ole Lehmann: i'm obsessed with AI DIY projects. my favorite one right now is this broccoli farmer in hokkaido, japan using Codex to r...

OpenAI教程/实践端侧编码
02:30
Chubby♨️@kimmonismus
71
Gemma 4 QAT 模型发布:本地设备内存需求低至 1GB

Google DeepMind 发布 Gemma 4 QAT 量化感知训练模型,专为本地 / 设备端优化。通过量化感知训练减少内存占用,同时相比标准训练后量化保留更多质量。支持 Q4_0 格式及新的移动专用量化格式。Gemma 4 E2B 版本可运行于约 1GB 内存,纯文本版本甚至低于 1GB,使手机、笔记本、边缘设备和消费级 GPU 上的本地 AI 更实用。

DeepMindGoogle模型发布端侧
01:41
jason@jxnlco
63
日本北海道前公务员 @tomiyasu16 从未学过农业,也未继承土地,利用 OpenAI 的 Codex 自行构建了 100 公顷西兰花农场的全套自动化工具:通过 ESP32、电机驱动器和 Cloudflare Workers 从聊天 App 远程控制温室通风;自动检测温度并开窗;将卫星作物健康数据叠加在地图上;用 Airtable 关联地块、任务、材料和传感器;从照片生成配电盘接线图。这些此前只有大型农业企业才能负担的工程,被他用一台笔记本和 Codex 开发成功。

Ole Lehmann: i'm obsessed with AI DIY projects. my favorite one right now is this broccoli farmer in hokkaido, japan using Codex to r...

现象/趋势端侧编码
00:59
Google AI Developers@googleaidevs
同事件精选72
谷歌发布 Gemma 4 QAT 检查点,支持消费级 GPU 和移动设备本地运行

谷歌发布 Gemma 4 量化感知训练 (QAT) 检查点,支持在消费级 GPU 和移动设备上本地运行,质量损失极小。新检查点提供 GGUF(Q4_0)格式,覆盖所有尺寸及起草模型,实现最佳本地性能。自定义移动模式采用混合精度方案,将 Gemma 4 压缩至 1GB 以下,包含 2-bit 解码层、优化 KV 缓存和静态激活。通过在训练中模拟压缩(而非训练后量化),大幅降低内存占用并加速解码,同时保持推理质量。

Google开源/仓库模型发布端侧
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
推荐理由:Gemma 4 的量化版把模型压到 1GB 以下,手机本地跑大模型的门槛又低了一大截。Google 这次没用传统的训练后量化,而是把压缩直接嵌进训练里,效果比 PTQ 好一截,搞端侧部署的可以拿 checkpoint 试起来了。
00:56
The Verge:AI(RSS)
56
AI笔记本电脑:Nvidia 黄仁勋描绘全新使用方式,微软 Google 相继推出相关产品

在开发者大会季中,Nvidia 黄仁勋描述了完全不同的笔记本电脑使用方式以及支持这一方式的新型笔记本。微软 Build 和 Google I/O 上也展示了大量 AI 产品,包括 Gemini S 等。但核心疑问依然存在:用户是否真的需要这些 AI 功能?

现象/趋势端侧
00:38
Tomer Tunguz 博客(VC 分析)
精选68
AI的微型钢厂

作者通过技能蒸馏将78%的AI工作交由Mac本地模型处理,仅复杂任务发往云端。智能体自动分类任务:简单任务本地数秒完成,复杂任务路由至云端。过去一周本地处理峰值达88%。双车道设计使吞吐量提升约25%,平均任务时长从47秒降至19秒,队列等待时间从73秒降至4秒(降幅94%)。该模式类比Nucor小钢厂,每台能运行蒸馏模型的边缘设备都成为小型AI工厂,仅对那1/5困难任务支付云费用。未来几年,数以千万计的此类设备将在企业内部增殖,逐步取代现阶段云厂商账单上的大部分工作负载。

智能体大佬观点端侧

推荐理由:Tunguz 把自己 78% 的 AI 任务都挪到本地跑,吞吐量涨了 25%,延迟降了 60%。mini-mill 的类比把端侧 AI 的颠覆逻辑讲得比任何行业报告都清楚,做工作流自动化的值得细读。
6月5日
23:15
IT之家(RSS)
39
谷歌 Chrome 149 稳定版发布,允许用户删除已下载的端侧 AI 模型

谷歌于 6 月 2 日推送 Chrome 149 稳定版,覆盖 Windows、Mac 和 Linux 平台,含 429 项安全修复。新增端侧 AI 模型管理选项,用户可拒绝下载或移除已下载模型。测试中的“AI 模式”绕过搜索首页,尚未正式上线。DevTools 的 MCP 服务器及 AI 智能体命令行接口稳定,新增自定义 HTTP 头模拟和改版 AI 助手面板;CSS 面板加入 Gemini 驱动的样式自动补全。Chrome 149 正式推出 ARM64 Linux 官方 deb/rpm 构建包。

MCP/工具产品更新端侧
23:15
IT之家(RSS)
47
加南 Kannan K2 智能眼镜发布:25.8g 重、32MP 摄像头,2350 元

加南科技今日发布 Kannan K2 智能眼镜,售价 2350 元。眼镜重 25.8 克,采用超轻尼龙材料,耳挂最薄 5.5 毫米。搭载 32MP 摄像头,支持 4K 30FPS 视频录制,具备 EIS+AI 双重防抖和 Live Photo。运行 Kiro OS,支持 0.3s 唤醒、0.8s 指令执行、0.3s 抓拍。续航:录像 60 分钟,待机 7 天,典型日用 1.5 天。

产品更新多模态端侧
22:15
IT之家(RSS)
59
英特尔与鸿海战略合作,携手推动AI机柜、边缘与物理AI发展

鸿海科技集团与英特尔宣布战略合作,结合英特尔在处理器、硅光子技术与软件生态的优势,以及鸿海的全球制造、系统整合与AI数据中心部署能力,共同探索从芯片、机柜到系统与应用的全方位AI解决方案。合作首先聚焦AI机柜领域,开发基于英特尔至强处理器的机柜级AI基础设施,推进高速互连、散热与液冷设计;同时在边缘与物理AI领域定义下一代平台架构,布局代理式AI、终端智能与机器人;此外还将探索定制ASIC、SoC与系统整合设计服务的合作。

智能体具身智能端侧行业动态
22:15
IT之家(RSS)
同事件精选76
Meta 智能眼镜 App 暗藏人脸识别代码,NameTag 功能已推送至超 5000 万设备

据《连线》今日报道,Meta 通过多次应用更新将人脸识别代码推送到智能眼镜配套 App 中,代号“NameTag”。该功能利用已部署的三个 AI 模型将人脸转换为“人脸特征模板”,与手机本地数据库匹配,识别成功后向佩戴者发送通知。App 下载量超 5000 万次。Meta 回应称代码仅为探索,尚未决定推出,且不会建立中央人脸数据库。此前 Meta 曾因人脸识别问题在伊利诺伊州和得克萨斯州分别达成 6.5 亿美元和 14 亿美元和解。

Meta多模态端侧行业动态
同一事件,精选展示《Meta 在智能眼镜上搭载人脸识别功能》
推荐理由:Meta一边付近百亿美元和解金,一边把完整人脸识别代码塞进 5000 万用户的眼镜里,「探索」这个解释太轻巧——代码都推送了,离功能上线只差一个开关。
20:54
公众号:面壁智能(MiniCPM)
39
面壁智能推出端侧座舱产品SuperMate,基于MiniCPM-o4.5全双工大模型

6月4日,面壁智能在高通汽车技术与合作峰会上推出端侧智能座舱产品矩阵SuperMate。该产品基于MiniCPM-o4.5全双工全模态大模型,实现多源感知、融合决策与精准执行的全链路端侧处理。采用意图驱动与思维链自主编排,引入L1-L5记忆分层机制和动态信任窗口,支持打断与情绪调节。目前SuperMate已量产交付超30万台车辆,覆盖68个场景,无需依赖云端。面壁智能通过低比特量化与知识蒸馏降低算力需求,推动端侧AI规模化装车。

端侧行业动态
20:15
IT之家(RSS)
47
荣耀MagicOS六月升级:YOYO新增排队码提醒,灵动胶囊支持赛事比分等

荣耀MagicOS六月更新公布。YOYO新增排队码提醒、AI图像创作、伴学助手(仅平板)、时光问图、漫画故事等风格模板;YOYO建议支持大众点评排号动态提醒;YOYO智能体新增女生音色。灵动胶囊新增咪咕视频赛事比分、淘宝闪购买药、高德/百度驾车导航、美团骑行、大众点评排号等生态服务。锁屏小组件新增世界时钟、小红书看笔记等。新增AI窥屏防护、虚拟权限、离焦视力舒缓运动模式。优化一碰传、输入法、相机关闭闪退等问题。合入安卓2026年5月安全补丁。适配机型包括Magic V6、Magic8系列、Magic7系列等数十款。

产品更新端侧
19:27
MarkTechPost(RSS)
54
Perplexity AI 推出混合本地-服务器推理编排器:自动在设备端与云端间路由 AI 任务

Perplexity AI 发布面向个人电脑的混合本地-服务器推理编排器,可自动将 AI 任务在设备端模型与云端模型之间动态路由,实现推理负载的智能分配与优化。

产品更新推理端侧
19:15
IT之家(RSS)
63
高通宣布车端人工智能 Claw 生态计划,将智能体 AI 引入智能座舱

在2026高通汽车技术与合作峰会上,高通联合诚迈科技等生态企业发布车端人工智能Claw生态计划。该计划结合骁龙数字底盘与高通智能体AI运行环境,将AI智能体和多模态大模型直接部署到车端,旨在消除下一代汽车智能开发碎片化。核心能力涵盖:全天候多模态感知(融合车内外摄像头、音频等)、百亿参数混合专家模型(MoE)在终端侧实时运行、六层车规级安全架构(覆盖车辆控制分级、用户授权、隐私保护等),以及持续演进的AI生态系统。推动汽车从移动工具进化为智能伙伴。

智能体多模态端侧行业动态
16:15
IT之家(RSS)
35
2GB内存以上的入门级手机就能用上,谷歌为Android Go系统带来Gemini

谷歌前天宣布为Android Go系统引入Gemini,配备2GB以上内存的Android Go手机可使用精简版Gemini Go AI助手。Gemini Go将替换原有Google Assistant Go,通过Google搜索应用提供服务。用户可通过长按Home键或电源键启动,支持拨打电话、发短信、查地图、搜餐厅、设闹钟、创建日历、播放媒体,并可上传文档和照片获取更多上下文。该助手已开始分阶段推送,用户将在未来几天或数周内体验到。

Google产品更新端侧
15:55
Berryxia.AI@berryxia
60
Locally AI被LM Studio纳入,退出手机端客户端

Locally AI 被 LM Studio 纳入麾下后,就退出移动手机版的客户端。 果然速度很AI,可以手机端更好跑本地大模型。 但是,目前其实这个场景我觉得还是没有真的挖掘出来或者说没有很好的支持用户的需求。

Locally AI - Local AI Chat: Locally is now @lmstudio's mobile app, and we are bringing LM Link to your iPhone. Use your largest models from your pho...

产品更新端侧
‹ 上一页
1…7891011…31
下一页 ›