理想汽车6月8日宣布,Livis Day软件与人工智能发布会将于6月15日16:30举行,探讨具身智能及未来方向。全新理想L9 Livis搭载自研5nm马赫M100芯片(算力1280TOPs),配备3D ViT感知模型与马赫VLA2.1系统,多模态计算量提升10倍,支持自动驾驶、自主泊车、智能交互。理想AI眼镜Livis重量36克,售价1999元起,续航18.8小时,支持控车、听歌。
理想汽车6月8日宣布,Livis Day软件与人工智能发布会将于6月15日16:30举行,探讨具身智能及未来方向。全新理想L9 Livis搭载自研5nm马赫M100芯片(算力1280TOPs),配备3D ViT感知模型与马赫VLA2.1系统,多模态计算量提升10倍,支持自动驾驶、自主泊车、智能交互。理想AI眼镜Livis重量36克,售价1999元起,续航18.8小时,支持控车、听歌。
YPlasma在COMPUTEX 2026展示首款适用于NVIDIA Jetson的无风扇固态冷却方案。该方案基于Jetson Orin Nano开发板,整合介质阻挡放电(DBD)等离子制动器散热系统,包含200μm制动器和87×60×2mm散热板,自身功耗低于1W,产生的“离子风”可覆盖7~25W功率范围。整个散热系统高度不足6mm,可贴合弯曲表面,支持灵活拼贴,兼容防尘防水外壳,且臭氧释放近乎为零。
SK海力士与英伟达达成多年内存合作,将为英伟达下一代AI超级计算机Vera Rubin、Vera CPU、RTX Spark PC及Jetson Thor平台联合开发内存。合作强调内存设计需提前数年与GPU协同设计、制造规划及资本投入,不能再于GPU完成后才设计。双方还将把AI引入芯片制造,利用NVIDIA CUDA-X、PhysicsNeMo、Omniverse、OpenUSD、cuOpt加速芯片设计和半导体仿真,并计划建立工厂数字孪生,在软件中模拟机器人、晶圆和物流后再投入产线。该合作进一步巩固了SK海力士在AI硬件供应链中的关键地位。
CJ Zafir团队发布Mac-1模型(6.6B参数),可在任何Mac本地运行,仅需7GB内存(12GB更佳)。它支持487个MacOS原生工具,能执行多工具链式调用,推理开启,输出速度约65 tok/s。应用层基于Mac原生UI/UX设计。作者认为这种本地小模型+原生工具的组合直接挑战云端SaaS agent,甚至可能抢了苹果Siri的活儿。
Here's a teaser of our Mac-1 model. > 6.6B model > runs locally (on any Mac) > requires 7GB RAM (12GB ideal) > can use 4...
英伟达与 SK 海力士宣布多年期技术合作,围绕 AI 工厂下一代内存联合研发。SK 海力士将为英伟达 Vera Rubin 超级计算机、Vera CPU、RTX Spark PC 及 Jetson Thor 机器人平台开发专用内存,进入 AI 基础设施、个人 AI 及物理 AI 市场。协议保障高端内存延长开发周期。制造方面,SK 海力士将采用英伟达 CUDA-X 库及 PhysicsNeMo 框架加速芯片仿真和光刻计算,并借助 Omniverse 和 cuOpt 构建晶圆厂数字孪生,推动自主化运营。
iOSWorld 是首个基于持久用户身份构建的原生 iOS 模拟器基准,包含 26 个新开发的互联应用及 133 个任务,分为单应用(27 个)、多应用(60 个,跨 2–8 个应用)和记忆与个性化(46 个,需从个人数据推断模式)三类。在纯视觉和特权视觉+XML 设置下评估前沿及开源模型,最佳准确率 52%(多应用仅 37%);特权 XML 使前沿模型提升最多 26 个百分点,小模型未受益。基准已开源发布。
据传 WWDC 2026 苹果将彻底重构 Siri,底层集成 Google Gemini 模型(约 1.2 万亿参数)作为云端智能层,与自有 3B 参数设备端模型组成混合系统。Siri 担任编排层,控制 UI、隐私和应用权限。预期新 Siri 支持更自然对话、跨应用上下文、屏幕感知、应用内操作、专用 Siri app、语音/文件/多模态交互、动态岛增强,并可选接入 ChatGPT/Claude 等第三方 AI。同时可能推出 AI 修图、智能相机、写作工具、自然语言快捷指令等新 Apple Intelligence 功能。
日本北海道农民富安弘毅用 ChatGPT 和 Codex 解决农场实际问题,涵盖 8 个用法:拍照识别西兰花病害、卫星监测获取 NDVI 数据、用 ESP32 和 LINE 机器人远程控制温室卷帘、为农场群聊开发机器人管理温度与排期、从聊天记录追踪播种数量、学习 RTK-GPS 自动转向原理并评估自建成本、设计基于 Airtable 的农场管理数据库。他说 AI 让传统昂贵的自动化变得低成本可及,“如同身边有一位超级工程师”。
AMD 表示统一内存架构(UMA)正迅速崛起,未来几年将成为行业重点。其第一代锐龙 AI MAX 支持 128GB 内存,最多 112GB 可分配给 GPU;新一代锐龙 AI MAX 400 Series 最高支持 192GB 统一内存,GPU 可用 160GB,能本地运行 300B+ 参数大模型。英伟达 RTX Spark 也采用类似动态内存分配思路,AMD 高管认为这是对其理念的认可。
极摩客 EVO-X3 迷你主机即将推出,首发搭载锐龙 AI Max+ 395(Strix Halo)处理器。新机新增 OCuLink 接口用于外接显卡,支持 Wi-Fi 7 和双 PCIe 4.0 SSD,上市标配 128GB 内存。同时极摩客正在开发锐龙 AI Max+ 495 高端版本,配备 192GB LPDDR5X 统一内存和 2TB 硬盘,可运行更大规模 AI 大语言模型,计划今年晚些时候发售,售价尚未公布。
Clive Chan 今天宣布离开 OpenAI 并于本周加入 Anthropic。他是 OpenAI 的 002 号芯片员工,曾深度参与定制芯片项目。他解释离职原因是想再次从底层攀爬新高峰,并称赞 Anthropic 的人才、价值观和雄心。OpenAI 此前与博通联合公告自研芯片项目预计 2026 年下半年启动。Chan 的跳槽凸显 AI 公司间人才竞争愈演愈烈。
vivo 在高考开考日上线高考通“AI 志愿助手”功能。考生可通过 vivo 浏览器或桌面搜索框进入,查询高考日程、真题答案、院校专业信息、高校排名、同分去向、一分一段及省控线。该功能引入 AI 大模型实现科学预测志愿方案和提前估分,支持一键生成、导出志愿表。
Smart 精灵 5 号 OTA 升级至 2.3.1 CN 版本,整合豆包 AI 大模型,新增电子后视镜、AR HUD 高度自动调节、高德导航升级、Carlink、苹果钱包钥匙、华为 HiCar 与记忆泊车闸机通行。NSP 领航辅助新增左转待转区与环岛通行能力。新增文生图、闲聊视频 AI 新闻、全民 K 歌 App,用 QQ 音乐替代爱趣听,并优化趣味喇叭及解锁车辆音效自定义。
根据特斯拉 2026.20 版本软件更新日志,由 xAI 研发的 Grok 聊天机器人已在车载系统应用近一年,现扩展至智利、马来西亚、菲律宾及中国香港等市场。Grok 支持开放式问答、导航指令、语音唤醒“嘿,Grok”及地理位置提醒功能。用户可通过应用启动栏、方向盘语音按键或语音唤醒使用,并可自定义语音音色与对话风格。部分功能需订阅特斯拉高级联网服务。Grok 仍处于早期测试版阶段,未来计划支持控制空调、车灯及 FSD 等核心功能。
红魔游戏手机产品总经理姜超表示,新品PAD上市日期内部未定,但本月上市目标不变;价格因存储及供应链成本剧增必然上涨。关于和平精英封号,团队正与游戏工作室研判调整策略,硬件无问题,误封用户可向腾讯或红魔客服反馈。此外,型号NP06J的努比亚平板已入网,据博主透露为红魔游戏平板5 Pro,搭载9英寸185Hz OLED屏、骁龙8 Elite Gen5、液冷散热、8300mAh电池,最高24GB+1TB存储,支持RGB灯和透明设计,内置豆包大模型。
东风汽车6日发布无人物流车品牌“东风 OpenVAN”,推出四款车型:DF-2(容量2方/载重1吨/续航120公里)、DF-8(8方/2.8吨/150-195公里)、DF-25(25方/4吨/300公里)、DF-60(60方/13.6吨/200公里)。车辆搭载九识智驾 Zelos Inside 大模型,经1.3亿公里真实路况验证,刹车/转向/供电均为双套系统,支持5G超低时延线上管控上百台车辆。发布会签约订单超4000台,预计8月交付。
6月6日,2026款小鹏X9启动AIOS 6.2.0推送。本轮升级中,Ultra和Ultra SE车主收到VLA 2.0的第二个版本,Max版VLA 2.0蒸馏版仍在开发。新增功能包括:园区地库无导航NGP漫游、全场景原地起步、终点车位选项、车位被占漫游找车位、效率泊车风格(本轮Max可用)、辅助驾驶车道级渲染、熟路智能推荐、手机App车内遥控器、后视镜展开时机设置、车窗拨杆控制方式、间歇雨刮灵敏度调节、停止模式指示灯、自动连接媒体音频开关、车辆信息及辅助驾驶战绩。
懒猫摄像头开始预售啦! 继懒猫微服,懒猫 AI 算力舱后,第三款懒猫智能硬件发布啦! 星际太空人,科幻外观设计,从零开模打磨了一年半,头围和蔚来汽车的 Nomi 一样大,意味着买了摄像头后,所有 Nomi 的头饰都可以随意搭配 后期会让懒猫...
在2026台北国际电脑展上,黄仁勋指出未来计算将收敛为一套面向AI智能体的统一模式,从云端延伸至PC、汽车、机器人及各类边缘设备。该模式覆盖AI训练与推理,使所有边缘设备具备自主运行能力。自动驾驶、类人机器人和通信基站本质上是同类智能体系统。英伟达驾驶系统基于语言推理,未来可通过读取“技能文件”和教程视频操作陌生设备。数据中心方面,新推的88核Arm处理器Vera已全面量产,专为AI智能体生成词元设计,侧重单线程速度和内存带宽。
据 IT 之家引述 9to5Mac 报道,iOS 27 版 Siri 上线初期将引入候补名单机制,苹果按批次开放体验资格,内部将其定义为“测试版”与“预览版”。官方可能在 2026 年 WWDC 宣布新功能,但并非所有用户能第一时间参与。苹果将边上线边打磨,收集用户反馈改进 Siri 表现。此前 Apple Intelligence 在 iOS 18.1 早期版本也曾采用类似机制。新版 Siri 采用全新架构并首次接入谷歌 Gemini 模型,系统稳定性、响应质量、兼容性与隐私体验需更谨慎观察。
Google 发布 Gemma 4 的 QAT(量化感知训练)检查点,将最小模型从 11.4GB 缩小至 1.1GB(纯文本版 0.84GB),便于手机和笔记本运行。常规 PTQ(训练后量化)因模型未学会应对舍入而损伤质量;QAT 在训练中模拟压缩,让模型在权重被挤压时学习,压缩版不易丢失推理能力。Google 还构建了移动端优化格式,包含静态激活、通道量化、定向 2-bit 量化及 KV 缓存优化,减少手机缩放计算并防止长对话过快消耗内存。
该教程演示如何配置Qualcomm AI Hub Models,运行MobileNet-V2推理与YOLOv7目标检测,并在真实设备上完成模型编译。
Google DeepMind 推出 Gemma 4 量化感知训练(QAT)检查点,包含 Q4_0 格式和一种新的移动端格式,旨在降低设备端内存占用。对比 BF16、Q4_0 QAT 和移动版 QAT 三种边缘端格式,官方公布了各格式的内存数据与设计权衡。
Google 发布 Gemma 4 QAT 模型,该模型通过量化感知训练(QAT)技术优化压缩,旨在提升移动设备和笔记本电脑上的运行效率与能效。文章来源于 Google 官方博客,介绍了这一面向移动端和笔记本端的模型优化方案。
i'm obsessed with AI DIY projects. my favorite one right now is this broccoli farmer in hokkaido, japan using Codex to r...
Google DeepMind 发布 Gemma 4 QAT 量化感知训练模型,专为本地 / 设备端优化。通过量化感知训练减少内存占用,同时相比标准训练后量化保留更多质量。支持 Q4_0 格式及新的移动专用量化格式。Gemma 4 E2B 版本可运行于约 1GB 内存,纯文本版本甚至低于 1GB,使手机、笔记本、边缘设备和消费级 GPU 上的本地 AI 更实用。
i'm obsessed with AI DIY projects. my favorite one right now is this broccoli farmer in hokkaido, japan using Codex to r...
谷歌发布 Gemma 4 量化感知训练 (QAT) 检查点,支持在消费级 GPU 和移动设备上本地运行,质量损失极小。新检查点提供 GGUF(Q4_0)格式,覆盖所有尺寸及起草模型,实现最佳本地性能。自定义移动模式采用混合精度方案,将 Gemma 4 压缩至 1GB 以下,包含 2-bit 解码层、优化 KV 缓存和静态激活。通过在训练中模拟压缩(而非训练后量化),大幅降低内存占用并加速解码,同时保持推理质量。
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》在开发者大会季中,Nvidia 黄仁勋描述了完全不同的笔记本电脑使用方式以及支持这一方式的新型笔记本。微软 Build 和 Google I/O 上也展示了大量 AI 产品,包括 Gemini S 等。但核心疑问依然存在:用户是否真的需要这些 AI 功能?
作者通过技能蒸馏将78%的AI工作交由Mac本地模型处理,仅复杂任务发往云端。智能体自动分类任务:简单任务本地数秒完成,复杂任务路由至云端。过去一周本地处理峰值达88%。双车道设计使吞吐量提升约25%,平均任务时长从47秒降至19秒,队列等待时间从73秒降至4秒(降幅94%)。该模式类比Nucor小钢厂,每台能运行蒸馏模型的边缘设备都成为小型AI工厂,仅对那1/5困难任务支付云费用。未来几年,数以千万计的此类设备将在企业内部增殖,逐步取代现阶段云厂商账单上的大部分工作负载。
谷歌于 6 月 2 日推送 Chrome 149 稳定版,覆盖 Windows、Mac 和 Linux 平台,含 429 项安全修复。新增端侧 AI 模型管理选项,用户可拒绝下载或移除已下载模型。测试中的“AI 模式”绕过搜索首页,尚未正式上线。DevTools 的 MCP 服务器及 AI 智能体命令行接口稳定,新增自定义 HTTP 头模拟和改版 AI 助手面板;CSS 面板加入 Gemini 驱动的样式自动补全。Chrome 149 正式推出 ARM64 Linux 官方 deb/rpm 构建包。
加南科技今日发布 Kannan K2 智能眼镜,售价 2350 元。眼镜重 25.8 克,采用超轻尼龙材料,耳挂最薄 5.5 毫米。搭载 32MP 摄像头,支持 4K 30FPS 视频录制,具备 EIS+AI 双重防抖和 Live Photo。运行 Kiro OS,支持 0.3s 唤醒、0.8s 指令执行、0.3s 抓拍。续航:录像 60 分钟,待机 7 天,典型日用 1.5 天。
鸿海科技集团与英特尔宣布战略合作,结合英特尔在处理器、硅光子技术与软件生态的优势,以及鸿海的全球制造、系统整合与AI数据中心部署能力,共同探索从芯片、机柜到系统与应用的全方位AI解决方案。合作首先聚焦AI机柜领域,开发基于英特尔至强处理器的机柜级AI基础设施,推进高速互连、散热与液冷设计;同时在边缘与物理AI领域定义下一代平台架构,布局代理式AI、终端智能与机器人;此外还将探索定制ASIC、SoC与系统整合设计服务的合作。
据《连线》今日报道,Meta 通过多次应用更新将人脸识别代码推送到智能眼镜配套 App 中,代号“NameTag”。该功能利用已部署的三个 AI 模型将人脸转换为“人脸特征模板”,与手机本地数据库匹配,识别成功后向佩戴者发送通知。App 下载量超 5000 万次。Meta 回应称代码仅为探索,尚未决定推出,且不会建立中央人脸数据库。此前 Meta 曾因人脸识别问题在伊利诺伊州和得克萨斯州分别达成 6.5 亿美元和 14 亿美元和解。
同一事件,精选展示《Meta 在智能眼镜上搭载人脸识别功能》6月4日,面壁智能在高通汽车技术与合作峰会上推出端侧智能座舱产品矩阵SuperMate。该产品基于MiniCPM-o4.5全双工全模态大模型,实现多源感知、融合决策与精准执行的全链路端侧处理。采用意图驱动与思维链自主编排,引入L1-L5记忆分层机制和动态信任窗口,支持打断与情绪调节。目前SuperMate已量产交付超30万台车辆,覆盖68个场景,无需依赖云端。面壁智能通过低比特量化与知识蒸馏降低算力需求,推动端侧AI规模化装车。
荣耀MagicOS六月更新公布。YOYO新增排队码提醒、AI图像创作、伴学助手(仅平板)、时光问图、漫画故事等风格模板;YOYO建议支持大众点评排号动态提醒;YOYO智能体新增女生音色。灵动胶囊新增咪咕视频赛事比分、淘宝闪购买药、高德/百度驾车导航、美团骑行、大众点评排号等生态服务。锁屏小组件新增世界时钟、小红书看笔记等。新增AI窥屏防护、虚拟权限、离焦视力舒缓运动模式。优化一碰传、输入法、相机关闭闪退等问题。合入安卓2026年5月安全补丁。适配机型包括Magic V6、Magic8系列、Magic7系列等数十款。
Perplexity AI 发布面向个人电脑的混合本地-服务器推理编排器,可自动将 AI 任务在设备端模型与云端模型之间动态路由,实现推理负载的智能分配与优化。
在2026高通汽车技术与合作峰会上,高通联合诚迈科技等生态企业发布车端人工智能Claw生态计划。该计划结合骁龙数字底盘与高通智能体AI运行环境,将AI智能体和多模态大模型直接部署到车端,旨在消除下一代汽车智能开发碎片化。核心能力涵盖:全天候多模态感知(融合车内外摄像头、音频等)、百亿参数混合专家模型(MoE)在终端侧实时运行、六层车规级安全架构(覆盖车辆控制分级、用户授权、隐私保护等),以及持续演进的AI生态系统。推动汽车从移动工具进化为智能伙伴。
谷歌前天宣布为Android Go系统引入Gemini,配备2GB以上内存的Android Go手机可使用精简版Gemini Go AI助手。Gemini Go将替换原有Google Assistant Go,通过Google搜索应用提供服务。用户可通过长按Home键或电源键启动,支持拨打电话、发短信、查地图、搜餐厅、设闹钟、创建日历、播放媒体,并可上传文档和照片获取更多上下文。该助手已开始分阶段推送,用户将在未来几天或数周内体验到。
Locally AI 被 LM Studio 纳入麾下后,就退出移动手机版的客户端。 果然速度很AI,可以手机端更好跑本地大模型。 但是,目前其实这个场景我觉得还是没有真的挖掘出来或者说没有很好的支持用户的需求。
Locally is now @lmstudio's mobile app, and we are bringing LM Link to your iPhone. Use your largest models from your pho...