AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「端侧」清除
6月5日周五
09:14IT之家(RSS)25七彩虹灵创 K16 游戏本发售:锐龙 AI Max+ 395 配 Radeon 8060S 核显,23999 元起
08:56Rohan Paul53Nemotron 3 Ultra 对比 GPT-5.5 在 atomic.chat 本地桌面应用上的性能与成本测试
08:14IT之家(RSS)52微软演示 AI 定制 Win11:一句话整机联动,调整壁纸、主题色、键盘灯效等
07:14IT之家(RSS)62LM Studio 上线 LM Link,让 iPhone 直连 Mac 本地 AI 模型
06:54Berryxia.AI60LM Studio 手机版发布,可本地跑大模型
05:17Hacker News 热门(buzzing.cc 中文翻译)80精选Meta 在智能眼镜上搭载人脸识别功能
04:47宝玉55OpenAI Codex 推出 Build iOS Apps 插件,允许在浏览器中查看和测试 iOS 应用
04:25Google Research:Blog(网页)79精选Google Research 发布被动心率监测系统 PHRM
03:55Chubby♨️662.4B开放模型实现实时音乐生成
6月4日周四
22:12IT之家(RSS)53撼与 Sparkle 展出首款 Arc Pro B70 单槽显卡,8 卡可组 256GB 显存工作站
21:11IT之家(RSS)54DeepX 将导入三星 LPDDR5X-PIM,2nm端侧AI芯片DX-M2售价低于50美元
21:11IT之家(RSS)60长安汽车自研大模型长安天枢获国家生成式 AI 备案审批,成为重庆首家
19:11IT之家(RSS)29华硕破晓 Ultra 评测:第三代酷睿 Ultra 处理器 + 双层 OLED 触控屏
18:25公众号:面壁智能(MiniCPM)42智能座舱卷到头了?这份白皮书给出了答案
17:11IT之家(RSS)55TrendForce:预估 2029 年 Arm 架构笔记本渗透率将达 34.2%
16:11IT之家(RSS)23骁龙 ARM 版微软 Surface Laptop 8 规格曝光,全新"翡翠"配色亮相
15:11IT之家(RSS)35OpenAI 硬件体验如何?CFO 弗里尔称"很自然,很喜欢"
14:51MarkTechPost(RSS)71精选Meet OpenJarvis:一个本地优先的设备端个人AI智能体框架,支持工具、记忆与学习
14:11IT之家(RSS)30红魔游戏平板 5 Pro 入网:9 英寸 185Hz 屏,骁龙 8 Elite Gen5,6 月发布
13:00歸藏(guizang.ai)68即览 Glimpse 发布:无 AI 离线预览工具开放测试
12:11IT之家(RSS)59谷歌 AI Edge Gallery 登陆 Mac,16GB 内存可运行 Gemma 4 12B 模型
11:10IT之家(RSS)52AMD 高管回应英伟达 RTX Spark 入局:欢迎竞争,自家 Strix Halo 系列足以应对
10:23Jeff Dean75Gemma 4 12B 开源模型,可在笔记本运行
09:10IT之家(RSS)48微软加速 Arm 生态补缺,用 AI 推进 Win11 原生应用适配
09:10IT之家(RSS)51微软 Surface RTX Spark Dev Box 更详细规格曝光:约 1000 孔铝壳散热驾驭 AI 负载
09:10IT之家(RSS)61苹果 iOS 27 Siri 部分查询将经 Google Cloud 调用授权版 Gemini,使用 NVIDIA Blackwell B200 集群处理
08:51Berryxia.AI66Gemma 4 12B 与 Google AI Edge 打通,笔记本全本地 Agentic 工作流上线
08:51Berryxia.AI70MLX 框架 Day0 同步支持 Gemma 4
08:40小互71Google 发布 Gemma 4 12B 开源模型
08:10IT之家(RSS)62豆包宣布将推出专业版,基础功能保持免费;阿里千问向第三方Agent全面开放
07:51Berryxia.AI69Gemma 4 12B 发布,16G内存即可运行
07:10IT之家(RSS)39微软 Surface Pro 第 12 版宣传图曝光:骁龙 X2 Elite 芯片、续航增 10%
03:58MiniMax (official)65MiniMax-M3加入NVIDIA与微软本地LLM阵容
03:40Sundar Pichai73同事件精选Gemma 4 12B发布:笔记本本地运行的多步推理模型同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
03:22Ars Technica:AI(RSS)60Google 新发布的 Gemma 4 12B 模型可在任何 16GB 内存笔记本电脑上运行
03:20Chubby♨️65微软新Surface Laptop Ultra上手体验
03:20Chubby♨️71Google 开源 Gemma 4 12B:无编码器架构,本地 16GB VRAM 运行
02:36Demis Hassabis74同事件精选Gemma 4 12B 发布:150M+ 下载量里程碑,16GB VRAM 本地运行同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
02:16AYi65Google 发布 Gemma 4 12B:无独立视觉编码器的统一多模态架构
01:38Hacker News 热门(buzzing.cc 中文翻译)78同事件精选Gemma 4 12B:一种统一的、无需编码器的多模态模型同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月5日
09:14
IT之家(RSS)
25
七彩虹灵创 K16 游戏本发售:锐龙 AI Max+ 395 配 Radeon 8060S 核显,23999 元起

七彩虹灵创K16游戏本6月5日10点首销,搭载16核32线程AMD锐龙AI Max+ 395处理器与Radeon 8060S核显,至高128GB LPDDR5X 8000MT/s内存、2TB PCIe 4.0 SSD,整机160W性能释放。配备2560x1600 165Hz IPS屏(100% sRGB、500尼特),4区RGB背光数字小键盘和机械师玻璃触控板。I/O含Oculink、USB-C 4、HDMI 2.1、RJ45 2.5G网口。内置Nova Studio AI平台,支持一键部署大模型、ComfyUI工作流和AI办公智能体。64GB+1TB版23999元(国补后22499元),128GB+2TB版27999元(国补后26499元)。

产品更新端侧
08:56
Rohan Paul@rohanpaul_ai
53
在 atomic.chat 本地桌面应用中,Nemotron 3 Ultra(MoE 架构,总参数 550B,每 token 活跃 55B)与 GPT-5.5 在构建带物理引擎的 HTML5 canvas 任务(旋转水桶、高尔顿板、极端质量块碰撞)上表现几乎相同。Nemotron 3 Ultra 消耗 11.3k tokens、花费 $0.051,GPT-5.5 消耗 11.0k tokens、花费 $0.57,前者成本仅为后者的约 1/10,质量差距远小于价格差距。

atomic.chat: Nemotron 3 Ultra performed GPT 5.5 level 10× cheaper We gave three same prompts to build HTML5 canvas with real physics....

端侧编码评测/基准
08:14
IT之家(RSS)
52
微软演示 AI 定制 Win11:一句话整机联动,调整壁纸、主题色、键盘灯效等

微软在 Build 2026 开发者大会上展示 Windows 11 AI 个性化功能,AI 智能体可根据用户自然语言描述联动调整壁纸、主题色、明暗模式和键盘灯效。现场演示“春日樱花风格”自动切换。开发者可利用 Windows API 和 WinUI Skills 项目构建原生应用。智能体还能通过 LampArray 接口设计键盘逐灯动画,并将主题色写入注册表路径,实现连贯任务处理。

智能体Microsoft产品更新端侧
07:14
IT之家(RSS)
62
LM Studio 上线 LM Link,让 iPhone 直连 Mac 本地 AI 模型

6 月 5 日,LM Studio 更新 Mac 版 Locally 应用,新增 LM Link 功能,用户可直接在 iPhone 上调用 Mac 本地运行的大语言模型。需两端登录同一 LM Studio 账号,通过定制 Tailscale 网状虚拟专用网络建立端到端加密连接。支持 Mac 上任意模型,包括 Apple Intelligence 基础模型,体验取决于 Mac 性能。预览阶段免费,后续将推出付费方案,具体未公布。

产品更新端侧部署/工程
06:54
Berryxia.AI@berryxia
60
😂 LM Studio 手机版也发布了,这下你可以"烧"你的iPhone 在本地跑大模型了……😆
产品更新端侧部署/工程
05:17
Hacker News 热门(buzzing.cc 中文翻译)
精选80
Meta 在智能眼镜上搭载人脸识别功能

Meta 为其智能眼镜产品推出了人脸识别功能,用户可通过眼镜识别他人身份,并获取相关信息。该功能目前正通过早期测试版本向部分用户开放,旨在增强增强现实设备的社交与信息交互能力。

Meta现象/趋势端侧
关联讨论 1 条IT之家(RSS)
推荐理由:Meta 把完整的人脸识别栈塞进了智能眼镜 App,这事一旦激活,公共场所的匿名性将被重新定义。作者的技术取证链条扎实,迫使 Meta 必须正面回应。
04:47
宝玉@dotey
55
OpenAI Codex 推出 Build iOS Apps 插件,允许在浏览器中查看和测试 iOS 应用

OpenAI Codex 推出 Build iOS Apps 插件,让用户在不离开 Codex 的情况下查看、测试 iOS 应用,预览 SwiftUI 并热重载。原理:借助第三方 npm serve-sim 将 iOS Simulator 画面截取为视频流显示在浏览器中,同时建立控制通道将浏览器的点击、拖动等操作转换为模拟器触摸或键盘事件。插件读取 iOS App 的 Accessibility 信息,在浏览器画面上覆盖透明 HTML 按钮,使 Codex 能选择原生 UI 元素。SwiftUI 预览和热重载通过临时生成预览小 App,仅重新编译相关动态库,无需完整重装应用。

OpenAI Developers: More of the iOS app loop, now inside Codex. The Build iOS Apps plugin lets Codex view and test your iOS app in the in-ap...

OpenAI教程/实践端侧编码
04:25
Google Research:Blog(网页)
精选79
Google Research 发布被动心率监测系统 PHRM

Google Research 开发了一种被动心率监测系统(PHRM),利用智能手机前置摄像头在日常使用中(人脸解锁后数秒内)捕捉面部视频,通过深度学习估算心率,平均绝对百分比误差(MAPE)低于10%(对比心电图金标准),满足各肤色人群的行业精度标准。系统将全天心率测量整合为每日静息心率(RHR),平均绝对误差(MAE)低于5 bpm(对比可穿戴设备)。研究同时发布了迄今最大规模的公开智能手机视频数据集及预训练模型PHRM-mini,合格研究人员可申请访问。

Google数据/训练端侧论文/研究

推荐理由:Google 这项发表在 Nature 上的研究,把手机前置摄像头变成了被动心率仪,而且专门解决了深肤色人群精度差的老问题,虽然离产品还远,但方向很对,穿戴设备的护城河可能又浅了一点。
03:55
Chubby♨️@kimmonismus
66
那太酷了!我爱这些家伙的创意。 一个仅2.4B参数的开放模型,用于实时音乐生成。 如果你在长途飞行中无聊,现在可以开始创作神曲了。

Omar Sanseviero: Introducing Magenta RealTime 2 🎺 - Open model for live music generation - Just 2.4B parameters, perfect for on-device -...

Google开源生态模型发布端侧
6月4日
22:12
IT之家(RSS)
53
撼与 Sparkle 展出首款 Arc Pro B70 单槽显卡,8 卡可组 256GB 显存工作站

撼与 Sparkle 在台北电脑展展示单槽 Intel Arc Pro B70 32GB 显卡,型号 Sparkle Intel Arc Pro B70 32 GB Blower 1S。该卡搭载完整 BMG-G31 GPU,配备 32 个 Xe2 核心与 32GB 显存,采用涡轮散热和单 16pin 供电,加速频率 2800 MHz。单槽设计使工作站可同时安装 8 块,总显存 256GB,支持本地运行参数超 2000 亿的 AI 大语言模型。相比双槽版(230W TGP),单槽版 TGP 降至 160W。售价尚未公布,预计近期上市。

产品更新端侧部署/工程
21:11
IT之家(RSS)
54
DeepX 将导入三星 LPDDR5X-PIM,2nm端侧AI芯片DX-M2售价低于50美元

韩国AI芯片企业DeepX首席执行官在2026 K-AI半导体成长论坛上表示,其80 TOPS算力的2nm端侧AI芯片DX-M2将搭配三星电子LPDDR5X-PIM存内计算解决方案,上市价格低于50美元。PIM技术将专用数据处理器集成到DRAM中,减少数据移动,提升AI加速器能效。后续DX-M3目标实现1000 TOPS算力,将使用JEDEC标准化的LPDDR6-PIM。

端侧行业动态
21:11
IT之家(RSS)
60
长安汽车自研大模型长安天枢获国家生成式 AI 备案审批,成为重庆首家

长安汽车今日宣布,其全栈自研的长安天枢大模型已通过国家网信办生成式人工智能服务备案审批,成为重庆首家通过国家级备案的车企。该大模型以语音、语言、视觉等多模态数据为特征,具备感知、理解、推理、生成等技术能力,后续将作为基座模型支撑天枢智能化产品研发体系。

端侧行业动态
19:11
IT之家(RSS)
29
华硕破晓 Ultra 评测:第三代酷睿 Ultra 处理器 + 双层 OLED 触控屏

华硕破晓 Ultra 于今年 3 月发布,搭载第三代酷睿 Ultra X7 358H 处理器和 Intel Arc B390 核显(12 个 Xe3 核心),配备 14 英寸 2.8K 120Hz 双层串联 OLED 触控屏,峰值亮度 1400nit。整机重 1.1kg、厚 10.9mm,内置 70Wh 电池并支持 90W PD 快充,32GB+1TB 版本售价 14999 元。游戏实测方面,1080P 低画质下《CS2》达 306 帧,《赛博朋克:2077》开启 XeSS 后达 100 帧,45W 功耗下噪音不超过 45 分贝。

端侧评测/基准
18:25
公众号:面壁智能(MiniCPM)
42
智能座舱卷到头了?这份白皮书给出了答案
多模态现象/趋势端侧
17:11
IT之家(RSS)
55
TrendForce:预估 2029 年 Arm 架构笔记本渗透率将达 34.2%

TrendForce集邦咨询报告称,当前AI笔记本仍缺大规模驱动换机产品。随着Nvidia在Computex发布RTX Spark平台及N1/N1X处理器,首次将CUDA生态延伸至Windows笔记本市场,AI笔记本渗透率预计从2025年19.3%升至2029年84.9%。其中Windows x86 AI笔记本2029年占整体约50.7%,Windows on Arm AI笔记本由2025年1.2%升至2029年11.5%。苹果M系列维持约17%市场占比。在Windows on Arm、苹果M系列及AI Chromebook推动下,2029年Arm架构笔记本渗透率预计达34.2%。

现象/趋势端侧
16:11
IT之家(RSS)
23
骁龙 ARM 版微软 Surface Laptop 8 规格曝光,全新"翡翠"配色亮相

微软计划于2026年6月16日发布基于ARM的Surface Laptop 8,搭载高通骁龙X2 Elite和X2 Plus芯片,最高80 TOPS AI性能,新增浅绿色“翡翠”配色,有望首次升级OLED屏。13.8英寸和15英寸版均采用PixelSense触摸屏,可选12核X2 Elite或10核X2 Plus(最高4.0 GHz),最高32GB LPDDR5X内存,512GB/1TB/2TB可更换SSD。13.8英寸版54Wh电池本地视频最长20小时,15英寸版66Wh最长19小时。ARM版本未提及隐私显示屏,与英特尔企业版不同。

Microsoft端侧行业动态
15:11
IT之家(RSS)
35
OpenAI 硬件体验如何?CFO 弗里尔称"很自然,很喜欢"

OpenAI 正开发高度保密的 AI 硬件,由乔尼·艾夫主导。CFO 莎拉·弗里尔称试用后感觉“非常自然,非常让人喜欢”。设备不是耳机(弗里尔开玩笑),也不是手机(奥尔特曼明确)。弗里尔称赞设计带来直接身体感受,将人性带入设备。该设备将于今年年底发布,但此前 OpenAI 法律文件称交付不早于 2027 年 2 月。OpenAI 正以约 65 亿美元收购艾夫创办的 IO 公司,共同打造“AI 产品家族”。

OpenAI端侧行业动态
14:51
MarkTechPost(RSS)
精选71
Meet OpenJarvis:一个本地优先的设备端个人AI智能体框架,支持工具、记忆与学习

Stanford 研究人员发布 OpenJarvis,一个完全在设备端运行推理、智能体、记忆与学习的开源框架。它将个人 AI 系统分解为五个可组合原语:Intelligence、Engine、Agents、Tools & Memory 和 Learning。该框架与最佳云端模型的性能差距在 3.2 points 以内,边际 API 成本降低约 800 倍。

智能体产品更新开源生态端侧

推荐理由:斯坦福这个框架把云端模型能力拉到本地,成本降了800倍,所有想做离线个人助理的开发者该试试看,开源实现比PPT有说服力。
14:11
IT之家(RSS)
30
红魔游戏平板 5 Pro 入网:9 英寸 185Hz 屏,骁龙 8 Elite Gen5,6 月发布

型号 NP06J 的红魔游戏平板 5 Pro 已入网,支持 80W 快充,预计 6 月发布。工程机配置 9 英寸 185Hz OLED 屏、骁龙 8 Elite Gen5、液冷循环散热系统、8300mAh± 电池,提供 12+256GB/16+512GB/16+1TB/24+1TB 存储,配备 RGB 灯和透明设计,内置豆包大模型。官方预告十大黑科技,包括超高刷游戏平板、全新发光材料、透明纯平设计、顶级触控芯片、PC 级散热材料、CUBE 擎天游戏引擎等。

产品更新端侧
13:00
歸藏(guizang.ai)@op7418
68
即览 Glimpse 发布:无 AI 离线预览工具开放测试

歸藏发布手机端小工具「即览 Glimpse」,无 AI、不联网,专用于解决 iOS 上预览 AI 产出的 Markdown 和 HTML 内容的问题。经过三天苹果审核,现已开放 8000 个测试名额。若名额用完,预计数天后正式上架 App Store。

歸藏(guizang.ai): http://x.com/i/article/2062359856376610816

产品更新端侧
12:11
IT之家(RSS)
59
谷歌 AI Edge Gallery 登陆 Mac,16GB 内存可运行 Gemma 4 12B 模型

谷歌 AI Edge Gallery 现已登陆 macOS,Mac 用户可在本地离线运行 Gemma AI 模型。该应用提供 5 个谷歌指令调优模型,其中 Gemma-4-12B-it 可在 16GB 内存 Mac 上处理文本、视觉和音频,具备代码能力,实现设备端智能体和多模态分析。AI Edge Gallery 完全离线、私密性高且速度快。同时,谷歌推出免费听写应用 Google AI Edge Eloquent,支持语音转文字、去除口误和轻度润色,全部在设备端完成,并支持不同写作风格和自定义词汇。

Google产品更新多模态端侧
11:10
IT之家(RSS)
52
AMD 高管回应英伟达 RTX Spark 入局:欢迎竞争,自家 Strix Halo 系列足以应对

AMD 客户端业务高级副总裁拉胡尔·蒂库在 2026 台北国际电脑展上回应英伟达推出 RTX Spark 入局 AI PC 处理器市场,表示欢迎竞争,认为大容量本地内存对 AI 智能体工作负载至关重要。AMD 的 Strix Halo 及后续 Gorgon Halo 足以与 RTX Spark 竞争,Gorgon Halo 采用 Zen 5 CPU 和 RDNA 3.5 GPU,统一内存最高 192GB。软件生态方面,AMD 主推 ROCm,称 CUDA 的壁垒影响已较三年前下降,开发者迁移难度较低。

推理端侧行业动态
10:23
Jeff Dean@JeffDean
75
来看看我们的 Gemma 4 12B 模型:它是一个功能非常强大的开源权重模型,可以直接在你的笔记本电脑上运行。

Google Gemma: Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...

Google多模态开源生态模型发布
关联讨论 4 条X:Google AI for Developers (@googleaidevs)Google Developers Blog(RSS)The Decoder:AI News(RSS)Google DeepMind:Blog(RSS)
09:10
IT之家(RSS)
48
微软加速 Arm 生态补缺,用 AI 推进 Win11 原生应用适配

微软将在 2026 年 Build 开发者大会上展示如何利用 AI 智能体,帮助开发者将 x86 应用转换为 Windows on Arm 原生应用。目前原生 Arm 版本已占所有 Windows on Arm 用户应用使用时长的 90%,剩余缺口仍需依靠 Prism 仿真层运行。AI 智能体可承担重复代码处理、转换检查和兼容性验证等任务。

智能体Microsoft端侧行业动态
09:10
IT之家(RSS)
51
微软 Surface RTX Spark Dev Box 更详细规格曝光:约 1000 孔铝壳散热驾驭 AI 负载

微软 Surface RTX Spark Dev Box 是一款面向本地 AI 开发的紧凑型桌面设备,主打模型微调、本地推理和智能体式工作流。采用 NVIDIA Grace CPU(最高 20 Arm 核心)、Blackwell RTX GPU(6144 CUDA 核心),配备 128GB 统一内存,AI 算力最高 1 Petaflop,可本地运行 120B 参数模型,整机功耗 100W。一体式铝制外壳覆盖约 1000 个散热孔兼作散热器,预装 Visual Studio Code、GitHub Copilot、WSL 2、CUDA 支持等工具。

Microsoft产品更新端侧
09:10
IT之家(RSS)
61
苹果 iOS 27 Siri 部分查询将经 Google Cloud 调用授权版 Gemini,使用 NVIDIA Blackwell B200 集群处理

科技媒体 The Information 报道,苹果 iOS 27 版 Siri 的部分用户查询将跳转至 Google Cloud,调用授权版 Gemini 模型,并由谷歌的 NVIDIA Blackwell B200 GPU 集群处理。Blackwell B200 基于 Blackwell 架构,面向大模型训练与推理。为降低云端隐私风险,苹果将启用英伟达机密计算(confidential compute)硬件级安全功能,在 GPU 处理数据时加密,保护 AI 模型在共享云环境中的机密性与完整性。

Google安全/对齐推理端侧
08:51
Berryxia.AI@berryxia
66
Gemma 4 12B 与 Google AI Edge 打通,笔记本全本地 Agentic 工作流上线

谷歌将 Gemma 4 12B 与 Google AI Edge 深度整合,开发者可在笔记本上运行 100% on-device 的 Agentic workflow。Mac 用户新增两款工具:AI Edge Gallery 直接生成代码,AI Edge Eloquent 支持语音输入并实时编辑文本。底层通过 LiteRT-LM 本地 serve 模型,实现零网络、零延迟、数据完全留在设备端。Google 将模型、推理引擎和开发工具链打包,让开发者拥有私有的、可连续执行的本地 AI 队友。

Google for Developers: Unlock local, agentic workflows with Gemma 4 12B and Google AI Edge, directly on your laptop. Experience 100% on-device ...

智能体Google现象/趋势端侧
08:51
Berryxia.AI@berryxia
70
MLX 框架 Day0 同步支持 Gemma 4

我擦! 我发现现在Apple的MLX框架和模型都可以Day0发布了? 这看来是同步进行操作的,MLX框架以及和模型厂商直接第一时间进行了对接啊! 强烈建议Mac的同学直接上MLX框架的模型,速度一般至少10-20%还是有的。

Dmitry Lyalin: If you're waiting Gemma 4 12b through @ollama, its here: gemma4:12b gemma4:12b-it-q4_K_M gemma4:12b-it-q8_0 gemma4:12b-i...

Google模型发布端侧部署/工程
08:40
小互@xiaohu
71
Google 发布 Gemma 4 12B 开源模型

Google 发布 Gemma 4 12B 开源模型,采用无编码器 Unified 架构,可直接处理文本、图像、音频、视频,无需独立编码器。16GB 显存可运行,4-bit 量化后低至 8GB。支持 256K token 上下文、140+ 语言,内置 Thinking 模式和 Function Calling。

Google多模态开源生态模型发布
08:10
IT之家(RSS)
62
豆包宣布将推出专业版,基础功能保持免费;阿里千问向第三方Agent全面开放

豆包声明,针对专业人群推出豆包专业版,基础功能(搜索问答、写作生图、语音和视频对话)保持免费。阿里千问向第三方Agent、Skill全面开放,瑞幸咖啡、肯德基、蜜雪冰城、东方航空为首批接入测试企业。DeepSeek首轮融资拟筹集500亿元,腾讯、宁德时代等参投,投后估值或达4000亿元。腾讯人士称微信AI智能体上线时间暂未定,取决于监管审批。苹果MacBook Neo开售三周出货110万台。

智能体DeepSeek端侧行业动态
07:51
Berryxia.AI@berryxia
69
Google 昨晚发布Gemma 4 12B 多模态的大模型,至少需要16G 内存就可以运行。 应该和Qwen 的模型进行对比其效果如何~

Google Gemma: Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...

Google多模态模型发布端侧
07:10
IT之家(RSS)
39
微软 Surface Pro 第 12 版宣传图曝光:骁龙 X2 Elite 芯片、续航增 10%

科技媒体 WinFuture 曝光微软 Surface Pro 第 12 版宣传物料,预计本月发布。新机搭载高通骁龙 X2 Elite 处理器,顶配 13 英寸采用 12 核 Oryon ARM 芯片,NPU 算力最高 80 TOPS,可支撑 Copilot 本地 AI 任务。配备最高 32GB 内存和 1TB PCIe 4.0 SSD(支持更换)。续航方面本地视频播放最高 15.5 小时,较上一代提升 10%。外观沿用家族式设计,采用明亮 OLED 触控屏,提供黑、铂金、Dune(金色)三种配色,取消蓝色版本。完整规格与售价尚未公布。

Microsoft产品更新端侧
03:58
MiniMax (official)@MiniMax_AI
65
我们已加入 @nvidia 和 @Microsoft 在 #GTC Taipei 的本地 LLM 阵容。🔥 PC 正围绕本地、智能体、开放权重模型重新定义。 MiniMax-M3 正是为此未来而打造: 开放权重。 1M 上下文。 强编码能力。 原生多模态。 对接下来的一切充满期待!
Microsoft开源生态端侧行业动态
03:40
Sundar Pichai@sundarpichai
同事件精选73
Gemma 4 系列累计下载量突破1.5亿次,Google随之推出新成员Gemma 4 12B。该模型仅12B参数,可在16GB VRAM笔记本上本地运行,兼顾尺寸与性能,支持多步推理和智能体工作流。采用Apache 2.0开源许可,供社区使用。

Demis Hassabis: Celebrating the milestone of a massive 150+ million downloads of Gemma 4 with the release of the new Gemma 4 12B model! ...

Google开源生态模型发布端侧
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
推荐理由:Gemma 4 12B 把多步推理塞进笔记本能跑的尺寸,Apache 2.0 开源,对想做本地 agent 的开发者是实实在在的新弹药,小模型的可用性正在逼近临界点。
03:22
Ars Technica:AI(RSS)
60
Google 新发布的 Gemma 4 12B 模型可在任何 16GB 内存笔记本电脑上运行

Gemma 4 12B 采用新的编码方案与 token 预测,实现了超越自身参数规模的性能表现。该模型专为在 16GB RAM 的笔记本电脑上本地运行而设计。

Google多模态模型发布端侧
03:20
Chubby♨️@kimmonismus
65
微软新Surface Laptop Ultra上手体验

微软推出全新Surface Laptop Ultra,定位创作者和AI笔记本,搭载NVIDIA新芯片(RTX GPU),最高提供1 petaflop AI算力、128GB统一内存。配备15英寸mini-LED PixelSense Ultra触摸屏(3:2比例,262 PPI,峰值2000尼特HDR亮度),厚度不足18mm。作者在幕后参观中亲手检测,认为做工、散热、显示屏和芯片令人印象深刻,微软明确将目标对准MacBook Pro,意在直接挑战苹果。

Chubby♨️: First hands-on with Microsoft's new Surface Laptop Ultra. Microsoft is clearly positioning this as a new class of creato...

Microsoft产品更新端侧
03:20
Chubby♨️@kimmonismus
71
Google 开源 Gemma 4 12B:无编码器架构,本地 16GB VRAM 运行

Google 开源 Gemma 4 12B(密集参数,Apache 2.0 许可),采用全新无编码器架构:移除独立的视觉(550M 参数、27 层 Transformer)和音频(300M 参数、12 层 Conformer)编码器。视觉改为 35M 嵌入层(约缩小 15 倍),音频以 40ms 帧直接投影到大语言模型。模型在 16GB VRAM 笔记本上即可运行智能体推理、视觉和音频任务,性能接近 26B 参数模型。共享权重支持一次 LoRA 调优覆盖视觉、音频和文本。

Google: Today we're introducing Gemma 4 12B - our latest open model that brings advanced agentic reasoning, vision and audio dir...

Google多模态开源生态模型发布
02:36
Demis Hassabis@demishassabis
同事件精选74
Demis Hassabis 宣布 Gemma 4 系列下载量突破 1.5 亿,并正式发布新版 Gemma 4 12B 模型。该模型是一个统一的、无编码器的多模态模型,兼具边缘端效率与高级推理能力。尽管参数规模仅为 12B,但性能强劲,且足够小巧,可在仅需 16GB VRAM 的笔记本上本地运行。采用 Apache 2.0 开源许可证,方便开发者自由构建。

Google Gemma: Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...

Google开源生态模型发布端侧
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
推荐理由:Gemma 4 12B 用 Apache 2.0 许可把多模态模型压进笔记本,16GB 显存就能跑,端侧智能的性价比又一次被 Google 拉高,做本地推理的可以马上试试。
02:16
AYi@AYi_AInotes
65
Google 发布 Gemma 4 12B:无独立视觉编码器的统一多模态架构

Google 推出 Gemma 4 12B(Apache 2.0),采用无独立视觉编码器的统一多模态架构。仅用 35M 参数的轻量嵌入器,将图像切为 48×48 块、音频(16kHz 原始波形)切为 40ms 帧,直接作为 token 输入 Transformer。M4 Max 上 4-bit 量化识图延迟 1.2-1.5 秒,官方称 16GB 内存可用,但社区指出高分辨率多图会压线。该设计暗示:当基座模型足够大,专用子模块不再是必需,未来一个微调好的统一模型可能取代传统拼装 Whisper、LLaVa 等多模态 pipeline。

Google Gemma: Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...

Google多模态大佬观点端侧
01:38
Hacker News 热门(buzzing.cc 中文翻译)
同事件精选78
Gemma 4 12B:一种统一的、无需编码器的多模态模型

Gemma 4 12B 是 Google 发布的一款统一架构、无需独立视觉编码器的多模态大语言模型(LLM)。该模型直接处理图像与文本输入,无需传统视觉编码器,简化了多模态推理流程。基于 12B 参数规模,Gemma 4 12B 面向开发者工具生态开放。目前其具体 benchmark 分数、上下文窗口、价格及开源/API 可用性等细节尚未披露。

Google多模态模型发布端侧
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》
推荐理由:我觉得Gemma 4 12B最大的变化不是参数大小,而是第一次在开源模型里把多模态直接交给LLM主干处理,没有单独的视觉编码器,这意味着本地多模态应用的延迟和内存占用都会大幅下降,对于在笔记本上做Agent的开发者,这是一个必试的版本。
‹ 上一页
1…89101112…31
下一页 ›