i'm obsessed with AI DIY projects. my favorite one right now is this broccoli farmer in hokkaido, japan using Codex to r...
i'm obsessed with AI DIY projects. my favorite one right now is this broccoli farmer in hokkaido, japan using Codex to r...
Google DeepMind 发布 Gemma 4 QAT 量化感知训练模型,专为本地 / 设备端优化。通过量化感知训练减少内存占用,同时相比标准训练后量化保留更多质量。支持 Q4_0 格式及新的移动专用量化格式。Gemma 4 E2B 版本可运行于约 1GB 内存,纯文本版本甚至低于 1GB,使手机、笔记本、边缘设备和消费级 GPU 上的本地 AI 更实用。
i'm obsessed with AI DIY projects. my favorite one right now is this broccoli farmer in hokkaido, japan using Codex to r...
谷歌发布 Gemma 4 量化感知训练 (QAT) 检查点,支持在消费级 GPU 和移动设备上本地运行,质量损失极小。新检查点提供 GGUF(Q4_0)格式,覆盖所有尺寸及起草模型,实现最佳本地性能。自定义移动模式采用混合精度方案,将 Gemma 4 压缩至 1GB 以下,包含 2-bit 解码层、优化 KV 缓存和静态激活。通过在训练中模拟压缩(而非训练后量化),大幅降低内存占用并加速解码,同时保持推理质量。
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》Locally AI 被 LM Studio 纳入麾下后,就退出移动手机版的客户端。 果然速度很AI,可以手机端更好跑本地大模型。 但是,目前其实这个场景我觉得还是没有真的挖掘出来或者说没有很好的支持用户的需求。
Locally is now @lmstudio's mobile app, and we are bringing LM Link to your iPhone. Use your largest models from your pho...
Nemotron 3 Ultra performed GPT 5.5 level 10× cheaper We gave three same prompts to build HTML5 canvas with real physics....
OpenAI Codex 推出 Build iOS Apps 插件,让用户在不离开 Codex 的情况下查看、测试 iOS 应用,预览 SwiftUI 并热重载。原理:借助第三方 npm serve-sim 将 iOS Simulator 画面截取为视频流显示在浏览器中,同时建立控制通道将浏览器的点击、拖动等操作转换为模拟器触摸或键盘事件。插件读取 iOS App 的 Accessibility 信息,在浏览器画面上覆盖透明 HTML 按钮,使 Codex 能选择原生 UI 元素。SwiftUI 预览和热重载通过临时生成预览小 App,仅重新编译相关动态库,无需完整重装应用。
More of the iOS app loop, now inside Codex. The Build iOS Apps plugin lets Codex view and test your iOS app in the in-ap...
Introducing Magenta RealTime 2 🎺 - Open model for live music generation - Just 2.4B parameters, perfect for on-device -...
歸藏发布手机端小工具「即览 Glimpse」,无 AI、不联网,专用于解决 iOS 上预览 AI 产出的 Markdown 和 HTML 内容的问题。经过三天苹果审核,现已开放 8000 个测试名额。若名额用完,预计数天后正式上架 App Store。
http://x.com/i/article/2062359856376610816
Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...
关联讨论 4 条Google Developers Blog(RSS)The Decoder:AI News(RSS)Google DeepMind:Blog(RSS)Hacker News 热门(buzzing.cc 中文翻译)谷歌将 Gemma 4 12B 与 Google AI Edge 深度整合,开发者可在笔记本上运行 100% on-device 的 Agentic workflow。Mac 用户新增两款工具:AI Edge Gallery 直接生成代码,AI Edge Eloquent 支持语音输入并实时编辑文本。底层通过 LiteRT-LM 本地 serve 模型,实现零网络、零延迟、数据完全留在设备端。Google 将模型、推理引擎和开发工具链打包,让开发者拥有私有的、可连续执行的本地 AI 队友。
Unlock local, agentic workflows with Gemma 4 12B and Google AI Edge, directly on your laptop. Experience 100% on-device ...
我擦! 我发现现在Apple的MLX框架和模型都可以Day0发布了? 这看来是同步进行操作的,MLX框架以及和模型厂商直接第一时间进行了对接啊! 强烈建议Mac的同学直接上MLX框架的模型,速度一般至少10-20%还是有的。
If you're waiting Gemma 4 12b through @ollama, its here: gemma4:12b gemma4:12b-it-q4_K_M gemma4:12b-it-q8_0 gemma4:12b-i...
Google 发布 Gemma 4 12B 开源模型,采用无编码器 Unified 架构,可直接处理文本、图像、音频、视频,无需独立编码器。16GB 显存可运行,4-bit 量化后低至 8GB。支持 256K token 上下文、140+ 语言,内置 Thinking 模式和 Function Calling。
Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...
Celebrating the milestone of a massive 150+ million downloads of Gemma 4 with the release of the new Gemma 4 12B model! ...
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》微软推出全新Surface Laptop Ultra,定位创作者和AI笔记本,搭载NVIDIA新芯片(RTX GPU),最高提供1 petaflop AI算力、128GB统一内存。配备15英寸mini-LED PixelSense Ultra触摸屏(3:2比例,262 PPI,峰值2000尼特HDR亮度),厚度不足18mm。作者在幕后参观中亲手检测,认为做工、散热、显示屏和芯片令人印象深刻,微软明确将目标对准MacBook Pro,意在直接挑战苹果。
First hands-on with Microsoft's new Surface Laptop Ultra. Microsoft is clearly positioning this as a new class of creato...
Google 开源 Gemma 4 12B(密集参数,Apache 2.0 许可),采用全新无编码器架构:移除独立的视觉(550M 参数、27 层 Transformer)和音频(300M 参数、12 层 Conformer)编码器。视觉改为 35M 嵌入层(约缩小 15 倍),音频以 40ms 帧直接投影到大语言模型。模型在 16GB VRAM 笔记本上即可运行智能体推理、视觉和音频任务,性能接近 26B 参数模型。共享权重支持一次 LoRA 调优覆盖视觉、音频和文本。
Today we're introducing Gemma 4 12B - our latest open model that brings advanced agentic reasoning, vision and audio dir...
Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...
同一事件,精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》Google 推出 Gemma 4 12B(Apache 2.0),采用无独立视觉编码器的统一多模态架构。仅用 35M 参数的轻量嵌入器,将图像切为 48×48 块、音频(16kHz 原始波形)切为 40ms 帧,直接作为 token 输入 Transformer。M4 Max 上 4-bit 量化识图延迟 1.2-1.5 秒,官方称 16GB 内存可用,但社区指出高分辨率多图会压线。该设计暗示:当基座模型足够大,专用子模块不再是必需,未来一个微调好的统一模型可能取代传统拼装 Whisper、LLaVa 等多模态 pipeline。
Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...
苹果分析师郭明錤更新预测:此前规划的XR头戴装置路线图已作废,目前仅两款智能眼镜设备有能见度。路线图大改由下一任CEO John Ternus拍板,Vision Pro系列被移除,资源转向智能眼镜。最新供应链调查显示,具有显示功能的AR/XR智能眼镜(光波导)推迟至2029年,无显示功能的AI眼镜(类似Ray-Ban Meta)仍预计2027年推出。郭明錤认为智能眼镜将带动下一波消费电子趋势。
Apple Vision系列與智慧眼鏡產品規劃預測 (2025-2028):智慧眼鏡可望帶動下一個消費電子趨勢 全文連結:https://mingchikuo.craft.me/FgF89wv0af9Bpw
郭明錤更新苹果XR头显与智能眼镜路线图,原先版本已失效。目前仅剩两款智能眼镜产品在规划中,主要调整由苹果下任CEO John Ternus批准,取消了Vision Pro产品线,将资源转向更具大众市场潜力的智能眼镜。最新供应链调查显示,配备光学波导显示屏的AR/XR智能眼镜设备推迟至2029年;不带显示屏的AI眼镜(类似Ray-Ban Meta)预计2027年出货。
Apple Vision Series and Smart Glasses Roadmap (2025-2028): Smart Glasses Set to Drive the Next Wave in Consumer Electron...
Join the waitlist for Personal Computer on Windows: https://www.perplexity.ai/hub/products/computer-for-windows
Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to y...
Google发布Gemma 4 12B,一款无编码器的统一多模态模型,可直接将视觉和音频输入送入LLM主干,无需传统多模态编码器。该模型填补了移动端E4B模型与26B MoE模型之间的空白,封装前沿推理与原生音频能力,采用Apache 2.0许可。在16GB VRAM下即可本地运行复杂多步骤智能体工作流,性能接近26B模型。
关联讨论 4 条Google Developers Blog(RSS)The Decoder:AI News(RSS)Google DeepMind:Blog(RSS)Hacker News 热门(buzzing.cc 中文翻译)国内团队开源项目OpenSquilla用Python重写“小龙虾”,解决费token、不按规则执行及安全问题。它集成小模型对请求实时分类:简单任务走便宜模型,复杂任务走顶级模型。测试25个任务,纯Claude Opus 4.7成本6.2美金,OpenSquilla混跑Opus 4.7、GLM5.1、DS4 Flash成本仅0.68美金,分数几乎一样。同时,它根据对话语义只注入匹配度最高的Skill(原90+个),每轮省约9000 Token,100次对话累计省100万Token。
Read more about hybrid agentic inference in Perplexity Computer: https://www.perplexity.ai/hub/blog/the-data-center-move...
微软推出Surface RTX Spark Dev Box,一款专为本地AI开发的小型台式机。它搭载NVIDIA RTX Spark芯片、128GB内存,算力达1 petaflop,可在本地运行1200亿参数大模型。其阳极氧化铝机身集成了散热系统,功耗100W。设备预装了开发者版Windows 11 Pro及开发工具链,预计售价3000至3500美元,将于今年晚些时候在美国上市。
商汤联合创始人兼首席科学家在2026 AI创新论坛指出,模型架构优化能显著降低单位智能所需的算力。其新发布的多模态模型SenseNova U1基于自研Neo-Unify架构,实践了这一理念,在生成信息图时实现了显著更低的计算成本,并已适配多款中国芯片。商汤强调持续通过应用与模型创新推动芯片发展,以创造商业价值与长期竞争力。
We're shifting from apps and operating systems to agents, and that changes the device experience end to end. Great conve...
This came as a surprise: Microsoft has unveiled handheld and desktop devices designed to control one's agents. It remind...
This came as a surprise: Microsoft has unveiled handheld and desktop devices designed to control one's agents. It remind...
这副智能眼镜内置Arm Cortex A7处理器,运行完整的Buildroot Linux系统,可通过SSH直接运行Claude Code、Codex等编程工具。整个系统将于8月前开源至GitHub。其核心价值在于将编程智能体从桌面带到用户眼前,通过眼镜的视觉上下文和骨传导麦克风实现“计算跟人走”的实时协作,被视为一种新型的“Agent Terminal”。
http://x.com/i/article/2061406941541240838
郭明錤认为,NVIDIA CEO黄仁勋在GTC提出的“重新发明PC”口号,核心是展示端侧AI agent工作流概念。他指出,该概念并非原创,但将借助高曝光度主导未来叙事。然而,现实挑战在于:配备N1X芯片的RTX Spark装置未来两年出货量约1000万台,仍属利基市场;且当前PC主流AI应用与端侧算力关系不大。关键制约在于操作系统支持,Windows需完善相关工具才能兑现端侧AI agent体验。这也将影响Apple在WWDC上如何回应。
許多人期待、Nvidia 可能將要發布的 N1X / Windows PC 處理器,供應鏈調查與重點分析: ▌供應鏈調查顯示,配備 N1X 的裝置未來兩年出貨量約10M ➡ 仍屬利基市場,瞄準對裝置端 AI 算力有需求的重度使用者。 ➡ 未...
郭明錤分析了NVIDIA在GTC上提出的RTX Spark笔记本及设备端AI智能体概念。他指出,该概念演示(无实际现场展示)包含操作系统、云/本地LLM切换、智能体框架等要素。供应链调查显示,配备相关N1X芯片的设备未来两年出货量约1000万台,仍属利基市场。当前PC端主流AI应用仍依赖云端算力。若设备出厂时,NVIDIA CUDA Toolkit未正式支持Windows Arm64,且Microsoft的设备端AI智能体栈(包括MCP on Windows、ODR等)仍处于预览状态,则RTX Spark将难以兑现其核心卖点。此外,Apple在WWDC上如何应对设备端AI智能体工作流也值得关注。
許多人期待、Nvidia 可能將要發布的 N1X / Windows PC 處理器,供應鏈調查與重點分析: ▌供應鏈調查顯示,配備 N1X 的裝置未來兩年出貨量約10M ➡ 仍屬利基市場,瞄準對裝置端 AI 算力有需求的重度使用者。 ➡ 未...