5月16日

16:56

歸藏(guizang.ai)@op7418

Codex除了通过ChatGPT连接和远程控制外，还能控制另一台电脑，实现在ChatGPT上直接管理多台设备而无需切换，只需切换项目即可访问不同设备的上下文和文件。引用推文补充，此功能还支持通过远程SSH设置其他VMs等，增强了多设备协作的灵活性和实用性。

Vaibhav (VB) Srivastav: @op7418 yes! and you can set up other VMs etc via remote SSH as well!

智能体 OpenAI 教程/实践端侧

5月15日

20:32

Chubby♨️@kimmonismus

Codex 的"锁定使用"即将到来。可能解释了 OpenAI 昨天的图片。 "让 Codex 在你的 Mac 锁定时使用它"

🚨 AI News | TestingCatalog: OpenAI is working on a dedicated setting for Codex to allow users to enable "Locked use." > Let Codex use your Mac while...

智能体 OpenAI 产品更新端侧

18:27

向阳乔木@vista8

面壁智能推出仅1.3B参数的视觉语言模型MiniCPM-V 4.6。该模型采用LLaVA-UHD v4技术，将视觉编码成本降低55%，专为消费级和移动硬件优化，支持高效边缘部署。其在关键多模态和Artificial Analysis基准测试中，性能超越了Gemma4-E2B-it和Qwen3.5-0.8B等更大模型，且仅消耗后者2.5%的token预算。在处理高分辨率图像时，其首token生成时间比Qwen3.5-0.8B快2.2倍，在单张RTX 4090上的token吞吐量约为后者的1.5倍。模型已在Hugging Face、ModelScope等平台开源发布。

OpenBMB: 1/5 MiniCPM-V 4.6 (1.3B) is now live 🚀🚀 High-res visual processing, optimized for consumer-grade and mobile hardware. ...

多模态模型发布端侧

5月14日

13:35

Rohan Paul@rohanpaul_ai

Qwen 3.6 27B 在 MacBook Pro M5 Max 64GB 上实现每秒34个token的本地推理

近期，Qwen 3.6 27B大型语言模型通过TurboQuant技术被量化为GGUF格式，并整合Multi-Token Prediction技术。在配备M5 Max芯片和64GB内存的MacBook Pro上，该模型实现了每秒34个token的本地推理速度。高达90%的接受率表明，性能提升并非以牺牲输出质量为代价，而是通过避免重复的全成本解码工作来达成。同时，利用llama.cpp进行高效调用，进一步优化了运行效率。这一技术组合显著扩展了“笔记本电脑AI”的应用边界，使得在本地设备上流畅运行大型模型成为可能，提升了用户体验。

atomic.chat: Multi-Token Prediction (MTP) for Qwen on LLaMA.cpp! +40% performance! 90% acceptance rate. Running locally on a MacBook ...

GitHub 推理教程/实践端侧

5月13日

12:50

Berryxia.AI@berryxia

精选76

oMLX更新强化苹果端侧AI，本地能力直逼云端

oMLX项目更新至0.3.9.dev2版本，集成了Gemma 4的MTP视觉路径、DFlash引擎和ParoQuant技术，显著提升了图文处理速度。新增一键启动copilot功能，可便捷接入Claude等工具，并通过oQ自动代理解决显存瓶颈。这些改进大幅增强了本地AI在速度、集成与易用性上的表现，正推动AI能力从云端向个人电脑回归。

GitHub MCP/工具多模态开源/仓库

推荐理由：oMLX 这个更新把 Gemma 4 的视觉能力塞进本地，加一键接入 Claude 的工具链，端侧 AI 从差点意思到真可用，值得每个 Mac 开发者立刻试一下。

11:50

歸藏(guizang.ai)@op7418

谷歌发布Gemini Intelligence，深度整合AI于安卓系统

谷歌在I/O大会上发布Gemini Intelligence，将AI深度集成至安卓系统。该功能将率先登陆三星Galaxy和Pixel手机，并逐步覆盖所有安卓设备。其核心能力包括跨应用自动执行复杂任务（如在备忘录与购物应用间同步清单），以及使Chrome浏览器能自动检索、总结内容及填写表单。新推出的Rambler语音输入功能可将口语转化为精炼文本，并支持多语言混用。用户还能通过自然语言指令生成个性化桌面小组件，如定制食谱或特定天气数据组件。此外，全新的Material 3 Expressive设计语言会在AI交互时使组件边界呈现虚化与模糊效果，提升视觉体验。

Google: Today, we introduced Gemini Intelligence, which brings the best of Gemini to our most advanced devices. Gemini Intellige...

智能体 Google 产品更新多模态

08:49

Berryxia.AI@berryxia

Jina同步发布MLX格式嵌入模型，端侧AI部署迎来新趋势

Jina在其新版嵌入模型发布首日，即同步提供了全套MLX格式变体，改变了以往社区缓慢移植的节奏。这表明MLX已被视为核心部署目标，背后应有自动化流程支持。这一动向反映了MLX生态的崛起：Qwen、DeepSeek等主流模型官方开始集成MLX，Hugging Face将其提升为一级框架标签。嵌入模型因其体积小、推理频繁的特性，尤其适合在Mac的M系列统一内存上运行，为本地RAG等场景提供了理想的端侧AI解决方案。

Berryxia.AI: https://huggingface.co/collections/jinaai/jina-embeddings-v5-omni

Hugging Face 开源/仓库模型发布现象/趋势

08:41

meng shao@shao__meng

Google 发布首款 AI 优先笔记本 Googlebook，集成 Gemini 智能

Google 正式推出首款为 Gemini Intelligence 设计的笔记本 Googlebook，标志着从“云优先”的 Chromebook 时代进入“AI 优先”新阶段。其核心创新包括：Magic Pointer 将系统光标变为 AI 交互入口，可直接触发上下文建议与任务；Create Your Widget 允许通过自然语言生成聚合多源信息的动态桌面小组件；深度整合 Android 生态，实现手机 App 无缝调用与文件跨设备快速访问。该产品以 Gemini 为核心，旨在将 AI 能力下沉至系统级交互，降低使用门槛，并强化跨设备协同体验。

Google: Introducing Googlebook, the first laptop designed for Gemini Intelligence. It's crafted for heavyweight performance, bui...

Google 产品更新端侧

03:38

阿绎 AYi@AYi_AInotes

Claude用微型电脑举办的编程活动，为何如此温暖人心？

在“Code with Claude”活动中，参与者使用资源有限的Cardputer微型电脑，在Claude的辅助下于几小时内创作出各种充满趣味的小项目，如魔法棒、拼写游戏和弹珠迷宫。这些项目虽无商业价值，却展现了极高创意密度与快乐。活动证明，在有限硬件条件下，AI能将创意实现时间从数月压缩到数小时，真正解放了有想法但不会编码的普通人。在当前AI行业过度聚焦生产力与替代人力的背景下，Claude此举凸显了“快乐比实用更有力量”的理念。

Claude: We gave people tiny computers at Code with Claude. Here are some of the small, delightful things they built:

Anthropic 现象/趋势端侧编码

5月12日