AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 301 条
全部一手资讯X论文
标签「端侧」清除
歸藏(guizang.ai)@op7418 · 5月16日74

我终于知道昨天 OpenAI 官方的人回复我是啥意思了! Codex 除了用 ChatGPT 连接和远程控制以外,还可以在 Codex 再控制你的另一台电脑。 这样你就可以在 ChatGPT 上直接控制多台电脑,而不用在 ChatGPT 切换设备,只需要切换项目就好。 比如我这个 Mac Book 的 Codex 可以读取他本地的文件,也可以直接读取我另一台 Mac Mini 的上下文和文件。 说一下怎么做: 1. 首先你去“设置”里的“连接”,选择“控制其他设备”。 2. 在“控制其他设备”里点击加号,选择你其他已经安装 Codex 的设备。 3. 选择完了以后,你需要在新聊天下的“选择工作区”里连接远程项目。 4. 找到你另一个远程设备下需要让它访问的文件夹。 这样你就可以在 Codex 下看到另一个设备跑的项目,ChatGPT 选择这个设备时也能看到另一个设备的项目。 它们的上下文就共享了。这个太有用了!

译Codex除了通过ChatGPT连接和远程控制外,还能控制另一台电脑,实现在ChatGPT上直接管理多台设备而无需切换,只需切换项目即可访问不同设备的上下文和文件。引用推文补充,此功能还支持通过远程SSH设置其他VMs等,增强了多设备协作的灵活性和实用性。

Chubby♨️@kimmonismus · 5月15日45

"Locked use" for Codex incoming. Probably explains OpenAI's image yesterday. "Let Codex use your Mac while it's locked"

译Codex 的“锁定使用”即将到来。 可能解释了 OpenAI 昨天的图片。 “让 Codex 在你的 Mac 锁定时使用它”

向阳乔木@vista8 · 5月15日63

前几天在Huggingface看到模型论文了。 面壁智能的MiniCPM-V 4.6 ,竟然只有1.3B的视觉模型。 看Benchmark效果有点强,抽空测试下。

译面壁智能推出仅1.3B参数的视觉语言模型MiniCPM-V 4.6。该模型采用LLaVA-UHD v4技术,将视觉编码成本降低55%,专为消费级和移动硬件优化,支持高效边缘部署。其在关键多模态和Artificial Analysis基准测试中,性能超越了Gemma4-E2B-it和Qwen3.5-0.8B等更大模型,且仅消耗后者2.5%的token预算。在处理高分辨率图像时,其首token生成时间比Qwen3.5-0.8B快2.2倍,在单张RTX 4090上的token吞吐量约为后者的1.5倍。模型已在Hugging Face、ModelScope等平台开源发布。

Rohan Paul@rohanpaul_ai · 5月14日77

Qwen 3.6 27B on a MacBook Pro M5 Max 64GB hitting 34tokens per sec, locally with atomic[.]chat 90% acceptance rate, i.e. most draft tokens matched what the main model would have produced, so the speed gain is not from skipping quality checks, but from avoiding repeated full-cost decoding work. TurboQuant and GGUF handle the storage and runtime side: the model is compressed enough to run locally, while llama.cpp can feed Apple Silicon efficiently instead of waiting on huge weight movement. Pretty serious local-inference result, changes what “laptop AI” can feel like.

译近期,Qwen 3.6 27B大型语言模型通过TurboQuant技术被量化为GGUF格式,并整合Multi-Token Prediction技术。在配备M5 Max芯片和64GB内存的MacBook Pro上,该模型实现了每秒34个token的本地推理速度。高达90%的接受率表明,性能提升并非以牺牲输出质量为代价,而是通过避免重复的全成本解码工作来达成。同时,利用llama.cpp进行高效调用,进一步优化了运行效率。这一技术组合显著扩展了“笔记本电脑AI”的应用边界,使得在本地设备上流畅运行大型模型成为可能,提升了用户体验。

Berryxia.AI@berryxia · 5月13日76

最近我鼓吹苹果的端侧模型和统一内存的优势! 前有MLX ,现在不断拓展的格式都出来比如之前也分享过的oMLX又有更新! Apple Silicon上的本地AI已经把云端大模型的很多优势直接干掉了。 oMLX 0.3.9.dev2直接把Gemma 4的MTP视觉路径、DFlash引擎、ParoQuant全塞了进来,图文解码速度大幅提升; 还新增了omlx launch copilot,一键接入Claude / Codex / OpenClaw等顶级工具; oQ自动建proxy解决显存不够的问题; 管理界面也加了重启服务器按钮。 以前本地AI总觉得“差点意思”,现在它在速度、集成度、易用性上越来越离谱地强。 这才是真正把AI从云端拉回你自己电脑的节奏。 项目地址:https://github.com/jundot/omlx

译oMLX项目更新至0.3.9.dev2版本,集成了Gemma 4的MTP视觉路径、DFlash引擎和ParoQuant技术,显著提升了图文处理速度。新增一键启动copilot功能,可便捷接入Claude等工具,并通过oQ自动代理解决显存瓶颈。这些改进大幅增强了本地AI在速度、集成与易用性上的表现,正推动AI能力从云端向个人电脑回归。

歸藏(guizang.ai)@op7418 · 5月13日62

谷歌昨天安卓 I/O 大会最大的跟 AI 相关的发布,是发布了 Gemini Intelligence 会先在三星 Galaxy 和 Pixel 手机上推出,后面会拓展到其他所有类型的安卓设备。 具体功能上,首先它可以帮你自动完成在多个 App 上操作的繁琐任务,而且可以跨多个软件去操作。 比如你备忘录里有一堆购物清单,然后你可以让它直接把这些清单加到购物车里。 安卓的 Chrome 浏览器可以自动帮你操作浏览器去检索内容和总结内容,也可以帮你填写表单之类的。 他们在新推出了一个语音输入功能,叫 Rambler,它可以自动将你的口语转换成文本语言,去掉一些语气词并重新排版,而且支持多语言混用。 最显眼的是它支持你通过自然语言去生成你想要的任何桌面小组件。 比如说你可以让它生成一个每周推荐食谱的小组件,它就会自定义 AI 帮你生成,然后固定到你的桌面上。 或者说你只关心某些天气的属性,比如说风速和降雨,然后它就会自动生成一个只有这些数据的桌面组件。 这个功能我在去年六七月的时候跟一个 AI 创业者提过,结果到现在谷歌自己出了。 而且他们这次还发布了  Material 3 Expressive 的设计语言,跟苹果的液态玻璃区别挺大的。 它会在没有交互的时候是实体的边界,非常明显的分隔线,就是组件边界。 在 AI 开始交互的时候,组件的边界会发生虚化和高斯模糊,非常的漂亮。

译谷歌在I/O大会上发布Gemini Intelligence,将AI深度集成至安卓系统。该功能将率先登陆三星Galaxy和Pixel手机,并逐步覆盖所有安卓设备。其核心能力包括跨应用自动执行复杂任务(如在备忘录与购物应用间同步清单),以及使Chrome浏览器能自动检索、总结内容及填写表单。新推出的Rambler语音输入功能可将口语转化为精炼文本,并支持多语言混用。用户还能通过自然语言指令生成个性化桌面小组件,如定制食谱或特定天气数据组件。此外,全新的Material 3 Expressive设计语言会在AI交互时使组件边界呈现虚化与模糊效果,提升视觉体验。

Berryxia.AI@berryxia · 5月13日65

Mac用户大喜啊!苹果端侧模型的优势又来了! 今天还看到Jina直接原生框架支持了MLX了! 以前开源 embedding 模型发布节奏一般是这样: Day 0:放 PyTorch 原版 Day 7-30:社区有人转 GGUF Day 30-90:有人想起来转 MLX 大部分时候:MLX 版本永远不会有,得自己 mlx_lm.convert Jina 这次是和原版同一天发布 MLX 变体,而且是全套——nano/small × 4 个任务变体 = 8 个 MLX 模型。 这意味着: MLX 已经被 Jina 当成很重要的部署目标,不是社区可选项 他们内部应该有 MLX pipeline,不是手工转的。 这背后的趋势,最近半年同类产品都有这些动作。 Qwen3、DeepSeek、Llama 系列官方 release 都开始带 MLX 变体。 Hugging Face 自己加了 MLX 作为一级 framework tag(和 PyTorch、JAX 并列) mlx-community 的下载量已经不输 GGUF 在某些细分领域 Apple 自己的 Foundation Models 也是 MLX 路线 embedding 这个赛道尤其适合 MLX: 模型小(1-2B 很完美啊!,正好塞进 M 系列统一内存) 推理频繁但每次量小(不像 LLM 是长 generation) 本地 RAG / 个人知识库场景天然在 Mac 上。

译Jina在其新版嵌入模型发布首日,即同步提供了全套MLX格式变体,改变了以往社区缓慢移植的节奏。这表明MLX已被视为核心部署目标,背后应有自动化流程支持。这一动向反映了MLX生态的崛起:Qwen、DeepSeek等主流模型官方开始集成MLX,Hugging Face将其提升为一级框架标签。嵌入模型因其体积小、推理频繁的特性,尤其适合在Mac的M系列统一内存上运行,为本地RAG等场景提供了理想的端侧AI解决方案。

meng shao@shao__meng · 5月13日71

Google 正式发布 Googlebook,第一款专门为 Gemini Intelligence 设计的笔记本,还有朋友记得很多年前的 Chromebook 吗 😂 Googlebook 融合了 Android(Google Play 应用生态 + 面向 AI 设计的现代 OS)与 ChromeOS(Chrome 浏览器)。15 年前 Chromebook 是为"云优先"时代而生;Googlebook 则是为"AI 优先"时代而生。 https://blog.google/products-and-platforms/platforms/android/meet-googlebook # 三大产品支柱 1. Magic Pointer(与 Google DeepMind 合作) 把"光标"——电脑上使用频率最高、却几十年未变(上次大变化是加入右键)的交互元素——重新设计为 AI 入口。 · 抖动光标即可唤出 Gemini 的上下文建议 · 指向邮件中的日期 → 直接创建会议 · 选中"客厅照片 + 新沙发图" → 立刻合成可视化效果 这是把 AI 从"独立聊天框"下沉到系统级指针交互,降低使用门槛。 2. Create Your Widget 通过自然语言提示生成自定义小组件,Gemini 可接入 Gmail、Calendar 等 Google 应用并联网,把一类任务(如"柏林家庭聚会"的航班、酒店、餐厅、倒计时)聚合成单一仪表盘。 将"桌面"从静态图标列表升级为任务驱动的动态信息中枢。 3. Android 生态深度互通 · 手机 App 直接在笔记本上调用(如下单外卖、完成 Duolingo 课程) · Quick Access:在文件浏览器中直接查看、搜索、插入手机文件,无需传输 对标 Apple 的 Continuity 生态,弥补 Google 多年以来手机与笔电协同的短板。

译Google 正式推出首款为 Gemini Intelligence 设计的笔记本 Googlebook,标志着从“云优先”的 Chromebook 时代进入“AI 优先”新阶段。其核心创新包括:Magic Pointer 将系统光标变为 AI 交互入口,可直接触发上下文建议与任务;Create Your Widget 允许通过自然语言生成聚合多源信息的动态桌面小组件;深度整合 Android 生态,实现手机 App 无缝调用与文件跨设备快速访问。该产品以 Gemini 为核心,旨在将 AI 能力下沉至系统级交互,降低使用门槛,并强化跨设备协同体验。

阿绎 AYi@AYi_AInotes · 5月13日59

Claude今天这波操作,真的把我看暖到了! 他们给每个参与者发了一台巴掌大的Cardputer, 只有几英寸的小屏幕,有限的内存,和一个迷你键盘, 然后让大家用Claude辅助写代码, 几个小时之后,所有人都做出了属于自己的小玩意儿, 有人做了摇一摇就能切换主题的魔法棒, 有人给女儿做了像素小花拼写游戏, 有人做了靠身体倾斜控制的弹珠迷宫, 有人复刻了经典的俄勒冈小径生存游戏, 没有一个是能赚钱的杀手级应用, 但每一个都让人忍不住会心一笑, damn,这才是AI coding真正的魔力啊, 以前做硬件需要懂嵌入式,懂MicroPython, 现在你只要跟Claude说,帮我做一个摇一摇会亮的魔法棒, 代码就出来了,刷一下就能跑, 最关键的地方在于 资源越少,创意密度反而越高, 无限的算力和大屏只会让你陷入功能堆叠地狱, 只有当你被限制在几英寸的屏幕里, 你才会逼着自己做最极简,最直觉,最打动人的东西, 我觉得AI真正解放的不一定都是程序员, 还有那些脑子里有一堆奇思妙想, 却从来不会写代码的普通人, 把从想法到原型的时间,从几个月压缩到了几个小时, 挺感慨的,现在最火的AI产品都在卷生产力,卷benchmark,卷能替代多少员工, 只有Claude,带着一群人,用最简陋的硬件, 做了一堆最没用,也最快乐的小玩具, 我相信 快乐永远比实用更有力量, 有趣和可爱才是终极的增长黑客, 所以兄弟们,别再天天想着用AI改变世界了, 今天就用Claude,给自己做一个没用的小玩意儿吧! #Claude #Cardputer #AI编程

译在“Code with Claude”活动中,参与者使用资源有限的Cardputer微型电脑,在Claude的辅助下于几小时内创作出各种充满趣味的小项目,如魔法棒、拼写游戏和弹珠迷宫。这些项目虽无商业价值,却展现了极高创意密度与快乐。活动证明,在有限硬件条件下,AI能将创意实现时间从数月压缩到数小时,真正解放了有想法但不会编码的普通人。在当前AI行业过度聚焦生产力与替代人力的背景下,Claude此举凸显了“快乐比实用更有力量”的理念。

Berryxia.AI@berryxia · 5月12日22

目前应该给到我们的是256G的涨价,但是似乎可能仿佛256G 的没有货啊,怎么选啊。 这个到底算是涨价还是没有涨价呢。。。

译用户反映Mac Studio的256G版本面临涨价且可能缺货,引发对实际价格变动的困惑。关键背景信息来自@berryxia的推文,其指出此次更新并非用户期待的M5芯片升级,而是产品即将涨价的通知。核心矛盾在于预期中的硬件更新落空,取而代之的是价格上涨与供应不确定性的问题。

Berryxia.AI@berryxia · 5月12日57

Apple 一直其实在赌端侧模型的应用! 统一架构内存就是端侧模型的天然温床! 统一内存也就是,内存即显存。 也看到越来越多的优秀端侧模型出现。 OpenBMB 把 MiniCPM-V 4.6 这个 1.3B 的多模态模型放出来了,我看完觉得现在小模型在边缘设备上真的越来越能打。 它重点做了高分辨率视觉处理,专门针对消费级硬件和手机优化。 他们用了 LLaVA-UHD v4 的新技术,直接把视觉编码成本砍了 55%,让模型能在普通手机和电脑上原生跑起来,效率高得离谱。 实际测下来,它在几个关键多模态基准上超过了 Gemma4-E2B-it 和Qwen3.5-0.8B,而且用的 token 只有后者的 2.5%。 速度方面也特别能看:在 RTX 4090 上处理 3136² 高清图片时,首 token 时间只要 75.7ms,比 Qwen3.5-0.8B 快 2.2 倍,token 吞吐量还高出 1.5 倍左右。 技术上他们玩了 Intra-ViT 早期压缩和混合 4x/16x 视觉压缩,基本把分辨率和延迟的曲线拉平了,想象一下以后手机上直接跑高分辨率视觉任务都不会卡。 对开发者来说也特别友好:iOS、Android、HarmonyOS 部署代码全开源,几步就能跑起来。 消费级 GPU 上就能 fine-tuning,还原生支持 SGLang、vLLM、llama.cpp、Ollama,GGUF、BNB、AWQ、GPTQ 各种量化格式都有,直接就能用。 Hugging Face、GitHub、Modelscope、网页 demo 和 App demo 都放出来了,想玩的同学可以直接去试。 我改天搞个demo看看😂

译推文指出Apple的统一内存架构是端侧AI的理想平台。同时,OpenBMB发布了专为消费级硬件优化的1.3B多模态模型MiniCPM-V 4.6。该模型采用LLaVA-UHD v4技术,将视觉编码成本降低55%,实现了高效的边缘原生部署。其在多项关键基准测试中超越了更大的模型,且token消耗仅为对比模型的2.5%。在RTX 4090上处理高分辨率图像时,首token延迟仅75.7ms,速度快2.2倍。模型技术亮点包括Intra-ViT早期压缩和混合视觉压缩,有效平衡了分辨率与延迟。其部署友好,支持iOS、Android、HarmonyOS及多种主流推理框架与量化格式,相关资源已在各大平台开源。

Berryxia.AI@berryxia · 5月12日66

Sigma 浏览器现已在 Private Mode 中支持 Hermes Agent! Hermes Agent 可以在现有的本地模型之上运行,以执行您的浏览器任务。用户可以在设置菜单中选择 OpenClaw 和 Hermes 选项。

译Sigma 浏览器现已在隐私模式中支持 Hermes Agent! Hermes Agent 可以在现有本地模型之上运行,以执行您的浏览器任务。用户可在设置菜单中选择 OpenClaw 或 Hermes 选项。 Team Hermes or team OpenClaw? 👀

Artificial Analysis@ArtificialAnlys · 5月12日62

OpenBMB, a Tsinghua University / ModelBest open weights collaboration, has released MiniCPM-V 4.6 1.3B Instruct, a tiny, non-reasoning model that scores 13 on the Artificial Analysis Intelligence Index This model sits 3 points ahead of Qwen3.5 0.8B (Non-reasoning, 10) and 2 points behind Qwen3.5 2B (Non-reasoning, 15) on the Intelligence Index, establishing a new Pareto-optimal point on our Intelligence vs. Total Parameters chart. Tiny models are useful for efficient inference and on-device use cases. MiniCPM-V 4.6 1.3B Instruct is a vision-language model that supports text, image, and video input with text output. @OpenBMB is a China-based lab jointly founded in 2022 by Tsinghua University’s NLP Lab and ModelBest Inc. The model’s weights have been released under an Apache 2.0 license on Hugging Face. Key results: ➤ At 1.3B parameters, MiniCPM-V 4.6 1.3B Instruct scores 13 on the Artificial Analysis Intelligence Index, the highest for any open weights model under 2B parameters. The next-most-intelligent open weights model at comparable scale is Qwen3.5 0.8B (Reasoning, 11) and used 43x as many tokens to run the Intelligence Index; Qwen3.5 2B which scores 16 (Reasoning) and 15 (Non-reasoning) requires 1.7x as many parameters (2.27B). MiniCPM-V 4.6 1.3B Instruct also tops sub-2B open weights on MMMU-Pro, scoring 38%. ➤ MiniCPM-V 4.6 1.3B Instruct extends the open weights Pareto frontier for Intelligence vs. Total Parameters. Because the model is dense, total and active parameter counts are both 1.3B, so it pushes both frontiers. The next-most-intelligent sub-2B model (Qwen3.5 0.8B (Reasoning), 11) lands 2 points behind, despite also using a reasoning mode. ➤ MiniCPM-V 4.6 1.3B Instruct is highly token efficient, and used just 5.4M output tokens to run the Intelligence Index, ~19x fewer than Qwen3.5 0.8B (Non-reasoning, 101M) and ~43x fewer than Qwen3.5 0.8B (Reasoning, 233M). This is the lowest output token count measured for any open weights model under 4B total parameters scoring 10 or above on the Index (next-lowest is Ministral 3 3B at 15.5M). ➤ MiniCPM-V 4.6 1.3B Instruct supports native multimodal input, including text, image, and video, and scores 38% on MMMU-Pro. This is the highest visual reasoning score measured for any open weights model under 2B parameters, ahead of LFM2.5-VL-1.6B (27%) and Qwen3.5 0.8B (Non-reasoning, 26%). Video input at this parameter scale is uncommon. ➤ Knowledge recall is low, in line with other sub-2B models. AA-Omniscience is -85, in the typical range for sub-2B non-reasoning models (Qwen3.5 0.8B (Non-reasoning) at -89, Exaone 4.0 1.2B (Non-reasoning) at -83), and 2 points behind Qwen3.5 2B (Non-reasoning) at -83 (1.7x the parameter count). Additional model details: ➤ Size: 1.3B total parameters (dense) ➤ Context window: 262K ➤ Precision: BF16 ➤ License: Apache 2.0 ➤ Providers: No confirmed providers on release

译清华大学与ModelBest合作的OpenBMB发布了MiniCPM-V 4.6 1.3B Instruct模型。这款仅13亿参数的多模态小模型在Artificial Analysis智能指数上获得13分,成为2B参数以下开源模型中得分最高的,刷新了该规模模型的帕累托前沿。它在MMMU-Pro视觉推理基准上也达到38%,领先同类小模型。模型支持文本、图像和视频输入,并具有极高的令牌效率,运行测试仅需540万输出令牌,远低于对比模型。其权重已在Hugging Face以Apache 2.0许可证开源。知识回忆能力与其他2B以下模型相当,处于较低水平。

🚨 AI News | TestingCatalog@testingcatalog · 5月12日56

Sigma browser now supports Hermes Agent inside its Private Mode! Hermes Agent can work on top of available local models to execute your browser tasks. Users can select between OpenClaw and Hermes options inside the Settings menu. Team Hermes or team OpenClaw? 👀

译Sigma浏览器现已在隐私模式中支持Hermes智能体! Hermes智能体可基于现有本地模型执行浏览器任务。用户可在设置菜单中选择OpenClaw或Hermes选项。 选择Hermes团队还是OpenClaw团队?👀

Rohan Paul@rohanpaul_ai · 5月12日53

Sigma just announced an open-source private AI browser that puts a web agent and local LLMs directly inside the browser instead of sending your web activity to remote servers. the browser stops being only a display layer and becomes an agent workspace, because the AI can see tabs, forms, search results, logged-in sessions, and unfinished tasks as one live working state. Models like Qwen, Gemma, and Nemotron can then support actions such as summarizing pages, filling forms, comparing products, searching across tabs, and automating repetitive web workflows without making every step a cloud request.

译Sigma近日宣布推出一款开源私有AI浏览器,其核心创新在于将网页智能体和本地大型语言模型(LLM)直接集成到浏览器内部,无需将用户网页活动发送至远程服务器。这使得浏览器从单纯的显示层转变为智能体工作空间,AI能够实时感知并操作标签页、表单、登录会话和未完成任务等作为统一工作状态。该浏览器支持Qwen、Gemma、Nemotron等本地模型,可执行页面总结、表单自动填写、产品比价、跨标签页搜索以及自动化重复性网页工作流等任务,整个过程完全在本地处理,实现了真正的私有化与开源设计,保障用户数据隐私。

Berryxia.AI@berryxia · 5月11日57

一次将大模型的格式搞清楚!盘它! 很多朋友都在讨论大模型的这么多格式,到底有啥区别? 于是想一篇把 GGUF、MLX 这些本地大模型格式弄清楚。 简单说,GGUF 是 llama.cpp 团队搞出来的单文件格式,现在已经是本地推理最主流的选择。 以前 GGML 已经基本淘汰了,现在一个 .gguf 文件就把 header、元数据和所有 tensor 全装进去,加载特别快,还支持各种 K-quants 量化,从 2bit 到 8bit 都能灵活混用。 llama.cpp、Ollama、LM Studio 这些工具基本都靠它跑,Hugging Face 上也一大堆现成的 GGUF 版本。 MLX 则是 Apple 专门为 M 系列芯片优化的框架,mlx-lm 是它的 LLM 版本。 模型格式不是单个文件,而是一个目录,里面有 config、tokenizer 和权重(常见 .npz 或 safetensors)。 它在 Mac 上跑得特别爽,因为用了统一内存架构,加载和上下文处理都稳,转换时还能直接做 4bit 量化或者混合精度。 还有一些其他非主流核心格式比如: PyTorch / Safetensors 是训练和分享的标配,ONNX 适合跨框架部署,TensorRT 则是 NVIDIA 极致性能专用。 最有意思的是:GGUF 单文件、量化最灵活、跨平台强,特别适合 CPU 和低配设备。 MLX 在 Mac 上速度和微调体验最好。 Safetensors 体积大但分享方便; ONNX 更偏生产部署。 预训练阶段其实都不直接用这些格式,大模型训练完都是 PyTorch/Safetensors 的 checkpoint,后续转换时再做量化(PTQ),GGUF 和 MLX 就是在这一步把量化玩得最溜。 总的来说,本地 Mac 用户优先 MLX,跨平台或低配设备就选 GGUF,训练分享还是 Safetensors 最稳。 对想自己折腾本地 LLM 的同学来说,可以看看对比图。

译本文梳理了本地大模型推理的主流格式。GGUF是llama.cpp推出的单文件格式,集成头文件、元数据和权重,加载快且支持灵活的K-quants量化(2-8bit),兼容llama.cpp等工具,适合CPU与低配设备跨平台使用。MLX是Apple为M系列芯片优化的框架,采用目录结构,在Mac上利用统一内存架构实现高效加载与处理,支持4bit量化,为Mac用户提供最佳体验。其他如PyTorch/Safetensors是训练分享标配,ONNX侧重跨框架部署。建议Mac用户优先MLX,跨平台或低配选GGUF,训练分享用Safetensors。

Chubby♨️@kimmonismus · 5月10日29

It’s such a shame that the Apple Vision Pro was a fail. I’d love have seen it succeed. However, apple is still working on AR glasses, but nowhere near to be released sadly..

译苹果Vision Pro的失败实在令人遗憾,我本希望它能成功。 不过苹果仍在研发AR眼镜,可惜距离发布还很遥远。

阿绎 AYi@AYi_AInotes · 5月10日26

Apple什么时候才能知道用户真正想要的是什么呀? Vision Pro卖3499美元,重一斤多,只能在家戴两个小时。 我们真正想要的,从来不是什么全沉浸元宇宙, 我们想要这样一副看起来和普通眼镜没区别,能偷偷拍照、实时翻译、走路导航、接电话听音乐的轻量眼镜。 不用插电,不用连电脑,和iPhone无缝配对,戴上就能用。 这个视频把所有分析师说了半年的谣言,全部变成了看得见的画面: 代号N50,2026年底预览,2027年初发售。 非独立设备,完全依赖iPhone算力。 没有花里胡哨的功能,只有最实用的那几个。 这不就是我们心心念想要的那个产品吗? 我们朝思暮想都想要的Apple Glasses!! 希望苹果@Apple 别让我们等太久! #AppleGlasses #苹果 #AR #VisionPro #科技概念

译用户批评Vision Pro价格昂贵、笨重且使用时间短,真正期待的是外观如普通眼镜的轻量AR设备,能实现拍照、实时翻译、导航等实用功能。据视频透露,代号N50的Apple Glasses预计2026年底预览、2027年初发售,依赖iPhone算力,专注核心应用,回应了市场对便捷可穿戴设备的需求。

Elon Musk@elonmusk · 5月10日51

The human-perceived RGB is image 1 and the Tesla AI photon count reconstruction is image 2. This is why Tesla FSD can see so well at night or through extreme glare.

译人类感知的RGB是图1,特斯拉AI光子计数重建是图2。 这就是为什么特斯拉FSD能在夜间或强眩光下看得如此清晰。

Elon Musk@elonmusk · 5月9日71

Tesla AI Vision

译Tesla通过分析真实车队碰撞数据,结合视觉系统与传感器,实现了安全系统的突破。传统碰撞传感器需要时间确认,降低阈值可能导致误触发。而视觉系统能提前“看到”即将发生的碰撞,与传感器协同,使约束控制器能更早、更准确地启动安全气囊和安全带预紧器。通过仿真重放碰撞并测量人体模型受力,团队发现提前部署能优化保护时机。这一改进使预测伤害严重程度整体显著下移,并通过OTA更新实现,是前所未有的安全提升。

阿绎 AYi@AYi_AInotes · 5月9日82

Damn,Redis创始人用一个C文件,干翻了大厂烧几十亿的GPU集群。 Antirez,那个写出Redis的传奇黑客,昨天开源了ds4。 一个专门为DeepSeek V4 Flash写的原生推理引擎,只有几千行C代码。 它做到了一件很多人都觉得不可能的事: 把拥有1M上下文窗口、能跑完整coding agent循环的准前沿模型,完整跑在一台普通的128GB MacBook Pro上。 YC CEO Garry Tan看完直接转发,只说了一句话: “正在下载… 1M上下文+可用的coding agent能力,全在一台128GB MacBook上,这太疯狂了🤯” 这已经不是一个普通的量化项目那么简单了铁汁们, 属于顶级黑客用极致的系统工程,把闭源实验室烧几十亿才能玩的东西,压到了每个人的笔记本里。 他的三个黑客级操作,每一个都颠覆了行业常识: 1. 不对称2-bit量化: 只对MoE里占90%体积的专家部分做2-bit压缩,所有关键路径保持全精度。 质量损失极小,Antirez本人亲测“coding agent工作良好,能可靠调用工具”。 2. 把KV Cache扔到SSD: 很多人都觉得KV Cache必须放内存,1M上下文会直接炸掉128GB内存。 他直接把KV Cache搬到了苹果的高速SSD上,用磁盘当扩展内存,彻底突破了硬件天花板。 3. 纯Metal原生优化: 没有任何多余的封装, 没有通用框架的开销, 所有代码只为Apple Silicon写, 只为DeepSeek V4 Flash写。 实测性能:M3 Max 128GB上稳定27 tok/s。 不算快,但对本地跑agent循环来说,完全够用了。 你不用再给OpenAI付API费,不用再担心数据泄露,不用再忍受网络延迟。 所有的AI能力,完完全全在你自己的电脑里。 卧槽,这才是真正的革命, 过去AI的权力攥在少数几家大厂手里,他们有GPU集群,定价格,甚至说删就删。 现在,一个黑客用几千行C代码,就把这个权力还给了每一个开发者。 开源AI真的是不可阻挡的, 大厂烧几十亿训练出来的模型,只要权重一开源, 全世界的黑客就会用你想象不到的方式,把它优化到每一个能跑的设备上。 今天是MacBook,明天是手机,后天是手表,太让人兴奋了! 2026年5月9日,AI终于从云端的神坛,落到了每个人的笔记本里。 或许这一天,会被写进历史!

译Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码,通过三项关键技术:对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化,成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型,实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力,通过极致工程优化 democratize 至个人设备,展现了开源社区推动技术平民化的强大潜力。

Chubby♨️@kimmonismus · 5月9日49

First Native Color Lidar Sensor by Ouster (REV8), where color and 3D data are fused in silicon and not in software. Traditional lidar sensors capture 3D point clouds of the environment (distance/depth data) but only in monochrome, no color information. To get color, you’d typically need to fuse lidar data with a separate RGB camera in software, which introduces latency, alignment errors, and added complexity. Ouster’s REV8 does something different: it captures both color and 3D depth data on the same silicon chip, meaning every single point in the 3D scan natively carries color information without needing a separate camera or post-processing software fusion. The color and depth are inherently aligned at the hardware level.

译Ouster推出首款原生彩色激光雷达传感器REV8,其核心创新在于将色彩与3D数据在芯片层面进行硬件融合。传统激光雷达仅能捕获单色点云,需额外通过软件融合RGB相机数据来获取色彩,这会导致延迟、对齐误差和系统复杂性问题。REV8则在同一硅芯片上直接捕获色彩和3D深度数据,使得扫描中的每个点都原生携带色彩信息,无需依赖独立相机或后处理软件融合,实现了硬件级别的色彩与深度对齐。

Chubby♨️@kimmonismus · 5月9日44

Hold on. Is @sama referring to the OpenAI phone? Are they finally hyping up their first hardware product? Remember: Just days ago, Ming-Chi Kuo reported that OpenAI is fast-tracking its first "AI agent phone" to directly compete with the iPhone, with mass production targeted as early as the first half of 2027.

译等等。@sama 指的是OpenAI手机吗? 他们终于要开始宣传首款硬件产品了? 提醒一下:就在几天前,郭明錤报告称OpenAI正加速推进首款“AI代理手机”,旨在直接与iPhone竞争,目标最早在2027年上半年实现量产。

歸藏(guizang.ai)@op7418 · 5月9日19

Mac Studio 也没货了

译Mac Studio 出现供货紧张情况,官方渠道购买需长时间等待。用户因最低配 Mac mini 作为 Agent 服务器性能不足,决定升级到 Mac Studio,但遭遇缺货问题。Mac mini 此前运行稳定,但随着任务增加,硬件捉襟见肘,凸显对 Mac Studio 的旺盛需求。

Orange AI@oran_ge · 5月9日39

Switch 都要涨价一万日元了 硬件已经疯了 没有一个Token是无辜的

小互@xiaohu · 5月8日58

Claude 开发者大会给KOL发的这个Cardputer感觉很不错 售价 $29.9(约 ¥215) 可以: 在 Cardputer 上敲问题 → 通过 WiFi 发到你电脑 → 电脑上的 Claude Code 处理 → 结果回传到小屏幕显示 当语音对讲口:按住按键说话 → 录音传到你电脑 → STT 转文字 → 喂给 Claude → TTS 播回小喇叭 当 Claude 的"实体宠物":屏幕上跑个像素小动物,Claude 思考时它在动,回答时它说话 也可以把把 Cardputer 接到 OpenClaw上,支持语音输入、TTS 语音回答

译Cardputer是Anthropic在Claude开发者大会上推出的售价29.9美元的实体设备,通过WiFi连接电脑,支持键盘输入问题由Claude处理并显示结果、语音对讲经STT/TTS转换交互,以及作为Claude实体宠物显示动态像素动物,还可接入OpenClaw平台扩展语音功能。

Berryxia.AI@berryxia · 5月8日26

我想用这个做个Voice Agent 能行吗? 直接给我进行问答和做一些定向的检测和人物啊! 有没有玩过的朋友?

Rohan Paul@rohanpaul_ai · 5月8日78

atomic[.]chat just made Gemma 4 26B faster inside LLaMA.cpp. making token generation about 40% faster in its MacBook Pro M5 Max test. Great news for local llms, because LLaMA.cpp and GGUF sit close to the local AI user base, where support often spreads into desktop apps, coding agents, and private on-device assistants. MTP (maltai token prediction) is like a smaller assistant drafting the next few words, while the main model checks whether those words are acceptable. If the draft is correct, the system accepts several tokens quickly. If the draft is wrong, the system rejects the wrong part and falls back to normal generation.

译atomic.chat通过为LLaMA.cpp引入多令牌预测技术,大幅提升了本地大型语言模型的推理效率。该技术利用小型辅助模型预先生成后续令牌草案,由主模型进行验证。在MacBook Pro M5 Max上测试时,使Gemma 4 26B模型的令牌生成速度加快约40%,整体运行速度提升1.5倍。这项优化进一步巩固了LLaMA.cpp和GGUF格式在本地AI生态中的核心地位,为桌面应用、编程助手和私有设备助手等场景提供了更高效的部署方案。

Chubby♨️@kimmonismus · 5月8日56

2026 will be the Apple AI year: AirPod 3 with AI + camera incoming The new AirPods have cameras in both earbuds that serve as eyes for Siri, capturing low-resolution visuals (not photos or video). Users can ask about things they're looking at, get context-aware reminders, and receive landmark-based navigation cues - all hands-free. Design-wise they look like AirPods Pro 3 with longer stems. A small LED indicates when visual data is being sent to the cloud for privacy purposes. No hand-gesture support. They've been in development four years, are currently in late-stage testing (DVT), and were delayed by the Siri overhaul (now rebuilt with Gemini, targeting September). Hardware is nearly final, but launch depends on AI quality meeting Apple's bar. Part of a broader push that includes smart glasses, a camera pendant, and a new visual AI mode in iOS 27.

译据彭博社报道,苹果计划于2026年推出第三代AirPods,这将是其首款AI可穿戴设备。新款AirPods的每个耳塞均内置摄像头,作为Siri的“眼睛”捕捉低分辨率视觉信息,以实现视觉问答、情境感知提醒和地标导航等免提AI功能。产品设计类似AirPods Pro 3,带有隐私提示LED灯,但不支持手势控制。该产品已开发四年,目前处于后期测试阶段,硬件已基本定型,但最终发布取决于AI体验能否达到苹果标准。其发布将与基于Gemini重构的Siri及iOS 27的新视觉AI模式同步,是苹果包括智能眼镜、相机吊坠在内的更广泛AI硬件布局的一部分。

Berryxia.AI@berryxia · 5月7日65

这一波!期待起来了~ Google Health + Gemini 直接把Apple Health的封闭优势干掉了。 Google正式推出全新Google Health,彻底取代Fitbit app,支持从任何追踪器导入数据(Apple Watch、Garmin、Whoop全都能导)! 还内置Gemini AI coach,能给你智能健康推荐和个性化指导。 Google这次选择彻底开放生态,而Apple Health依然是封闭花园。 这场健康数据+AI的战争,终于要真正开打了。 你觉得Google Health能挑战Apple Health的统治地位吗?

译Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。

Chubby♨️@kimmonismus · 5月7日66

Zyphra under 1B active parameters, AMD-Trained, big evals, look strong? Zyphra says its new ZAYA1-8B model delivers unusually high reasoning power for its size, using under 1 billion (!) active parameters while competing with much larger open-weight and proprietary systems on math, coding, and reasoning benchmarks. The interesting part is not just the model’s size, but its full-stack bet: AMD-only training infrastructure (!), new architectural choices, large-scale RL, and a test-time compute method called Markovian RSA that appears to boost hard math performance through parallel reasoning and recursive aggregation.

译Zyphra发布ZAYA1-8B模型,其活跃参数不足10亿,却在数学、编程和推理基准测试中媲美更大的开源及专有系统。其亮点不仅在于小尺寸,更在于全栈技术方案:完全基于AMD基础设施训练,采用了新的架构选择和大规模强化学习。此外,模型应用了一种名为Markovian RSA的测试时计算方法,通过并行推理和递归聚合,显著提升了复杂数学问题的解决能力。

歸藏(guizang.ai)@op7418 · 5月7日50

过去一段时间,最值得的硬件投资可能就是我那个最低配的 Mac mini 了。 在年前买了以后,到现在几乎只关过一次机;在我出门旅游之类的时候,它一直运行得非常稳定,相当于一个自己的 Agent 服务器了。 随着里面跑的东西越来越多,现在有时候感到有点捉襟见肘了,所以就换了一个 Mac Studio。 结果发现 Mac Studio 现在供货也不足了,官方渠道买的话要等好久。

译作者认为最低配的Mac mini是过去一段时间最值得的硬件投资,它运行极其稳定,几乎不关机,可作为个人Agent服务器使用。随着运行任务增多,Mac mini性能捉襟见肘,因此决定升级到Mac Studio。但发现Mac Studio目前供货不足,通过官方渠道购买需要等待很长时间。

向阳乔木@vista8 · 5月7日75

http://x.com/i/article/2052185467773202433 # Al Agent装进口袋:TRAE SOLO移动端上手全攻略 手机上如何随时随地用 AI Agent 做任务? 大家一般会在电脑安装 Happy 或 Tailscale,手机上还要安装Happy、Termius等工具,配置起来也相对麻烦。 最近字节TRAE SOLO 移动端正式发布,完美解决了小白用户的这个痛点。 而且三端(App / Web / 桌面端)首次向 全量用户开放,不再需要免邀请码,直接能用 。 测试发现,竟然还支持第三方模型,能安装各种技能(Skill),可用性很高。 重点说说移动端,我觉得是这次发布的最大亮点。 ## 移动端安装配置 目前 TRAE SOLO 已经上架国内 App Store。 1、下载安装 TRAE SOLO手机端并登录账号 2、电脑端和手机端用同一个账号登录,然后电脑端点左下角头像->设置->SOLO 移动端。扫码安装后后打开下面两个选项。 设置完,手机就能访问电脑上创建的项目,哪怕出去玩不带电脑,也能继续连接电脑工作。 一开始没理解MTC是什么模式,看到下面的Slogan就懂了: More Than Coding (简称 MTC) 这个说明还挺有必要的。 比如很多人看到 Claude Code 这个名字就被劝退了。 AI Agent 真的很强大,不只是编程厉害。 任何长程复杂任务,只要搭配合适的技能(Skill),基本都可以搞定。 TRAE SOLO 估计也是想传递这个想法。 下面演示一些案例,可能更直观。 ## Skill安装并调用 TRAE SOLO 电脑端安装的技能(Skill),手机端也可以调用。 点击界面左上角的「技能」,进入技能安装和管理界面,可上传技能或技能市场直接添加。 比如搜索“data-analysis”,添加TRAE SOLO官方的数据分析技能。 上传 X 平台最近 90 天的数据 CSV,输入:“这是我的X最近的数据,做一个全面的数据分析洞察。” 分析后生成一个详细的 Markdown 文件,点击可直接查看。 从中发现了一些有趣的洞察: - 发帖越多通常越能拉曝光,但最佳效率区间更接近 3-5 条/天 ,不是单纯越多越好。 - 周三平均互动率最高,周四平均涨粉最高,周六最适合冲曝光。 - 90天中44%新增关注来自前10个高涨粉日,涨粉靠帖子爆发。 ## 让TRAE SOLO支持飞书 强烈建议打开下面设置,能调用飞书各种功能,比如创建飞书文档、多维表格、日程等等,如虎添翼。 电脑端点设置->外部应用授权->飞书(海外可用Lark) 做个简单测试,跟 TRAE SOLO 语音对话,让创建个晚上6点的日程。 执行过程,会弹出卡片询问时区等要求,点选确定,日程创建成功。 支持飞书后,个人感觉最实用的是飞书文档,随时跟TRAE SOLO对话产出文档,方便沉淀、分享、协作。 后面几个案例,我都要求写入飞书文档。 ## 纳瓦尔最新播客和观点 想必很多朋友都读过《纳瓦尔宝典》。 但这本书的英文版出版于2020年,中文版出版于2022年。 好多年过去了,纳瓦尔有什么新的播客访谈,又有什么新观点? 手机语音跟 TREA SOLO 对话,让帮搜集整理一份资料。 果然有不少新观点,例如: - AI 让“写代码”从纯执行转向“用自然语言表达意图 + 迭代验证”,核心竞争力更偏向“判断力/品味/定义问题” - 杠杆持续增强(代码→媒体→资本→AI),回报更非线性。 - 用行动驱动学习,循环是「做 → 停 → 反思 → 调整 → 再做」 > 纳瓦尔近一年的访谈和观点 > https://xiangyangqiaomu.feishu.cn/docx/Dqmkdzav8o5jgOxWmsNcdir1nTg ## Github 项目查看与安装 好友Tw93开发了很多好用的工具和Skill,都放在他的Github里。 我让 TRAE SOLO 整理下输出一份飞书文档,方便自己和他人查看。 > 查看tw93的Github项目,从Star由高到低,列10个项目和介绍,写入飞书文档 文档地址: > https://xiangyangqiaomu.feishu.cn/docx/JAXqdaUkBo1v7PxFmPoctoZinBh 如果你对哪个感兴趣,可以让 TRAE SOLO 帮你安装,比如让它安装上面的两个Skill 是不是很简单,任何Github项目,都可以丢链接让TRAE SOLO安装。 ## 学习辅助 TRAE SOLO 这种 AI Agent 工具,除了写代码和办公,还有很多使用场景,拿学习举例。 如果想研究 AI 最新进展,除 OpenAI 和 Anthropic 等公司的官方博客外,推荐读 Huggingface 周热门论文。 > https://huggingface.co/papers/ 你只需跟 TRAE SOLO 说:“整理Huggingface上周 Top10 论文,写入飞书文档。” 没多会儿,论文简介、arXiv地址,按投票人数由高到低整理好,你只需要挑感兴趣的读就行。 读不懂也没关系,直接跟一句:“解读第 x 篇论文”。 > https://xiangyangqiaomu.feishu.cn/docx/PPf2dhht2oaICSxH67acXw8QnSd 再比如孩子快考英语了,单词薄弱,直接让TRAE SOLO 生成常见必考单词复习资料。 > https://xiangyangqiaomu.feishu.cn/docx/MfRXdjcMPo9D4bxj0IrcTdLxnld ## 第三方模型配置 如果想用其他 AI 模型,TRAE SOLO电脑版可以配置,支持几乎所有第三方模型。 比如我配置了DeepSeek V4 Flash,跑一些简单任务,又快又好。 还配置了火山引擎 Plan,充分榨干订阅 Token,不浪费。 手机端可以接电脑上的会话继续聊。 但好像还不支持选择电脑端配置好的第三方模型,期待后续优化。 ## 自动化任务 之前看到个非官方调研,发现很多人用小龙虾和 Hermes 等工具,最多使用场景就是看 AI 新闻简报,再或者就是股价监控等。 如果你没装这些工具,直接用 TRAE SOLO 就能搞定。 在界面左上角点“自动化”->任务模版,直接添加,然后设定推送时间即可。 运行效果如下: 当然,你也可以手动创建你的自动化 Skill。 ## 电脑端安装(竟有Windows版) 这年头支持 Windows 客户端的 AI 工具真的不算多。 想玩 AI ? 先配一台 Macbook 或 Mac mini,哈哈哈。 TRAE SOLO 不仅有 Mac 版客户端,还有 Windows 版,这点要给好评。 官方下载 - 国内 https://www.trae.cn/ide/download - 国际 https://www.trae.ai/download ## 写在后面 说实话,AI Agent 工具这一年冒出来太多了,但大部分都 只能在电脑前用 ,稍微有点割裂。 电脑上跑了一半的任务,出门就断了。 TRAE SOLO 这次把移动端做出来,而且是 三端同账号、同项目、同会话 ,体验上确实跨了一步。 手机不再只是"看一眼结果",而是真的能 发起任务、安装技能、调用飞书、语音对话 ,把 AI Agent 从桌面搬进了口袋。 文章只展示了数据分析、信息整理、学习辅助、自动化这几个场景,但 AI Agent 的能力远不止于此。 它的上限,取决于你怎么用、用在哪。 如果你身边有朋友还觉得 AI 只是"聊天机器人",把这篇转给他。 More Than Coding,一切刚刚开始。

译字节推出的TRAE SOLO AI Agent工具现已向全量用户开放App、Web和桌面三端,实现跨设备无缝衔接。其移动端支持访问电脑项目、调用已安装技能并执行任务,演示了数据分析、信息整理、学习辅助及自动化等场景。工具支持第三方模型和技能扩展,并与飞书深度集成,便捷创建文档和日程。其“More Than Coding”理念强调AI Agent能处理各类长程复杂任务,而不仅限于编程。

宝玉@dotey · 5月7日70

Boris Cherny(Anthropic 工程负责人)在最近的红杉 AI Ascent 大会上说,他现在大部分工作从手机完成。Claude App 里常驻 5 到 10 个 session、几百个 Agent,夜里有几千个在跑深度任务。他管这种做法叫 Loop,让 Claude 用 cron 起一个定时任务,可以每分钟、每五分钟、或者每天跑一次。 我本来还不太习惯用手机操作 Agent。这几天受邀测试最新版的 TRAE SOLO Mobile,刻意多在手机上试用,越用越能理解 Boris 说的那种变化。 This content is only supported in a Feishu Docs 这次 TRAE SOLO 首次实现了移动端、Web 端、桌面端(含 Windows 版)的全量开放,并真正做到三端同步联动,让 Agent 使用的场景大幅扩展。我在手机端体验了几天,结合官方新推出的功能,一些感受: 【1】Agent 已经不是程序员专属 打开 TRAE SOLO,首页让我先选模式:Code 还是 MTC(More Than Coding,意思是“不只是写代码”)。Code 模式好理解,写代码、跑 Git、看 Diff,而 MTC 模式则全面覆盖了写文档、数据分析、报表生成等日常办公场景。 从 Claude Cowork 发布开始就已经有了这个趋势,上周 Codex 的升级也是宣称:“用 Codex 做几乎一切工作(use Codex for (almost) everything)”。 TRAE SOLO 最新的升级同样顺应了这个趋势,从一个编程 Agent 泛化到了通用 Agent。 最新版本特别强化了飞书 CLI 接入功能。现在只要简单授权,就能在 TRAE SOLO 里直接操作飞书文档:例如,输入一句指令,“帮我整理一份本月 AI 编程工具市场动态”,Agent 会自动去网上检索,最后直接生成飞书文档或者动态网页,完全不需要人工再去排版或复制粘贴。 与过去“AI 给文字、用户再粘到飞书”的繁琐流程相比,这种一步到位的体验已经完全不是一回事了。 【2】三端连起来是什么体验 这次 TRAE SOLO 的一个大动作是三端(手机、Web、桌面端)全量开放,不再需要邀请码,所有用户都能用。 单独看 Mobile 端,它主要解决随时下发任务和确认任务的问题。但只有当 Mobile、Web 和 Desktop(包括最新上线的 Windows 版)真正打通之后,你才能真正做到随时随地让 Agent 持续执行任务。 过去云端执行环境总有局限,不能访问本地工具。而 TRAE SOLO Mobile 解决了这个痛点——只要完成简单的设备配对,你的手机就可以直接控制云端环境与本地多台设备。任务信息在所有设备之间实时同步,手机端下发的任务可以立即在 Web 和 Desktop 端查看执行进度,反过来也一样,真正实现跨设备的无缝接力。 比如上周末我在外面看孩子踢比赛,间歇刷手机,看到一篇不错的英文技术文章,顺手在 TRAE SOLO Mobile 上给 Agent 发了条指令:“把这篇文章翻译成中文,写一份推荐稿”,家里的 TRAE SOLO Desktop 就会启动我一套配置好工作流开始工作。等比赛结束回到家,打开电脑,稿子已经在那了。这种感觉有点像你出门前跟一个助手说了句话,回来活儿已经干完了。 【3】手机是用来指挥 Agent 的意图路由器,不是用来操作电脑的 这个区分挺关键。我之前不太爱用手机端办公,潜意识觉得是在用手机操作电脑。但是转换一下:“人操作 Agent,Agent 操作电脑”,那么用手机就很自然了。你不需要在小屏幕上精确点击什么按钮,你只需要说清楚你要什么。 用手机还有个障碍是输入速度,打字慢。TRAE SOLO 手机端有语音交互讨论功能,可以跟 AI 语音对话讨论一个问题,讨论结束后自动生成会议纪要,然后直接从手机把工作任务派发出去,电脑端同步接上后续操作。一部手机可以连接管理云端环境加多台 PC,在环境选择面板里挑一下设备和工作目录,剩下的全部交给 Agent。 这个功能在外面的时候特别好用。走路的时候、坐地铁的时候,想到一个点子,按住说话就行了,比打字快很多。过去这些碎片时间里冒出来的想法,要么记在备忘录里回头再处理,要么干脆就忘了。现在一句话就能让 Agent 开始干活。 【4】不着急的事,让定时任务自己跑 回到 Boris Cherny 跑几百个 Agent 的场景。做法很简单,让 Claude 用 CRON 给自己设一个重复执行的任务,一分钟跑一次、五分钟跑一次、每天跑一次,都行。 Boris 开着几十个定时任务,举三个例子。 一个 Loop 在照看他的 PR:CI 挂了就去修,需要 rebase 就自动 rebase。 一个 Loop 在维护整个项目的 CI 健康,发现 flaky test(不稳定的测试)就去定位修复。 还有一个 Loop 每 30 分钟从 Twitter 上抓他的反馈,自动聚类成几个主题汇报给他。 我自己也在用类似的方式。我有一个定时任务监控我 GitHub 上开源项目的 Issues,有人提了 Issue 就自动总结并给出处理意见,我看一眼觉得没问题,再指示 Agent 去操作。还有一个定时任务盯着我 X 的收藏夹,我平时刷到好文章随手收藏,它帮我自动抓取到本地,英文的还会翻译成中文,到时候集中看就行。 很多需求其实没那么紧急,但需要持续做。每天看一眼竞品动态、每周整理一次行业新闻、每月生成一次数据报表,这些活适合扔给定时任务。 现在 TRAE 的桌面端和网页端都已支持定时任务,无论是在云端还是本地环境,都能稳定地自动执行。比如你告诉 Agent:“每天早上 10 点发一份最新的 AI 新闻动态整理”,第二天早上工作台就会自动收到文档。你只需要专注于真正有创造性的判断,把那些重复且不着急的任务统统交给 Agent。 总结与体会 整体来说,这次对 TRAE SOLO Mobile 试用的感受就是: - Agent 使用门槛大大降低,不再只是程序员专属,很多日常办公、写作场景已经可以由 Agent 来做了。 - 三端真正打通后,无论何时何地,都能轻松管理并延续任务。 - 手机不再是远程桌面,而是随时随地的“意图路由器”。 - 通过 Loop 定时机制,真正把重复且耗时的任务自动化,让用户只做关键决策。 Boris 说他夜里有几千个 Agent 在跑,很多人大概觉得这是大厂工程师的特权。但我这几天的体感是,这件事的门槛已经比想象中低很多了。一部手机、一台电脑、一个 Agent 工具,你就可以开始把重复的事交出去。未来办公的趋势,或许就是这种“人随时随地指挥 Agent、Agent 做具体工作、人只负责验收成果”的模式吧。 推荐可以去用下 TRAE SOLO Mobile,体验随时随地指挥 Agent 干活的感受。 想试用的 Mac 可以去官网下载了——国内:https://www.trae.cn/ide/download;国际:https://www.trae.ai/download

译Anthropic工程负责人Boris Cherny透露,他已习惯用手机管理大量Claude Agent,并通过定时任务(Loop)自动化工作。作者体验TRAE SOLO Mobile后指出,Agent正从编程工具泛化为通用办公助手。最新版本实现了移动端、Web端和桌面端的全量开放与实时同步,使手机成为随时下发指令的“意图路由器”,用户可通过语音便捷派发任务,由Agent在多设备间接力执行。同时,定时任务功能支持将日常重复性工作自动化,大幅降低使用门槛,推动办公模式向“人指挥、Agent执行”转变。

Rohan Paul@rohanpaul_ai · 5月7日48

There's a category quietly forming in consumer hardware that nobody has named correctly yet, and Dreamspan just gave it the right name: Adaptive Health Ecosystem. Wearables 1.0 was about measurement. Wrist sensors, sleep stages, step counts, HRV graphs. The user did all the work — interpreting data, changing behavior, hoping it stuck. The category plateaued because measurement without intervention is just well-designed guilt. People lost interest. Founders moved on. Adaptive Health is what comes next. The system senses, decides, and acts — in real time, on your biology, in the background. Lucid Pro is the cleanest expression of it: it reads your sleep stage, your heart rate variability, your breathing, your skin temperature, and uses that read to physically change the bed and the air around you. You sleep deeper because the product made it happen, not because you read a chart and tried harder. And it's just product 01. Brain, Metabolism, Gut, Inflammation, Musculoskeletal, Cellular Aging are next, each with its own adaptive hardware, all running on SpanOS so your biology gets read across the entire stack. This is the actual successor to the wearables category. Whoever ships it first and ships it best owns the next decade of consumer health. Dreamspan published the full roadmap on launch day.

译可穿戴设备1.0因仅测量数据(如心率、睡眠)而陷入停滞,用户需自行解读与行动。下一代消费硬件类别被命名为“自适应健康生态系统”,它能实时感知用户生理数据、自主决策并主动干预。例如,Dreamspan的Lucid Pro通过读取睡眠数据,自动调节床和周围空气以改善睡眠。未来将扩展至大脑、代谢等领域,所有硬件基于SpanOS平台协同工作,实现全栈生理读取。这标志着可穿戴设备的真正演进,率先推出并优化该系统的企业将主导未来十年消费健康市场。Dreamspan的最终目标是借助此技术推动人类实现150年的健康寿命。

小互@xiaohu · 5月6日69

Mininglamp-AI @Mininglamp 开源了两个很有意思的项目: Cider 和 Mano-P 一个解决“Mac 本地跑 AI 怎么更快” 一个解决“AI 怎么真正操作电脑” 可以让你的 Mac 不只是运行 AI,而是成为本地 AI 工作站 很多人用 Mac 跑本地模型,会遇到一个问题: 芯片很强,但模型跑起来没有想象中那么快 Cider 做的事情,就是把 M5 芯片里的 INT8 TensorOps 更充分用起来,让 LLM / VLM 推理更快、更省内存 Mano-P 则是一个 GUI-VLA Agent,面向端侧设备,可以在 Mac mini / MacBook 上本地推理 它不是只能操作浏览器,还能操作桌面软件、网页界面、专业工具和复杂图形化工作流 支持复杂 GUI 自动化、跨系统数据整合、长任务规划执行、智能报告生成、自主应用构建 技术路径是纯视觉 GUI 操作,截图和任务数据可以不出设备 Cider 解决的是: Mac 本地模型怎么跑得更快、更省内存 Mano-P 解决的是: AI 怎么像人一样看屏幕、操作电脑、完成任务 一个是端侧推理加速框架 一个是端侧 GUI Agent 模型 合起来,就是一套私有 AI 的本地基础设施 下面是 Mano-P系统在麻将游戏中的应用:通过纯视觉理解游戏界面,自主完成识牌、分析和决策。

译Mininglamp-AI开源了两个核心项目,旨在将Mac打造为本地AI工作站。Cider是一个端侧推理加速框架,通过更充分利用M系列芯片的INT8 TensorOps,显著提升LLM/VLM等模型在Mac上的运行速度并降低内存占用。Mano-P则是一个端侧GUI-VLA Agent模型,采用纯视觉方式理解屏幕,能在本地操作各类桌面软件、网页、专业工具及复杂图形化工作流,实现自动化任务执行与数据整合。两者结合,为私有AI提供了高效的本地基础设施。

Berryxia.AI@berryxia · 5月6日18

时间留给Trae 吧😂 我们来喝咖啡就可以了!

译Trae推出限时推广活动,用户下载其手机客户端并完成一次问答,即可在5月8日活动开启后,于北京、上海、广州、深圳、杭州、成都免费领取星巴克咖啡。活动通过分享链接进行传播,旨在吸引用户体验其服务。

Berryxia.AI@berryxia · 5月6日50

豆包收费,豆包姐姐这下真要造反了!!!

Berryxia.AI@berryxia · 5月6日65

Apple将在iOS 27 中支持用户接入自定义API或“中转站”了,就是为了解决可以给他们的AI应用Image PlayGround、Writing Tos等功能的不足和缺点。

Chubby♨️@kimmonismus · 5月6日76

Major leaks about the new OpenAI Phone: -OpenAI is reportedly accelerating development of its first AI agent phone, with mass production potentially starting in the first half of 2027. -One possible reason is strategic timing: the device could support a stronger IPO narrative by year-end, positioning OpenAI not just as a model company, but as a consumer hardware platform. -Competition in AI-native smartphones / agent phones appears to be heating up, increasing pressure to move faster. -MediaTek currently looks best positioned to become the sole processor supplier. -The phone is expected to use a customized Dimensity 9600, manufactured on TSMC’s N2P process node in the second half of 2026. -The most important hardware spec may not be raw compute, but the ISP, with an enhanced HDR pipeline designed to improve real-world visual sensing for AI agents. -Other expected specs include: Dual-NPU architecture for heterogeneous AI workloads LPDDR6 + UFS 5.0 to reduce memory and storage bottlenecks pKVM + inline hashing for stronger security If development remains on schedule, total shipments across 2027–2028 could reach around 30 million units.

译据报道,OpenAI正加速其首款AI智能体手机的开发,目标在2027年上半年量产。此举可能旨在强化其年底IPO的叙事,并将自身定位拓展至消费硬件平台。联发科有望成为独家处理器供应商,提供基于台积电N2P制程定制的天玑9600。关键硬件规格包括增强HDR管线的图像信号处理器,以提升AI视觉感知能力,以及双NPU架构、LPDDR6与UFS 5.0等。若按计划推进,2027至2028年总出货量可能达到约3000万台。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月16日
16:56
歸藏(guizang.ai)@op7418
74
Codex实现多设备远程控制与上下文共享

Codex除了通过ChatGPT连接和远程控制外,还能控制另一台电脑,实现在ChatGPT上直接管理多台设备而无需切换,只需切换项目即可访问不同设备的上下文和文件。引用推文补充,此功能还支持通过远程SSH设置其他VMs等,增强了多设备协作的灵活性和实用性。

Vaibhav (VB) Srivastav: @op7418 yes! and you can set up other VMs etc via remote SSH as well!

智能体OpenAI教程/实践端侧
5月15日
20:32
Chubby♨️@kimmonismus
45
Codex 的"锁定使用"即将到来。 可能解释了 OpenAI 昨天的图片。 "让 Codex 在你的 Mac 锁定时使用它"

🚨 AI News | TestingCatalog: OpenAI is working on a dedicated setting for Codex to allow users to enable "Locked use." > Let Codex use your Mac while...

智能体OpenAI产品更新端侧
18:27
向阳乔木@vista8
63
面壁智能推出仅1.3B参数的视觉语言模型MiniCPM-V 4.6。该模型采用LLaVA-UHD v4技术,将视觉编码成本降低55%,专为消费级和移动硬件优化,支持高效边缘部署。其在关键多模态和Artificial Analysis基准测试中,性能超越了Gemma4-E2B-it和Qwen3.5-0.8B等更大模型,且仅消耗后者2.5%的token预算。在处理高分辨率图像时,其首token生成时间比Qwen3.5-0.8B快2.2倍,在单张RTX 4090上的token吞吐量约为后者的1.5倍。模型已在Hugging Face、ModelScope等平台开源发布。

OpenBMB: 1/5 MiniCPM-V 4.6 (1.3B) is now live 🚀🚀 High-res visual processing, optimized for consumer-grade and mobile hardware. ...

多模态模型发布端侧
5月14日
13:35
Rohan Paul@rohanpaul_ai
77
Qwen 3.6 27B 在 MacBook Pro M5 Max 64GB 上实现每秒34个token的本地推理

近期,Qwen 3.6 27B大型语言模型通过TurboQuant技术被量化为GGUF格式,并整合Multi-Token Prediction技术。在配备M5 Max芯片和64GB内存的MacBook Pro上,该模型实现了每秒34个token的本地推理速度。高达90%的接受率表明,性能提升并非以牺牲输出质量为代价,而是通过避免重复的全成本解码工作来达成。同时,利用llama.cpp进行高效调用,进一步优化了运行效率。这一技术组合显著扩展了“笔记本电脑AI”的应用边界,使得在本地设备上流畅运行大型模型成为可能,提升了用户体验。

atomic.chat: Multi-Token Prediction (MTP) for Qwen on LLaMA.cpp! +40% performance! 90% acceptance rate. Running locally on a MacBook ...

GitHub推理教程/实践端侧
5月13日
12:50
Berryxia.AI@berryxia
精选76
oMLX更新强化苹果端侧AI,本地能力直逼云端

oMLX项目更新至0.3.9.dev2版本,集成了Gemma 4的MTP视觉路径、DFlash引擎和ParoQuant技术,显著提升了图文处理速度。新增一键启动copilot功能,可便捷接入Claude等工具,并通过oQ自动代理解决显存瓶颈。这些改进大幅增强了本地AI在速度、集成与易用性上的表现,正推动AI能力从云端向个人电脑回归。

GitHubMCP/工具多模态开源/仓库

推荐理由:oMLX 这个更新把 Gemma 4 的视觉能力塞进本地,加一键接入 Claude 的工具链,端侧 AI 从差点意思到真可用,值得每个 Mac 开发者立刻试一下。
11:50
歸藏(guizang.ai)@op7418
62
谷歌发布Gemini Intelligence,深度整合AI于安卓系统

谷歌在I/O大会上发布Gemini Intelligence,将AI深度集成至安卓系统。该功能将率先登陆三星Galaxy和Pixel手机,并逐步覆盖所有安卓设备。其核心能力包括跨应用自动执行复杂任务(如在备忘录与购物应用间同步清单),以及使Chrome浏览器能自动检索、总结内容及填写表单。新推出的Rambler语音输入功能可将口语转化为精炼文本,并支持多语言混用。用户还能通过自然语言指令生成个性化桌面小组件,如定制食谱或特定天气数据组件。此外,全新的Material 3 Expressive设计语言会在AI交互时使组件边界呈现虚化与模糊效果,提升视觉体验。

Google: Today, we introduced Gemini Intelligence, which brings the best of Gemini to our most advanced devices. Gemini Intellige...

智能体Google产品更新多模态
08:49
Berryxia.AI@berryxia
65
Jina同步发布MLX格式嵌入模型,端侧AI部署迎来新趋势

Jina在其新版嵌入模型发布首日,即同步提供了全套MLX格式变体,改变了以往社区缓慢移植的节奏。这表明MLX已被视为核心部署目标,背后应有自动化流程支持。这一动向反映了MLX生态的崛起:Qwen、DeepSeek等主流模型官方开始集成MLX,Hugging Face将其提升为一级框架标签。嵌入模型因其体积小、推理频繁的特性,尤其适合在Mac的M系列统一内存上运行,为本地RAG等场景提供了理想的端侧AI解决方案。

Berryxia.AI: https://huggingface.co/collections/jinaai/jina-embeddings-v5-omni

Hugging Face开源/仓库模型发布现象/趋势
08:41
meng shao@shao__meng
71
Google 发布首款 AI 优先笔记本 Googlebook,集成 Gemini 智能

Google 正式推出首款为 Gemini Intelligence 设计的笔记本 Googlebook,标志着从“云优先”的 Chromebook 时代进入“AI 优先”新阶段。其核心创新包括:Magic Pointer 将系统光标变为 AI 交互入口,可直接触发上下文建议与任务;Create Your Widget 允许通过自然语言生成聚合多源信息的动态桌面小组件;深度整合 Android 生态,实现手机 App 无缝调用与文件跨设备快速访问。该产品以 Gemini 为核心,旨在将 AI 能力下沉至系统级交互,降低使用门槛,并强化跨设备协同体验。

Google: Introducing Googlebook, the first laptop designed for Gemini Intelligence. It's crafted for heavyweight performance, bui...

Google产品更新端侧
03:38
阿绎 AYi@AYi_AInotes
59
Claude用微型电脑举办的编程活动,为何如此温暖人心?

在“Code with Claude”活动中,参与者使用资源有限的Cardputer微型电脑,在Claude的辅助下于几小时内创作出各种充满趣味的小项目,如魔法棒、拼写游戏和弹珠迷宫。这些项目虽无商业价值,却展现了极高创意密度与快乐。活动证明,在有限硬件条件下,AI能将创意实现时间从数月压缩到数小时,真正解放了有想法但不会编码的普通人。在当前AI行业过度聚焦生产力与替代人力的背景下,Claude此举凸显了“快乐比实用更有力量”的理念。

Claude: We gave people tiny computers at Code with Claude. Here are some of the small, delightful things they built:

Anthropic现象/趋势端侧编码
5月12日
15:49
Berryxia.AI@berryxia
22
用户反映Mac Studio的256G版本面临涨价且可能缺货,引发对实际价格变动的困惑。关键背景信息来自@berryxia的推文,其指出此次更新并非用户期待的M5芯片升级,而是产品即将涨价的通知。核心矛盾在于预期中的硬件更新落空,取而代之的是价格上涨与供应不确定性的问题。

Berryxia.AI: 兄弟们,你们等来的不是Mac Studio的M5芯片的更新。 而是,涨价。 😄 我们刚刚接到通知说,Mac Studio即将涨价调价。

端侧行业动态
09:49
Berryxia.AI@berryxia
57
Apple押注端侧AI,开源小模型MiniCPM-V 4.6实现高效边缘部署

推文指出Apple的统一内存架构是端侧AI的理想平台。同时,OpenBMB发布了专为消费级硬件优化的1.3B多模态模型MiniCPM-V 4.6。该模型采用LLaVA-UHD v4技术,将视觉编码成本降低55%,实现了高效的边缘原生部署。其在多项关键基准测试中超越了更大的模型,且token消耗仅为对比模型的2.5%。在RTX 4090上处理高分辨率图像时,首token延迟仅75.7ms,速度快2.2倍。模型技术亮点包括Intra-ViT早期压缩和混合视觉压缩,有效平衡了分辨率与延迟。其部署友好,支持iOS、Android、HarmonyOS及多种主流推理框架与量化格式,相关资源已在各大平台开源。

OpenBMB: 1/5 MiniCPM-V 4.6 (1.3B) is now live 🚀🚀 High-res visual processing, optimized for consumer-grade and mobile hardware. ...

多模态开源/仓库模型发布端侧
07:49
Berryxia.AI@berryxia
66
Sigma浏览器隐私模式新增Hermes Agent支持

Sigma 浏览器现已在隐私模式中支持 Hermes Agent! Hermes Agent 可以在现有本地模型之上运行,以执行您的浏览器任务。用户可在设置菜单中选择 OpenClaw 或 Hermes 选项。 Team Hermes or team OpenClaw? 👀

🚨 AI News | TestingCatalog: Sigma browser now supports Hermes Agent inside its Private Mode! Hermes Agent can work on top of available local models ...

智能体产品更新端侧
06:58
Artificial Analysis@ArtificialAnlys
62
清华大学与ModelBest合作发布MiniCPM-V 4.6 1.3B Instruct多模态小模型

清华大学与ModelBest合作的OpenBMB发布了MiniCPM-V 4.6 1.3B Instruct模型。这款仅13亿参数的多模态小模型在Artificial Analysis智能指数上获得13分,成为2B参数以下开源模型中得分最高的,刷新了该规模模型的帕累托前沿。它在MMMU-Pro视觉推理基准上也达到38%,领先同类小模型。模型支持文本、图像和视频输入,并具有极高的令牌效率,运行测试仅需540万输出令牌,远低于对比模型。其权重已在Hugging Face以Apache 2.0许可证开源。知识回忆能力与其他2B以下模型相当,处于较低水平。

Hugging Face多模态模型发布端侧
05:03
🚨 AI News | TestingCatalog@testingcatalog
56
Sigma浏览器现已在隐私模式中支持Hermes智能体! Hermes智能体可基于现有本地模型执行浏览器任务。用户可在设置菜单中选择OpenClaw或Hermes选项。 选择Hermes团队还是OpenClaw团队?👀

Sigma Browser: Hermes agent running in private browser on free local models Private by design. Local. Open-source

智能体MCP/工具产品更新端侧
02:01
Rohan Paul@rohanpaul_ai
53
Sigma推出开源私有AI浏览器,内置网页智能体与本地LLM

Sigma近日宣布推出一款开源私有AI浏览器,其核心创新在于将网页智能体和本地大型语言模型(LLM)直接集成到浏览器内部,无需将用户网页活动发送至远程服务器。这使得浏览器从单纯的显示层转变为智能体工作空间,AI能够实时感知并操作标签页、表单、登录会话和未完成任务等作为统一工作状态。该浏览器支持Qwen、Gemma、Nemotron等本地模型,可执行页面总结、表单自动填写、产品比价、跨标签页搜索以及自动化重复性网页工作流等任务,整个过程完全在本地处理,实现了真正的私有化与开源设计,保障用户数据隐私。

Sigma Browser: Hermes agent running in private browser on free local models Private by design. Local. Open-source

智能体产品更新开源生态端侧
5月11日
20:48
Berryxia.AI@berryxia
57
一次将大模型的格式搞清楚!盘它!

本文梳理了本地大模型推理的主流格式。GGUF是llama.cpp推出的单文件格式,集成头文件、元数据和权重,加载快且支持灵活的K-quants量化(2-8bit),兼容llama.cpp等工具,适合CPU与低配设备跨平台使用。MLX是Apple为M系列芯片优化的框架,采用目录结构,在Mac上利用统一内存架构实现高效加载与处理,支持4bit量化,为Mac用户提供最佳体验。其他如PyTorch/Safetensors是训练分享标配,ONNX侧重跨框架部署。建议Mac用户优先MLX,跨平台或低配选GGUF,训练分享用Safetensors。

教程/实践端侧部署/工程
5月10日
23:22
Chubby♨️@kimmonismus
29
苹果Vision Pro的失败实在令人遗憾,我本希望它能成功。 不过苹果仍在研发AR眼镜,可惜距离发布还很遥远。
端侧行业动态
15:33
阿绎 AYi@AYi_AInotes
26
Apple什么时候才能知道用户真正想要的是什么呀?

用户批评Vision Pro价格昂贵、笨重且使用时间短,真正期待的是外观如普通眼镜的轻量AR设备,能实现拍照、实时翻译、导航等实用功能。据视频透露,代号N50的Apple Glasses预计2026年底预览、2027年初发售,依赖iPhone算力,专注核心应用,回应了市场对便捷可穿戴设备的需求。

现象/趋势端侧
02:58
Elon Musk@elonmusk
51
人类感知的RGB是图1,特斯拉AI光子计数重建是图2。 这就是为什么特斯拉FSD能在夜间或强眩光下看得如此清晰。
产品更新端侧
5月9日
23:58
Elon Musk@elonmusk
精选71
Tesla通过分析真实车队碰撞数据,结合视觉系统与传感器,实现了安全系统的突破。传统碰撞传感器需要时间确认,降低阈值可能导致误触发。而视觉系统能提前"看到"即将发生的碰撞,与传感器协同,使约束控制器能更早、更准确地启动安全气囊和安全带预紧器。通过仿真重放碰撞并测量人体模型受力,团队发现提前部署能优化保护时机。这一改进使预测伤害严重程度整体显著下移,并通过OTA更新实现,是前所未有的安全提升。

Wes: Every one of these dots is an actual crash from the fleet. Real world speeds, collisions, and people. Not just the regul...

多模态大佬观点端侧

推荐理由:below_threshold:T2 推文门槛 75,当前 finalScore=71
23:32
阿绎 AYi@AYi_AInotes
精选82
Redis创始人用C语言引擎将大模型"装进"个人电脑

Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码,通过三项关键技术:对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化,成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型,实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力,通过极致工程优化 democratize 至个人设备,展现了开源社区推动技术平民化的强大潜力。

Garry Tan: Downloading now... 1M token context window with supposedly usable coding agent capability all on a 128GB Macbook Pro is ...

DeepSeek开源/仓库推理端侧

推荐理由:Antirez用几千行C代码把DeepSeek V4 Flash塞进128G Mac,本地跑1M上下文coding agent,这才是真正的AI民主化时刻,开发者必试。
22:21
Chubby♨️@kimmonismus
49
Ouster发布首款原生彩色激光雷达REV8

Ouster推出首款原生彩色激光雷达传感器REV8,其核心创新在于将色彩与3D数据在芯片层面进行硬件融合。传统激光雷达仅能捕获单色点云,需额外通过软件融合RGB相机数据来获取色彩,这会导致延迟、对齐误差和系统复杂性问题。REV8则在同一硅芯片上直接捕获色彩和3D深度数据,使得扫描中的每个点都原生携带色彩信息,无需依赖独立相机或后处理软件融合,实现了硬件级别的色彩与深度对齐。

产品更新具身智能端侧
18:21
Chubby♨️@kimmonismus
44
等等。@sama 指的是OpenAI手机吗? 他们终于要开始宣传首款硬件产品了? 提醒一下:就在几天前,郭明錤报告称OpenAI正加速推进首款"AI代理手机",旨在直接与iPhone竞争,目标最早在2027年上半年实现量产。

Sam Altman: call me maybe

OpenAI端侧行业动态
16:43
歸藏(guizang.ai)@op7418
19
Mac Studio 出现供货紧张情况,官方渠道购买需长时间等待。用户因最低配 Mac mini 作为 Agent 服务器性能不足,决定升级到 Mac Studio,但遭遇缺货问题。Mac mini 此前运行稳定,但随着任务增加,硬件捉襟见肘,凸显对 Mac Studio 的旺盛需求。

歸藏(guizang.ai): 过去一段时间,最值得的硬件投资可能就是我那个最低配的 Mac mini 了。 在年前买了以后,到现在几乎只关过一次机;在我出门旅游之类的时候,它一直运行得非常稳定,相当于一个自己的 Agent 服务器了。 随着里面跑的东西越来越多,现在有时...

智能体现象/趋势端侧
09:54
Orange AI@oran_ge
39
Switch 都要涨价一万日元了 硬件已经疯了 没有一个Token是无辜的
现象/趋势端侧
5月8日
17:15
小互@xiaohu
58
Claude开发者大会展示Cardputer实体交互设备

Cardputer是Anthropic在Claude开发者大会上推出的售价29.9美元的实体设备,通过WiFi连接电脑,支持键盘输入问题由Claude处理并显示结果、语音对讲经STT/TTS转换交互,以及作为Claude实体宠物显示动态像素动物,还可接入OpenClaw平台扩展语音功能。

Anthropic教程/实践端侧语音
10:21
Berryxia.AI@berryxia
26
我想用这个做个Voice Agent 能行吗? 直接给我进行问答和做一些定向的检测和人物啊! 有没有玩过的朋友?

marisa: the @claudeai code conference welcome kit came with a tiny cardputer 😭 it's basically a mini programmable handheld comp...

智能体其他端侧语音
08:06
Rohan Paul@rohanpaul_ai
精选78
atomic.chat为LLaMA.cpp引入多令牌预测技术,显著加速本地模型推理

atomic.chat通过为LLaMA.cpp引入多令牌预测技术,大幅提升了本地大型语言模型的推理效率。该技术利用小型辅助模型预先生成后续令牌草案,由主模型进行验证。在MacBook Pro M5 Max上测试时,使Gemma 4 26B模型的令牌生成速度加快约40%,整体运行速度提升1.5倍。这项优化进一步巩固了LLaMA.cpp和GGUF格式在本地AI生态中的核心地位,为桌面应用、编程助手和私有设备助手等场景提供了更高效的部署方案。

atomic.chat: Multi-Token Prediction (MTP) for LLaMA.cpp! Running Gemma4 local model 1.5x faster. We patched LLaMA.cpp. Quantized Gemm...

开源/仓库推理教程/实践端侧

推荐理由:在笔记本上把 Gemma 26B 的生成速度拉高 40% 是个真实的体验提升,atomic.chat 把 MTP 带入 LLaMA.cpp 生态,本地 AI 玩家可以直接拿去用。
03:31
Chubby♨️@kimmonismus
56
苹果计划2026年推出带摄像头的AI AirPods,开启AI硬件新篇章

据彭博社报道,苹果计划于2026年推出第三代AirPods,这将是其首款AI可穿戴设备。新款AirPods的每个耳塞均内置摄像头,作为Siri的“眼睛”捕捉低分辨率视觉信息,以实现视觉问答、情境感知提醒和地标导航等免提AI功能。产品设计类似AirPods Pro 3,带有隐私提示LED灯,但不支持手势控制。该产品已开发四年,目前处于后期测试阶段,硬件已基本定型,但最终发布取决于AI体验能否达到苹果标准。其发布将与基于Gemini重构的Siri及iOS 27的新视觉AI模式同步,是苹果包括智能眼镜、相机吊坠在内的更广泛AI硬件布局的一部分。

Mark Gurman: NEW: Apple's AirPods with cameras reach an advanced testing stage where the design and features have been nearly finaliz...

多模态端侧行业动态
5月7日
23:21
Berryxia.AI@berryxia
65
Google Health以开放生态挑战Apple Health

Google推出全新Google Health平台,取代Fitbit应用,采用开放生态策略,支持从Apple Watch、Garmin等多设备导入健康数据。平台内置Gemini AI教练,提供智能推荐与个性化指导,直接挑战Apple Health的封闭模式,标志着健康数据与AI竞争进入新阶段。

Google产品更新端侧
19:31
Chubby♨️@kimmonismus
66
ZAYA1-8B小模型展现超强推理能力,采用AMD全栈方案

Zyphra发布ZAYA1-8B模型,其活跃参数不足10亿,却在数学、编程和推理基准测试中媲美更大的开源及专有系统。其亮点不仅在于小尺寸,更在于全栈技术方案:完全基于AMD基础设施训练,采用了新的架构选择和大规模强化学习。此外,模型应用了一种名为Markovian RSA的测试时计算方法,通过并行推理和递归聚合,显著提升了复杂数学问题的解决能力。

推理模型发布端侧
12:22
歸藏(guizang.ai)@op7418
50
Mac mini稳定服役后升级Mac Studio遇供货短缺

作者认为最低配的Mac mini是过去一段时间最值得的硬件投资,它运行极其稳定,几乎不关机,可作为个人Agent服务器使用。随着运行任务增多,Mac mini性能捉襟见肘,因此决定升级到Mac Studio。但发现Mac Studio目前供货不足,通过官方渠道购买需要等待很长时间。

智能体大佬观点端侧
09:12
向阳乔木@vista8
精选75
Al Agent装进口袋:TRAE SOLO移动端上手全攻略

字节推出的TRAE SOLO AI Agent工具现已向全量用户开放App、Web和桌面三端,实现跨设备无缝衔接。其移动端支持访问电脑项目、调用已安装技能并执行任务,演示了数据分析、信息整理、学习辅助及自动化等场景。工具支持第三方模型和技能扩展,并与飞书深度集成,便捷创建文档和日程。其“More Than Coding”理念强调AI Agent能处理各类长程复杂任务,而不仅限于编程。

智能体MCP/工具教程/实践端侧

推荐理由:TRAE SOLO 移动端不是阉割版,三端同步、同会话,还能装 Skill、接飞书,是目前把 AI Agent 随身化的最完整方案。在外面也能工作,这才是移动端该有的样子。
08:06
宝玉@dotey
70
手机化身"意图路由器":Agent办公助手实现三端联动与任务自动化

Anthropic工程负责人Boris Cherny透露,他已习惯用手机管理大量Claude Agent,并通过定时任务(Loop)自动化工作。作者体验TRAE SOLO Mobile后指出,Agent正从编程工具泛化为通用办公助手。最新版本实现了移动端、Web端和桌面端的全量开放与实时同步,使手机成为随时下发指令的“意图路由器”,用户可通过语音便捷派发任务,由Agent在多设备间接力执行。同时,定时任务功能支持将日常重复性工作自动化,大幅降低使用门槛,推动办公模式向“人指挥、Agent执行”转变。

宝玉: http://x.com/i/article/2051687844679143424

智能体教程/实践端侧
01:03
Rohan Paul@rohanpaul_ai
48
自适应健康生态系统:消费硬件的下一个十年,从可穿戴测量到主动干预

可穿戴设备1.0因仅测量数据(如心率、睡眠)而陷入停滞,用户需自行解读与行动。下一代消费硬件类别被命名为“自适应健康生态系统”,它能实时感知用户生理数据、自主决策并主动干预。例如,Dreamspan的Lucid Pro通过读取睡眠数据,自动调节床和周围空气以改善睡眠。未来将扩展至大脑、代谢等领域,所有硬件基于SpanOS平台协同工作,实现全栈生理读取。这标志着可穿戴设备的真正演进,率先推出并优化该系统的企业将主导未来十年消费健康市场。Dreamspan的最终目标是借助此技术推动人类实现150年的健康寿命。

sahu: Introducing Dreamspan. We're building towards 150 years of healthspan. Enabled by adaptive health technologies.

现象/趋势端侧
5月6日
19:07
小互@xiaohu
69
Mininglamp-AI开源Cider与Mano-P,将Mac变为本地AI工作站

Mininglamp-AI开源了两个核心项目,旨在将Mac打造为本地AI工作站。Cider是一个端侧推理加速框架,通过更充分利用M系列芯片的INT8 TensorOps,显著提升LLM/VLM等模型在Mac上的运行速度并降低内存占用。Mano-P则是一个端侧GUI-VLA Agent模型,采用纯视觉方式理解屏幕,能在本地操作各类桌面软件、网页、专业工具及复杂图形化工作流,实现自动化任务执行与数据整合。两者结合,为私有AI提供了高效的本地基础设施。

智能体开源/仓库端侧
17:20
Berryxia.AI@berryxia
18
Trae推出限时推广活动,用户下载其手机客户端并完成一次问答,即可在5月8日活动开启后,于北京、上海、广州、深圳、杭州、成都免费领取星巴克咖啡。活动通过分享链接进行传播,旨在吸引用户体验其服务。

Berryxia.AI: "我"请大家免费喝星巴克了哈哈😂 只需要下载Trae 手机客户端,问答一次即可,5/8 日 开启。 地址:北/上/广/深/杭州/成都 赶紧啊! 地址:https://www.trae.cn/h5/events/solo-starbucks...

端侧编码行业动态
09:17
Berryxia.AI@berryxia
50
豆包收费,豆包姐姐这下真要造反了!!!
产品更新端侧
08:17
Berryxia.AI@berryxia
65
Apple将在iOS 27 中支持用户接入自定义API或"中转站"了,就是为了解决可以给他们的AI应用Image PlayGround、Writing Tos等功能的不足和缺点。

Mark Gurman: NEW: Apple's iOS 27 will allow users to choose from a range of outside AI services to power features like Image Playgrou...

产品更新端侧
07:27
Chubby♨️@kimmonismus
精选76
OpenAI加速开发AI智能体手机,瞄准2027年量产

据报道,OpenAI正加速其首款AI智能体手机的开发,目标在2027年上半年量产。此举可能旨在强化其年底IPO的叙事,并将自身定位拓展至消费硬件平台。联发科有望成为独家处理器供应商,提供基于台积电N2P制程定制的天玑9600。关键硬件规格包括增强HDR管线的图像信号处理器,以提升AI视觉感知能力,以及双NPU架构、LPDDR6与UFS 5.0等。若按计划推进,2027至2028年总出货量可能达到约3000万台。

郭明錤|Ming-Chi Kuo: [Industry Check Update]OpenAI appears to be fast-tracking its first AI agent phone, with mass production targeted as ear...

OpenAI推理端侧行业动态

推荐理由:OpenAI 开始认真做手机了,而且冲着 IPO 去,这不是一个模型公司的副业,而是把自己变成消费硬件平台的关键一步,所有做 AI 硬件的都得重新看牌桌。
‹ 上一页
1…45678
下一页 ›