NVIDIA与Span计划利用家庭未充分利用的电力容量,将住宅转变为分布式AI计算节点。其核心是配备16块NVIDIA RTX Pro 6000 Blackwell GPU和4颗AMD EPYC CPU的XFRA节点,并内置电池以确保AI负载稳定运行。该模式旨在规避传统数据中心在土地、审批和电网升级方面的扩张瓶颈。Span计划于2026年第三季度启动100个节点的概念验证,目标是从2027年起实现年容量超过1吉瓦的分布式算力网络,同时为参与家庭降低电费成本。
NVIDIA与Span计划利用家庭未充分利用的电力容量,将住宅转变为分布式AI计算节点。其核心是配备16块NVIDIA RTX Pro 6000 Blackwell GPU和4颗AMD EPYC CPU的XFRA节点,并内置电池以确保AI负载稳定运行。该模式旨在规避传统数据中心在土地、审批和电网升级方面的扩张瓶颈。Span计划于2026年第三季度启动100个节点的概念验证,目标是从2027年起实现年容量超过1吉瓦的分布式算力网络,同时为参与家庭降低电费成本。
OpenAI正加速开发其首款AI Agent手机,预计2027年上半年量产。该手机将AI Agent能力深度集成至系统层,使其成为可感知、决策与执行的随身智能底座。供应链方面,联发科独家提供基于天玑9600的定制处理器,采用台积电N2P工艺,并配备强化ISP、双NPU、LPDDR6内存及UFS 5.0存储等硬件。预计2027-2028年出货量约3000万台。此举标志OpenAI从软件模型商转向硬件领域,可能引发手机行业新一轮竞争。
http://x.com/i/article/2048582573291606016
KroWork的核心创新在于“chat-to-software”模式,旨在超越仅能提供建议或代码的传统AI聊天机器人。它是一个桌面AI智能体,能通过20多种内置技能端到端自动化执行任务,并将完整工作流转化为名为“Kro App”的持久性本地应用程序。该应用可一键安装至系统菜单,像常规软件一样运行,且重复使用无需消耗token或重新构建。所有操作均在用户本地设备上完成,保障数据隐私,无需云端依赖,用户也无需具备编程背景即可创建属于自己的可复用软件。
Your AI chatbot can't ship. It answers. It suggests. It generates code you still have to wire up yourself. Close the tab...
Your AI chatbot can't ship. It answers. It suggests. It generates code you still have to wire up yourself. Close the tab...
苹果近期悄然调整Mac产品线内存配置与定价。Mac mini取消599美元256GB入门款,起售价升至799美元/512GB;Mac Studio也移除了512GB统一内存选项,且256GB升级价暴涨400美元。这并非简单存储升级,而是因AI数据中心导致全球DRAM供应紧张、价格飙升。Tim Cook指出AI需求超预期,导致Mac供货紧张数月。苹果通过砍掉低配和高配、整体上移配置阶梯变相提价,对依赖统一内存进行本地大模型推理的用户而言,高性价比硬件窗口期可能快速关闭。
The Mac mini price hike doesn't look like a one-off. It looks like a pattern, and if you run local LLMs, you should pay ...
简单基于Apple已有产品p了一下自己目前理想的 AI 硬件设计:iA 最基础想法:手机+AI硬件配合使用,因为离不开手机,同时不想增加手机复杂度(过渡时期想法,未来一定会合一) iA 主体:来自iPod Shuffle,可独立交互,小巧且...
这个也太屌了! 这个中国开发者在飞机上用 MacBook 本地跑 Llama 70B,整整 11 小时没有网络,处理了完整的客户项目。 他坐在跨大西洋航班的靠窗位置,设备是 MacBook Pro M4,64GB 内存。机上 WiFi 要价...
( #appleinternal ) Apple Internally uses an application that looks pretty similar to ChatGPT named AFM Playground, which...
腾讯开源了Hy-MT1.5-1.8B-1.25bit翻译模型,其参数量为18亿,经量化后仅440MB,可在手机上完全离线运行。该模型支持33种语言、5种方言及1056个翻译方向,包括藏语、蒙古语等少数语言。在标准测试中,其性能媲美商业翻译API和2350亿参数的大模型。通过量化至1.25比特,模型内存占用从FP16格式的3.3GB大幅降低,比之前的1.67比特方法体积缩小25%、速度提升约10%,且无精度损失。该模型已在国际机器翻译竞赛中获得30项第一,并部署于腾讯多个产品中。
FlashQLA是基于TileLang构建的高性能线性注意力内核,专为个人设备上的智能体AI设计。其核心创新包括门控驱动的自动片内计算并行、硬件友好的代数重构以及TileLang融合的Warp专用内核,通过提升流处理器利用率,在前向传播上实现2-3倍加速,反向传播实现2倍加速。该技术在小模型、长上下文工作负载和张量并行设置中效果显著,虽然在大批次处理时内存I/O开销略高,但在边缘设备和长上下文场景中实际性能更优。反向传播通过16级Warp专用流水线在严格片上内存限制下实现了核心级加速。相关资源已开源。
FlashQLA是基于TileLang开发的高性能线性注意力内核,专为提升个人设备上智能体AI性能而设计。它实现了2-3倍的前向传播加速和2倍的反向传播加速。其核心技术包括门控驱动的片上自动计算与通信重叠、硬件友好的代数重构,以及TileLang融合的Warp专用内核。该设计通过自动片上通信重叠显著提升了流处理器利用率,在张量并行、小模型和长上下文任务中效果突出。尽管在大批量处理时,其将GDN流程拆分为两个内核的策略会带来额外内存开销,但在边缘设备和长上下文实际场景中性能更优。反向传播部分通过构建16级、严格片上内存限制下的Warp专用流水线,实现了超过2倍的内核级加速。
NVIDIA发布了多模态模型Nemotron 3 Nano Omni,专为处理长上下文设计,能够同时理解文本、图像、音频和视频。该模型在文档分析、自动语音识别、音视频理解以及智能体计算机使用等实际应用场景中表现优异。在多项基准测试中,Nemotron 3 Nano Omni均展现出领先的准确性和效率。
🚀 🚀Excited to announce the technical report of MiniCPM-o 4.5! MiniCPM-o 4.5 transitions #AI interaction from tradition...
Learn how to run a local coding agent! Use: - Pi agent - Gemma 4 26B - Serving engine of choice: e.g. LM Studio
纽约眼科医生Eric Rosenberg于2025年10月使用Apple Vision Pro结合ScopeXR混合现实平台,完成了全球首例由该设备辅助的白内障手术,并已成功实施数百例。该应用提供了3D立体显微视野、实时数据叠加和远程专家协作功能,标志着空间计算技术正式进入手术室。主推文同时指出,国内沈阳和北大医院此前已有使用AVP进行手术的案例,因此此次并非严格意义上的“全球首例”。
Apple Vision Pro Used in World-First Cataract Surgery https://www.macrumors.com/2026/04/28/apple-vision-pro-cataract-sur...
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
Sigma发布了一款开源私有AI浏览器,其核心是将本地大语言模型(如Qwen、Gemma、Nemotron)与Chromium浏览器深度集成。该浏览器通过内置的OpenClaw智能体,能直接读取页面内容、理解用户意图,并执行点击、输入、总结等自动化操作,从而将浏览器从被动查看工具转变为能直接处理任务的AI工作界面。此举旨在解决多数AI浏览器需将数据发送至远程服务器导致的延迟和隐私风险,所有计算均在用户本地设备完成,确保了隐私安全和响应速度。
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
Private AI browser with the OpenClaw agent on free local models Run your agent on Qwen, Gemma, or Nemotron directly in t...
Ling-2.6-flash is now officially open-sourced 🚀 (from @AntLingAGI) Was "Elephant Alpha" on OpenRouter. Now fully open f...
Even Realities推出的G2智能眼镜具备“终端模式”,可将完整的Claude AI终端直接投射到用户视野中。开发者能在移动场景(如散步、通勤)中通过语音与AI交互,实时获取代码、设计规范等内容,实现开发环境与物理世界的无缝融合。该技术彻底消除了上下文切换成本,将碎片时间转化为生产力,被视为“vibe coding”的终极形态。尽管引发工作与生活界限的担忧,但这代表了程序员工作流的革命性变革,被形容为“巅峰性能”和“新物种”的诞生。
You may not like it, but this is what peak performance looks like. Vibe coding everywhere, straight to your eyeballs. Ma...
小米正式开源MiMo-V2.5系列模型,采用宽松的MIT协议,允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型:专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro,以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时,小米推出Orbit 100T Token计划,包含面向AI开发者的“百万亿Token创造者激励计划”,提供最高价值659元的Credits,以及面向Agent框架团队的“Agent生态共建计划”,为其用户提供MiMo token限免支持。
Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...
小米正式开源MiMo-V2.5系列模型,包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro,以及支持多模态代理的310B参数MoE模型MiMo-V2.5,两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术,以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式,通过多教师策略蒸馏提升模型综合能力。同时,小米推出100T Token的创造者激励计划,为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。
Just dropped two open-source models: MiMo-V2.5-Pro (Code Agent, 1T total) and MiMo-V2.5 (Multimodal Agent, 310B total). ...
据报道,OpenAI正与联发科和高通合作开发智能手机处理器,立讯精密为独家设计与制造伙伴,目标2028年量产。此举旨在通过完全掌控硬件与操作系统,提供完整的AI智能体服务。智能手机被视为能持续捕捉用户实时状态的关键设备,是AI实时推理的重要输入。未来手机将深度结合云端与端侧AI,处理器设计需重点考量功耗与上下文理解。该项目对联发科和高通意味着长期增长机会,对立讯精密则是切入下一代智能手机核心供应链的关键。
http://x.com/i/article/2048582516391751680
一个完全本地的 Agent,就生活在你的浏览器里。 由 Gemma 4 E2B 和 WebGPU 驱动,它使用原生工具调用来实现: 🔍 搜索浏览历史 📄 阅读并总结页面内容 🔗 管理标签页 100% 本地运行!无需任何服务器!
A completely local agent that lives right inside your browser. Powered by Gemma 4 E2B and WebGPU, it uses native tool ca...
开发者@patloeber分享了一套完全本地的Coding Agent方案,核心是Pi Agent框架与Gemma 4 26B A4B模型。Gemma 4因原生支持function calling和thinking mode,首次真正适合作为Agent;其MoE架构在质量与速度间取得平衡。Pi框架设计极简,仅提供read、write等四个核心工具以节省宝贵的上下文窗口。文中强调了上下文长度与显存的权衡,并给出安全警告:本地模型可能产生危险命令幻觉,建议至少安装permission-gate等扩展进行防护。
Lately I've been having fun with running coding agents fully locally. The setup I landed on is: - Pi agent - Gemma 4 26B...
分析师郭明錤透露,OpenAI正与联发科、高通合作开发手机专用AI处理器,并由立讯精密独家负责系统设计与制造,预计2028年量产。此举旨在从根本上颠覆当前以App为中心的手机逻辑,将手机转变为AI Agent执行平台,用户只需表达意图,AI即可自动调用跨应用、跨云端服务完成任务。OpenAI选择自研硬件的核心原因在于,云端模型无法获取手机本地实时数据(如位置、传感器、日程等),而这些是AI Agent有效运作的关键。此举可能彻底重塑运行多年的App生态,并将AI硬件竞争从云端延伸至个人设备。
http://x.com/i/article/2048582573291606016
据爆料人古尔曼透露,苹果前CEO Tim Cook在卸任前为新任CEO John Ternus规划了六个全新的产品类别,全部由AI驱动。这些产品包括AI AirPods(集成Apple Intelligence)、Apple Glasses智能眼镜、AI智能吊坠Pendant(带摄像头和视觉计算)、带屏HomePod智能显示屏、Tabletop Robot桌面机器人以及隐私安全摄像头。这些创新覆盖穿戴设备和智能家居领域,可能推动苹果硬件在Ternus领导下迈向新高度。
You can now run DeepSeek4-Flash on 256GB Mac. Next up speed 🚀 PR: https://github.com/ml-explore/mlx-lm/pull/1192
Apple M4 Mac mini全线供应紧张,256GB型号在官方商店已无货,更高存储型号也面临6至10周的发货延迟。这一状况并非简单的产品线过渡所致,而是反映了更广泛的供应链压力。核心原因在于行业范围内的内存和存储组件短缺,同时苹果似乎优先将资源分配给了需求更高的MacBook产品线,而非台式机。这表明持续的半导体供应限制正在引发更多问题。
AirJelly突破OpenAI Chronicle代表的"记忆基础设施"局限,成为始终运行的桌面AI代理。它不仅实时监测Figma、GitHub等跨应用屏幕活动,更主动推断用户意图,自动创建任务、时间线与提醒,将原始上下文转化为有组织的执行。与传统工具需人工提示才激活记忆不同,它在无需指令的情况下主动完成工作闭环。所有数据本地处理,在保护隐私的同时构建跨应用连续上下文层,实现从被动记录到主动执行的范式转变。
🚨The world just started talking about AI Screen Context. We've been building something deeper - AirJelly can see your s...
Hermes Agent by @NousResearch (100k+ ⭐) now inside Atomic Bot: - Free Local models: Qwen, Gemma or - Use your API keys f...