🚀 We're out of stealth. Today we're introducing Ent, the industry's first intent-aware Workspace Security platform for ...
🚀 We're out of stealth. Today we're introducing Ent, the industry's first intent-aware Workspace Security platform for ...
Open-weight MiniMax M3 filled out a US customs form from a driver's license photo For this test we deployed MiniMax M3 Q...
Google 正实验将退休手机组成计算集群,以减少碳排放——淘汰手机的芯片、内存等仍可正常工作,无需生产新服务器。此举类比于 SETI@home 利用闲置电脑贡献算力,以及 Google 用廉价服务器组建超级计算机的经典思路。在 AI 时代算力紧张、能源成瓶颈的背景下,重新利用抽屉里的旧手机或成创新方向。
Today on the blog, we discuss a pathway for the second life of phones through the exploration of "phone cluster computin...
Berry Xia 介绍了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型。它将 Fable 5 的推理链条蒸馏进 12B 参数模型,训练数据使用 Composer 2.5 真实通过案例并由 Fable 5 辅助补全。GGUF 格式让模型在 12GB 消费级显卡即可本地运行,甚至支持 CPU。模型专为代码生成、调试、复杂算法、链式思考提示等任务优化,无需 API 费用且无导出限制。该模型基于 Google 最新 gemma-4 架构,目前下载量已破六千,社区反馈其在本地 coding 场景表现出色,填补了云端模型与本地可用之间的鸿沟。
Gemma 4 12B Coder is here and it's a game changer for local code generation. This GGUF model packs Google's latest gemma...
AMD发布Mac mini尺寸本地AI开发平台,对标NVIDIA DGX Spark。配备128GB统一内存,无需联网可本地运行最高2000亿参数大模型,环境预配置,开机几分钟可出token。支持GPT OSS 120B、Qwen 3.5 122B、Qwen 3.6B、GLM 4.7 Flash 30B等模型。接口含Wi-Fi 7、蓝牙5.4、10GbE、4个USB-C、HDMI 2.1b。售价3999美元起。
Berry Xia 推荐四个开源 AI 项目:/last30days(新搜索引擎)、agent-skills(将全栈开发技能打包成可调用模块)、open-notebook(本地版 NotebookLM,可离线运行知识整理与生成)、headroom(不改代码即可将 AI API 账单降低 90%)。这些项目聚焦工具层优化,免费开源,一次性解决本地化、成本控制和 agent 能力三个痛点,让开发者能直接拿来提升效率。
4 awesome open-source AI projects: 🔸 /last30days (new search engine) 🔸 agent-skills (full dev skills) 🔸 open-notebook...
MiniMax M3 support added to mlx-vlm with MSA implementation! 🚀 Tested on M3 Ultra 512GB running at 24 tps with peak mem...
我尼玛!苹果现在安全性真的差! 世界果真就是草台班子、谁也不例外! 苹果新Siri AI的等候名单? 国外大神Mac用户直接一顿操作就把AI增强版给硬解锁了,名单这东西瞬间成了笑话。 WWDC刚秀完新Siri,大家还在排队等官方推送,结果有...
mlx-vlm v0.6.3 is here 🚀 Day-0 support for TWO new models from our partners we work closely with: 🔥 @GoogleDeepMind Di...
MiniMax 宣布参加 6 月 11 日在 Cupertino 举办的 AiOS Meetup(WWDC'26 版),聚焦 Apple 平台、端侧 AI 与 AI 原生应用。演讲嘉宾包括 MLX 联合创始人 Awni Hannun 和 Peter Friese,将分享 Gemini 模型(通过 Firebase)及 Apple Foundation Models。每位参会者可获得 $50 积分用于体验 MiniMax M3。活动由 CommunityKit 等多位人士主办。
苹果在WWDC 2026发布全新Siri AI,由第三代Apple Foundation Models(AFM 3)驱动,共五个模型:端侧AFM 3 Core(30亿)和AFM 3 Core Advanced(200亿MoE,每次激活10-40亿);服务器AFM 3 Cloud、ADM 3 Cloud(图像)、AFM 3 Cloud Pro(Agent/推理)。核心创新将200亿参数模型塞入手机:权重存闪存,自研Instruction-Following Pruning技术按Prompt路由专家而非逐Token,大幅降低搬运次数。最强算力依赖Google和NVIDIA。
Apple 发布全新基础模型家族,亮点是 AFM 3 Core Advanced:200 亿参数,完全运行在 iPhone 17 Pro 设备端。通过将完整模型存于闪存,每次仅加载 1-4B 专家参数到活跃内存,巧妙绕过 DRAM 瓶颈,实现设备端更生动的语音和更精准的听写。共 5 个模型,与 Google 合作打造,覆盖从设备端到 Private Cloud Compute 的云端模型,最高性能云端模型运行在 NVIDIA GPU 上。
iOS 27 的新 Siri 实现质变级升级。演示中用户提及水瓶需求,Siri 自动关联妈妈聊天记录,弹出卡片显示「Your mom mentioned that she really wanted a LARQ bottle.」并附上消息片段。这涉及个人语义理解和跨应用上下文召回,支持 Messages、照片/视频文本解读。本地处理为主,速度快、隐私更好。
New Siri in iOS 27...it actually works 🤯
苹果发布全新Siri AI演示,定位为端侧+云端双模型架构。端侧负责调用本机个人信息与感知场景,云端基于Gemini模型定制(非完全采用)以处理复杂任务。Siri升级为独立App,支持自然对话、上下文记忆、跨应用操作,并能理解屏幕内容和摄像头画面。同时,照片、Safari、密码、快捷指令均加入AI功能:照片可重新构图,浏览器标签自动归类,弱密码一键修改,快捷指令一句话生成。
没有熬夜的兄弟们来看,WWDC 2026 速览! 另插一嘴,Apple真的没有特别的新东西。 一、历史性时刻 1库克谢幕:Tim Cook最后一次以CEO身份主持WWDC,9月1日将交接给硬件工程副总裁John Ternus 2基调延续:发...
Kimi Work 是一款桌面 AI 代理,支持在本地最多 300 个代理并行执行任务,已适配 macOS(Apple Silicon)和 Windows。配合 WebBridge 扩展,代理可自主在浏览器中搜索、滚动、点击、打字完成操作。内置财经场景优化,原生调用 Yahoo Finance 和世界银行数据,无需复杂 API 配置。自带记忆系统记录用户偏好和决策历史。最终自动生成 PPTX、Word、PDF、Excel 文件。
Meet Kimi Work - a local AI agent on your desktop that does the work for you. 🔹Native agent swarm: Up to 300 AI agents ...
同一事件,精选展示《Kimi Work Beta版发布:面向知识工作者的本地Agent》Tim Cook 最后一次以 CEO 身份主持 WWDC,AI 成绝对核心。苹果推出双轨模型:基础层 3B 端侧 AFM 3 Core,进阶层 20B MoE 仅限 iPhone 17 Pro/M4 设备。四大 AI 能力:个人上下文理解、世界知识检索、App Actions、屏幕感知。Siri 升级支持连续对话、跨设备同步、视觉识别及独立 App,仅限英语,中国/欧盟暂不可用。应用生态:Safari 智能标签分组、密码自动更新、来电识别、快捷指令自然语言生成。影像:Image Playground 写实生成与空间重构。开发者工具:Xcode 支持多模型,Core AI Framework 开放本地部署。遗留问题:中国区功能缺失,Agent 多步自动化能力薄弱。
推文介绍了如何使用 llmistanbul 在网页上10秒内训练一个小模型(电子鹦鹉)。只需将纯文本文档(如哈利波特1-7)拖入即可,建议使用 Apple Silicon Mac(M1-M5),避免 markdown/json 等格式。N 卡(3080Ti)适配不佳。提醒尊重版权,勿公开发布他人作品。
WWDC 2026: A brief assessment At WWDC26, Tim Cook's last keynote before he hands the CEO role to John Ternus on Septembe...
In the next version of siri you can search for files across your mac
- System wide awareness - Visual Intelligence in Camera App
Apple Intelligence sounds like a very good update. But did I miss all the relevant (nerd) stuff like paramters, evals in...
WWDC 2026 - Apple rents Google's brain to fix Siri. What we can expect: Apple's keynote today is a software reset built ...
Kimi发布Kimi Work,一款本地运行的桌面AI智能体。支持最多300个AI智能体同时在本地机器并行运行;配合WebBridge浏览器扩展,智能体可在浏览器中导航、搜索、点击、填写并完成任务;内置全球市场数据工具,可直接调用Yahoo Finance和世界银行数据,无需复杂API设置;记忆系统会记录用户偏好、过往决策和上下文。支持macOS(Apple Silicon)和Windows。
同一事件,精选展示《Kimi Work Beta版发布:面向知识工作者的本地Agent》郭明錤指出,Apple 當前多頭核心敘事是「AI 雖落後但最終後來居上」。供應鏈調查顯示其業績將好到今年底,進一步強化此敘事。WWDC26 上無論發布什麼,只要該敘事不被破壞,Apple 2H26 股價正向趨勢就不易改變。真正觀察點在於:Apple 能否用 Gemini 做出比 Google 更好的 AI 應用、AI 智能體工作流及設備端+雲端混合體驗。答案肯定則利好敘事延續;否則「Gemini 決定 Apple AI 上限」的質疑將削弱「後來居上」共識。
郭明錤指出,苹果核心看涨叙事是“AI暂时落后但最终会迎头赶上”。供应链显示业务势头年底前强劲,强化“无AI已不错,有AI更想象”叙事。故无论WWDC26内容,只要叙事不变,苹果2026下半年股价趋势积极。WWDC26真正看点在于苹果能否用同款Gemini做出比谷歌更好的AI应用、智能体工作流及端云混合体验。若能,叙事延续;若不能,Gemini设定AI上限,“苹果最终领先”将受质疑。
Kocoro 是一个引擎级的开源 Mac AI agent 框架。它通过本地 agent 读取用户的过往会话、文件、应用、浏览器、屏幕和终端,将有用事实压缩为记忆,使 agent 无需重复上下文即可继续工作。安全模型以本地优先:工具操作需授权,危险命令被拦截或二次确认,行为可审计,秘密自动脱敏,记忆/同步默认不上传。其“情景记忆”将历史会话转化为项目事实、决策、协作者、截止日期和习惯。每晚自动将工作日蒸馏成本地知识图谱,次日直接恢复进度。
The models keep getting smarter. The users keep turning into assistants. You paste the file. Re-explain the project. Nar...
SK海力士与英伟达达成多年内存合作,将为英伟达下一代AI超级计算机Vera Rubin、Vera CPU、RTX Spark PC及Jetson Thor平台联合开发内存。合作强调内存设计需提前数年与GPU协同设计、制造规划及资本投入,不能再于GPU完成后才设计。双方还将把AI引入芯片制造,利用NVIDIA CUDA-X、PhysicsNeMo、Omniverse、OpenUSD、cuOpt加速芯片设计和半导体仿真,并计划建立工厂数字孪生,在软件中模拟机器人、晶圆和物流后再投入产线。该合作进一步巩固了SK海力士在AI硬件供应链中的关键地位。
CJ Zafir团队发布Mac-1模型(6.6B参数),可在任何Mac本地运行,仅需7GB内存(12GB更佳)。它支持487个MacOS原生工具,能执行多工具链式调用,推理开启,输出速度约65 tok/s。应用层基于Mac原生UI/UX设计。作者认为这种本地小模型+原生工具的组合直接挑战云端SaaS agent,甚至可能抢了苹果Siri的活儿。
Here's a teaser of our Mac-1 model. > 6.6B model > runs locally (on any Mac) > requires 7GB RAM (12GB ideal) > can use 4...
据传 WWDC 2026 苹果将彻底重构 Siri,底层集成 Google Gemini 模型(约 1.2 万亿参数)作为云端智能层,与自有 3B 参数设备端模型组成混合系统。Siri 担任编排层,控制 UI、隐私和应用权限。预期新 Siri 支持更自然对话、跨应用上下文、屏幕感知、应用内操作、专用 Siri app、语音/文件/多模态交互、动态岛增强,并可选接入 ChatGPT/Claude 等第三方 AI。同时可能推出 AI 修图、智能相机、写作工具、自然语言快捷指令等新 Apple Intelligence 功能。
日本北海道农民富安弘毅用 ChatGPT 和 Codex 解决农场实际问题,涵盖 8 个用法:拍照识别西兰花病害、卫星监测获取 NDVI 数据、用 ESP32 和 LINE 机器人远程控制温室卷帘、为农场群聊开发机器人管理温度与排期、从聊天记录追踪播种数量、学习 RTK-GPS 自动转向原理并评估自建成本、设计基于 Airtable 的农场管理数据库。他说 AI 让传统昂贵的自动化变得低成本可及,“如同身边有一位超级工程师”。
懒猫摄像头开始预售啦! 继懒猫微服,懒猫 AI 算力舱后,第三款懒猫智能硬件发布啦! 星际太空人,科幻外观设计,从零开模打磨了一年半,头围和蔚来汽车的 Nomi 一样大,意味着买了摄像头后,所有 Nomi 的头饰都可以随意搭配 后期会让懒猫...
Google 发布 Gemma 4 的 QAT(量化感知训练)检查点,将最小模型从 11.4GB 缩小至 1.1GB(纯文本版 0.84GB),便于手机和笔记本运行。常规 PTQ(训练后量化)因模型未学会应对舍入而损伤质量;QAT 在训练中模拟压缩,让模型在权重被挤压时学习,压缩版不易丢失推理能力。Google 还构建了移动端优化格式,包含静态激活、通道量化、定向 2-bit 量化及 KV 缓存优化,减少手机缩放计算并防止长对话过快消耗内存。