mlx-vlm v0.6.3 is here 🚀 Day-0 support for TWO new models from our partners we work closely with: 🔥 @GoogleDeepMind Di...
mlx-vlm v0.6.3 is here 🚀 Day-0 support for TWO new models from our partners we work closely with: 🔥 @GoogleDeepMind Di...
苹果在 WWDC 2026 公布其最高端端侧 AI 模型,需 12GB 统一内存,用于提升 Siri 语音表现力与全系统听写精度。该模型仅适配 iPhone Air、iPhone 17 Pro / Pro Max,以及搭载 M4 及后续芯片的 iPad、M3 及后续芯片的 Mac、M5 芯片的 Vision Pro。标准版 iPhone 17(8GB 内存)无法使用这两项功能,但其他 Siri AI 功能(如个性化语境识别、屏幕感知、网络检索等)仍对 8GB 设备开放。iOS 27 开发者测试版已上线,公开测试版下月推送,正式版秋季更新。
苹果在 WWDC 2026 推出 CarPlay“路线共享”功能,支持导航应用以路段坐标数组向车辆传递路线并实时更新,解决特斯拉 FSD 因无法获知 CarPlay 目的地导致的自动变道失效问题。反向操作也支持:特斯拉可根据能耗选充电站,回传途经点至 iPhone 更新路线。另新增视频浏览应用,支持 AirPlay 视频串流,驾驶时自动切换纯音频。
datasette-agent 0.2a0 新增两个核心功能。工具可通过 ToolContext 对象的 await context.ask_user(...) 向用户提问,支持 yes/no、多选(options=[...])或自由文本(free_text=True)。问题未回答时 agent 挂起,问题以表单形式渲染在聊天界面并持久化到内部数据库,服务器重启后对话可继续。工具应在执行副作用前调用 ask_user(),回答后从头重放。另一内置工具 save_query 允许 agent 将 SQL 保存为 Datasette 存储查询,但必须经人工批准——显示完整 SQL 及提议的名称、数据库和可见性,用户确认后才会存储。ask_user 功能基于作者昨日用 Claude Fable 5 构建的新 LLM alpha 实现。
小米将MiMo 2.5模型接入Bloome后开源了MiMo-Code。它fork自OpenCode,新增SQLite持久记忆(跨会话)、build/plan/compose三类自主子代理、自动checkpoint、智能上下文预算,以及/dream自我提炼知识和/distill打包技能机制。支持语音输入和零配置任意OpenAI兼容模型,一键curl安装,MIT协议。引用推文称该项目由5人在14天内完成。
A strong model evolution needs a solid harness system, and vice versa. 14 days, 5 people, one vibe-coding journey - and ...
今天被很多人忽略的大新闻 Google 发布实时翻译模型 :Gemini 3.5 Live Translate - 能在70多种语言之间做到边听边译 - 同时保留说话人的语调、节奏和音高 - 不用等说完才翻,全程只比说话人慢几秒 - 自动滤...
子智能体现可创建自己的子智能体,最多嵌套5层。Amazon Bedrock 在未设置 AWS_REGION 时从 ~/.aws/config 读取区域。插件市场新增搜索栏。修复了使用1M上下文且无使用额度的会话永久卡住的问题,现会自动压缩回标准上下文限制。修复了多个图片导致重复报错等问题。改进了长对话性能,减少冗余消息归一化和不必要的UI重绘,降低空闲CPU占用。Claude in Chrome 工具加载改为单次批量调用。/code-review 在未登录时保留 ultra 选项并提示需要 claude.ai 账户。
6 月 11 日,小米 MiMo 发布并开源 MiMo Code V0.1.0,一款终端 AI 编程助手,基于 OpenCode 二次开发,采用 MIT 协议。内置限时免费多模态模型 MiMo-V2.5,支持接入 DeepSeek、Kimi、GLM 等模型。独创持久记忆系统通过项目记忆、会话检查点、任务进度三重机制解决长会话遗忘,由独立 subagent 自动保存状态并在窗口快满时生成简报。Compose 模式可一键完成设计、规划、编码、测试、审查全流程。内置 /dream 命令每 7 天自动合并、去重、验证路径并压缩记忆文件。支持语音输入与控制(MiMo-V2.5-ASR)。
小米 MiMo 正式开源 AI 编程助手 MiMo Code V0.1,搭载多模态模型 MiMo V2.5(限时免费),拥有百万 token 上下文窗口。核心功能包括:无限上下文与无损压缩、Agent 框架(测试/审查/验证闭环)、Compose 模式(设计先行)、自进化系统、语音输入(基于 MiMo-V2.5-ASR)。兼容 Claude Code,自动加载现有技能、MCP 服务器和命令,零成本迁移。采用 MIT 许可,支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。可通过一行命令安装。
Cursor 的代码审查工具 Bugbot 迎来重大更新:运行速度提升超 3 倍,成本降低 22%,每轮审查多发现 10% 的 bug,90% 的运行在三分钟内完成。新增 /review 命令,可在推送代码前运行 Bugbot 和安全审查,并与 GitHub/GitLab 同步——若已通过 /review 审查过同一 diff,打开 PR 时 Bugbot 会自动跳过并备注。支持配置仅审查 PR 中新增内容。性能提升源于驱动 Bugbot 的 Composer 2.5 模型训练改进。Bugbot 遵循模型阻止列表,若组织禁用 Composer 2.5 则自动回退。该功能已在 Cursor 3.7+ 和 cursor.com/agents 上线,CLI 支持即将推出。
0G × @MiniMax_AI We're thrilled to partner with MiniMax to bring frontier AI on-chain through verifiable, privacy-preser...
同一事件,精选展示《MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型》小米 MiMo 发布并开源 MiMo Code V0.1,一款终端 AI 编程助手。它附带多模态模型 MiMo V2.5(限时免费),支持百万 token 上下文窗口。核心特性包括:无限上下文(无损压缩,百万行项目质量不降)、深度优化的 Agent 框架(测试/审查/验证闭环)、Compose 模式(规格→计划→构建→报告)、自动学习每轮会话经验的自我进化系统、MiMo-V2.5-ASR 语音输入、与 Claude Code 兼容(可复用现有 skills/MCP/API 配置)、MIT 许可,并支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等模型提供商。一键安装(Mac/Linux 用 curl,Windows 用 npm install)。
安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。
小米MiMo开源终端AI编码助手MiMo Code V0.1,内置MiMo V2.5多模态模型(百万token上下文窗口,限时免费)。特性包括:无限上下文(无损压缩保留百万行细节)、智能体-模型协同闭环、Compose模式(规格→规划→构建→报告)、自我进化系统、语音输入(基于MiMo-V2.5-ASR)。兼容Claude Code,MIT许可,支持Anthropic、OpenAI、DeepSeek、Kimi、GLM等模型。安装:Mac/Linux执行curl -fsSL https://code.xiaomimimo.com/install | bash;Windows执行npm install -g @mimo-ai/cli。
Apache Burr 是一个用于构建可靠 AI 智能体和应用程序的框架,已在 Apache 基金会下发布。该项目提供工具和抽象,帮助开发者设计、开发和部署可信任的智能体应用,强调可靠性、可观测性和生产级部署能力。
小米推出开源终端 AI 编程助手 MiMo Code V0.1,附带限时免费使用的多模态模型 MiMo V2.5,支持百万 token 上下文窗口。核心特性包括:无限上下文(自动知识积累与无损压缩)、Agent-模型深度协同(测试-审查-验证闭环)、Compose 模式(规格→计划→构建→报告)、自进化系统、语音输入(基于 MiMo-V2.5-ASR)、兼容 Claude Code(零成本迁移),以及 MIT 许可、支持 Anthropic、OpenAI、DeepSeek、Kimi、GLM 等主流模型提供商。
关联讨论 3 条公众号:小米 MiMoX:Berry Xia (@berryxia)Hacker News 热门(buzzing.cc 中文翻译)NVIDIA 发布了与 Lambda 合作的共封装光学(CPO)交换机视频。CPO 将光通信部件移至主网络芯片附近,而非独立可插拔模块。官方博客指出,在 GB300 NVL72 规模下,CPO 通过降低网络功耗和消除大量可插拔光学组件来减少故障点,提升每瓦 token 数。一个 128,000 GPU 数据中心传统需约 655,000 个独立收发器,每个都是潜在故障点,CPO 完全移除该类组件。智能体工作负载需要弹性数据移动,CPO 可减少网络功耗和组件数量,避免 GPU 等待数据。
📣 Get a first look at the NVIDIA Photonics co-packaged optics switch with @LambdaAPI. At NVIDIA GB300 NVL72 scale, the ...
Anthropic 推出 Claude Managed Agents,一套可组合 API 套件,用于构建和部署生产级智能体。该产品从早期简单 API 演进至 Claude Agent SDK,再到将智能体调度层与代码执行沙箱解耦的 Managed Agents。通过只追加日志的会话机制,Managed Agents 解决了托管伸缩、会话持久化、文件系统管理、执行隔离、凭证安全与可观测性等生产部署挑战。团队借助该方案可在数天内完成从原型到生产环境的转化,无需自建基础设施。
同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》Apodex-1.0-H 发布一个异步智能体团队,用于深度研究。协调者将子智能体分配到独立上下文和工具,再通过事实核查、冲突审查和草稿审查智能体检验弱主张。该方案将深度研究视为分布式系统问题,展示了推理时缩放路径:通过多个协调搜索智能体、持久追踪和独立验证层提升答案质量,而非依赖单一更大模型,并声称取得 SOTA 结果。
Dive in 👇 📝 Blog: https://www.apodex.com/blog/apodex-1.0 📄 Tech report: http://www.apodex.com/pdf/20260608 💻 Github:...
We want to make AI accessible for everyone, so we're reducing our API prices by ~50%. Consumer AI growth is still blocke...
Today, the Stanford @DigEconLab launches the AI Economic Indicators, a new platform for tracking how AI is reshaping wor...
Introducing NoimosAI: The world's first all-in-one autonomous AI marketing team. Simply connect your apps or website. It...
NoimosAI 推出全合一自主 AI 营销团队。连接产品应用、网站及数据源后,系统自动规划执行 SEO、GEO、社交媒体、外展和转化等增长工作,24/7 运行并将输出结果送交审批。产品基于一个关键洞察:AI 虽加速了产品构建,但分发仍依赖流量、线索、内容和反复测试,因此 NoimosAI 试图将营销流程转化为日常自动运营闭环。
Introducing NoimosAI: The world's first all-in-one autonomous AI marketing team. Simply connect your apps or website. It...
Google更新搜索交互数据保存方式,新增“Search Services History”设置,用于保存用户搜索时使用的图片、文件、音频和视频,包括Google Lens搜索的图片、实时搜索工具Search Live的录音、语音搜索和Translate中的语音片段。这些数据将被用于“提供、改进和开发AI模型”。用户可关闭该设置并禁用“Save Media”选项以避免保存。
Introducing NoimosAI: The world's first all-in-one autonomous AI marketing team. Simply connect your apps or website. It...
Suno 对音轨分离功能进行重构,推出三种拆分方式:Auto Split 将歌曲自动拆分为最多 12 个音轨(鼓、贝斯、吉他等);Split from Mix 可隔离或移除特定乐器/人声并生成伴奏轨道;Advanced Split(仅 Premier 订阅)支持从近 100 种乐器中精确提取目标音轨。与常规切割算法不同,Suno 使用最新模型从零重新生成每个音轨,而非从混音中切割,以消除串音和音质损失。该功能适用于 Pro 和 Premier 订阅用户,可用于 Suno 创作或上传的音乐。
Google DeepMind 的 Gemma 4 12B 已在硅基流动上线,定价输入 $0.1/1M tokens,输出 $0.3/1M tokens。支持 262K 上下文、内置思考、原生工具调用及 140+ 种语言。采用无编码器架构,视觉和音频输入直接注入 LLM 主干,降低处理延迟。12B 参数但配备 26B “大脑”,性能接近 Google 26B 级别,擅长多步推理与智能体工作流。
6月10日,智元推出灵犀X2 EDU“人人造”版本机器人,面向科研教育、工程实训、机器人赛事开发。整机高130cm、重35kg,全身29个自由度(单臂7自由度),末端负载3kg,行走速度1.8m/s,搭载RK3588算力模组。支持选配夹爪、仿真假手、假拳等多类型末端执行器,适配抓取、人机交互、运动实验等任务。开放关节控制与运动控制接口,允许底层算法二次开发,并支持传感器及开发板自由加装。
荣耀PC端YOYO Claw优化应用启动与工具调用,新增对话置顶、Bot市场筛选、文件拖拽区域扩大,上线美加墨世界杯龙虾(支持赛事数据与预测),Windows版上架荣耀官网。平板端推出PC桌面(14x8网格布局,支持文件操作)、YOYO伴学助手、极客中心2.0、全局充电分离、游戏管家AI变声、灵动胶囊(切歌动画、淘宝闪买)、AI圈搜智慧套索及苹果AirPods原生互联。升级覆盖荣耀WIN游戏本H9/H7、MagicBook系列、MagicPad3 Pro、荣耀平板GT系列等机型。
苹果密码App现在能自动扫描所有账号的弱密码、重复密码和已泄露密码,并自动登录对应网站,找到修改密码页面,生成强密码完成替换,最后存入钥匙串。全程只需用户点一次确认,无需手动操作。@MKBHD 演示了银行、税务、医院等账号逐一处理。此前改一个密码至少花5分钟,现在一键完成。
The new Apple Passwords app