Midjourney V8.1 的 Draft mode 草稿模式每次生成24张低分辨率低质量图片。用户可对任意图片点击 "Vary",将其渲染为全质量、全分辨率版本。草稿任务消耗的快速小时数减半。
同一事件,精选展示《Midjourney V8.1 已成为默认模型》Midjourney V8.1 的 Draft mode 草稿模式每次生成24张低分辨率低质量图片。用户可对任意图片点击 "Vary",将其渲染为全质量、全分辨率版本。草稿任务消耗的快速小时数减半。
同一事件,精选展示《Midjourney V8.1 已成为默认模型》Midjourney 将在明天(美国太平洋时间下午6点)通过 Discord 和 X 平台直播,首次公开其秘密硬件项目。该项目被描述为“雄心勃勃、物理尺寸巨大且出人意料”。具体细节尚未公布。
Google DeepMind 与英国政府合作,基于 Gemini 构建 AI 规划原型,旨在将家庭规划申请处理时间减半。该工具可整合数据、识别本地政策、总结公众反馈并起草评估报告,但规划官员保留最终决策权。原型已在 Barnet、Camden 和 Dorset 试点,计划 2027 年向全英议会开放。此前推出的 Extract 工具(同样基于 Gemini)已向英格兰所有议会开放,能将非结构化 PDF 转为可用数据,预计为每个议会每年节省约 255 小时人工。家庭规划申请占每年规划申请的近 70%,AI 工具旨在让官员聚焦更复杂的公共利益申请。
本次次要版本修复了多项问题:流式连接中断后保留部分响应并修复 spinner 卡死;修复 WSL2(Windows Terminal / VS Code)中鼠标滚轮失效(v2.1.172 引入的回归);修复 Linux 上 sandbox denyRead/allowRead glob 覆盖大目录树导致 Bash 工具描述膨胀、会话不可用;修复反馈调查在单次回复后立即捕获评分;修复欢迎界面每会话最多显示一个促销横幅;修复查看子 agent 时 Ctrl+O 不显示其对话记录;修复点击输入框无法从子 agent/底栏面板恢复焦点;修复远程会话后台任务轮次间显示“正在运行”但实际卡住;改进了远程会话中插件加载性能。
微软正考虑采用自托管微调版 DeepSeek V4 作为 Copilot Cowork 的更廉价模型选项,同时将 Cowork 改为按使用量计费。Cowork 基于 Anthropic 的 Claude 技术。Copilot EVP Charles Lamanna 表示固定费率因高频用户推高成本而不可持续。微软已在 GitHub Copilot 上实施类似调整。DeepSeek 将作为可选模型,完全托管于 Azure 并配备偏见防护,客户数据不出微软云。最终决定预计数周内做出。CEO Satya Nadella 此前发文支持企业可挑选并微调的多模型生态。
Google 近日发布 Android 17 正式版及 Wear OS 7,率先登陆 Pixel 设备。Pixel Drop 新增 AI 模型支持:音乐生成模型 Lyria 3、多模态 Gemini Omni 及基于 AudioLM 的语音翻译工具(Pixel 10a)。Quick Share 文件分享兼容 Apple AirDrop。Android 17 引入“气泡栏”多任务界面、自拍屏幕录制、折叠游戏模式(50/50 布局与动态手柄)以及“标记为丢失”等安全与家长控制功能。Pixel Watch 新增车祸/跌落/无脉搏自动紧急呼叫。Wear OS 电池续航提升最高 10%,并将在夏季推出更多 Gemini 智能功能。
Google Research 发布 Vectorized Farmscapes 2020 向量化数据集,将英格兰超 130,000 km² 高分辨率栅格地图转化为树篱、石墙、小树林等精细生态特征量化清单。该数据集基于 RSF 的 Vision-Transformer Backbone(在超 3 亿张卫星图像上预训练)微调,融合亚米级影像与 1 米 LiDAR 数据实现双层标注。为突破 247 km² 标注数据限制,采用 Polsby–Popper 紧凑性评分对几何形状功能分类,区分林地、连接廊道与孤立树丛。旨在不侵占农业用地提升碳汇与生物多样性。
xAI 于 6 月 16 日发布 Grok for PowerPoint,作为免费 Microsoft 365 插件上线。用户无需离开应用即可利用 Grok 将大纲转为完整幻灯片,进行内容研究、撰写、排版,并支持添加单张幻灯片、调整样式主题、重构章节。插件还能调用 Grok 连接器,从邮件或 SharePoint 中获取信息。该插件同样适用于 Word 和 Excel。
同一事件,精选展示《xAI 发布 Grok for Word 插件》谷歌今日推出 TPU Developer Hub,面向模型构建者与开发者提供端到端教育资源。内容覆盖预训练、后训练及推理工作负载,涵盖硬件架构、软件栈(XLA、PyTorch 零成本迁移)、追踪调试(XProf 工具)、并行优化(Pallas 内核、KV cache 卸载)及网络安全实践。资源形式包括交互式 Colab、开源代码配方与深度技术文档,支持 AI 智能体辅助集成,帮助用户充分发挥 Cloud TPU 性能。
小米推出云端轻量化 Claw 类产品 MiMo Claw 正式版,搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 旗舰模型。该模型原生兼容 MCP 工具调用协议,内置百万级超长上下文,支持单会话千次以上连续工具调用;依托 MTP 三层解码架构,在 OpenClaw 标准 Agent 工作流中吞吐效率提升约 3 倍。ClawEval 测试中任务达标率(Pass³)达 63.8%,Token 消耗较同类产品降低 40%-60%。联动金山办公生态,提供 Word、Excel、PPT、PDF 等格式的 AI 生成、预览与在线编辑一站式服务。免费用户每日单次体验时长从1小时升级至4小时,面向高频用户推出 TokenPlan 分层订阅(Lite/Standard/Pro/Max),支持灵活叠加,限时定价14.9元/月、19.9元/月、233.8元/年。
关联讨论 1 条X:小米 MiMo (@XiaomiMiMo)6 月 16 日,华为 nova 15 系列手机开启鸿蒙 HarmonyOS 6.1.0.125 SP10 版本升级,系统包约 2.85GB。本次更新后,图库 AI 沾色支持为逆光人物图一键生成剪影效果,在复刻色调的同时增强人物光影对比。此外优化了部分应用和第三方相机拍照体验,提升部分游戏流畅性,并合入 2026 年 6 月安全补丁。华为采取分批推送,未收到更新的用户需等待。
6月16日,腾讯公关总监张军宣布,全国首个省级政务智能中枢平台「湾擎」上线试运行,同时预发布湾擎·WorkBuddy。该智能体基于腾讯自研AI办公智能体WorkBuddy打造,专为政务场景定制,覆盖公文辅助、材料校核、政策检索、业务咨询、流程协同、任务辅助六大高频场景。WorkBuddy即将在广东省直多个单位试点,后续面向全省铺开。「湾擎」中枢已归集100余个政务场景,适配十数款主流大模型,搭配Token级安全防护。
小米云端轻量化 Claw 产品正式版发布,搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 模型,原生兼容 MCP 协议,无需额外提示词。支持百万级上下文、单会话千次以上工具调用,MTP 三层解码架构使推理吞吐效率提升约 3 倍。联动金山办公,支持 Word/Excel/PPT/PDF,实现 AI 生成、预览与在线编辑闭环。ClawEval 中 Pass³ 达 63.8%,Token 消耗降低 40%-60%。免费用户每日体验时长升级至 4 小时,上线 TokenPlan 分层订阅,限时特惠 ¥14.9/月。
关联讨论 1 条X:小米 MiMo (@XiaomiMiMo)腾讯网盘官网近日上线,页面显示“COMING SOON”。该产品连接多个AI应用,共享存储并聚合上下文,将AI应用数据沉淀为长期记忆资产。核心能力包括:多应用数据互通(打通腾讯文档、WorkBuddy等)、OneID统一身份、跨应用全局搜索、高效共享协作、支持Agent通过CLI/MCP调用网盘数据,以及个人版、SaaS版、VPC版、私有化版等多版本灵活交付。
Nous Research 为开源个人代理 Hermes Agent 新增异步子代理功能。原先的 delegate_task 工具同步阻塞主聊天,现通过 async_delegation 工具集(issue #5586)实现非阻塞:delegate_task_async 立即返回 task_id,主聊天可继续操作。异步工具涵盖 spawn、check、steer、collect、cancel 和 list 全生命周期。子代理完全隔离,仅向父代理返回最终摘要,继承父代理的 API 密钥和配置。现有用户运行 hermes update 即可启用。该更新由 Nous Research 及联合创始人 Teknium 于 6 月 15 日宣布。
Atoms由MetaGPT团队(68.7k GitHub星标、11篇顶会论文)打造,将八位AI智能体组织为产品团队:Iris验证需求、Emma制定规格、Bob设计架构、Alex构建全栈应用、Sarah生成SEO页面、Adrian投放Google Ads、David分析数据、Mike协调流程并在关键节点请求审批。平台内置Atoms Cloud,提供身份认证、实时数据库、Stripe支付、可扩展托管及一键部署;Race Mode可同时调用多个前沿模型并让用户选择最佳输出,据称准确率提升至3倍。内置SEO和广告智能体自动优化搜索排名与投放。用户可随时导出代码或同步GitHub,避免锁定。免费版每日15信用,Pro版$20/月起(100信用),Max版$100/月起(500信用,含Race Mode)。相比Lovable、Base44,Atoms将市场研究、SEO与广告管理纳入构建流程。
Google Cloud 发布 Open Knowledge Format (OKF) v0.1,一种供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文知识。OKF 将知识表示为带 YAML 前置元数据的 markdown 文件目录,每个概念对应一个文件,通过 type、title、description 等少量保留字段实现互操作。无需专有服务、SDK 或运行时,目录可托管在 GitHub、以 tarball 传输或挂载到任意文件系统。OKF 旨在解决组织内部知识碎片化问题——表结构、指标定义、runbook 等散落在不同 catalog 和 wiki 中,各厂商方案互不兼容。遵循最少意见原则,只强制 type 字段,生产者和消费者可独立实现。使用场景包括数据团队将 BigQuery 表定义导出为代码、为智能体存储 incident runbook、跨组织知识交换等。
AI 模型 API 聚合平台 OpenRouter 于 6 月 14 日推出 Fusion API,将用户请求并行发送至多个模型,经审查模型分析后由调用模型生成统一回答。官方测试显示,Claude Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro 组合得分 68.3%,超过单独 Claude Fable 5 的 65.3%;双 Claude Opus 4.8 组合得 65.5% 同样高于 Fable 5。低成本组合 Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro 得分 64.7%,以约 Claude Fable 5 一半的成本将分数差距控制在 1% 以内。
荣耀 X80 Pro Max 将于 6 月 22 日发布,提供元气橙、闪电红、月影白、玄甲黑四款配色。新机支持 AI 随心握功能,可自适应手指高度、识别左右手握持,实现单手接电话。规格包括 6.8 英寸 2788×1280p 120Hz OLED 直屏,全屏激发 2000nit,局部峰值 10000nit,3840Hz PWM 调光;骁龙 6 Gen5 处理器;11000mAh 单芯电池 +90W 快充;前置 8Mp,后置 50Mp OIS 单摄;塑料中框、光学指纹;IP66/IP68/IP69/IP69K 防护;厚 8.08mm,重 203g。
阿里云桌面AI智能体QoderWork今日上线“意识”功能,集成记忆、反思、技能进化三个模块。记忆采用分层结构,短期可晋升长期;反思借鉴人脑选择性遗忘,反思前快照备份,越界自动回滚。触发基于多因子加权评分模型,从意图深度、对话长度等维度判断。进化通过Fork Session分叉轻量子会话,缓存命中率99%以上,成本控制5%以内。系统检测反复任务自动生成技能建议,用户可选采纳、忽略或驳回。所有记忆以Markdown文本存本地,可编辑删除。
华硕为 Ascent GX10 迷你超级计算机新增 128GB LPDDR5X 统一内存 + 4TB SSD 版本,定价 36999 元。该产品基于英伟达 GB10 超级芯片,融合 Arm 架构 20 核心 Grace CPU 与 Blackwell GPU(6144 CUDA 核心、第五代 Tensor Core,支持 FP4),AI 算力 1000 TOPS,可运行超 2000 亿参数大模型。主机尺寸 150×150×51 mm,内置超宽鳍片、五根热管和双 140×80mm 风扇散热系统,并支持通过 ConnectX-7 NIC 实现双终端互联。
6月16日,阿里巴巴发布千问具身智能大模型Qwen-Robot系列,包括VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld。Qwen-RobotNav统一指令跟随、点/目标导航、目标追踪和自动驾驶四类任务;Qwen-RobotManip基于超38100小时开源语料库实现多机型训练;Qwen-RobotWorld通过自然语言动作接口跨场景预测物理规律。三个模型可单独或协同部署。此外,5月20日发布的Qwen3.7-Max在Arena全球大模型盲测总榜中位列国产模型第一。
Anthropic 自 7 月 8 日起调整隐私策略,要求 Claude Free、Claude Pro、Claude Max 用户完成年龄或身份验证,验证方式包括提供官方证件或扫描面部信息。Teams、Enterprise 及 Claude Developer Platform 等商业服务暂不涉及。Anthropic 重申不出售用户数据、Claude 无广告,用户可控制是否将对话用于改进模型。
Tensordyne 于当地时间6月15日发布 AI 推理系统 Napier (TDN),宣称按 token 计能效达 NVIDIA Blackwell 系统的 17 倍、吞吐量达 13 倍。Napier 处理器采用对数数学设计,以台积电 3nm 制程生产,集成大量 SRAM 缓存和 HBM 内存,处理器间通信延迟<1μs。Tensordyne 构建了集成 72 颗 Napier 芯片的 TDN72“推理舱”,一个机柜可容纳 4 个舱共 288 颗芯片。机架级 TDN 系统可支持以 1000 Token/s/user 速率进行 T 级 LLM 推理,每年额外创造 3300 万美元收入。
微软为Windows 11推出实验性命令行工具Intelligent Terminal,基于Windows Terminal分支,在专用窗格中集成AI智能体。智能体可查看shell上下文、实时捕获错误、解释失败原因、生成命令或处理多步任务。用户需手动从微软商店下载,可用winget install Microsoft.IntelligentTerminal安装。支持ACP协议,默认识别GitHub Copilot。提供智能体聊天(Ctrl+Shift+.)和智能体管理(Ctrl+Shift+/)两种交互,可开启自动错误检测与跨终端会话管理。
支付宝今日开启 AI 版邀测,用户可右滑进入新版界面,在对话框或语音中输入指令,由“阿宝”助手代办事项。以查询公积金为例,阿宝自动匹配对应小程序和服务入口,用户点击确认即可完成,将多步跳转折叠为一句指令。所有涉及资金变动和支付的环节均需用户本人确认。首批放出 100 个邀请码。
微软更新官方支持文档,承认 Windows 11 设备上的专用 Copilot 按键会打断部分生产力与无障碍工作流,尤其影响依赖右 Ctrl 键、菜单键或屏幕阅读器的用户。微软计划在后续 Win11 版本中允许用户在设置中将其重映射为右键菜单键或右 Ctrl 键。该按键于 2024 年随 AI+ PC 浪潮引入,但随 Copilot 战略调整,目前已弱化为调用 Microsoft Edge 的网页包装器。
教育部“阳光志愿”信息服务系统今日全新升级上线,依托招生、学籍、就业等海量官方数据,免费为考生和家长提供志愿填报服务。系统支持31个省区市本专科普通批次志愿筛选,输入高考成绩、位次及个性化条件即可快速生成合理参考方案。AI助手“智慧小招”24小时在线解答政策规则。平台数据由高校直接报送、官方核验,真实可靠。同时推出专业倾向测评和21项生涯测评工具,帮助学生认清特长、规划未来。
Adobe 于 6 月 15 日升级 Creative Cloud 套件。Lightroom 新增辅助筛选(按“睁眼”“眼部清晰度”过滤)、照片转视频功能,以及基于 Topaz Labs 模型的 AI 锐化,已支持索尼 Alpha 7R VI 的 RAW 格式。Premiere 引入全局音频静音、标记搜索、Single Word 编辑、3D Spinback 和 Slide 转场及纹理效果。After Effects 新增 AI 对象蒙版,支持 SVG 导入为形状图层,优化与 Illustrator 的复制粘贴。Photoshop 加入设备端 AI 移除工具和反光去除工具。
datasette-agent 0.3a0 发布,新增 execute_write_sql 工具,可在用户批准后写入数据库并考虑权限。新版增强了 datasette agent chat 终端模式,支持用户审批流程,新增 --root(以 root 运行)、--yes(自动批准所有询问)和 --unsafe(同时启用两者)选项。工具现在可为 CLI 提供纯文本替代 HTML 显示。使用命令 datasette agent chat content.db -m gpt-5.5 --unsafe 可直接对话并修改数据库。
东京 AI 公司 Sakana AI 发布首个商业产品 Sakana Marlin,定位为虚拟首席战略官(Virtual CSO)的 B2B 自主研究智能体。输入主题后,Marlin 自主运行最多约8小时,输出数十至100页详细报告(含正文、参考文献和附录)及 AI 生成的幻灯片。核心算法是自适应分支蒙特卡洛树搜索(AB-MCTS),可动态选择“扩宽”或“加深”。产品经2026年4月封闭测试(约300名专业人士)优化,已与三菱 UFJ 金融集团合作,获花旗集团战略投资。定价按次付费(每次100积分,每积分98日元)及 Pro(月费15万日元,含2000积分)、Team(月费40万日元,含6000积分)套餐,AB-MCTS 已以 Apache 2.0 许可证开源。
本次更新新增 Tool(param:value) 语法用于权限规则匹配工具输入参数;嵌套 skills 目录中的技能自动加载,名称冲突时以 <dir>:<name> 形式保留;嵌套 agent、workflow、output-style 冲突时取最近目录。改进自动模式下子 agent 生成前的分类器评估;/doctor 采用扁平树布局;工作流提示词高亮为紫色闪烁,仅触发显式短语;/bug 提交前需填写描述。修复了 CLI 继承过期 WebSocket/OAuth 文件描述符导致的崩溃、Chrome 中 OAuth token 账号不匹配导致连接失败、子 agent 转录显示工具结果、后台恢复不从头重启、compaction 未使用 --fallback-model 等问题。
Meta 今日起在 Facebook 推送新的 AI Mode 搜索功能,与“用户”“Marketplace”等常规模式并列。搜索结果并非“仅链接”,而是基于 Meta 旗下各平台公开帖子生成 AI 回复,用户还可追问。同步上线的还有照片预设(可将运动衫换到粉丝身上)和拼贴模板建议等 AI 功能。
Meta 宣布在 Facebook 推出“AI Mode”搜索功能,利用 Meta AI 从公开帖子(含群组和 Reels)提取信息并合成答案,用户可用自然语言提问获得摘要。同时新增视频拼贴剪辑、过渡效果及 AI 照片预设(可更换服装、发型和配饰),体育迷可在 Stories 中点击“AI Edit”虚拟穿上队服。这些更新延续了此前动态头像、Marketplace 自动回复和创作者 AI 助手的部署节奏。此外,Meta 近期启动了 Facebook、Instagram 和 WhatsApp 的全球订阅计划(每月 3.99 美元起),更多 AI 订阅层级正在规划中。
xAI 为 Grok Build 推出 Agent Dashboard,提供单一屏幕管理多个编码会话。仪表板按状态分组(等待输入、工作中、空闲),每行显示状态标记、名称、分支、权限模式和当前操作。选中会话可打开 peek 面板查看最新输出并直接回复,等待输入的会话支持用箭头键或数字键选择选项。底部输入框用于分派新会话,支持设置模型、启动计划模式或自动批准编辑。通过 grok dashboard、/dashboard 或 Ctrl+\ 打开,关闭后会话继续运行,重新打开即可恢复。
Kimi K2.7 Code 模型高速版上线,面向 Kimi Code Beta 计划成员、Kimi API 开发者及 Kimi Business 用户开放。高速版与普通版为相同模型,输出速度约普通版的 5‑6 倍,常规编程场景约 180 Tokens/s,短上下文可达 260 Tokens/s。价格为普通版两倍:1M tokens 标准输入 13 元、输出 54 元,命中缓存输入 2.6 元。该模型基于 6 月 12 日发布的 K2.7 Code,相比 K2.6 提升长上下文指令遵循与长程编程性能,平均 token 消耗减少 30%。
关联讨论 3 条X:硅基流动 SiliconFlow (@SiliconFlowAI)X:Kimi.ai (@Kimi_Moonshot)Hacker News 热门(buzzing.cc 中文翻译)Openrouter 推出 Fusion API,可通过 openrouter.ai 使用,在 Hacker News 上获得 103 个用户点赞。
百度搭子DuMate完成Harness引擎系统性升级,复杂任务积分消耗最高降低75%。以行业深度调研报告为例,积分从约400降至约100;电商运营周报从近300降至约78。降本不降质源于三项优化:自研安全沙箱资源消耗降低、模型推理效率提升(非替换低成本模型)、Harness执行链路工程升级(提升任务规划精度与工具调用效率)。
华为在苹果确认 Siri AI 不在中国推出后发布 HarmonyOS 7,集成 HarmonyOS 智能体框架 2.0,以“意图即服务”模型将多应用操作压缩为单条自然语言指令。小艺升级为系统级智能体,可控制超 2100 项系统能力并协调 2000 多个第三方 AI 智能体。底层搭载 openPangu 2.0 基础模型,Pro 版 505B 参数,Flash 版 92B 参数,均支持 512K 上下文窗口;30B 参数端侧模型计划秋季登陆 Kirin 芯片。系统性能较 HarmonyOS 6.1 提升超 15%,任务执行准确率宣称超 90%(未经独立验证)。2026 年 Q1 HarmonyOS 占中国智能手机 OS 市场 19%,首超 Apple 的 iOS(16%)。目前为开发者 beta 版,稳定版秋季发布。