xAI 将 Grok 引入 Microsoft Word,推出免费 365 插件。用户可将笔记转为结构化文档、重写文本以提升清晰度与简洁性,也能通过插件搜索网页、X 平台或生成图表。插件支持连接 SharePoint 和 Google Drive 等外部来源,还可用于 PowerPoint 和 Excel。
关联讨论 3 条X:cb_doge (@cb_doge)IT之家(RSS)xAI:News(网页)xAI 将 Grok 引入 Microsoft Word,推出免费 365 插件。用户可将笔记转为结构化文档、重写文本以提升清晰度与简洁性,也能通过插件搜索网页、X 平台或生成图表。插件支持连接 SharePoint 和 Google Drive 等外部来源,还可用于 PowerPoint 和 Excel。
关联讨论 3 条X:cb_doge (@cb_doge)IT之家(RSS)xAI:News(网页)Claude Code 现已支持 Artifacts,可将编程会话结果转为交互式网页并分享给团队。网页包含完整会话上下文(代码、工具、聊天记录),自动更新并保留版本历史。用户只需在会话中提出请求即获得链接,用于 PR 审查、事故时间线等场景。Artifacts 默认私有,仅组织内认证成员可见,管理员通过角色和保留策略控制访问。该功能以 beta 版向 Claude Team 和 Enterprise 客户提供,支持 CLI 和桌面应用。
OpenAI 为 ChatGPT Enterprise 推出信用额度用量分析与更新的支出控制功能。全局管理控制台(Global Admin Console)统一展示 ChatGPT 和 Codex 的信用消耗,支持按时间、用户、产品、模型追踪用量趋势。管理员可为整个工作区设置默认限额,按群组配置额度,并为个人设置叠加限制。员工可查看个人用量并申请增加额度(附工作上下文)。这些功能即日起可用。
从今日起,Claude Code 可将工作进度生成为 artifacts——实时、可分享的交互式网页,涵盖 PR 走查、系统说明、仪表盘、发布清单等。artifacts 基于会话完整上下文(代码库、连接器、对话)自动构建,更新时页面原地刷新,同事即时可见。默认仅作者可见,可分享给组织内成员,由管理员通过组织层级开关和角色权限管控。内部测试中最常见用例为调试:工程师调查事件,Claude Code 分析日志并发布包含时间线、嫌疑提交和错误率图表的 artifact,团队无需再“走过场式汇报”。
每周超2.3亿用户通过ChatGPT获取健康信息。GPT-5.5 Instant在健康评估中表现显著提升,最具挑战性评测上达到前沿Thinking模型水平,已面向所有免费用户开放。基于医生编写的HealthBench和HealthBench Professional评估,其回复在准确性、安全性和沟通质量上优于医生手写回复及早期模型,故障模式发生率更低。近两个月生产流量显示,健康类回复事实性问题率下降71%。
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)The Decoder:AI News(RSS)X:Greg Brockman (@gdb)Claude Enterprise 推出企业托管授权功能,管理员可通过身份提供商(率先支持 Okta)为整个组织配置 MCP 连接器。用户首次登录 Claude 时自动获得授权,无需手动操作,实现零接触设置。该功能基于 Model Context Protocol 的 Enterprise-Managed Authorization 扩展构建,支持 Asana、Atlassian、Canva、Figma、Granola、Linear、Supabase 等 MCP 提供商,Slack 即将支持。授权管理集成到现有 IdP 工作流中,可按组限定范围、通过 IdP 快速撤销授权,并支持要求连接器仅通过 IdP 连接以隔离工作与个人使用。
《粉雄救兵》生活教练 Karamo Brown 推出健康应用 Kē,其核心特色为基于 AI 初创公司 Delphi 技术打造的“AI Karamo”数字克隆。该克隆通过学习 Brown 的采访、播客等内容,可与用户实时对话并提供建议。应用还提供个性化健身计划、基于家中食材的营养指导、冥想视频及社区支持功能。Kē 已上线 iOS 和 Android,订阅费 $14.99/月,提供 3 天免费试用。
6月18日,Adobe为Firefly推出更新,引入Creative Skills,用户通过自然语言对话即可生成Logo、配色方案、营销视频等,Firefly会主动反问以完善需求,并提供控制面板微调字体、镜头运动等细节。同时,Photoshop、Premiere Pro等软件加入智能体,侧边栏输入指令可整理素材、重命名文件、更新设计稿。
Adobe 将其“创意智能体”扩展至 Photoshop、Premiere 等应用,以公开测试形式提供 AI Assistant。该智能体可自动完成多步骤常规任务,如 Premiere 分拣素材和粗剪、Photoshop 换背景、Illustrator 批量生成文件、InDesign 更新版式等。Firefly 新增面向个人创作者的品牌套件、产品图转短视频及 Quick Cut 自动剪辑功能。Adobe 工具已集成至 ChatGPT、Claude 及 Microsoft 365 Copilot,Google Gemini 和 Slack 集成即将推出。
Midjourney 与 Butterfly Network 合作推出全身超声波扫描仪。用户步入一池金色浅水,身体穿过水下传感器环,约 60 秒内生成无辐射 3D 身体图像。初期提供无需 FDA 批准的身体成分图,计划 2027 年底在旧金山开设首家水疗中心;2031 年前部署超过 5 万台扫描仪,每月完成 10 亿次扫描。第三代扫描仪预计 2028 年推出,采用完全定制硅片,成像质量和扫描时间将有“昼夜之别”。CEO David Holz 称,足够早期成像可避免“30% 的死亡和 50% 的医疗成本”。
Adobe 今日在 private beta 中上线了重新设计的 Firefly AI 工作室,新增“Elements”(可保存已创建的角色、地点和对象并命名复用)和“Projects”(将资产、生成内容与创作上下文集中管理)两项功能。Firefly AI 助手新增品牌套件生成(根据公司名和风格生成 Logo 与色板)、Quick Cut(快速剪辑视频成初稿)、故事板生成以及图片转短视频能力,旨在减少繁琐任务同时保留人工控制权。
Adobe在其最受欢迎的Creative Cloud应用中推出AI助手,即日起公开测试。每个应用拥有专精的AI助手:Premiere助手可排序素材、批量重命名剪辑、识别语音关键词并添加时间线标记;Photoshop助手可描述预期效果、整理图层、切换背景、调整资源尺寸;Illustrator助手支持多步生产任务,如检查颜色模式错误、缺失字体、重组图层;InDesign助手可进行打印就绪检查和样式批量更新;Frame.io助手能整理拍摄资产、生成B-roll素材并提供创意方向帮助。
Pixi 在 App Store 上线 iMessage 应用,用户可发送 AI 驱动的 AR 角色。角色通过收信人 iPhone 相机实时与真实环境互动,能感知面部表情和周围物体,所有视觉和音频处理在设备端进行以保护隐私。首批角色包括机器人、猫和动画信封,支持井字棋等游戏。未来计划开放市场供品牌和创作者提供专属角色,并允许用户自创。应用免费,品牌可选择性收费。仅支持 iPhone 11 及以上机型,未来将扩展至 Android 和 WhatsApp 等平台。
谷歌正在测试新版 reCAPTCHA,要求用户拍摄一段对摄像头挥手的视频。系统分析手部运动,提取手指关节、手掌位置等 21 个关键点坐标以判断动作真实性。视频不会与身份绑定、不录制音频,验证完成后自动删除。新系统意在抵御机器人批量注册和凭证填充攻击,但被批评推动生物特征认证。
DeepSeek 识图模式于 6 月 18 日在 App 和网页端上线。IT之家测试发现,该模式无法正确识别创始人梁文锋的照片,多次将其识别为董宇辉、张雪峰或雷军;而雷军照片可正常上传并准确识别。原因可能是梁文锋网络公开照片和信息较少,模型难以形成稳定识别特征,说明 DeepSeek 未针对自家老板做特殊识别优化。
Canonical 公布 Project Myna,为 Ubuntu 桌面打造的本地语音转文字工具,首个版本随 Ubuntu 26.10 发布。Myna 仅提供听写功能:用户按下键盘快捷键后说话,转录文字直接插入当前应用,屏幕显示视觉反馈。所有识别在本地运行,下载模型后无需联网;麦克风仅在激活时被访问,音频数据在内存中处理后丢弃。首版以 Wayland 上的 GNOME 为主要验证环境,架构采用模块化设计,源码和文档已以 GPLv3 协议托管于 GitHub。后续计划加强桌面集成并优化听写体验。
小米开源全屋智能 AI 方案 Xiaomi Miloco 2.0,基于自研 MiMo 大模型,以 Agent 形式接入 OpenClaw。具备六大核心特性:通用常识(自动识别危险并预警)、身份识别(人脸+体态)、家庭记忆(沉淀习惯供主动决策)、家庭任务(条件自动化、定时提醒等)、主动智能、家庭面板。前置条件:内存≥4GB、存储≥256GB、7×24运行(推荐 Mac mini),macOS/Linux,需小米账号及米家设备,以及多模态大模型 API Key(感知用 MiMo-v2.5,Agent 用 MiMo-v2.5-pro)。
6 月 17 日,Midjourney 宣布成立医疗部门 Midjourney Medical,并推出首款硬件——全身超声波扫描仪 Scanner(FBUCT 类)。该设备利用声波和水,约 60 秒完成全身扫描,生成亚毫米级 3D 图像,速度接近传统 MRI 的百倍,无电离辐射或强磁场。项目由 Butterfly Network 协助,Midjourney 支付 1500 万美元预付款及每年 1000 万美元许可费。硬件负责人为前苹果 Vision Pro 工程师 Ahmad Abbas。未来 12 个月优化算法与扫描仪,明年在旧金山开设首家体验中心,2028 年推出第三代定制芯片机器,2031 年目标全球部署 5 万台。
千问上线了国内首个全周期高考志愿填报Agent,免费为全国考生提供志愿填报和咨询服务。该Agent帮助用户梳理分数排名、专业详情与选择方向,已有多位家长通过它解决了信息盲区与填报难题。千问同时发起故事征集,邀请考生、家长、老师分享使用经历。
应用材料于6月17日推出面向AI智能眼镜的全集成视觉系统SENZ,集成光波导、光引擎、传感器、视觉矫正、电子调光技术,旨在解决供应链破碎问题,降低设备制造复杂性,让市场参与者无需在性能与尺寸间取舍,专注用户体验优化。关键合作伙伴包括格罗方德(光波导量产)、高通(Snapdragon START白牌计划)、依视路陆逊梯卡(光学系统与商业化战略合作)。
微软昨日发布 VS Code 1.125 版本,主要改进 Marketplace 安装额外语言模型的体验。用户可通过语言编辑器打开扩展 Marketplace 页面,筛选并安装提供模型服务的扩展,安装后响应模型自动出现在模型选择器中。内置浏览器支持直接在地址栏输入搜索关键词,远程工作区浏览器可连接 HTTP/HTTPS 代理流量,为使用 SSH、容器或远程服务器的开发者带来更顺滑体验。1.125 版本已正式推送,可在官网下载。
月之暗面旗下 Kimi Work(Beta 版)新增「目标模式」,支持设定终点后由 Agent 自主循环推进任务,最长连续运行24小时,过程中人类可随时中断调整。同时上线「插件中心」,可选装百度网盘、Canva可画、钉钉、飞书、WPS、Notion、Cloudflare 等外部应用。6月限时福利期间,Kimi 电脑客户端 Work 模式所有任务会员额度消耗减半,即从0.02%降至0.01%。
同一事件,精选展示《Kimi Work Beta版发布:面向知识工作者的本地Agent》Anthropic 宣布 Claude Design 上线首周用户突破 100 万。新版重构设计系统导入功能,支持从 GitHub 仓库、设计文件或直接上传素材获取设计系统,自动检测输出是否符合现有组件标准。用户可通过 /design-sync 拉取设计系统,完成设计后直接传递给 Claude Code 转化为软件;Claude Code 端也可用 /design 命令创建、编辑、同步项目。编辑器新增布局控件,支持拖拽、调整大小和对齐,修复数百项稳定性问题。Claude Design 与 Chat、Claude Cowork、Claude Code 共享使用配额,平均每次交互消耗更少 token,错误率下降。导出支持 PDF、PowerPoint,或发送至 Adobe、Base44、Canva、Gamma 等应用。
DeepSeek 识图模式于6月18日在网页和 App 端正式上线,与快速模式、专家模式并列。开启后用户可直接上传图片让 DeepSeek 识别图像,能力超越简单文字提取。目前 App 端仍显示“图片理解功能内测中”,网页端无此提示。该模式背后的多模态模型技术细节于今年4月公开,核心框架为“Thinking with Visual Primitives(以视觉原语思考)”。
讯飞AI眼镜6月18日在京东首销,定价4299元(部分国补后3369元),重40克,获SGS舒适认证。核心搭载语音同传大模型,支持122种语言翻译,覆盖通话翻译、线上同传、同声传译(8米全向拾音)、面对面翻译(18语种离线)、视觉翻译及附赠App权益等六大场景。还支持实时提词、蓝牙遥控翻页,内置GlassClaw AI助理,可开会自动总结图文纪要。
英伟达在虚幻嘉年华 2026 宣布 NVIDIA ACE Game Agent SDK 进入 Beta 测试。该轻量级 C/C++ 框架内置 Qwen 3.5 4B 模型用于决策、Chatterbox Turbo 350M 用于语音合成,包含 UE5 插件,可在 8GB 显存 GPU 上本地运行。SDK 提供 Agent API、Chat API 和 RAG API。已有 KRAFTON 在《绝地求生》推出限时 AI 队友 Ally,Creative Assembly 在《全面战争:法老》加入 AI 顾问。同期英伟达还发布 DLSS 4.5 UE5 插件(支持动态多帧生成、6X 模式、第二代 Transformer 超分)及开源项目 NVIDIA Kimodo 与 Animotive Kimodo 插件。
MOSS-TTS-Local-Transformer-v1.5 是一款开源 TTS 模型,支持 48 kHz 立体声、零样本声音克隆、最长 10 分钟长文本合成、时长控制及 31 种语言。其核心采用 Qwen3-4B 骨干与约 2B 参数的 MOSS-Audio-Tokenizer-v2 音频编解码器,通过 12 个 RVQ 码本运行。SGLang-Omni 以三阶段流水线部署该模型。在 Seed-TTS-Eval 上词错误率 5.10%、语音相似度 69.23%,CV3-Eval 上 WER 7.48%、SIM 61.59%,MiniMax Multilingual 上 WER 6.37%、SIM 75.31%,X Voice 上 WER 20.48%、SIM 63.00%。
Anthropic 正升级 Claude 的语音模式,新增西班牙语、中文、日语、德语、葡萄牙语、俄语和乌克兰语等语言选项,打破仅支持英语的限制。语音交互引入两种模式:原有的免提模式支持连续对话,新增按下通话模式需按住按钮说话、松手发送语音消息。iOS 版 Claude 应用出现类似电话听筒的新图标,外界猜测可能为更接近通话的语音交互做准备。
蔚来6月18日官宣“Cedar S 雪松”智能系统1.5.0版本全量推送。ET9、全新ES8获超80项功能新增与优化,包括点到点全域领航辅助(城区新增潮汐车道识别、园区内部道路领航,高速可选仅导航/自动变道;城区领航换电无需预先学习)、NWM人机共驾、智能泊车偏左/居中/偏右选择、自动紧急避让AES识别锥桶等障碍物;新ES6等四款车型获超50项升级。座舱新增艺境桌面“日影时序”“银河漫步”主题、行业首发充换电资源语音自由搜、杜比动态视频增强等。NOMI新增AI帽子九连拍及马年联动悬架。
6月18日,蔚来世界模型全新版本正式推送,覆盖超70万用户,最早4年前购车用户也可升级。新版本升级为“世界模型+监督微调+闭环强化学习”三层框架,新增监督微调利用好行为数据提升拟人性与合规性。国内首次实现智能辅助驾驶直出方向盘和加减速踏板的操作信号,采用端到端运动学建模,路径更短、延迟更低。选路准确性宣称不分技术架构与输入形式均属行业领先,并首个实现对潮汐车道、可变车道天空路牌的实时识别与理解。误刹车与风险干预两个矛盾指标宣称同时做到行业领先,复杂场景长时序规划能力增强。
摩尔线程 MTT AICUBE“家庭 AI 中枢”已在京东开启预售,16GB RAM 版 9999 元,32GB 版 10999 元。内置自研 SoC“长江”,AI 算力 50 TOPS,配备 LPDDR5X 内存和 1TB SSD,双 M.2 插槽可作 NAS 使用,自带双扬声器。搭载 MTT AIOS 与小麦智能体,支持自然语言交互;可在安卓容器环境下运行《王者荣耀》《原神》等手游。
Midjourney 宣布进军医疗领域,开发基于水下超声波的新型扫描仪。用户站在平台上缓慢下降(每秒约2英寸),经过由50万个微型方块组成的环,每个方块同时作为扬声器和麦克风,每秒产生TB级数据。数千台计算机将声波变化重建为亚毫米级3D图像,单次扫描仅需60秒。同时计划开设Midjourney水疗中心,将扫描融入日常休闲体验。未来将优化算法与硬件,并建设首个研究型水疗中心。
Midjourney CEO David Holz 展示了首款硬件 The Midjourney Scanner,一款基于超声波的全身扫描仪。设备采用环形传感器阵列,通过水下传感器从多角度发送超声波,约 60 秒完成扫描,捕捉肌肉、脂肪、骨骼等垂直切片。与 Butterfly Network 合作,每台搭载 40 个成像模块及 2 petaflops 处理能力,Holz 称图像质量“在许多方面可比肩 MRI”。Midjourney Medical 计划 2027 年底前在旧金山 Union Square 开设 Midjourney Spa,内设 10 台扫描仪及健身房、桑拿、冷浴。目前仅提供“身体成分图”,不涉及 FDA 诊断许可,用户可创建扫描库并与医生或 AI 健康工具共享。
联想百应 AI 主机 300 今日上架,搭载 AMD 锐龙 AI Max+ 395 处理器,配备 128GB 内存、2TB SSD,支持 2.5GbE 有线网卡与 Wi-Fi 7 无线网卡,到手价 26999 元。该机型内置百应 Clow 智能体协同平台,Skill 广场提供超 2000 个技能,支持自主进化、多级记忆,适用于 AI 短剧制作、专利/销售/经营管理、金融分析、广告营销等场景。
据《读佳》今日报道,千问团队将推出名为“千问输入法”的独立App,其AI功能与键盘针对手机端操作优化,区别于PC端千问语音输入法。产品已开发完成,择日上线各大应用商店。继微信输入法、豆包输入法后,这将是国内第三家头部互联网大厂入局独立AI输入法赛道。千问语音输入法是今年5月上线的AI语音输入能力,集成于千问App内,支持口语去语气词、纠错、格式化整理,以及基于上下文的智能回复、创作、问答与翻译指令。
谷歌在 Canary 频道最新 Chrome 浏览器中引入实验性 Flag,启用后工具栏可嵌入 AI Mode 快捷方式。AI Mode 是谷歌搜索结果页的 AI 对话交互,支持自然语言提问、多轮对话及文件上传分析。用户启用“Contextual Tasks Pin Button In Toolbar”Flag 后,点击按钮将在当前页面右侧弹出侧边栏,可针对浏览内容提问并上传文件。谷歌正测试“Browse with AI”和“Google Search AI Mode”两个暂用名。
在 2026 年 WWDC 期间,苹果发布 Xcode 27,其核心组件首次整合 AI 智能体,能理解 Swift 语言并通过多轮自然语言对话辅助开发。AI 可跨多个文件修改整个代码库,也能根据提示与资源生成应用设计并独立构建完整应用,建成后仍可通过对话添加特效、动画等。Xcode 27 支持接入 Anthropic、OpenAI 和 Google 等第三方 AI 模型,同时引入 Core AI 框架提供现代 Swift API 调用端侧模型,并升级开源框架 MLX。
同一事件,精选展示《Apple 推出新智能能力、Xcode 生产力功能及平台改进以辅助应用开发》Epic 今日发布虚幻引擎 5.8,同时预热 UE6。UE6 的游戏逻辑开发模型将全面转向 Verse 语言,以降低门槛并支持大规模在线世界与多人协作。引擎将引入开放标准实现跨游戏内容互通,涵盖资源、代码和经济系统,并深度整合 Unreal Editor For Fortnite。UE6 还将集成大语言模型与生成式 AI 工具,整合 Claude、Gemini 等模型辅助开发。时间上,UE6 预计 2027 年底进入 Early Access,正式版在此后 12–18 个月内推出;UE5.8 为 UE5 最后一个重大更新,后续重点转向 UE6。
香橙派正式公布 Orange Pi 6 标准版开发板,价格未公布。该板尺寸 90×90mm,搭载 CIX P1(CD8180)12 核 Arm 处理器及 Arm Immortalis-G720 MC10 GPU,NPU 算力 28.8 TOPS,整体 AI 算力最高 45 TOPS。提供 8/16/24GB LPDDR5 RAM,双 2.5GbE 接口。存储支持两个 M.2 2280(PCIe 4.0 x4 NVMe)、microSD 及 M.2 E-Key 插槽。接口包含双 USB-C、双 USB-A 3.0、双 USB-A 2.0、DisplayPort 1.4、HDMI 2.0、eDP、3.5mm 音频、MIPI-CSI 及 40Pin GPIO。支持 Debian、Ubuntu、安卓、Windows OpenHarmony 系统。
SK海力士今日宣布,已向主要客户供应12层HBM4E样品。该产品是面向AI的下一代超高性能DRAM,较HBM4引脚速率最高达16Gbps,能效提高20%以上,热阻降低约17%。采用先进MR-MUF工艺,12层堆叠实现48GB容量,并降低数据传输延迟,旨在提升下一代AI数据中心和大规模计算系统的处理效率。