AIHOT
内容
精选全部 AI 动态AI 日报
接入
Agent 接入
更多
关于更新日志反馈
登录
精选全部日报更多
产品发布
AI HOT 聚合 AI 产品与应用发布:新工具、新功能、商业化落地,一站看全。
6月21日
10:03
IT之家(RSS)
41
马斯克:Grok 语音控制特斯拉 FSD 功能将在 3 个月左右推出

马斯克在 X 平台回复称,Grok 语音控制特斯拉 FSD(监督版)功能预计约三个月后上线,今年秋季推送全系车辆。此前 Grok 已作为车载助手上线,通过 2025 假日版本更新增加导航语音指令,2026 春季更新新增“嘿 Grok”唤醒与位置提醒。新功能将允许用户用自然语言设定 FSD 行驶逻辑,无需手动打转向灯;停车场景提升显著,可实时口述精准泊车指令,弥补 14.1 版本“抵达目的地自动泊车”模式有限。

产品更新具身智能语音
09:35
向阳乔木@vista8
65
开发者 @zhongerxin 发布开源项目 Cowart,将 OpenAI Codex 与无限画布工具结合,作为 VS Code 插件使用。项目名 Cowart 取自 "Code with Art"。代码已托管至 GitHub:https://github.com/zhongerxin/cowart#

钟二信: Cowart:Codex + 无限画布工具插件开源,大家可以来试试啦,这个插件先取名叫 Cowart,别问为什么叫这个,我只能说 Code with Art 这种冠冕堂皇的理由:https://github.com/zhongerxin/c...

GitHubMCP/工具开源/仓库编码
09:06
SemiAnalysis@SemiAnalysis_
27
"MYTHOS 来了,MYTHOS 来了!!"
产品更新行业动态
07:33
MarkTechPost(RSS)
64
思科 AI 发布 FAPO:基于 Claude Code 的多步 LLM 流水线优化系统

思科 AI 推出 FAPO,一个由 Claude Code 驱动的多步 LLM 流水线自动化优化系统,基于 Apache 2.0 开源。FAPO 通过步骤级故障归因,从提示词、参数到链式结构逐级升级优化。在六项基准测试中,以 GPT-4.1-mini、GPT-5.4-mini 和 Gemma 3-12B 为任务模型,与 SOTA 优化器 GEPA 对比:18 个模型-基准比较中赢下 15 个,平均增益 +14.1 个百分点;在 HoVer 和 IFBench 上触发结构升级时六组全胜,平均增益达 +33.8 个百分点;仅在 AIME 上略逊 3.1 个百分点,在采样噪声范围内。防过拟合机制包括仅检查训练集、不可变文件及独立审查。

AnthropicGitHub产品更新部署/工程
07:32
🚨 AI News | TestingCatalog@testingcatalog
49
错过提醒 👀:用户现在可以在Grok上搜索@imagine图片和视频了! 它就像一个正常的图片搜索,但仅限于你创建的Imagine内容。我希望最终能在所有已发布的Grok图片上实现这个功能--那将非常棒!
xAI产品更新图像生成搜索
06:03
MarkTechPost(RSS)
66
Nous Research 为 Hermes Agent 新增 Blank Slate 模式:默认仅开启三项工具,其余全部禁用

Nous Research 为其开源 AI 智能体框架 Hermes Agent 新增 Blank Slate 设置模式。该模式默认仅开启 provider & model、File Operations 和 Terminal 三项,Web、浏览器、代码执行、视觉、记忆、委托、cron、技能、插件及 MCP 等全部禁用。配置被写入 `platform_toolsets.cli` 和 `agent.disabled_toolsets` 并固化到磁盘,即使执行 `hermes update` 也不会静默启用未选工具。用户可在极简基线后选择完全禁用或逐项启用。该模式适用于安全敏感部署、可复现团队设置和教学审计场景。本地运行要求模型至少 64K 上下文窗口。

智能体产品更新开源生态
04:33
Hacker News 热门(buzzing.cc 中文翻译)
66
用于 AI 智能体的临时 Cloudflare 账户

Cloudflare 上线面向 AI 智能体的临时账户。智能体无需注册,直接运行 `wrangler deploy --temporary` 即可部署 Worker,部署持续 60 分钟,期间可通过链接认领为永久账户,超时自动删除。专为无人类参与的后台 AI

智能体产品更新部署/工程
04:02
TechCrunch:AI(RSS)
68
In the Weights:以AI为中心的虚荣搜索新工具

前OpenAI员工Thomas Dimson和Joey Flynn创建了In the Weights网站。该网站向Grok、Gemini、多个GPT版本(包括GPT-5.4 Mini)、Claude、Llama等模型提问“Who is [姓名]?”,聚类描述后生成强度分数,以衡量一个人被AI模型“记住”的程度。测试显示作者得分641(前6%),榜首Macaulay Culkin得分988。网站还会列出返回结果的模型并标注潜在幻觉,例如GPT-5.4 Mini对Anthony Ha的描述。该工具意在替代传统Google vanity search,因为流量正转向大语言模型。

产品更新搜索数据/训练
01:07
Berryxia.AI@berryxia
62
Codex 实现本地远程线程无缝切换

现在 Codex 能将代码线程从笔记本无缝 handoff 到远程服务器,再随时接回。过程自动打包 Git 状态、未提交变更、分支、工作树等全部上下文,无需手动 sync 或重建环境。该功能消除了本地开发与远程重型计算之间的摩擦,让 agent 自动管理状态流动,用户可根据需要自由切换场景。

Guinness Chen: Codex can now hand off threads between local and remote hosts. Start work on your laptop, send it to a remote box before...

智能体OpenAI产品更新编码
6月20日
22:27
向阳乔木@vista8
31
Vista8 公众号URL一键转PPT 下周开源

开发者 @vista8 推出新项目:只需输入微信公众号文章 URL,即可自动将其转换为 PPT,并保留文章中的图片。支持导出 PPTX(可任意编辑)、HTML 和 PDF 格式。项目仍在开发中,排版尚需优化,预计下周开源。该功能吸收了此前将公众号 URL 转为 Markdown 并下载图片的能力,实现了从文章到演示文档的自动化转换。

向阳乔木: 发现卡比一个库也很实用,只需微信公众号URL,就能转成Markdown,还能下载网页中的图片。 发现内置会用一个叫camoufox的浏览器,看介绍叫Anti-detect 亲测好用,把能力吸收,让公众号文章也能转PPT。 地址见评论区

产品更新
22:23
X.PIN@thexpin
65
微信于6月20日扩大了对小微(Xiaowei)的灰度测试--一个内置在主应用中的对话助手,可通过文本或语音运行。它能操作微信原生功能并调用小程序完成任务:打车、外卖、订酒店、查快递。它还能根据单条提示词生成一个可运行的小程序。生成的应用程序目前为
智能体产品更新语音
22:23
🚨 AI News | TestingCatalog@testingcatalog
37
Anthropic正在为其即将推出的Claude Conway开发"Schedules"功能。 非常期待看到Conway如何与所有这些计划功能配合工作。
智能体Anthropic产品更新
21:30
The Decoder:AI News(RSS)
54
OpenAI 为 macOS 版 Codex 推出 Record & Replay 功能

OpenAI 为 macOS 版 Codex 新增 Record & Replay 功能。用户可先演示一次操作(如上传 YouTube 视频并添加元数据、缩略图和字幕),Codex 将其录制成可复用的“skill”,随后自主重复执行。该功能需开启 Computer Use,在欧盟、英国和瑞士不可用;Computer Use 自 6 月 16 日起已在欧盟上线。版本 26.616 还新增了 Automations 历史批量操作及本地与远程主机间线程交接能力。Codex 是 OpenAI 面向编程和白领工作自动化的 AI 智能体,应用免费下载,但需付费 ChatGPT 账号才能实际使用。

智能体OpenAI产品更新
20:23
🚨 AI News | TestingCatalog@testingcatalog
42
Google 正在为 NotebookLM 开发一种名为 "Lit review" 的新 Artifact 类型。在此模式下,NotebookLM 将能够基于你的来源 "生成文献综述矩阵"。 考虑到即将新增 Google Play Books 和 Text Books 作为来源,Google 计划为读者和作者拓展新的用例。 它能否梳理出《冰与火之歌》中的所有角色?
Google产品更新
19:24
meng shao@shao__meng
51
LandingAI ADE 支持密码保护文档解析

LandingAI Agentic Document Extraction(ADE)现支持在 Parse 或 Parse Jobs 调用中传入 password 参数,同一请求完成解密、解析及结构化输出。该功能要求启用 Zero Data Retention(ZDR)模式,文档仅在内存处理,不持久化,适用于 HIPAA/PHI/PII 合规场景。支持 PDF、DOC、DOCX、ODT、PPT、PPTX、XLSX 格式。集成成本低:单一可选参数,非加密文件不受影响;缺密码返回 422 错误。密码经 HTTPS 传输,ZDR 下服务端不持久化,建议配合最小权限 API Key 与审计日志。REST API 及 Python/TypeScript 库均可用。

LandingAI: Parse password-protected documents! Agentic Document Extraction (ADE) accepts a password parameter directly in the Parse...

智能体产品更新部署/工程
18:02
歸藏(guizang.ai)@op7418
11
一个预告 【引用 @op7418】:http://x.com/i/article/2053655813877870592

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

产品更新其他
18:00
The Decoder:AI News(RSS)
67
Data2Story:七个AI智能体将CSV文件自动生成可验证的交互式新闻文章

Data2Story是牛津和斯坦福研究人员基于Claude Code构建的技能,通过Detective、Analyst、Editor、Designer、Programmer、Auditor、Inspector七个专用AI智能体,将CSV文件自动生成包含研究背景、统计图表和可追溯来源的交互式在线文章。核心“检查员”面板为每个声明和图表提供结构化证据,93%的可见陈述可溯源(人类文章基线为25%)。在53位读者对18个数据集的评测中,AI文章在视觉设计、叙事节奏、数据透明度、可验证性和洞察力五个类别均胜出,74%的读者更偏好AI版本。但人类在编辑视角、创意设计和密集图形方面仍保持优势。项目已开源。

智能体产品更新数据/训练
17:59
IT之家(RSS)
精选73
微信 AI 助手"小微"灰度上线,可通过文字或语音对话操作原生功能

微信原生 AI 助手“小微”今日扩大灰度测试,支持文字或语音操作微信原生功能(调整设置、发送消息、拨打电话、点外卖、生成图片等),集成文件总结、提醒设置、音乐推荐。用户可一句话生成小程序(仅限个人使用,暂不支持分享),并可通过多轮对话修改风格。该功能由微信技术架构负责人周颢带队推进,计划 2026 年第三季度向更多用户推出。此前微信开放平台已于 6 月 8 日开放 AI 生态接入能力,微信支付同步发布 AI 专属卡。

智能体产品更新
关联讨论 2 条IT之家(RSS)公众号:数字生命卡兹克
推荐理由:微信这次把 AI 助手直接塞进主界面,不止是聊天,而是能操作设置、发消息、点外卖甚至一句话生成小程序。国民应用 + 原生 AI 的整合,可能会让这代人对智能助手的理解彻底刷新一遍。
17:23
🚨 AI News | TestingCatalog@testingcatalog
55
ClickUp 将通过 Brain2 添加 artifacts 👀 > 它将能够创建幻灯片、原型、网站或仪表板。 > Brain 从工作区上下文中提取信息,因此输出基于真实项目数据 > Artifacts 在频道内内联渲染,并保持完全交互。 当要求 Brain 制作演示文稿时,它现在将在线程中直接返回一个已完成、专业、可导航的幻灯片组,随时可以分享或放入任务中。
产品更新多模态
17:00
The Decoder:AI News(RSS)
50
ChatGPT 新增「Scheduled」侧边栏,统一管理定时任务

OpenAI 为 ChatGPT 新增「Scheduled」侧边栏页面,集中管理所有定时任务。用户可查看、暂停、编辑或删除任务。研究任务可搜索网页和已连接应用,仅在内容变化时发送提醒。所有任务速度更快、可靠性更高,用户可按具体时间或早晨、下午、晚间时段触发。该功能面向 Plus、Pro、Business、Enterprise 用户,活跃任务数量因套餐而异,最多每小时执行一次,用户不活跃时自动暂停。原有「Pulse」功能已整合进定时任务中。

智能体OpenAI产品更新
15:59
IT之家(RSS)
精选75
马斯克 SpaceXAI 为微软 Office 推出 Grok 扩展,支持自然语言操控文档、表格和演示文稿

6月19日,马斯克旗下SpaceXAI面向微软Word、Excel、PowerPoint推出Grok扩展。安装后Office应用右侧出现侧边栏,支持自然语言指令操控。Word中,Grok可根据草稿和格式自动生成文档,识别语法错误并提出表述建议,还能调用X平台及互联网实时信息补充数据。Excel中,Grok可分析选中区域数据,进行统计、趋势识别并一键生成图表。PowerPoint中,输入主题、页数和风格,Grok自动生成幻灯片框架并填充内容。

智能体产品更新
关联讨论 2 条X:cb_doge (@cb_doge)xAI:News(网页)
推荐理由:SpaceXAI 把 Grok 带进 Office,不是简单的对话侧边栏,而是能调用 X 实时数据的生产力插件。比起 Copilot 的封闭数据,Grok 的实时联网让报告和数据分析更有血有肉,做市场的同学可以试试。
15:59
IT之家(RSS)
66
开源工具 Headroom 爆火:Netflix 工程师打造,声称可节省 60%-95% Token 消耗量

Netflix 高级工程师 Tejas Chopra 开发的开源工具 Headroom(v0.26.0)在 AI 应用与 LLM 间建立本地透明压缩层,通过压缩 JSON、代码、RAG 片段和对话历史等冗余数据减少 Token 消耗,支持可逆压缩与 CCR 缓存机制。实测代码搜索场景 Token 从 17765 降至 1408(节省 92%),SRE 事故调试场景从 65694 降至 5118(同样节省 92%)。累计帮助用户节省约 70 万美元成本、释放超 2000 亿 Token。提供 Python/TypeScript 库、智能体代理模式、直接包装现有 AI 编程智能体以及 MCP 服务器模式,并可精简 AI 回复中客套话进一步降低成本。

GitHubMCP/工具开源/仓库部署/工程
13:59
IT之家(RSS)
26
金山办公将于下月推出组织级AI产品"企业大脑"WPS Comate

金山办公副总裁王少康在“2026人民数据大会”上透露,将于下月(7月)正式推出组织级AI办公产品“企业大脑”WPS Comate,后续将规模化交付。该产品面向知识密集的中大型组织,主打复杂业务场景,整合并激活组织内结构化与非结构化数据,利用AI理解组织结构与协作关系,生成数字员工等AI产品融入业务运营与决策,帮助员工跨工具协同完成专业任务。后续金山办公将对接客户,根据不同公司情况定制专属“企业大脑”,实现数据、系统、流程和知识资源的高效连接,打造AI统一入口。

智能体产品更新部署/工程
12:24
宝玉@dotey
57
Codex 上线 Handoff 跨设备任务迁移功能

Codex 推出 Handoff 功能,支持用自然语言指令将正在进行的任务连同完整 Git 状态(未提交代码、当前分支)从笔记本迁移到远程服务器继续运行,之后可再拉回本地。前提:本地需在 Settings > Connections > SSH 配置远程主机;远程也需安装 Codex 并开启“允许其他设备连接”,双方登录同一 ChatGPT 账号;远程需有同一 Git 仓库的克隆并保存为项目,子目录路径需匹配。该功能解决了 AI 编程中途离开时任务进度的托管问题。

Guinness Chen: Codex can now hand off threads between local and remote hosts. Start work on your laptop, send it to a remote box before...

OpenAI产品更新编码部署/工程
12:01
AYi@AYi_AInotes
68
Cascadeur 取消 AI 动画 token 计费,实现全本地无限生成

Cascadeur 取消 AI 动画 token 计费,实现全本地运行,无 token、无 credits、无云端排队,支持无限生成。演示用低多边形 blockout rig 直接生成复杂奔跑动画,多场景秒切。核心功能:导入自定义 rig、AI 补帧与智能摆姿、物理工具自动计算重量感和接触。全程不联网,本地算力即可运行,将动画迭代变为像 Photoshop 滤镜一样随意尝试。

产品更新视频
11:23
PixVerse@PixVerse_
52
Pick your signature shot 官方《足球小将》模板已在 PixVerse Web 上线。 上传照片,选择如 Curve Shot 或 Tiger Shot 等招式,创建你自己的动漫足球时刻。 转发+关注 = 私信获得 100 Cred(仅限 24 小时) #CaptainTsubasa
产品更新视频
08:56
向阳乔木@vista8
21
Vista 计划开发 PPT 生成 Skill

Vista 计划开发 PPT 生成 Skill,核心:同时输出可编辑 PPTX、PDF、HTML;基于 GPT 5.5 Pro 方法论;按环境在 Codex 生图或 SVG 渐变背景;集成 echart、lucide icon、Google Font;内置抓取 X 帖子、长文、论文 PDF 素材。预计下周开源。

开源/仓库开源生态
08:24
Tibo@thsottiaux
62
Remote / local handoff in Codex! 一步步消除边界。 当你让模型掌握主导权时,实际上需要的底层设施更少。

Guinness Chen: Codex can now hand off threads between local and remote hosts. Start work on your laptop, send it to a remote box before...

智能体OpenAI产品更新编码
07:59
IT之家(RSS)
47
visionOS 27 今秋推送:M5 Vision Pro 头显独占 Siri 语音定制和苹果最强本地 AI 模型

visionOS 27 将于今秋推送。M5 Vision Pro 独占 Siri 语音定制(Voice Customization),用户可自由调整语气表现力和语速;同时独占搭载 AFM 3 Core Advanced 本地 AI 模型,该模型支持原生多模态能力并采用稀疏架构,需 M5 芯片算力支撑。M2 款 Vision Pro 可共享 visionOS 27 大部分升级,包括 Siri AI、全景照片转空间场景、重新设计的控制中心、更智能的自然语言理解及语音操作交互等。苹果承诺未来通过云端计算为 M2 设备提供部分 AI 功能的折中方案,具体细节尚未公布。

产品更新多模态端侧语音
06:54
MarkTechPost(RSS)
精选77
NVIDIA Research 发布 SpatialClaw:免训练空间推理框架

NVIDIA Research 发布 SpatialClaw,一个免训练的空间推理框架。它通过将代码作为动作接口,让智能体调用感知工具(Depth Anything 3、SAM 3)并自由组合输出,解决视觉语言模型在 3D 空间判断上的弱点。在 20 项基准测试中平均准确率达 59.9%,比近期智能体 SpaceTools 高 11.2 个百分点,比无工具基线高 6.5 点,比结构化工具调用高 3.2 点。框架无需重新训练,同一提示词和工具集可跨所有基准和骨干网络运行,支持 Qwen3.5/3.6 及 Gemma4 等 26B 至 397B 参数的模型。

智能体具身智能开源/仓库推理

推荐理由:NVIDIA 把空间推理的动作接口从工具调用换成代码,这个思路很巧,20 个基准平均拉升到 59.9%,无训练即插即用,做机器人和视频理解的人该直接跑一下 repo。
05:21
jason@jxnlco
49
Codex 现在可以在本地和远程主机之间切换任务。在笔记本上开始工作,合盖前发送到远程机器,稍后取回。Codex 能自主编排这一切换过程。

Guinness Chen: Codex can now hand off threads between local and remote hosts. Start work on your laptop, send it to a remote box before...

OpenAI产品更新编码
03:21
Luma@LumaLabsAI
51
你的素材。你的剪辑。一张画布。 在 Timeline 上组装,你的剪辑逐渐成形。将全分辨率文件保留在你工作的地方,无需代理或降级。然后通过 EDL 导出,逐帧发送到你的后期合成套件。 初剪和终剪现在同在一路。你只需构建一次,它随你而动。 立即试用 → http://lumalabs.ai/app
产品更新视频
02:51
🚨 AI News | TestingCatalog@testingcatalog
27
OpenAI正在准备将ChatGPT中的Library也添加到Codex中。 整合的下一个阶段👀
OpenAI产品更新
01:54
Rohan Paul@rohanpaul_ai
64
DeepAdapt 推出 ACI 运行时学习层:GPU 转 CPU,成本降 82%、推理快 33 倍

DeepAdapt 发布 ACI(自适应持续智能)运行时学习层,通过将重复工作负载从 GPU 转移至标准 CPU,实现运营成本降低 82%、推理速度提升 33 倍(中位延迟 159 ms)。ACI 在推理时实时学习模型决策、人工修正与反馈,已知请求直接本地 CPU 处理,仅不确定或复杂请求回传底层 LLM。基准测试:token 消耗降 90%、生产级成本降 5.7 倍、准确率 96%(对比无 ACI 的 85%)、每千次决策能耗降 85.7%、规则违规减 4.8 倍。无需微调或重训,即插即用,GPU 依赖随系统成熟递减。该架构先用于云端 LLM 智能体,未来对个人设备同样重要。

产品更新推理部署/工程
01:23
Runway@runwayml
26
你不需要环游世界来制作全球广告活动。 从构思到执行,这整支广告仅由一个人用 Runway 在一天内完成。点击下方链接亲自尝试。#MadeWithRunway
其他视频
00:01
AYi@AYi_AInotes
53
Claude Code上线Artifacts功能

Claude Code新增Artifacts功能,可将整个工作会话(代码、上下文、工具调用)打包成独立网页,后台持续迭代时页面自动同步更新。生成的私密链接可共享给团队成员,支持切换历史版本,适用于PR走查、系统架构图、交互式数据分析仪表盘等场景。目前以beta版面向Team和Enterprise计划开放。作者认为,该功能的核心价值在于将AI产出从静态文本升级为可共享、可实时更新的数字资产,降低技术方案向非技术人员解释的成本,让AI更顺畅地融入团队协作流程。

Claude: New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dash...

Anthropic产品更新编码
6月19日
23:59
IT之家(RSS)
42
印度首富安巴尼:印度必须成为 AI 的创造者和全球领导者

信实工业在年度股东大会上发布 AI 通话助手 Jio Call Agent,直接嵌入 Jio 电信网络,可转录对话、生成摘要,并帮助用户叫车、点餐和预订,用户通过“Hey Jio”唤醒,预计今年晚些上线,覆盖超 5 亿用户。同时推出 AI 版 MyJio,支持自然语言指令完成开通 eSIM、选漫游套餐等操作;TeleFrame 可利用 AI 智能体主动显示天气预警、日程和家庭提醒。信实还通过 Reliance Intelligence 为消费者、企业和政府开发支持印度 22 种语言的 AI 基础设施。安巴尼强调印度不能只做 AI 消费者,而应成为创造者和全球领导者。

产品更新行业动态语音
23:50
TechCrunch:AI(RSS)
45
信实工业推出多款AI服务,涵盖通话、应用与家居

印度信实工业在年度股东大会上发布AI服务:Jio Call Agent可加入电话会议转录、总结并执行叫车、订餐等任务,通过“Hey Jio”激活,今年晚些时候面向超5亿用户上线;MyJio应用新增AI版,支持自然语言激活eSIM、选择漫游套餐;家庭显示设备TeleFrame利用AI智能体推送天气、日程提醒;还推出医疗、教育、农业和中小企业AI套件,支持22种印度语言。公司计划投资1100亿美元建设AI基础设施,并与Google、Meta、Nvidia合作。此外,Jio Platforms董事会批准IPO草案,拟发行最多2.7亿股新股。

智能体产品更新语音
23:24
SenseTime@SenseTime_AI
45
商汤 SenseNova U1 实现文本-图像交错生成

商汤 SenseNova U1 具备行业首创的文本-图像交错生成能力。用户上传客厅照片后,U1 可瞬间将其风格转变为温馨阅读角。该演示由 @eigi_and_ai 完成。U1 现已通过 SenseNova Studio、HuggingFace 模型库、GitHub 源码及 Discord 社区开放体验。

GitHubHugging Face其他图像生成
22:00
Cloudflare Blog
精选62
Cloudflare 为 AI 智能体推出临时账户

Cloudflare 在 Workers 上推出临时账户(Temporary Accounts),允许 AI 智能体直接运行 `wrangler deploy --temporary`,在数秒内获取一个可用的实时 Worker,无需绕开面向人类设计的部署流程。该功能旨在降低智能体部署门槛。

智能体MCP/工具产品更新部署/工程

推荐理由:Cloudflare 给 agent 开临时账号这个功能很聪明,一步解决了身份验证和资源清理的麻烦,做智能体部署的可以认真试试。
模型发布行业动态论文研究技巧观点