AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2613 条
全部一手资讯X论文
标签「产品更新」清除
swyx@swyx · 6月17日50

gentle irony that SpaceXAICursor, on its very first day of existence, announced a product that is a blue Origin (right after @JeffBezos announces Prometheus)

译Cursor/Graphite 的 TomasReimers 刚刚宣布了 Origin,这是 @cursor_ai 期待已久的 Git 竞争对手,可针对 agent 工作负载进行扩展,可通过 API 和 MCP 扩展,并内置合并冲突和协同故障 agent 解决功能。 颇具讽刺意味的是,SpaceX/AI/Cursor 在成立第一天就发布了一个“蓝色起源”产品 (就在 @JeffBezos 发布 Prometheus 之后)

Ethan Mollick@emollick · 6月17日65

Fable's implementation of Borges's Library of Babel, finished posthumously by Opus 4.8. Quite accurate to the story. It is multiplayer (others appear as ghosts). You can locate key volumes, like the weights of GPT-1 & the code to the Library sim itself: https://borges-library-of-babel.netlify.app/

译Fable 对博尔赫斯《巴别图书馆》的实现,由 Opus 4.8 在其死后完成。非常忠实于原著。 这是多人游戏(其他人以幽灵形式出现)。你可以找到关键卷册,例如 GPT-1 的权重和图书馆模拟本身的代码:https://borges-library-of-babel.netlify.app/

AYi@AYi_AInotes · 6月17日28

来看看中国宇树科技的机器人跳难度超高的古风舞,这舞我是跳不出来的,感觉几年后没有人类啥事了😂

译仿人机器人无需像人。Eno 是 Genesis 的首款通用机器人——不是假装成人的机器,而是赋予身体的智能。它冷静、能干、乐于助人,将于今年 Q4 面市。

Rohan Paul@rohanpaul_ai · 6月17日65

AI agents are removing friction from work one workflow at a time. Any rule-based workflow with structured chaos is AI-agent territory. Okara just launched an influencer marketing Agent that turns creator campaigns from agency work into software work.

译Rohan Paul 指出,基于规则的混乱工作流正是 AI Agent 的领地。引用 Okara 官方消息,其发布全球首个网红营销 Agent:用户只需告知推广目标,该 Agent 即可自动发现创作者、联系沟通、管理活动、处理付款并上线内容,将机构工作转化为软件工作。访问 okara.ai/influencer 即可体验。

swyx@swyx · 6月17日54

Cursor/Graphite’s @TomasReimers just announced Origin @cursor_ai’s long awaited Git competitor, scalable for agent workloads, extensible with api and mcp, and built in merge conflicts and co failure agent resolution

译Cursor/Graphite 的 @TomasReimers 刚刚宣布了 Origin,这是 @cursor_ai 期待已久的 Git 竞争对手,可扩展用于 AI 智能体工作负载,可通过 API 和 MCP 扩展,并内置了合并冲突和协作失败智能体解决方案。

jason@jxnlco · 6月17日51

codex eu-sers! chrome, computer use, are now all available in the eu codex can now use apps across your Mac, automate workflows in Chrome and remember context across your work. if you want to automate that one task you're dying to automate, just take an app shot and kick it off

译codex 欧盟用户们! Chrome、电脑使用现在都在欧盟可用。 codex 现在可以跨你的 Mac 使用应用、在 Chrome

Jim Fan@DrJimFan · 6月17日64

Today, we enable AutoResearch in the physical world for the first time! Introducing ENPIRE: we give 8 Codex agents a fleet of robots, an allocation of GPUs, and generous token budget. We set them free with a simple goal: solve the task as quickly as possible, keep the robots busy but stay safe, don't waste precious compute. Make no mistake. Then humans step aside and our watch begins. The robot fleet starts to come alive: they learn to look for visual clues, reset the scene, practice novel skills, tinker with control stack, read papers online, debate, reflect, get stuck, and try again directly on the hardware. All we did is to give Codex an API to the world of atoms, and the rest is emergence. ENPIRE is able to solve high-precision tasks like tying zip-ties, organizing fine pins, and installing GPUs all by itself. We also discovered a new type of "physical scaling": 8 robots exploring in parallel improves significantly faster than fewer ones. A part of our NVIDIA GEAR lab now self-improves tirelessly over night. We just read the reports in the morning. /goal: we all take a holiday and Jensen wouldn't even notice ;) We will be open-sourcing everything, so you can host your self-running robot lab at home too! Deep dive in the thread:

译NVIDIA GEAR 实验室首次在物理世界启用 AutoResearch,推出 ENPIRE 项目。给 8 个 Codex 智能体分配机器人舰队、GPU 和 token 预算,目标快速安全完成任务。人类退出后,机器人舰队自主学会寻找视觉线索、重置场景、练习新技能、调整控制栈、阅读论文、辩论反思。ENPIRE 能高精度完成扎带、整理细针、安装 GPU 等任务。发现物理扩展:8 机器人并行探索比少机器人效率显著提升。实验室部分可整夜自我改进,早上读取报告。所有内容将开源。

ClaudeDevs@ClaudeDevs · 6月17日56

How do teams get agents into production? New blog post from our Applied AI team on Claude Managed Agents and the challenges it solves (credentials, sandboxing, observability, & more) ...

译团队如何让 AI 智能体投入生产? 我们 Applied AI 团队的新博客文章,关于 Claude Managed Agents 及其解决的挑战(凭证、沙箱、可观测性等)...

DogeDesigner@cb_doge · 6月17日69

🚨 Grok Update 🚨 You can now share your screen with Grok and get real-time help in Voice Mode. Just tap the window icon, select Share Screen, and start the broadcast.

译🚨 Grok 更新 🚨 现在你可以与 Grok 共享屏幕,并在语音模式下获得实时帮助。 只需点击窗口图标,选择共享屏幕,然后开始广播。

Chubby♨️@kimmonismus · 6月17日37

A decade of endpoint security has meant scanning content for keywords and file types, then alerting after the data already left. Ent runs local models that read intent instead: who's in the meeting, what's on screen, what shouldn't be visible externally, and covers it before the screen share goes out. On-device, nothing leaves the boundary. From the RiskIQ and Security Copilot team.

译Ent 发布业内首个 intent-aware 工作空间安全平台,结束隐身模式。传统端点安全在数据外泄后扫描关键词告警,Ent 直接在设备端运行本地模型,实时理解会议参与者、屏幕内容,在屏幕共享前自动遮盖不应外露的信息。所有处理在设备本地完成,数据不离开边界。该产品来自 RiskIQ 与 Security Copilot 团队成员。

Satya Nadella@satyanadella · 6月17日70

Copilot Cowork is now generally available worldwide, now with multi-model support! Every organization can put long-running agents to work on complex, multi-step tasks, grounded in your organization's unique knowledge and know-how. https://www.microsoft.com/en-us/microsoft-365/blog/2026/06/16/copilot-cowork-is-now-generally-available/?v=15

译Copilot Cowork 现已全球正式可用,并支持多模型! 每个组织都可以让长期运行的智能体处理复杂的多步骤任务,基于你组织的独特知识和专有技术。 https://www.microsoft.com/en-us/microsoft-365/blog/2026/06/16/copilot-cowork-is-now-generally-available/?v=15

OpenAI Developers@OpenAIDevs · 6月17日42

More of Codex is rolling out across Europe this week. We’re bringing Computer use, the Codex Chrome extension, personalized memory, and Chronicle to Codex users in the EEA, UK, and Switzerland. https://developers.openai.com/codex/changelog/#codex-2026-06-16-app

译本周,更多 Codex 功能正在欧洲各地推出。 我们正在将 Computer use、Codex Chrome 扩展、个性化记忆和 Chronicle 带给 EEA、英国和瑞士的 Codex 用户。

Google Gemini@GeminiApp · 6月17日64

Organize your day before you even wake up with Daily Brief, your new morning AI agent. Here are some helpful tips from the Gemini app team to help you get the most out of your Daily Brief: 1) Thumbs up 👍 or thumbs down 👎to give feedback: This is the quickest and most direct way to teach Gemini what you want to see more or less of in your Daily Brief. 2) “Chat with Gemini” to fine-tune: If you want to ask questions about any item in your Daily Brief or give even clearer direction on what you want to see more, you can chat directly with Gemini. 3) Check an item’s source: If you want to confirm the source of an item in your Daily Brief, you can click ‘More’ below it to see the specific email, chat, or event in your Google Calendar that Gemini referenced. How are you liking Daily Brief so far? We’re constantly working to make Gemini better, and your feedback helps make it more useful and helpful for everyone. Share any Daily Brief feedback or tips you have in the replies. 👇

译Gemini 应用推出名为 Daily Brief 的新 AI 智能体,用户可在起床前用它规划一天。官方提供三条使用建议:1)通过点赞或踩直接反馈,训练 Gemini 了解偏好;2)直接与 Gemini 对话,对简报内容提问或调整;3)点击简报项下方的“更多”按钮,查看 Gemini 引用的具体邮件、聊天或 Google 日历事件来源。目前该功能已上线,官方持续收集用户反馈以改进体验。

Xiaomi MiMo@XiaomiMiMo · 6月16日70

🚀 MiMo Claw is now live!

译小米 MiMo 推出旗舰 AI 模型 MiMo Claw,集成金山办公(Kingsoft Office)。支持 Word、Excel、PowerPoint、PDF 等工作流,通过智能体实现可靠长任务执行,token 消耗比同类方案低 40–60%。每日免费使用时长从 1 小时扩展至 4 小时,全云端无需部署。限时订阅价 ¥14.9/月。

Rohan Paul@rohanpaul_ai · 6月16日61

"I don't prompt Claude anymore. I write loops and the loops do the work. My job is to write loops." - Boris Cherny, creator of Claude Code. @withneo 's newly launched MCP server gives Claude Code a local AI engineering worker through neo-mcp. It lets Claude Code hand off complex AI/ML tasks to Neo, which can implement code, run experiments, evaluate results, debug failed runs, and return the full execution trail. I.e. Claude Code talks to you, Neo does the longer ML work. In one benchmark, Claude Code + NEO cut task cost from $1.96 to $0.74, made runtime 37% faster, and switched the backend from PyTorch to ONNX Runtime for CPU-optimized execution. Connect Claude Code, Cursor, VS Code, and other MCP clients to NEO. The editor stays in control of the conversation. NEO does the AI engineering. So Neo becomes the execution layer for AI engineering work. Claude Code hands off the task. Neo plans, runs experiments, monitors progress, evaluates results, and returns the trail: transcripts, files, metrics, reports, or repo changes. That feedback loop matters. Instead of burning Claude Code’s limited iterations babysitting long-running tasks, Claude can use Neo’s MCP tools to check status, pause, resume, inspect the trail, or ask for input at decision points. Claude stays focused on decisions, not execution noise.

译Boris Cherny(Claude Code 开发者)表示不再手动提示 Claude,而是编写循环让循环工作。@withneo 新发布的 MCP 服务器 neo-mcp 为 Claude Code 配备了本地 AI 工程工人 Neo。Claude Code 可将复杂 AI/ML 任务委托给 Neo,由其实现代码、运行实验、评估结果、调试失败运行并返回完整执行轨迹。在基准测试中,Claude Code + NEO 将任务成本从 $1.96 降至 $0.74,运行时间缩短 37%,并将后端从 PyTorch 切换为 ONNX Runtime 以优化 CPU 执行。该 MCP 服务器支持连接 Claude Code、Cursor、VS Code 等客户端,编辑器控制对话,Neo 负责执行,Claude 专注于决策而非执行噪音。

小互@xiaohu · 6月16日51

看来 Claude 的语音模式即将推出 在设置页面可以设置语音语言和风格 而且支持中文,出乎意料 之前据说用的是 11Lab 的模型…

Elon Musk@elonmusk · 6月16日19

Made with Grok Imagine

译由 Grok Imagine 制作

🚨 AI News | TestingCatalog@testingcatalog · 6月16日50

ANTHROPIC 🔥: Looks like a Voice Mode upgrade has started rolling out on Claude mobile apps. Voice mode is getting multilingual! It is likely just a first step ahead of a broader upgrade. Upcoming model selector appearance may signal an underlying model improvement coming. Besides that, the voice mode icon has a new “phone call” variant in the latest iOS build. Sus! Testing time if you got it 👀

译ANTHROPIC 🔥:看起来语音模式升级已经开始在 Claude 移动应用中推出。语音模式将支持多语言! 这很可能只是更大升级前的第一步。即将出现的模型选择器外观可能预示着底层模型的改进。 除此之外,在最新的 iOS 构建版本中,语音模式图标新增了一个“电话”变体。有猫腻! 如果你已经拿到,测试一下吧 👀

凡人小北@frxiaobei · 6月16日62

Codex CLI 新版本这个功能好, /import 从 Claude Code 导入:设置、配置和聊天记录, 挖墙脚继续。

meng shao@shao__meng · 6月16日60

LandingAI 把 Agentic Document Extraction 从「API 文档 + 手写脚本」升级成 Agent Skills ——让 Codex、Claude Code、Cursor 等 Coding Agents 在对话里直接写出可用的文档处理流水线 http://github.com/landing-ai/ade-document-processing-skills # 两个 Skill 的分工 1. document-extraction — 原子操作 · Parse:结构化 Markdown + 层级 JSON · Extract:JSON Schema / Pydantic 字段抽取(发票、表单、表格等) · Split:混合批次按文档类型拆分 · Classify:按页分类路由(Preview) · TOC:生成目录结构(Preview) · 大文件:异步处理(最高约 1GB / 6000 页) · Visual grounding:元素级坐标与置信度 2. document-workflows — 生产级组合 · 并行批处理(ThreadPool / async) · Classify → Extract 混合文档流水线 · RAG 准备:语义分块、embedding、ChromaDB/FAISS · 导出 DataFrame / CSV / Snowflake · 可视化标注(bbox 叠加、词级高亮) · Streamlit 交互 UI

译LandingAI 将 Agentic Document Extraction 升级为 Agent Skills,支持在 Codex、Claude Code、Cursor 等 coding agent 的对话中直接调用,实现零脚本文档处理流水线。两个 Skill 分工明确:document-extraction 提供结构化 Markdown/层级 JSON 解析、基于 JSON Schema/Pydantic 的字段抽取、按文档类型拆分、按页分类路由(预览)、目录生成(预览)、异步大文件处理(最高约 1GB/6000 页)及元素级坐标与置信度可视化;document-workflows 封装并行批处理、Classify→Extract 混合流水线、RAG 准备(语义分块、embedding、ChromaDB/FAISS)、DataFrame/CSV/Snowflake 导出、bbox 标注叠加及 Streamlit 交互 UI。安装命令:`/plugin marketplace add landing-ai/ade-document-processing-skills`。

Greg Brockman@gdb · 6月16日40

great ux makes such a difference

译我们刚为 ChatGPT 推送了更快、更流畅的照片附件体验!附件菜单现在可平滑过渡到相机,拍摄更迅速,选中的图片直接移入输入框,整个流程如同一个连续动作。优秀的用户体验影响巨大。

小互@xiaohu · 6月16日60

兄弟们 好消息! 从6月15日起,也就是今天,Agent SDK 和 Claude -p 的用量 不再占用你 Claude 订阅套餐额度 根据你的订阅,现在每个月会多出一笔"专用零花钱" Pro 用户是 $20,Max 5x 是 $100,以此类推... 这笔钱专门用来跑 claude -p、自己写的 Agent SDK 脚本、或者第三方 Agent App, 不会动你原来用量额度 以前的问题是:你用 claude -p 跑批量任务,会把日常对话的配额也吃掉,两边抢同一个池子。现在拆开了,互不影响。 额度用完了才开始扣其他费用 未用完的不滚存到下个月 需要一次性手动领取,之后自动续期

译自6月15日起,Claude 将 Agent SDK 和 claude -p 的用量从订阅套餐原有额度中剥离,每月额外提供一笔“专用零花钱”,其中 Pro 用户 $20、Max 5x 用户 $100,以此类推。该额度专门用于运行 claude -p、自写 Agent SDK 脚本或第三方 Agent App,不占用日常对话配额。额度用完后才扣其他费用,未用完不滚存下月;需手动领取一次后自动续期。

meng shao@shao__meng · 6月16日66

Generative UI × Agent Harness Coding Agent(Claude Code / Codex / Pi)在 Vercel Sandbox 里真实改代码、跑命令、测用例;汇报时不再只返回 Markdown,它基于「json-render」输出受约束的 JSON UI 规格,前端实时渲染成步骤、Diff、终端、测试结果、图表等组件。 https://github.com/vercel-labs/json-render/tree/main/examples/harness-chat 这个实现思路,和 Claude Code 核心开发者 @trq212 「Using Claude Code: The Unreasonable Effectiveness of HTML」异曲同工: https://x.com/trq212/status/2052809885763747935 技术架构(三层解耦) 用户 Prompt ↓ HarnessAgent(AI SDK 7 实验 API) ├─ Claude Code / Codex / Pi(可互换) └─ Vercel Sandbox(隔离 Linux 环境,真实 bash/edit/test) ↓ Agent 输出:短 prose + ```spec 围栏内的 JSONL ↓ pipeJsonRender(从流中提取 spec → data-spec parts) ↓ 前端 useChat + useJsonRenderMessage → 渲染组件树 关键设计点: 1. Harness 抽象与模型抽象对称 AI SDK 7 的 HarnessAgent 让你像换模型一样换 Harness——claudeCode 换成 codex 或 pi,调用方式不变。Harness 管 skills、sandbox、session、权限、compaction 等「模型之上的层」。 2. UI 层与执行层完全解耦 HarnessAgent. stream() 返回标准 AI SDK StreamTextResult,因此 json-render 管道与单模型 chat 示例 完全相同。换 Agent Harness,前端代码不用改。 3. Catalog 约束 = 安全 + 可预测 Agent 只能使用预定义组件(Steps、FileChange、Terminal、TestResults、Metric、BarChart…),输出必须符合 Zod schema。AI 生成 UI,但 在你划定的组件边界内。 4. Session 绑定 Sandbox 每个 chat 维护一个 live session + sandbox;首条消息冷启动较慢,后续复用同一工作区。10 分钟 idle 或「Start Over」会销毁 sandbox。 一次完整交互里发生了什么 1. 用户选 Agent(Claude Code / Codex / Pi)并发送任务 2. 服务端 getSession(chatId, agent) 创建或复用 Harness session 3. Agent 在 sandbox 内执行真实操作(写文件、跑测试、benchmark 等) 4. 回合结束时 Agent 输出: · 一两句 conversational 总结 · 一个 ```spec 围栏包裹的 JSONL UI 报告 5. pipeJsonRender 把 spec 从文本流中拆出,变成 typed data-spec parts 6. 前端同时渲染:Markdown prose、工具调用活动行(bash/edit/read…)、结构化报告组件 Agent 的 system instructions 明确要求:不得虚构结果——失败就展示 error step、非零 exit code、失败测试;Terminal 必须用 session 中真实捕获的输出。

译Vercel Labs 利用 AI SDK 7 实验 API 推出 HarnessAgent,结合 json-render 为 Claude Code / Codex / Pi 等 Coding Agent 提供生成式 UI。Agent 在 Vercel Sandbox 隔离 Linux 环境中执行写文件、跑测试等真实操作,输出受 Zod schema 约束的 JSONL UI 规格(仅限 Steps、FileChange、Terminal 等预定义组件),前端通过 useChat + useJsonRenderMessage 实时渲染。核心设计:Harness 抽象允许像换模型一样互换 Agent;UI 层与执行层完全解耦;Session 绑定 Sandbox,10 分钟空闲或“Start Over” 销毁。Agent 不得虚构结果,失败必须展示 error step、非零 exit code 或失败测试。

🚨 AI News | TestingCatalog@testingcatalog · 6月16日37

OPENAI 🔥: Codex now supports Chrome DevTools Protocol for browser use. This is a huge superpower that will allow Codex to inspect and modify any website. It is still a very early implementation, but I bet that in several years this will be a default browser capability. If websites are loaded through AI, users will be able to customize their UX on the fly. This is the way 👀

译OPENAI 🔥: Codex 现在支持 Chrome DevTools 协议,可用于浏览器操作。这是一个巨大的超能力,将允许 Codex 检查并修改任何网站。 这仍是一个非常早期的实现,但我敢打赌,几年后这将成为浏览器的默认能力。如果网站通过 AI 加载,用户将能够即时自定义他们的用户体验。 这就是方向 👀

Josh Woodward@joshwoodward · 6月16日74

Our mic icon just got way better on Android and iOS! This is HUGE for non-English speakers. + now 70+ languages + mix languages freely + don't have to change language settings + still doesn't interrupt you :)

译我们的麦克风图标在 Android 和 iOS 上变得更好用了!这对非英语使用者来说意义重大。 + 现已支持 70+ 种语言 + 可自由混用语言 + 无需更改语言设置 + 仍然不会打断你 :)

xAI@xai · 6月16日47

You can now use your SuperGrok or X Premium subscription inside @warpdotdev. Try it out from Warp Agent Settings and switch to the Grok Build model. https://x.ai/news/grok-warp

译你现在可以在 @warpdotdev 内使用你的 SuperGrok 或 X Premium 订阅。 从 Warp Agent 设置中试用,切换到 Grok Build 模型。

Rohan Paul@rohanpaul_ai · 6月16日54

Factory 2.0 is here. Connects AI agents to the whole software workflow: tickets, customer requests, code, tests, security checks, reviews, deployments, docs, and production incidents. Managing this feedback loop is so important - every incident and review should become training signal for the next task. It treats every bug report, customer request, internal discussion, code review, test failure, security warning, and incident as a signal inside one loop, where agents help triage work, write code, test it, review it, ship it, watch production, and feed what happened back into the system.

译FactoryAI 今日推出 Factory 2.0,将 AI 智能体与整个软件工作流打通——涵盖工单、客户请求、代码、测试、安全检查、代码审查、部署、文档和生产事故。系统强调反馈循环的重要性:每个事故和审查记录都应成为下一任务的训练信号。所有 bug 报告、客户请求、内部讨论、测试失败、安全警告和事故被视为单一循环内的信号,由智能体协助分类、编写代码、测试、审查、发布、监控生产环境,并将结果反馈回系统。这标志着从编码智能体向软件工厂的升级。

MiniMax (official)@MiniMax_AI · 6月16日44

.@CommandCodeAI added M3, free through the 17th. One npm install and it's in your terminal👇

译.@CommandCodeAI 已添加 M3,17 日前免费。 一条 `npm install` 就出现在你的终端👇

Runway@runwayml · 6月16日61

Use Runway inside ChatGPT to generate and edit video and images. No tab-switching required.

译在ChatGPT内使用Runway生成并编辑视频与图像。 无需切换标签页。

Chubby♨️@kimmonismus · 6月16日59

Not gonna lie, the government accidentally did the best product marketing for routing tools.

译OrcaRouter 发布 DSL 路由工具,对标 OpenRouter 48 小时前推出的 Fusion。其宣称复活了已停止的 Fable 5(来自 Anthropic)级智能,且更便宜、开源、用户掌握密钥。针对 Fusion 的 synthesizer 在深度研究中表现优秀但编码能力差的问题,OrcaRouter 进行了修复:用户只需一个 prompt,即可扩展到任意 panel,经 judge 和 synthesizer 输出高质量答案,并用 YAML 自定义整个流程,实现完全可控。

ChatGPT@ChatGPTapp · 6月16日56

📌📌📌📌📌📌📌 You can now hover to pin chats and projects on web, then organize Recents however you like: together in one list or grouped by project

译现在您可以在网页上悬停来固定聊天和项目,然后按您喜欢的方式组织最近列表:统一放在一个列表或按项目分组。

OpenRouter@OpenRouter · 6月16日65

New Free capacity on OpenRouter, served by @eigenlabs's Darkbloom: gpt-oss-20b and Gemma 4 26B Start using the models today ↓

译OpenRouter 上新增免费容量,由 @eigenlabs 的 Darkbloom 提供:gpt-oss-20b 和 Gemma 4 26B。 今天就开始使用这些模型吧 ↓

Andrew Milich@milichab · 6月16日54

Use your SuperGrok or X @premium subscription inside Warp

译在Warp中使用你的SuperGrok或X Premium订阅

OpenRouter@OpenRouter · 6月15日32

Sneak peak of the new multimodal Rankings page 👀 Google's Veo 3.1 climbing the video leaderboard

译新多模态排名页面的预览 👀 Google 的 Veo 3.1 正在视频排行榜上攀升

🚨 AI News | TestingCatalog@testingcatalog · 6月15日32

Google is working on new controls for Personal intelligence, allowing users to manage what Gemini learns from them. Managed intelligence 👀

译Google正在为个人智能开发新控制功能,允许用户管理Gemini从他们那里学习的内容。

🚨 AI News | TestingCatalog@testingcatalog · 6月15日35

xAI is planning to transform Grok Tasks into Grok Automations. A new version will be able to use skills and will have a model selector.

译xAI 计划将 Grok Tasks 转变为 Grok Automations。新版本将能使用技能并配备模型选择器。

Baidu Inc.@Baidu_Inc · 6月15日53

DuMate just got more efficient. With its latest core engine upgrade, driven by optimizations to the Harness engine and related engineering workflows, DuMate can now complete the same tasks with 75% lower token consumption, without compromising task performance. For users, that means 75% lower credit consumption too.

译DuMate 变得更高效了。 凭借最新的核心引擎升级,通过对 Harness 引擎及相关工程工作流的优化,DuMate 现在能以降低 75% 的 token 消耗完成相同任务,且不影响任务性能。 对用户而言,这也意味着积分消耗降低 75%。

🚨 AI News | TestingCatalog@testingcatalog · 6月15日57

Cutback has launched Selects, an AI editing assistant for long-form that can video sync, organize, and cut raw footage. Selects analyzes both transcript and video to build a storyline from a prompt in minutes, with Cutback reporting around 60% less editing time per project. In testing by 5 professional editors, it cut raw footage into nearly the same edit they would have, with one noting it picked the same intro he had.

译Cutback发布Selects,一款面向长视频的AI编辑助手,支持视频同步、组织与原始素材剪辑。它同时分析转录和视频,几分钟内根据提示构建故事线,每个项目可减少约60%编辑时间。在5位专业编辑的测试中,Selects将原始素材剪辑成几乎与他们手动剪辑一致的版本,其中一位编辑指出它选了他自己使用的同一个开场。该工具被定位为从零为AI智能体重建的Premiere Pro(引用@thetomkim),并非简单的片段生成器,而是能理解素材并做出专业编辑认可剪辑的“真正编辑器”,已由Key & Peele、Beast Games等作品的编辑测试。

Chubby♨️@kimmonismus · 6月15日45

An AI editor and a pro editor cut the same 4-hour video project. They made the same cuts 84% of the time. Still their own test, and the last ~16% is where a human's judgment wins. But a draft in minutes at ~60% less prep sounds really exciting.

译一款基于Premiere Pro重构的AI视频编辑器,与专业剪辑师共同剪辑同一4小时视频项目,两者84%的剪辑操作相同。AI编辑器可在数分钟内完成草稿,节省约60%的准备工作时间。最后约16%的差异点仍需要人类判断。该工具在Key & Peele、Beast Games等项目幕后剪辑师中进行了测试。

Kimi.ai@Kimi_Moonshot · 6月15日51

🌘 Meet Kimi K2.7 Code HighSpeed! A high-speed mode of our latest open-source multimodal coding model, Kimi K2.7 Code. ⚡️ Up to 6× faster: Around 180 tok/s on coding tasks with median-length inputs, and up to 260 tok/s on shorter-context tasks. 🔷 Rolling out to Kimi Code Beta Program members, Kimi API developers, and Kimi Business users. (Access will remain limited for now due to capacity constraints.) 🔷 No invite needed. Anyone who joins the Beta Program has a chance to get access 👉 https://www.kimi.com/code/beta Open intelligence should be instant, affordable, and borderless. We'll continue improving the model and expanding access as more capacity becomes available! 🔗 Kimi Code: https://kimi.com/code 🔗 API: https://platform.kimi.ai/

译Kimi 开源多模态编程模型 Kimi K2.7 Code 推出高速模式 HighSpeed,编码任务中长输入可达约 180 tok/s,短上下文任务最高 260 tok/s,速度提升最多 6 倍。该模式已向 Kimi Code Beta Program 成员、API 开发者及商业用户开放(容量有限),无需邀请,加入 Beta 计划即有机会获得访问权限。Kimi 表示将继续优化模型并扩大接入。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月17日
03:55
swyx@swyx
50
Cursor/Graphite 的 TomasReimers 刚刚宣布了 Origin,这是 @cursor_ai 期待已久的 Git 竞争对手,可针对 agent 工作负载进行扩展,可通过 API 和 MCP 扩展,并内置合并冲突和协同故障 agent 解决功能。 颇具讽刺意味的是,SpaceX/AI/Cursor 在成立第一天就发布了一个"蓝色起源"产品 (就在 @JeffBezos 发布 Prometheus 之后)

swyx: Cursor/Graphite's @TomasReimers just announced Origin @cursor_ai's long awaited Git competitor, scalable for agent workl...

智能体MCP/工具产品更新编码
02:33
Ethan Mollick@emollick
65
Fable 对博尔赫斯《巴别图书馆》的实现,由 Opus 4.8 在其死后完成。非常忠实于原著。 这是多人游戏(其他人以幽灵形式出现)。你可以找到关键卷册,例如 GPT-1 的权重和图书馆模拟本身的代码:https://borges-library-of-babel.netlify.app/
产品更新现象/趋势
02:04
AYi@AYi_AInotes
28
仿人机器人无需像人。Eno 是 Genesis 的首款通用机器人--不是假装成人的机器,而是赋予身体的智能。它冷静、能干、乐于助人,将于今年 Q4 面市。

Genesis AI: Humanoid robots don't need to look human. Meet Eno, our first general-purpose robot. Not a machine pretending to be huma...

产品更新具身智能
02:02
Rohan Paul@rohanpaul_ai
65
Rohan Paul 指出,基于规则的混乱工作流正是 AI Agent 的领地。引用 Okara 官方消息,其发布全球首个网红营销 Agent:用户只需告知推广目标,该 Agent 即可自动发现创作者、联系沟通、管理活动、处理付款并上线内容,将机构工作转化为软件工作。访问 okara.ai/influencer 即可体验。

Okara: Today we're introducing the world's first influencer Agent. Tell it what you want to promote and it finds creators, reac...

智能体产品更新
01:24
swyx@swyx
54
Cursor/Graphite 的 @TomasReimers 刚刚宣布了 Origin,这是 @cursor_ai 期待已久的 Git 竞争对手,可扩展用于 AI 智能体工作负载,可通过 API 和 MCP 扩展,并内置了合并冲突和协作失败智能体解决方案。
MCP/工具产品更新编码
00:53
jason@jxnlco
51
codex 欧盟用户们! Chrome、电脑使用现在都在欧盟可用。 codex 现在可以跨你的 Mac 使用应用、在 Chrome
OpenAI产品更新编码
00:52
Jim Fan@DrJimFan
64
NVIDIA GEAR 实验室推出 ENPIRE:首次在物理世界启用 AutoResearch

NVIDIA GEAR 实验室首次在物理世界启用 AutoResearch,推出 ENPIRE 项目。给 8 个 Codex 智能体分配机器人舰队、GPU 和 token 预算,目标快速安全完成任务。人类退出后,机器人舰队自主学会寻找视觉线索、重置场景、练习新技能、调整控制栈、阅读论文、辩论反思。ENPIRE 能高精度完成扎带、整理细针、安装 GPU 等任务。发现物理扩展:8 机器人并行探索比少机器人效率显著提升。实验室部分可整夜自我改进,早上读取报告。所有内容将开源。

智能体产品更新具身智能开源生态
00:52
ClaudeDevs@ClaudeDevs
56
团队如何让 AI 智能体投入生产? 我们 Applied AI 团队的新博客文章,关于 Claude Managed Agents 及其解决的挑战(凭证、沙箱、可观测性等)…
智能体Anthropic产品更新
00:23
DogeDesigner@cb_doge
69
🚨 Grok 更新 🚨 现在你可以与 Grok 共享屏幕,并在语音模式下获得实时帮助。 只需点击窗口图标,选择共享屏幕,然后开始广播。
xAI产品更新多模态语音
00:23
Chubby♨️@kimmonismus
37
Ent 发布业内首个 intent-aware 工作空间安全平台,结束隐身模式。传统端点安全在数据外泄后扫描关键词告警,Ent 直接在设备端运行本地模型,实时理解会议参与者、屏幕内容,在屏幕共享前自动遮盖不应外露的信息。所有处理在设备本地完成,数据不离开边界。该产品来自 RiskIQ 与 Security Copilot 团队成员。

Ent: 🚀 We're out of stealth. Today we're introducing Ent, the industry's first intent-aware Workspace Security platform for ...

产品更新安全/对齐端侧
00:22
Satya Nadella@satyanadella
精选70
Copilot Cowork 现已全球正式可用,并支持多模型! 每个组织都可以让长期运行的智能体处理复杂的多步骤任务,基于你组织的独特知识和专有技术。 https://www.microsoft.com/en-us/microsoft-365/blog/2026/06/16/copilot-cowork-is-now-generally-available/?v=15
智能体Microsoft产品更新

推荐理由:Copilot Cowork 的正式上线让多模型代理真正进入企业工作流,不再只是演示,团队今天就可以开始部署长期运行的复杂任务代理。
00:22
OpenAI Developers@OpenAIDevs
42
本周,更多 Codex 功能正在欧洲各地推出。 我们正在将 Computer use、Codex Chrome 扩展、个性化记忆和 Chronicle 带给 EEA、英国和瑞士的 Codex 用户。
智能体OpenAI产品更新
00:22
Google Gemini@GeminiApp
64
Gemini 推出 Daily Brief AI 晨间助手

Gemini 应用推出名为 Daily Brief 的新 AI 智能体,用户可在起床前用它规划一天。官方提供三条使用建议:1)通过点赞或踩直接反馈,训练 Gemini 了解偏好;2)直接与 Gemini 对话,对简报内容提问或调整;3)点击简报项下方的“更多”按钮,查看 Gemini 引用的具体邮件、聊天或 Google 日历事件来源。目前该功能已上线,官方持续收集用户反馈以改进体验。

智能体Google产品更新
6月16日
23:31
Xiaomi MiMo@XiaomiMiMo
70
小米 MiMo 推出旗舰 AI 模型 MiMo Claw,集成金山办公(Kingsoft Office)。支持 Word、Excel、PowerPoint、PDF 等工作流,通过智能体实现可靠长任务执行,token 消耗比同类方案低 40-60%。每日免费使用时长从 1 小时扩展至 4 小时,全云端无需部署。限时订阅价 ¥14.9/月。

Xiaomi MiMo Developers: 🚀 MiMo Claw is LIVE Flagship AI Model + Kingsoft Office Integration 🤖 Unlock the Full Power of Agents • Powered by MiM...

智能体产品更新
关联讨论 2 条公众号:小米 MiMoIT之家(RSS)
23:28
Rohan Paul@rohanpaul_ai
61
Claude Code 开发者 Boris Cherny:用循环替代手动提示;neo-mcp 为 Claude Code 配备本地 AI 工程工人 Neo

Boris Cherny(Claude Code 开发者)表示不再手动提示 Claude,而是编写循环让循环工作。@withneo 新发布的 MCP 服务器 neo-mcp 为 Claude Code 配备了本地 AI 工程工人 Neo。Claude Code 可将复杂 AI/ML 任务委托给 Neo,由其实现代码、运行实验、评估结果、调试失败运行并返回完整执行轨迹。在基准测试中,Claude Code + NEO 将任务成本从 $1.96 降至 $0.74,运行时间缩短 37%,并将后端从 PyTorch 切换为 ONNX Runtime 以优化 CPU 执行。该 MCP 服务器支持连接 Claude Code、Cursor、VS Code 等客户端,编辑器控制对话,Neo 负责执行,Claude 专注于决策而非执行噪音。

智能体AnthropicMCP/工具产品更新
22:51
小互@xiaohu
51
看来 Claude 的语音模式即将推出 在设置页面可以设置语音语言和风格 而且支持中文,出乎意料 之前据说用的是 11Lab 的模型…
Anthropic产品更新语音
22:16
Elon Musk@elonmusk
19
由 Grok Imagine 制作
xAI产品更新视频
21:45
🚨 AI News | TestingCatalog@testingcatalog
50
ANTHROPIC 🔥:看起来语音模式升级已经开始在 Claude 移动应用中推出。语音模式将支持多语言! 这很可能只是更大升级前的第一步。即将出现的模型选择器外观可能预示着底层模型的改进。 除此之外,在最新的 iOS 构建版本中,语音模式图标新增了一个"电话"变体。有猫腻! 如果你已经拿到,测试一下吧 👀

Evinstein X: Did Anthropic update voice mode?! This is 100 times better than ChatGPT!!

Anthropic产品更新语音
21:16
凡人小北@frxiaobei
62
Codex CLI 新版本这个功能好, /import 从 Claude Code 导入:设置、配置和聊天记录, 挖墙脚继续。

Codex Changelog: 🚀 Codex CLI 0.140.0 is out! 📊 /usage: daily, weekly & cumulative token stats 📥 /import from Claude Code: setup, confi...

OpenAI产品更新编码
20:29
meng shao@shao__meng
60
LandingAI 推出 Agentic Document Extraction 的 Agent Skills

LandingAI 将 Agentic Document Extraction 升级为 Agent Skills,支持在 Codex、Claude Code、Cursor 等 coding agent 的对话中直接调用,实现零脚本文档处理流水线。两个 Skill 分工明确:document-extraction 提供结构化 Markdown/层级 JSON 解析、基于 JSON Schema/Pydantic 的字段抽取、按文档类型拆分、按页分类路由(预览)、目录生成(预览)、异步大文件处理(最高约 1GB/6000 页)及元素级坐标与置信度可视化;document-workflows 封装并行批处理、Classify→Extract 混合流水线、RAG 准备(语义分块、embedding、ChromaDB/FAISS)、DataFrame/CSV/Snowflake 导出、bbox 标注叠加及 Streamlit 交互 UI。安装命令:/plugin marketplace add landing-ai/ade-document-processing-skills。

LandingAI: Turn Claude Code into a Document Processing Agent! We just released Agentic Document Extraction (ADE) skills for AI codi...

智能体GitHubMCP/工具产品更新
14:35
Greg Brockman@gdb
40
我们刚为 ChatGPT 推送了更快、更流畅的照片附件体验!附件菜单现在可平滑过渡到相机,拍摄更迅速,选中的图片直接移入输入框,整个流程如同一个连续动作。优秀的用户体验影响巨大。

Naman Kedia: We just shipped a faster, more fluid photo attach experience in ChatGPT! The attach menu now transitions smoothly into t...

OpenAI产品更新多模态
09:38
小互@xiaohu
60
Claude 为 Agent SDK 和 claude -p 新增独立用量额度

自6月15日起,Claude 将 Agent SDK 和 claude -p 的用量从订阅套餐原有额度中剥离,每月额外提供一笔“专用零花钱”,其中 Pro 用户 $20、Max 5x 用户 $100,以此类推。该额度专门用于运行 claude -p、自写 Agent SDK 脚本或第三方 Agent App,不占用日常对话配额。额度用完后才扣其他费用,未用完不滚存下月;需手动领取一次后自动续期。

智能体Anthropic产品更新
09:19
meng shao@shao__meng
66
Vercel Labs 推出 HarnessAgent:为 Coding Agent 提供生成式 UI

Vercel Labs 利用 AI SDK 7 实验 API 推出 HarnessAgent,结合 json-render 为 Claude Code / Codex / Pi 等 Coding Agent 提供生成式 UI。Agent 在 Vercel Sandbox 隔离 Linux 环境中执行写文件、跑测试等真实操作,输出受 Zod schema 约束的 JSONL UI 规格(仅限 Steps、FileChange、Terminal 等预定义组件),前端通过 useChat + useJsonRenderMessage 实时渲染。核心设计:Harness 抽象允许像换模型一样互换 Agent;UI 层与执行层完全解耦;Session 绑定 Sandbox,10 分钟空闲或“Start Over” 销毁。Agent 不得虚构结果,失败必须展示 error step、非零 exit code 或失败测试。

Chris Tate: Introducing Generative UI for Claude Code, Codex and Pi Charts, forms, 3D, anything Your agent renders real UI for users...

智能体GitHubMCP/工具产品更新
09:03
🚨 AI News | TestingCatalog@testingcatalog
37
OPENAI 🔥: Codex 现在支持 Chrome DevTools 协议,可用于浏览器操作。这是一个巨大的超能力,将允许 Codex 检查并修改任何网站。 这仍是一个非常早期的实现,但我敢打赌,几年后这将成为浏览器的默认能力。如果网站通过 AI 加载,用户将能够即时自定义他们的用户体验。 这就是方向 👀
智能体MCP/工具OpenAI产品更新
08:07
Josh Woodward@joshwoodward
74
我们的麦克风图标在 Android 和 iOS 上变得更好用了!这对非英语使用者来说意义重大。 + 现已支持 70+ 种语言 + 可自由混用语言 + 无需更改语言设置 + 仍然不会打断你 :)
Google产品更新多模态语音
05:06
xAI@xai
47
你现在可以在 @warpdotdev 内使用你的 SuperGrok 或 X Premium 订阅。 从 Warp Agent 设置中试用,切换到 Grok Build 模型。
xAI产品更新编码
04:19
Rohan Paul@rohanpaul_ai
54
Factory 2.0 发布:AI 智能体接入完整软件工作流

FactoryAI 今日推出 Factory 2.0,将 AI 智能体与整个软件工作流打通——涵盖工单、客户请求、代码、测试、安全检查、代码审查、部署、文档和生产事故。系统强调反馈循环的重要性:每个事故和审查记录都应成为下一任务的训练信号。所有 bug 报告、客户请求、内部讨论、测试失败、安全警告和事故被视为单一循环内的信号,由智能体协助分类、编写代码、测试、审查、发布、监控生产环境,并将结果反馈回系统。这标志着从编码智能体向软件工厂的升级。

Factory: Today, we're announcing Factory 2.0: from coding agents to software factories.

智能体产品更新编码
04:02
MiniMax (official)@MiniMax_AI
44
.@CommandCodeAI 已添加 M3,17 日前免费。 一条 `npm install` 就出现在你的终端👇

Command Code: MiniMax M3 is now FREE in Command Code! We're partnering up with MiniMax. One of the best open models. LIVE NOW • all su...

MCP/工具产品更新
03:03
Runway@runwayml
61
在ChatGPT内使用Runway生成并编辑视频与图像。 无需切换标签页。
OpenAI产品更新图像生成视频
03:03
Chubby♨️@kimmonismus
59
OrcaRouter 发布 DSL 路由工具,对标 OpenRouter 48 小时前推出的 Fusion。其宣称复活了已停止的 Fable 5(来自 Anthropic)级智能,且更便宜、开源、用户掌握密钥。针对 Fusion 的 synthesizer 在深度研究中表现优秀但编码能力差的问题,OrcaRouter 进行了修复:用户只需一个 prompt,即可扩展到任意 panel,经 judge 和 synthesizer 输出高质量答案,并用 YAML 自定义整个流程,实现完全可控。

OrcaRouter 🐳: Fable 5 is dead. We just resurrected it - cheaper, open and you hold the keys. OpenRouter dropped Fusion 48h ago and bro...

MCP/工具产品更新开源/仓库
03:02
ChatGPT@ChatGPTapp
56
现在您可以在网页上悬停来固定聊天和项目,然后按您喜欢的方式组织最近列表:统一放在一个列表或按项目分组。
OpenAI产品更新
02:32
OpenRouter@OpenRouter
同事件精选65
OpenRouter 上新增免费容量,由 @eigenlabs 的 Darkbloom 提供:gpt-oss-20b 和 Gemma 4 26B。 今天就开始使用这些模型吧 ↓
产品更新部署/工程
同一事件,精选展示《OpenRouter 免费套餐更新:引入新模型维持可访问 AI 推理》
推荐理由:OpenRouter 免费层加了两个模型,其中一个名字暗示 Gemma 4,如果属实值得一看,否则就是一次普通的容量扩充,但对经常薅免费 API 的开发者来说多了选择。
00:59
Andrew Milich@milichab
54
在Warp中使用你的SuperGrok或X Premium订阅

Warp: You can now use the latest Grok models through your SuperGrok subscription directly in Warp. Grok Build 0.1 moves quickl...

MCP/工具xAI产品更新编码
6月15日
23:56
OpenRouter@OpenRouter
32
新多模态排名页面的预览 👀 Google 的 Veo 3.1 正在视频排行榜上攀升
Google产品更新多模态视频
23:51
🚨 AI News | TestingCatalog@testingcatalog
32
Google正在为个人智能开发新控制功能,允许用户管理Gemini从他们那里学习的内容。
Google产品更新安全/对齐
22:47
🚨 AI News | TestingCatalog@testingcatalog
35
xAI 计划将 Grok Tasks 转变为 Grok Automations。新版本将能使用技能并配备模型选择器。
智能体产品更新
22:24
Baidu Inc.@Baidu_Inc
53
DuMate 变得更高效了。 凭借最新的核心引擎升级,通过对 Harness 引擎及相关工程工作流的优化,DuMate 现在能以降低 75% 的 token 消耗完成相同任务,且不影响任务性能。 对用户而言,这也意味着积分消耗降低 75%。
产品更新推理
21:43
🚨 AI News | TestingCatalog@testingcatalog
57
Cutback发布Selects,一款面向长视频的AI编辑助手,支持视频同步、组织与原始素材剪辑。它同时分析转录和视频,几分钟内根据提示构建故事线,每个项目可减少约60%编辑时间。在5位专业编辑的测试中,Selects将原始素材剪辑成几乎与他们手动剪辑一致的版本,其中一位编辑指出它选了他自己使用的同一个开场。该工具被定位为从零为AI智能体重建的Premiere Pro(引用@thetomkim),并非简单的片段生成器,而是能理解素材并做出专业编辑认可剪辑的"真正编辑器",已由Key & Peele、Beast Games等作品的编辑测试。

Tom Kim: We rebuilt Premiere Pro from scratch for AI agents. Not a toy that generates clips. A real editor that watches footage, ...

产品更新视频
21:18
Chubby♨️@kimmonismus
45
一款基于Premiere Pro重构的AI视频编辑器,与专业剪辑师共同剪辑同一4小时视频项目,两者84%的剪辑操作相同。AI编辑器可在数分钟内完成草稿,节省约60%的准备工作时间。最后约16%的差异点仍需要人类判断。该工具在Key & Peele、Beast Games等项目幕后剪辑师中进行了测试。

Tom Kim: We rebuilt Premiere Pro from scratch for AI agents. Not a toy that generates clips. A real editor that watches footage, ...

产品更新视频评测/基准
18:43
Kimi.ai@Kimi_Moonshot
51
Kimi K2.7 Code HighSpeed 高速模式发布,6 倍加速

Kimi 开源多模态编程模型 Kimi K2.7 Code 推出高速模式 HighSpeed,编码任务中长输入可达约 180 tok/s,短上下文任务最高 260 tok/s,速度提升最多 6 倍。该模式已向 Kimi Code Beta Program 成员、API 开发者及商业用户开放(容量有限),无需邀请,加入 Beta 计划即有机会获得访问权限。Kimi 表示将继续优化模型并扩大接入。

产品更新开源生态编码
‹ 上一页
1…1213141516…50
下一页 ›