AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 2613 条
全部一手资讯X论文
标签「产品更新」清除
Rohan Paul@rohanpaul_ai · 6月24日67

The biggest weakness of AI agents: every useful run usually dies with the session. Imagine being able to turn an AI workflow into a desktop application that runs without consuming any tokens when restarted. i.e. non-technical users can create complete, deployable applications through natural language alone No programming background needed. Just open the app, describe what you need, done. No vibe-coding, instead it’s outcome-coding. Newly launched KroWork is turning an AI chat into a small desktop app you can reuse. Instead of getting a one-time answer, you get a workflow that can run again without rebuilding it. So with KroWork, you describe a task once, the AI agent builds the workflow, and then you can save it as software you actually keep. The conversation becomes something persistent, local, and reusable. Besides, it runs purely locally — your data never leaves your device. I want to monitor the market in real time and access stock information, but tools like Yahoo Finance, Seeking Alpha, and SEC filings are scattered, and paid tools with similar features are too expensive. KroWork can directly generate a reusable application to help me monitor the market for free. With just one command, installation and free deployment are complete.

译KroWork 新发布,解决 AI 智能体每次运行后会话即失效的痛点。用户用自然语言描述任务,AI 自动构建工作流并保存为可重用的桌面应用,无需编程背景。应用完全本地运行,数据不出设备。相比一次性回答,它生成持久、可复用的软件——例如一句指令即可生成免费市场监控应用,替代分散的付费工具。KroWork 将“氛围编码(vibe-coding)”转变为“结果编码(outcome-coding)”。

🚨 AI News | TestingCatalog@testingcatalog · 6月24日64

Latitude is released as an open-source, MIT-licensed platform for monitoring AI agents in production, letting users surface what an agent does once it meets real users, catch recurring failures, and route fixes back into the editor. Users can cluster thousands of live conversations into a single view of what people ask for and where they drop off, with plain-English search across every trace. AI observability 👀

译Latitude 以 MIT 许可证开源发布,用于监控生产环境中的 AI 智能体。平台可揭示智能体与真实用户交互时的行为、捕获重复失败,并将修复反馈回编辑器。用户能将数千条实时对话聚类为单一视图,了解用户需求与流失点,并支持纯英文搜索所有 trace。引用指出:AI 智能体的对话是企业最被低估的数据源,Latitude 改变了这一现状。

🚨 AI News | TestingCatalog@testingcatalog · 6月23日58

OPENAI 🔥: Bidi 1, an upcoming voice model from OpenAI, can sing and generate different sounds too. Some samples below 👀

译OpenAI 即将推出双向语音模型 Bidi 1,支持唱歌和生成不同声音。Bidi 1 可在用户说话时插话并继续监听,能在句子中间来回切换任务,处理打断和停顿的能力显著提升,并能更好地保持对话上下文记忆。模型仍有连续说话长度上限(一次可轻松数到 23 不停顿)。Bidi 1 将登陆 ChatGPT,并可能进入 Codex,预计很快可用。

Berryxia.AI@berryxia · 6月23日54

AI把“做出东西”变得容易了,但把东西做得真正优秀,反而更难了。 Paul Bakaus今天宣布成立Renaissance Geek(Impeccable背后的公司),拿了a16z的钱,还和GitHub达成合作。 他核心的观点是:AI已经把地板抬高了(第一稿变容易),但天花板并没有被自动抬高。 真正优秀的工作,依然来自清晰的意图、 无休止的迭代……判断力和craft,而不是单纯的循环制胜。 他把这个方向叫“增强工艺”——让人类深度参与智能体循环的最后20%,而不是把人彻底踢出去。 天衣无缝的设计就是这个理念的第一个产品:给AI coding agent一套设计词汇表,让它在真实代码库里做视觉迭代,而不是只在聊天里生成slop。 更重要的是,他提出了“文艺复兴极客”这个新人群画像:T型通才 + 高品味 + 高主动性 + 强好奇心的人。 AI让他们能跨领域移动,而他们的taste和判断力,正是AI目前最缺的东西。 这篇文章把当前AI工具界的两种路径说得很清楚: 一条是继续堆地板(让更多人能做出东西),另一条是认真抬天花板(让真正有品味的人能做出更好的东西)。 他选择后者。 我翻译了一下中文,感兴趣可以看看。

译Paul Bakaus 宣布成立 Renaissance Geek(Impeccable 母公司),获 a16z 投资并与 GitHub 合作。他认为 AI 降低了创作门槛,但未自动提高上限;真正优秀的工作仍需清晰意图、迭代、判断力与工艺。公司方向为“增强工艺”——让人类深度参与智能体循环的最后 20%。首款产品 Impeccable 为 AI coding agent 提供设计词汇表,支持在真实代码库视觉迭代,避免低质量输出。同时提出“文艺复兴极客”画像:T 型通才、高品味、高主动性、强好奇心,AI 赋能其跨领域移动,而品味与判断力是 AI 最稀缺的能力。

Rohan Paul@rohanpaul_ai · 6月23日66

AI agents are coming to each and every workflow. Templafy just launched a AI PowerPoint Agent that turns prompts and source files into real, editable .pptx decks. The product is aimed at the boring failure point of AI slide tools: a deck may look finished, but it often breaks when a team edits it in PowerPoint, applies brand rules, updates charts, or sends it through legal. You give it a prompt, choose the theme and depth, add source files when needed, review the outline, and get a deck that can still be edited where work actually happens. free, in the browser, no signup.

译Templafy 推出 AI PowerPoint Agent,用户只需输入提示词、选择主题与深度、添加源文件并审核大纲,即可生成可直接编辑的 .pptx 演示文稿。该工具旨在解决现有 AI 幻灯片工具在编辑、品牌规则应用、图表更新和法律审核环节的易用性问题。产品完全免费、在浏览器中使用,无需注册。引用推文显示本次升级新增聊天历史、自定义颜色和可编辑图表功能,进一步提升了灵活性和创作效率。

elvis@omarsar0 · 6月23日65

Microsoft Teams just crossed a line I did not expect this year. It now runs an AI employee that does the work, not one that answers questions. Here is what is new:

译Microsoft Teams 刚刚跨过了一条我今年没预料到的界限。 它现在运行一个 AI 员工,这个员工能完成工作,而不是回答问题的员工。 以下是新内容:

Mistral AI@MistralAI · 6月23日54

Introducing Mistral OCR 4. It creates structure with bounding boxes, block classification, and inline confidence scores in 170 languages. 🧵👇

译推出 Mistral OCR 4。它通过边界框、块分类和内联置信度评分在170种语言中创建结构。 🧵👇

Kling AI@Kling_ai · 6月23日14

Your next opponent is you.

译你的下一个对手是你自己。

elvis@omarsar0 · 6月23日64

Most AI code review tools look at one repo at a time. But the bug usually isn't in the code that changed. It's in what that change quietly breaks three repos away. @QodoAI just shipped Cross Repo Review to solve this. I tested it on my own repos. Here's what it caught.

译大多数 AI 代码审查工具一次只看一个仓库。 但 bug 通常不在被修改的代码里。而是在那次修改悄悄破坏的三个仓库之外。 @QodoAI 刚刚推出了跨仓库审查来解决这个问题。 我在自己的仓库上测试了它。这是它发现的问题。

Kling AI@Kling_ai · 6月23日18

Your next opponent is you.

译你的下一个对手是你。

PixVerse@PixVerse_ · 6月23日36

A lost human. A tiger warrior. A rhino guardian. A giraffe scholar. A desert frog. Drifters is a weird, wonderful found-family adventure from PixVerse Originals. @ruangideai built it solo on PixVerse, turning impossible worlds into one warm journey home. RT+Follow+Reply "Drifters" = 150 Creds & Full Film in DMs (48H ONLY)

译一个迷失的人类。一只老虎战士。一只犀牛守护者。一只长颈鹿学者。一只沙漠青蛙。 《Drifters》是一部来自 PixVerse Originals 的奇特而温馨的寻家冒险故事。 @ruangideai 独自在 PixVerse 上构建了它,将不可能的世界变成了一段温暖的归家之旅。 转发+关注+回复“Drifters”= 150 Credits 及完整影片私信(仅限48小时)

AYi@AYi_AInotes · 6月23日73

全网都在吹日本Fugu跑分超GPT,但我敢说99%的人没看懂它真正炸场的地方。 首先这玩意儿根本不是什么超大单体大模型, 它全身上下只有0.6B参数,本职工作就其实就是个AI项目经理, 简单任务自己处理,复杂任务自动拆分,从全球顶级模型池里挑最合适的选手,分配思考执行验证三种角色,多轮协作最后合成答案。 你调用它和调普通模型没区别,一行API的事, 但背后的编排策略是训练出来的,不是人手写prompt调路由磨出来的,它可以发掘出人类根本想不到的协作模式。 我觉得最狠的还不是跑分超了Claude和GPT,关键是它直接绕开了scaling law的军备竞赛。 不用堆万亿参数,不用砸超算中心,靠更聪明的协作机制就能摸到前沿模型的天花板,AI的竞争第一次从拼参数变成了拼管理。 当然不是银弹,比如黑箱不透明,复杂任务延迟更高,简单题用它反而更贵。 但这件事的信号意义比跑分数字重要一百倍,意味着多智能体编排从实验室玩具正式变成了可用的生产力工具。 orchestration layer这条新赛道,今天正式开跑咯🚀

译日本团队 Sakana AI 推出 Fugu(Fugu Ultra),一个仅 0.6B 参数的多智能体编排系统,通过统一 API 调用。它不是单体大模型,而是 AI“项目经理”:简单任务自处理,复杂任务自动拆分,从全球模型池选择模型分配思考、执行、验证角色,多轮协作输出答案。编排策略由训练生成,而非手工 prompt。Fugu Ultra 在多个基准上超过 Claude 和 GPT,性能匹敌 Fable 和 Mythos,绕开 scaling law 军备竞赛。缺点包括黑箱性、复杂任务延迟高、简单任务成本更高。此举标志着多智能体编排从实验室走向可用生产力工具,开启编排层赛道。

PixVerse@PixVerse_ · 6月23日60

The frame cuts off half the scene. Cropping again is not the answer. Magic Extend on PixVerse Web outpaints the missing space — subject stays, background fills in. RT+Follow+Reply=300Creds in dm (72H ONLY)

译画面被裁掉一半。再次裁剪不是解决办法。 PixVerse Web 上的 Magic Extend 可以补全缺失的空间——主体保持不变,背景被填充。 转推+关注+回复=300Creds 私信(仅 72 小时)

Alibaba Cloud@alibaba_cloud · 6月23日56

🚀 Coding Agent 2.0: From Personal Tool to Organization System ꔷ Sandbox isolation & session recovery ꔷ Long-term memory & multi-channel access ꔷ Prevent quota burn & ensure safety Build production-grade agents with AgentScope Harness. https://int.alibabacloud.com/m/1000414751/ #AgentScope #CodingAgent #LLMOps #OpenSource #AIEngineering #Java

译🚀 Coding Agent 2.0:从个人工具到组织系统 ꔷ 沙箱隔离与会话恢复 ꔷ 长期记忆与多渠道访问 ꔷ 防止配额消耗并确保安全 使用 AgentScope Harness 构建生产级智能体。 https://int.alibabacloud.com/m/1000414751/ #AgentScope #CodingAgent #LLMOps #OpenSource #AIEngineering #Java

Alibaba Cloud@alibaba_cloud · 6月23日55

🚀 Coding Agent 2.0: From Personal Tool to Organization System ꔷ Sandbox isolation & session recovery ꔷ Long-term memory & multi-channel access ꔷ Prevent quota burn & ensure safety Build production-grade agents with AgentScope Harness. https://int.alibabacloud.com/m/1000414751/ #AgentScope #CodingAgent #LLMOps #OpenSource#AIEngineering #Java

译🚀 Coding Agent 2.0:从个人工具到组织系统 ꔷ 沙箱隔离与会话恢复 ꔷ 长期记忆与多通道访问 ꔷ 防止配额燃烧并确保安全 使用 AgentScope Harness 构建生产级智能体。 https://int.alibabacloud.com/m/1000414751/ #AgentScope #CodingAgent #LLMOps #OpenSource#AIEngineering #Java

Chubby♨️@kimmonismus · 6月23日37

OpenAI’s new upcoming „bidi“-voice mode sounds insane!

译OpenAI即将推出的“bidi”语音模式听起来太疯狂了!

Alibaba Cloud@alibaba_cloud · 6月23日39

🏎️ Welcome to the Autopilot Agent Arena! Your challenge is to automate real-world business workflows end-to-end to win your share of the $70,000+ prize pool. 🔗 Register now: https://click.qwencloud.com/m/20000000281/

译🏎️ 欢迎来到 Autopilot Agent Arena!你的挑战是端到端自动化真实世界的商业工作流,赢取 $70,000+ 奖金池。 🔗 立即注册:https://click.qwencloud.com/m/20000000281/

凡人小北@frxiaobei · 6月23日49

火山引擎 FORCE 大会现场看到个有意思的硬件,YoooClaw C-ONE,一张卡片大小的「AI 记忆卡」。 它干两件事: 一是录音。开会、聊天,声音进去,转文字。 二是抓收集通知。只要你开了通知权限,手机上来的每条消息它都能拿到,实时喂进去。 两路信息都汇到火山的 ArkClaw 做抽取和推理,中间那个龙虾,就是个一直被喂个人上下文的大脑。理论上知识会越来越丰富,龙虾也会越来越懂你。 最有意思的是出口端,它跟飞书打通了。 他们讲了个场景:老板跟投资人开完会,一句话,就把每个人接下来该干啥,分别发到了对应同事的飞书上。 这个应该是除了 seedance2.5,我今天看到的另一个心动的产品。

译火山引擎在FORCE大会上展示YoooClaw C-ONE,一款卡片大小的「AI记忆卡」。它能录音转文字,也能抓取手机通知实时喂入,两路数据汇入火山引擎的ArkClaw做抽取和推理,形成个人知识大脑。出口端打通飞书,例如老板开完会后一句话即可将任务分别推送给对应同事。推文作者称这是除seedance2.5外今次最心动的产品。

X.PIN@thexpin · 6月23日62

We got early access to WeChat's new AI assistant "Xiaowei" and ran an initial test. Xiaowei says it's built by the WeChat team, runs on their in-house Chinese LLM WeLM, with DeepSeek handling some responses. Users activate it manually. From there, Xiaowei can set calendar events, send messages, make calls, generate playlists, and spin up mini-programs — WeChat's lightweight in-app tools. It can wake up Meituan for food delivery or http://JD.com for shopping, but the final payment — including transfers and red packets — requires the user to tap through manually. Privacy: chat messages are read for the current session only — not saved, not used for training. Context memory can be disabled manually. The stakes are high. Tencent's top LLM development trails ByteDance and Alibaba, making WeChat — 1B+ users — its most critical AI launch surface. Alipay is already testing AI agents with vehicle booking and food delivery.

译作者抢先体验了微信AI助手“小微”。小微基于腾讯自研中文大模型WeLM,部分响应由DeepSeek处理。用户手动激活后,可设置日程、发消息、打电话、生成歌单、启动小程序,并能唤醒美团外卖和京东购物,但转账、红包等最终支付需手动确认。隐私方面:聊天信息仅当前会话读取,不保存、不用于训练,上下文记忆可手动关闭。微信拥有超10亿用户,而腾讯在大模型领域落后于字节和阿里,因此微信成为其最重要的AI落地窗口。支付宝也已在测试具备车辆预约和外卖配送能力的AI智能体。

jason@jxnlco · 6月23日13

codex is for everyone.

译Codex 面向所有人。

向阳乔木@vista8 · 6月23日35

今天在国家会议中心参加火山引擎活动。 又是全国AI圈朋友聚会的好日子。 Seeddance 2.5 还是最受期待,7月份上,价格还没说。 Seedream 5.0 Pro的编辑能力不错,支持箭头,高亮区块编辑。

译火山引擎活动透露,Seeddance 2.5 是全场最受期待的产品,预计 7 月上线,价格尚未公布。同时展示的 Seedream 5.0 Pro 编辑能力提升,支持箭头和高亮区块编辑。

小互@xiaohu · 6月23日29

字节跳动今天将在2026火山引擎大会上 发布 Seedance2.5 我马上到会场了 给你们播报 发布的还有全新的豆包seed2.1模型,据说能力达到Opus4.6水平,还有全新的图像模型Seeddream 5.0…

译字节跳动今日在 2026 火山引擎大会上发布 Seedance2.5,同时推出全新豆包 Seed2.1 模型,声称能力达 Opus4.6 水平,以及新款图像模型 Seeddream 5.0。具体参数、性能分数及定价信息尚未公布。

🚨 AI News | TestingCatalog@testingcatalog · 6月23日33

BREAKING 🔥: OpenAI is preparing "Bidi 1" for the upcoming web release! > A new voice model will be available in settings, alongside standard and advanced options. > Voice mode bubble will have a Yellow color instead of blue. How soon? 👀

译BREAKING 🔥: OpenAI 正在准备“Bidi 1”即将网络发布! > 一种新的语音模型将在设置中可用,与标准和高级选项并列。 > 语音模式气泡将变为黄色而不是蓝色。 多久?👀

meng shao@shao__meng · 6月23日59

AI:你永远想象不到人类对可视化的执念?! 前不久 Claude Code 开发者 @trq212 发布了 Using Claude Code: The Unreasonable Effectiveness of HTML https://x.com/trq212/status/2052809885763747935 用 HTML 代替 Markdown 来给人类做解释,今天 @HeyGen 甚至把它做成了视频「pr-to video Skill」 https://x.com/trq212/status/2052809885763747935 Markdown -> HTML -> Video 人类的最佳信息输入源,真的是视频吗?这么说,我要把荒废了很久的视频内容重新做起来了!

译继 Claude Code 开发者用 HTML 代替 Markdown 向人类解释模型输出后,HeyGen 为其 HyperFrames 平台推出新技能 pr-to-video。智能体可将无人阅读的 Pull Request(PR)直接转化为简短解释性视频,用户可通过命令 `npx skills add heygen-com/hyperframes` 添加该技能。作者感叹视频或为人类最佳信息输入源,并表示将重启视频内容。

xAI@xai · 6月23日45

You can now connect Grok to Interactive Brokers, delivering high quality, up-to-date information on your portfolio

译你现在可以将Grok连接到Interactive Brokers,获取关于你投资组合的高质量、最新信息。

🚨 AI News | TestingCatalog@testingcatalog · 6月23日52

Flashcards are now editable on NotebookLM 👀 Users can adjust the text of questions and answers, plus add new cards to the stack. FlashcardLM ⚡

译Flashcards are now editable on NotebookLM 👀 用户可调整问题和答案的文本,还能向卡片组添加新卡片。 FlashcardLM ⚡

elvis@omarsar0 · 6月23日48

OMG! Fugu Ultra is ridiculously good at these 3D renders.

译天哪!Fugu Ultra 在这些 3D 渲染中表现得极其出色。

Elon Musk@elonmusk · 6月23日31

Grok Build upgrades

译Grok Build 升级

Runway@runwayml · 6月23日57

Change the aspect ratio of a video to to fit any platform. Aleph 2.0 expands the scene to fit the new aspect ratio so your video looks like it was filmed that way from the start. Learn how in today's Runway Academy.

译改变视频的宽高比以适应任何平台。Aleph 2.0 扩展场景以适配新的宽高比,让你的视频看起来从一开始就是那样拍摄的。在今天的 Runway Academy 中了解操作方法。

Google Gemini@GeminiApp · 6月23日31

Gemini Spark is your 24/7 personal AI agent, handling the heavy lifting from start to finish under your direction. Here are some ways our team has been using Gemini Spark to make their lives easier and more productive. 🧵

译Gemini Spark 是您的 24/7 个人AI智能体,在您的指导下从头到尾处理繁重工作。 以下是我们团队使用 Gemini Spark 让生活更轻松、更高效的一些方式。🧵

OpenCode@opencode · 6月23日23

we've added unique user rankings some models are token heavy so they skew upwards in rankings - unique people using the model is a more accurate ranking we'll orient more of our data around this metric

译我们已添加独立用户排名 某些模型 token 消耗大,导致它们在排名中偏高——使用模型的独立用户数是更准确的排名 我们将围绕这一指标调整更多数据

Greg Brockman@gdb · 6月23日51

Codex Security plugin for security teams: deep scans, validating findings, tracing attack paths, building threat models, generating codebase-specific patches for review, and exporting into other tools: https://openai.com/daybreak/codex-security-plugin/

译面向安全团队的 Codex Security 插件:深度扫描、验证发现、追踪攻击路径、构建威胁模型、生成针对代码库的补丁以供审查,以及导出到其他工具:https://openai.com/daybreak/codex-security-plugin/

NotebookLM@NotebookLM · 6月23日60

Flashcards are now fully customizable. Edit questions, tweak answers, and add brand-new cards to create the ultimate set of study tools. Share them with your friends, classmates, academic rivals, etc— just be prepared for the endless shower of praise and accolades that follows.

译Flashcards 现已完全可自定义。编辑问题、调整答案、添加新卡片,打造终极学习工具集。 与朋友、同学、学术竞争对手等分享——只需准备好迎接随之而来的无尽赞美与赞誉。

Logan Kilpatrick@OfficialLoganK · 6月23日73

Today we are shipping the Interactions API into GA, our new API designed to let you orchestrate across models and agents in the same interface, and is our new default API going forward. Interactions sets the stage for the new era of Agents : ) https://x.com/GoogleAIStudio/status/2069108412453908791?s=20

译今天我们将 Interactions API 推向 GA,这是我们设计的新 API,可让您在同一个界面中编排跨模型和智能体,并将成为我们未来的默认 API。Interactions 为智能体新时代奠定了基础。

Chubby♨️@kimmonismus · 6月23日61

OpenAI is practically calling for regulation by the US government. Jokes aside: GPT Cyber ​​New outperforms Claude Mythos on CyberGym.

译OpenAI 宣布扩展 Daybreak 项目,旨在以机器速度民主化修复脆弱软件。主要发布包括:Codex Security 插件(在 Codex 内发现、验证并修复漏洞);完整版 GPT-5.5-Cyber 模型(面向受信防御者的安全专用模型);Cyber Partner Program(支持安全公司基于 OpenAI 顶级网络能力构建产品);以及 Patch the Planet(与维护者合作保护关键开源项目)。据主推文称,GPT-5.5-Cyber 在 CyberGym 基准上表现优于 Claude Mythos。

Greg Brockman@gdb · 6月23日61

We're accelerating patching, in addition to vuln finding, with new tools and models in OpenAI Daybreak. Our models are now discovering and generating patches for critical vulns in major browsers, network infrastructure, and operating systems (such as FreeBSD and the Linux kernel), and patching projects like cURL, Go, Python, Sigstore, and pyca/cryptography. Working together with partners and the ecosystem to help secure the world's software:

译Greg Brockman 宣布 OpenAI Daybreak 加速漏洞发现与修复。模型已能发现并生成针对主流浏览器、网络基础设施、FreeBSD 和 Linux 内核等操作系统,以及 cURL、Go、Python、Sigstore、pyca/cryptography 等项目的关键漏洞补丁。同时扩展 Daybreak 项目:推出 Codex Security 插件(在 Codex 内发现、验证、修复漏洞);发布完整版 GPT-5.5-Cyber 模型;启动 Cyber Partner Program(为安全公司提供顶级网络能力产品);推出 Patch the Planet(与维护者合作保护关键开源项目)。

Google AI Developers@googleaidevs · 6月23日62

The Interactions API is now GA. Featuring a stable schema and new capabilities via a single /interactions endpoint, it is now our standard interface for both model inference and autonomous agents. Check out the key updates: — Managed Agents: Spin up a secure, remote Linux sandbox for code execution and browsing via a single API call, using the default antigravity-preview-05-2026 agent or your own custom instructions — Simplified Schema: Every action is now represented as its own step (from user_input to model_output, etc.) in a simplified, linear flow — Background Execution: Set background=True to run models and agents asynchronously, letting you poll for results when ready — Expanded Tool Ecosystem: Native support for Computer Use, File Search, and Google Maps, alongside new agent-building tools like the Gemini API Docs MCP server and gemini-interactions-api Skill — Media Generation: Image generation via Google Search-grounded Nano Banana 2, music with Lyria 3, and expressive multi-speaker TTS Read the blog to learn more: https://blog.google/innovation-and-ai/technology/developers-tools/interactions-api-general-availability/

译Google Interactions API 现已正式可用(GA),通过统一 `/interactions` 端点提供稳定 schema,同时支持模型推理与自主智能体。关键更新包括:Managed Agents — 单次 API 调用即可启动安全远程 Linux 沙箱进行代码执行与网页浏览,默认使用 `antigravity-preview-05-2026` 智能体或自定义指令;简化 schema — 每个操作作为独立 step 形成线性流;后台执行 — 设置 `background=True` 实现异步运行并轮询结果;扩展工具生态 — 原生支持 Computer Use、File Search、Google Maps,新增 Gemini API Docs MCP server 与 gemini-interactions-api Skill;媒体生成 — 基于 Google Search 的 Nano Banana 2 图像生成、Lyria 3 音乐生成及多说话人 TTS。

OpenAI@OpenAI · 6月23日60

We’re expanding OpenAI Daybreak to help democratize patching vulnerable software at machine speed: - Codex Security plugin: find, validate, and fix vulnerabilities right inside Codex - The full version of GPT-5.5-Cyber model: a great model for trusted defenders - Cyber Partner Program: powering products built on top of our best cyber capabilities for leading security companies to secure the world's software - Patch the Planet: working with maintainers to secure critical open source projects https://openai.com/index/daybreak-securing-the-world/

译OpenAI 宣布扩展 Daybreak 项目,以机器速度民主化修补易受攻击的软件。具体包括:推出 Codex Security 插件,可在 Codex 内查找、验证和修复漏洞;发布完整版 GPT-5.5-Cyber 模型,专为可信防御者设计;启动 Cyber Partner Program,支持领先安全公司基于 OpenAI 最佳网络能力构建产品;以及 Patch the Planet,与维护者合作保护关键开源项目。

Chubby♨️@kimmonismus · 6月23日43

Most AI agents reset the moment a task ends: you prompt, it runs, the context is gone. Delos Workers is built on the opposite assumption: Each agent keeps a standing identity and persistent memory, with its own email, phone number and Slack handle, so it carries context between tasks the way a colleague does instead of starting cold every time. That changes where the agent sits. It stops being a tool you open and becomes something addressable inside the org chart, reachable directly by anyone on the team. Curious to see how the autonomy holds up at launch!

译Delos Workers 突破传统 AI 智能体每次任务后重置上下文的限制,为每个智能体保留持久身份和记忆,独立拥有邮箱、电话和 Slack 句柄,能在任务间传递上下文,从而成为组织架构中可直接寻址的成员。引用 @pierre_dlgr 称其为“无限 AI 员工”,数天内实现 100 万美元 ARR,旨在取代邮件回复、CRM 更新等流程化知识工作。

Rohan Paul@rohanpaul_ai · 6月23日57

Delos just launched Workers. Turns AI agents into always-available digital employees with their own email, phone, Slack, Teams, computer, memory, and company-specific training. Delos says each worker is trained on one business, so the system learns the company’s routines, tools, vocabulary, permissions, and handoff patterns instead of acting like a generic assistant dropped into a random workplace. The key point is the persistent identity plus long-term memory, because an AI employee only becomes useful if people can contact it like a coworker and trust it to remember past decisions, open loops, customer context, and internal procedures.

译Delos发布Workers,将AI智能体转化为拥有专属邮箱、电话、Slack、Teams、电脑、记忆及公司训练的“数字员工”。每个Worker针对单一企业训练,学习其常规、工具、词汇、权限和交接模式。核心是持久身份与长期记忆,使同事可像联络人类同事一样找到它,并信任其记住过往决策与客户上下文。引用推文透露上线数天内已实现100万美元ARR,指出大多数知识工作本不该存在——大量工作仅为流程(回复邮件、跟进、更新CRM等),而Workers能像人类队友一样跨组织执行任务,软件与劳动力界限消失。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月24日
00:16
Rohan Paul@rohanpaul_ai
67
KroWork:AI对话秒变可重用桌面应用

KroWork 新发布,解决 AI 智能体每次运行后会话即失效的痛点。用户用自然语言描述任务,AI 自动构建工作流并保存为可重用的桌面应用,无需编程背景。应用完全本地运行,数据不出设备。相比一次性回答,它生成持久、可复用的软件——例如一句指令即可生成免费市场监控应用,替代分散的付费工具。KroWork 将“氛围编码(vibe-coding)”转变为“结果编码(outcome-coding)”。

智能体产品更新端侧部署/工程
00:08
🚨 AI News | TestingCatalog@testingcatalog
64
Latitude 以 MIT 许可证开源发布,用于监控生产环境中的 AI 智能体。平台可揭示智能体与真实用户交互时的行为、捕获重复失败,并将修复反馈回编辑器。用户能将数千条实时对话聚类为单一视图,了解用户需求与流失点,并支持纯英文搜索所有 trace。引用指出:AI 智能体的对话是企业最被低估的数据源,Latitude 改变了这一现状。

cesar.wtf: Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...

智能体产品更新开源生态
6月23日
23:38
🚨 AI News | TestingCatalog@testingcatalog
58
OpenAI 即将推出双向语音模型 Bidi 1,支持唱歌和生成不同声音。Bidi 1 可在用户说话时插话并继续监听,能在句子中间来回切换任务,处理打断和停顿的能力显著提升,并能更好地保持对话上下文记忆。模型仍有连续说话长度上限(一次可轻松数到 23 不停顿)。Bidi 1 将登陆 ChatGPT,并可能进入 Codex,预计很快可用。

🚨 AI News | TestingCatalog: BREAKING 🔥: First tests of "Bidi 1", an upcoming bidirectional voice model from OpenAI. This upgrade will arrive in Cha...

OpenAI产品更新语音
23:16
Berryxia.AI@berryxia
54
Paul Bakaus 成立 Renaissance Geek:获 a16z 投资,与 GitHub 合作推"增强工艺"路线

Paul Bakaus 宣布成立 Renaissance Geek(Impeccable 母公司),获 a16z 投资并与 GitHub 合作。他认为 AI 降低了创作门槛,但未自动提高上限;真正优秀的工作仍需清晰意图、迭代、判断力与工艺。公司方向为“增强工艺”——让人类深度参与智能体循环的最后 20%。首款产品 Impeccable 为 AI coding agent 提供设计词汇表,支持在真实代码库视觉迭代,避免低质量输出。同时提出“文艺复兴极客”画像:T 型通才、高品味、高主动性、强好奇心,AI 赋能其跨领域移动,而品味与判断力是 AI 最稀缺的能力。

Berryxia.AI: http://x.com/i/article/2069426743950417920

智能体GitHub产品更新编码
23:15
Rohan Paul@rohanpaul_ai
66
Templafy 发布免费 AI PowerPoint Agent

Templafy 推出 AI PowerPoint Agent,用户只需输入提示词、选择主题与深度、添加源文件并审核大纲,即可生成可直接编辑的 .pptx 演示文稿。该工具旨在解决现有 AI 幻灯片工具在编辑、品牌规则应用、图表更新和法律审核环节的易用性问题。产品完全免费、在浏览器中使用,无需注册。引用推文显示本次升级新增聊天历史、自定义颜色和可编辑图表功能,进一步提升了灵活性和创作效率。

Templafy: Our free PowerPoint Agent just got a big upgrade! Now with: 💬 Chat history 🎨 Custom colors 📊 Editable charts Create p...

智能体产品更新
22:50
elvis@omarsar0
65
Microsoft Teams 刚刚跨过了一条我今年没预料到的界限。 它现在运行一个 AI 员工,这个员工能完成工作,而不是回答问题的员工。 以下是新内容:
智能体Microsoft产品更新
22:11
Mistral AI@MistralAI
54
推出 Mistral OCR 4。它通过边界框、块分类和内联置信度评分在170种语言中创建结构。 🧵👇
产品更新多模态
21:36
Kling AI@Kling_ai
14
你的下一个对手是你自己。
产品更新视频
21:19
elvis@omarsar0
64
大多数 AI 代码审查工具一次只看一个仓库。 但 bug 通常不在被修改的代码里。而是在那次修改悄悄破坏的三个仓库之外。 @QodoAI 刚刚推出了跨仓库审查来解决这个问题。 我在自己的仓库上测试了它。这是它发现的问题。
产品更新编码
21:06
Kling AI@Kling_ai
18
你的下一个对手是你。
产品更新
20:11
PixVerse@PixVerse_
36
一个迷失的人类。一只老虎战士。一只犀牛守护者。一只长颈鹿学者。一只沙漠青蛙。 《Drifters》是一部来自 PixVerse Originals 的奇特而温馨的寻家冒险故事。 @ruangideai 独自在 PixVerse 上构建了它,将不可能的世界变成了一段温暖的归家之旅。 转发+关注+回复"Drifters"= 150 Credits 及完整影片私信(仅限48小时)
产品更新视频
19:11
AYi@AYi_AInotes
73
Sakana AI 发布 Fugu:0.6B 参数多智能体编排系统,性能超 Claude 和 GPT

日本团队 Sakana AI 推出 Fugu(Fugu Ultra),一个仅 0.6B 参数的多智能体编排系统,通过统一 API 调用。它不是单体大模型,而是 AI“项目经理”:简单任务自处理,复杂任务自动拆分,从全球模型池选择模型分配思考、执行、验证角色,多轮协作输出答案。编排策略由训练生成,而非手工 prompt。Fugu Ultra 在多个基准上超过 Claude 和 GPT,性能匹敌 Fable 和 Mythos,绕开 scaling law 军备竞赛。缺点包括黑箱性、复杂任务延迟高、简单任务成本更高。此举标志着多智能体编排从实验室走向可用生产力工具,开启编排层赛道。

Sakana AI: Introducing Sakana Fugu: A full multi-agent orchestration system accessible via a single model API. Our 'Fugu Ultra' mod...

智能体产品更新部署/工程
19:11
PixVerse@PixVerse_
60
画面被裁掉一半。再次裁剪不是解决办法。 PixVerse Web 上的 Magic Extend 可以补全缺失的空间--主体保持不变,背景被填充。 转推+关注+回复=300Creds 私信(仅 72 小时)
产品更新图像生成视频
17:16
Alibaba Cloud@alibaba_cloud
56
🚀 Coding Agent 2.0:从个人工具到组织系统 ꔷ 沙箱隔离与会话恢复 ꔷ 长期记忆与多渠道访问 ꔷ 防止配额消耗并确保安全 使用 AgentScope Harness 构建生产级智能体。 https://int.alibabacloud.com/m/1000414751/ #AgentScope #CodingAgent #LLMOps #OpenSource #AIEngineering #Java
智能体产品更新编码
16:46
Alibaba Cloud@alibaba_cloud
55
🚀 Coding Agent 2.0:从个人工具到组织系统 ꔷ 沙箱隔离与会话恢复 ꔷ 长期记忆与多通道访问 ꔷ 防止配额燃烧并确保安全 使用 AgentScope Harness 构建生产级智能体。 https://int.alibabacloud.com/m/1000414751/ #AgentScope #CodingAgent #LLMOps #OpenSource#AIEngineering #Java
智能体产品更新编码
16:26
Chubby♨️@kimmonismus
37
OpenAI即将推出的"bidi"语音模式听起来太疯狂了!
OpenAI产品更新语音
16:16
Alibaba Cloud@alibaba_cloud
39
🏎️ 欢迎来到 Autopilot Agent Arena!你的挑战是端到端自动化真实世界的商业工作流,赢取 $70,000+ 奖金池。 🔗 立即注册:https://click.qwencloud.com/m/20000000281/
智能体产品更新
16:04
凡人小北@frxiaobei
49
火山引擎展示AI记忆卡YoooClaw C-ONE,打通飞书任务分发

火山引擎在FORCE大会上展示YoooClaw C-ONE,一款卡片大小的「AI记忆卡」。它能录音转文字,也能抓取手机通知实时喂入,两路数据汇入火山引擎的ArkClaw做抽取和推理,形成个人知识大脑。出口端打通飞书,例如老板开完会后一句话即可将任务分别推送给对应同事。推文作者称这是除seedance2.5外今次最心动的产品。

产品更新语音部署/工程
15:55
X.PIN@thexpin
62
微信AI助手"小微"抢先体验:基于WeLM,部分由DeepSeek响应

作者抢先体验了微信AI助手“小微”。小微基于腾讯自研中文大模型WeLM,部分响应由DeepSeek处理。用户手动激活后,可设置日程、发消息、打电话、生成歌单、启动小程序,并能唤醒美团外卖和京东购物,但转账、红包等最终支付需手动确认。隐私方面:聊天信息仅当前会话读取,不保存、不用于训练,上下文记忆可手动关闭。微信拥有超10亿用户,而腾讯在大模型领域落后于字节和阿里,因此微信成为其最重要的AI落地窗口。支付宝也已在测试具备车辆预约和外卖配送能力的AI智能体。

智能体DeepSeek产品更新
13:06
jason@jxnlco
13
Codex 面向所有人。

SIGKITTEN: @jxnlco

OpenAI产品更新编码
12:01
向阳乔木@vista8
35
火山引擎活动:Seeddance 2.5 与 Seedream 5.0 Pro 更新

火山引擎活动透露,Seeddance 2.5 是全场最受期待的产品,预计 7 月上线,价格尚未公布。同时展示的 Seedream 5.0 Pro 编辑能力提升,支持箭头和高亮区块编辑。

产品更新图像生成
09:44
小互@xiaohu
29
字节火山引擎大会发布 Seedance2.5、豆包 Seed2.1 等新模型

字节跳动今日在 2026 火山引擎大会上发布 Seedance2.5,同时推出全新豆包 Seed2.1 模型,声称能力达 Opus4.6 水平,以及新款图像模型 Seeddream 5.0。具体参数、性能分数及定价信息尚未公布。

产品更新图像生成多模态视频
09:06
🚨 AI News | TestingCatalog@testingcatalog
33
BREAKING 🔥: OpenAI 正在准备"Bidi 1"即将网络发布! > 一种新的语音模型将在设置中可用,与标准和高级选项并列。 > 语音模式气泡将变为黄色而不是蓝色。 多久?👀
OpenAI产品更新语音
08:40
meng shao@shao__meng
59
继 Claude Code 开发者用 HTML 代替 Markdown 向人类解释模型输出后,HeyGen 为其 HyperFrames 平台推出新技能 pr-to-video。智能体可将无人阅读的 Pull Request(PR)直接转化为简短解释性视频,用户可通过命令 `npx skills add heygen-com/hyperframes` 添加该技能。作者感叹视频或为人类最佳信息输入源,并表示将重启视频内容。

HeyGen: This week we're launching new skills for HyperFrames, each built around a workflow Today is pr-to-video Nobody reads pul...

MCP/工具产品更新编码视频
07:39
xAI@xai
45
你现在可以将Grok连接到Interactive Brokers,获取关于你投资组合的高质量、最新信息。

Interactive Brokers: Interactive Brokers integrates with Grok. Research investments and analyze your portfolio using AI. AI informs. Approve ...

MCP/工具xAI产品更新
06:36
🚨 AI News | TestingCatalog@testingcatalog
52
Flashcards are now editable on NotebookLM 👀 用户可调整问题和答案的文本,还能向卡片组添加新卡片。 FlashcardLM ⚡

NotebookLM: Flashcards are now fully customizable. Edit questions, tweak answers, and add brand-new cards to create the ultimate set...

Google产品更新
05:07
elvis@omarsar0
48
天哪!Fugu Ultra 在这些 3D 渲染中表现得极其出色。

Sakana AI: Introducing Sakana Fugu: A full multi-agent orchestration system accessible via a single model API. Our 'Fugu Ultra' mod...

智能体产品更新多模态
05:07
Elon Musk@elonmusk
31
Grok Build 升级

skcd: /goal is live on Grok Build. We use a team of agents: - implementors - skeptics - code reviewers - planners and a mix of...

智能体xAI产品更新
04:10
Runway@runwayml
57
改变视频的宽高比以适应任何平台。Aleph 2.0 扩展场景以适配新的宽高比,让你的视频看起来从一开始就是那样拍摄的。在今天的 Runway Academy 中了解操作方法。
产品更新视频
04:03
Google Gemini@GeminiApp
31
Gemini Spark 是您的 24/7 个人AI智能体,在您的指导下从头到尾处理繁重工作。 以下是我们团队使用 Gemini Spark 让生活更轻松、更高效的一些方式。🧵
智能体Google产品更新
03:41
OpenCode@opencode
23
我们已添加独立用户排名 某些模型 token 消耗大,导致它们在排名中偏高--使用模型的独立用户数是更准确的排名 我们将围绕这一指标调整更多数据
产品更新开源生态
03:08
Greg Brockman@gdb
51
面向安全团队的 Codex Security 插件:深度扫描、验证发现、追踪攻击路径、构建威胁模型、生成针对代码库的补丁以供审查,以及导出到其他工具:https://openai.com/daybreak/codex-security-plugin/
OpenAI产品更新安全/对齐编码
03:05
NotebookLM@NotebookLM
60
Flashcards 现已完全可自定义。编辑问题、调整答案、添加新卡片,打造终极学习工具集。 与朋友、同学、学术竞争对手等分享--只需准备好迎接随之而来的无尽赞美与赞誉。
Google产品更新
02:10
Logan Kilpatrick@OfficialLoganK
73
今天我们将 Interactions API 推向 GA,这是我们设计的新 API,可让您在同一个界面中编排跨模型和智能体,并将成为我们未来的默认 API。Interactions 为智能体新时代奠定了基础。

Google AI Studio: http://x.com/i/article/2069077093036576768

智能体Google产品更新
01:56
Chubby♨️@kimmonismus
61
OpenAI 宣布扩展 Daybreak 项目,旨在以机器速度民主化修复脆弱软件。主要发布包括:Codex Security 插件(在 Codex 内发现、验证并修复漏洞);完整版 GPT-5.5-Cyber 模型(面向受信防御者的安全专用模型);Cyber Partner Program(支持安全公司基于 OpenAI 顶级网络能力构建产品);以及 Patch the Planet(与维护者合作保护关键开源项目)。据主推文称,GPT-5.5-Cyber 在 CyberGym 基准上表现优于 Claude Mythos。

OpenAI: We're expanding OpenAI Daybreak to help democratize patching vulnerable software at machine speed: - Codex Security plug...

MCP/工具OpenAI产品更新安全/对齐
01:38
Greg Brockman@gdb
61
Greg Brockman 宣布 OpenAI Daybreak 加速漏洞发现与修复。模型已能发现并生成针对主流浏览器、网络基础设施、FreeBSD 和 Linux 内核等操作系统,以及 cURL、Go、Python、Sigstore、pyca/cryptography 等项目的关键漏洞补丁。同时扩展 Daybreak 项目:推出 Codex Security 插件(在 Codex 内发现、验证、修复漏洞);发布完整版 GPT-5.5-Cyber 模型;启动 Cyber Partner Program(为安全公司提供顶级网络能力产品);推出 Patch the Planet(与维护者合作保护关键开源项目)。

OpenAI: We're expanding OpenAI Daybreak to help democratize patching vulnerable software at machine speed: - Codex Security plug...

OpenAI产品更新安全/对齐
01:35
Google AI Developers@googleaidevs
62
Google Interactions API 正式可用:统一端点、稳定 schema、Managed Agents 等新功能

Google Interactions API 现已正式可用(GA),通过统一 /interactions 端点提供稳定 schema,同时支持模型推理与自主智能体。关键更新包括:Managed Agents — 单次 API 调用即可启动安全远程 Linux 沙箱进行代码执行与网页浏览,默认使用 antigravity-preview-05-2026 智能体或自定义指令;简化 schema — 每个操作作为独立 step 形成线性流;后台执行 — 设置 background=True 实现异步运行并轮询结果;扩展工具生态 — 原生支持 Computer Use、File Search、Google Maps,新增 Gemini API Docs MCP server 与 gemini-interactions-api Skill;媒体生成 — 基于 Google Search 的 Nano Banana 2 图像生成、Lyria 3 音乐生成及多说话人 TTS。

智能体Google产品更新多模态
01:12
OpenAI@OpenAI
60
OpenAI 扩展 Daybreak 项目,加速修补漏洞

OpenAI 宣布扩展 Daybreak 项目,以机器速度民主化修补易受攻击的软件。具体包括:推出 Codex Security 插件,可在 Codex 内查找、验证和修复漏洞;发布完整版 GPT-5.5-Cyber 模型,专为可信防御者设计;启动 Cyber Partner Program,支持领先安全公司基于 OpenAI 最佳网络能力构建产品;以及 Patch the Planet,与维护者合作保护关键开源项目。

OpenAI产品更新安全/对齐编码
00:56
Chubby♨️@kimmonismus
43
Delos Workers 让 AI 智能体拥有持久身份,像同事一样传递上下文

Delos Workers 突破传统 AI 智能体每次任务后重置上下文的限制,为每个智能体保留持久身份和记忆,独立拥有邮箱、电话和 Slack 句柄,能在任务间传递上下文,从而成为组织架构中可直接寻址的成员。引用 @pierre_dlgr 称其为“无限 AI 员工”,数天内实现 100 万美元 ARR,旨在取代邮件回复、CRM 更新等流程化知识工作。

Pierre de la Grand'rive: Introducing Workers: unlimited AI employees that run your company... And we've just made $1M ARR in a couple of days. Mo...

智能体产品更新现象/趋势
00:40
Rohan Paul@rohanpaul_ai
57
Delos推出Workers:将AI智能体转化为数字员工

Delos发布Workers,将AI智能体转化为拥有专属邮箱、电话、Slack、Teams、电脑、记忆及公司训练的“数字员工”。每个Worker针对单一企业训练,学习其常规、工具、词汇、权限和交接模式。核心是持久身份与长期记忆,使同事可像联络人类同事一样找到它,并信任其记住过往决策与客户上下文。引用推文透露上线数天内已实现100万美元ARR,指出大多数知识工作本不该存在——大量工作仅为流程(回复邮件、跟进、更新CRM等),而Workers能像人类队友一样跨组织执行任务,软件与劳动力界限消失。

Pierre de la Grand'rive: Introducing Workers: unlimited AI employees that run your company... And we've just made $1M ARR in a couple of days. Mo...

智能体产品更新部署/工程
‹ 上一页
1…7891011…50
下一页 ›