AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 3062 条
全部一手资讯X论文
标签「Agent」清除
Google AI@GoogleAI · 5月20日85

Three years ago, Gemini started by understanding the world. With Gemini 2, models learned to think and reason. Late last year, Gemini 3 brought any idea to life. Today, we’re continuing that journey with our Gemini 3.5 series, starting with Gemini 3.5 Flash, delivering frontier performance for agents and coding.

译三年前,Gemini从理解世界开始。 随着Gemini 2,模型学会了思考和推理。 去年底,Gemini 3将任何想法变为现实。 今天,我们继续这段旅程,推出Gemini 3.5系列,首先发布Gemini 3.5 Flash,为智能体和编程提供前沿性能。

Google Gemini@GeminiApp · 5月20日74

Gemini Spark is your new 24/7 personal AI agent. Give it a task and it works autonomously in the background, even if your phone and laptop are turned off. You choose to turn it on and it's designed to check with you before taking major actions. #GoogleIO

译Gemini Spark 是你的新全天候个人AI代理。 给它一个任务,它会在后台自主工作,即使你的手机和笔记本电脑已关机。你选择启用它,它被设计为在执行重大操作前会先征询你的意见。#GoogleIO

🚨 AI News | TestingCatalog@testingcatalog · 5月20日66

GOOGLE I/O 🔥: A 24/7 GEMINI SPARK AI AGENT HAS BEEN ANNOUNCED! > Comes with a dedicated virtual machine > Supports MCPs and Connectors > Powered by Gemini 3.5 and Antigravity harness Tons of use cases! 👀 Rolling out to trusted testers this week and to Ultra users in the US next week.

译谷歌在I/O大会上发布了名为Gemini Spark的24/7个人AI代理。该产品基于Gemini 3.5模型与Antigravity平台构建,运行在Google Cloud专用虚拟机上,可无需用户保持设备开机而在后台自主执行长时间任务。Gemini Spark旨在作为用户的数字助手,依据指令采取行动,并计划通过MCP协议与Google现有工具及第三方应用集成。目前该产品已向部分测试者开放,下周将面向美国Ultra用户推出。

Artificial Analysis@ArtificialAnlys · 5月20日78

Google’s new Gemini 3.5 Flash is the clear leader on the Intelligence vs Speed Pareto frontier and makes large gains on GDPval-AA (real-world agentic tasks), but is 5x the cost of Gemini 3 Flash @GoogleDeepMind gave us pre-release access to Gemini 3.5 Flash, the latest model in its Flash family, which has traditionally has offered faster, lower-cost alternatives to Gemini Pro models. Gemini 3.5 Flash scores 55 on the Artificial Analysis Intelligence Index, up 9 points from Gemini 3 Flash, driven primarily by agentic performance gains and hallucination reduction. It achieves speeds of over 280 output tokens/s, but higher token usage and token pricing make it over 5x more costly to run the Intelligence Index than Gemini 3 Flash, and 75% more costly than Gemini 3.1 Pro. Gemini 3.5 Flash is $1.50/1M input and $9/1M output tokens, Gemini 3 Flash was $0.5/$3 per 1M input/output tokens, a 3x increase. The rest of the increase was driven by higher token usage when running our benchmarks Key results for Gemini 3.5 Flash with ‘high’ thinking level: ➤ 9 point Intelligence Index improvement: Gemini 3.5 Flash scores 55 on the Artificial Analysis Intelligence Index, up 9 points from Gemini 3 Flash. This places it ahead of Grok 4.3 (high, 53) and Claude Sonnet 4.6 (max, 52). The model improves across nearly all evaluations, with the largest gains coming from agentic evaluations and AA-Omniscience (knowledge and hallucination). On AA-Omniscience, Gemini 3.5 Flash improves by 11 points, driven primarily by reduced hallucinations, with its hallucination rate falling to 61%, a 31 point decrease compared to Gemini 3 Flash ➤ Agentic capability improvements: Gemini 3.5 Flash improves substantially over Gemini 3 Flash across our agentic evaluations, in both GDPval-AA (real-world agentic tasks) and Tau2-Bench Telecom (agentic tool use). Its GDPval-AA result is especially notable, achieving an Elo of 1656, well ahead of Gemini 3 Flash (1204) and Gemini 3.1 Pro (1314), and just behind GPT-5.4 (xhigh, 1674). This represents a meaningful step forward for Google in agentic performance, which has historically been a relative weakness for Gemini models ➤ Speed-intelligence frontier: Gemini 3.5 Flash achieves speeds of over 280 output tokens per second, ~70% faster than Gemini 3 Flash and models such as gpt-oss-120b and GPT-5.4 mini (xhigh). With its 55 Intelligence Index score, this places Gemini 3.5 Flash on the speed-intelligence Pareto frontier alongside Gemini 3.1 Pro and Gemini 3.1 Flash-Lite, reinforcing Google’s strength in models balancing speed and intelligence ➤ 5.5x increase in cost to run: Gemini 3.5 Flash costs $1,552 to run the Artificial Analysis Intelligence Index, 5.5x more than Gemini 3 Flash and 75% more than Gemini 3.1 Pro. This is driven by increases in both token usage and token prices. Output token usage is broadly unchanged from Gemini 3 Flash (73M vs. 72M), but input token usage increases significantly, driven primarily by an increase in the number of turns in agentic evaluations. Gemini 3.5 Flash is priced 3x higher than Gemini 3 Flash at $1.50/$9.00 per 1M input/output tokens, with a 90% discount for cached input tokens ➤ Google continues to lead multimodal performance: Gemini 3.5 Flash is multimodal, supporting image, video, and speech input alongside text. This differs from many proprietary models, including Claude Opus 4.7, Grok 4.3, and GPT-5.5, which support image input only. In our multimodal evaluation, MMMU-Pro, Gemini 3.5 Flash scores 84% - the highest score recorded. This puts models from Google in the top two spots, with Gemini 3.1 Pro scoring 82% Key model details: ➤ Context window: Retains the same 1M context window as Gemini 3 Flash ➤ Multimodality: Text, image, video and speech input with text output only ➤ Pricing: $1.50/$9.00 per million input/output tokens, with a 90% discount for cached input tokens Congratulations @GoogleDeepMind , @sundarpichai and @demishassabis on the great release!

译谷歌发布新模型Gemini 3.5 Flash,其在智能指数上提升9分至55分,超越Grok 4.3和Claude Sonnet 4.6,尤其在代理任务和知识真实性(大幅减少幻觉)方面进步显著。输出速度超280 tokens/s,使其位于速度与智能的领先前沿。然而,模型运行成本相比前代增加5.5倍,主要由于输入令牌用量及定价上涨。此外,它在多模态评估MMMU-Pro中取得最高分,支持多模态输入,展现了谷歌的综合优势。

Jeff Dean@JeffDean · 5月20日85

1/ Today at #GoogleIO, we’re releasing Gemini 3.5, our latest family of models combining frontier intelligence with action. We’re starting by releasing 3.5 Flash, which is built to help you execute complex, long-horizon agentic workflows. Gemini 3.5 Flash is our strongest model for coding and agent http://yet.It outscores 3.1 Pro on agentic and coding benchmarks like Terminal-Bench and MCP Atlas, while running 4x faster than other frontier models. Used in Google Antigravity, 3.5 Flash is even further optimized to be up to 12x faster. It’s a powerful engine to deploy sub-agents that collaborate, run high-frequency iterative loops, and solve real-world problems at scale. Some highlights we’re excited about 🔽

译在Google I/O大会上,谷歌正式推出Gemini 3.5系列模型,首个发布的Gemini 3.5 Flash专为执行复杂、长周期的代理工作流而设计。该模型在Terminal-Bench和MCP Atlas等编程与代理基准测试中得分超越3.1 Pro,且运行速度可达其他前沿模型的4倍。若在Google Antigravity环境中使用,速度提升可高达12倍。它能高效部署协同工作的子代理,通过高频迭代循环来解决现实世界的大规模问题。

elvis@omarsar0 · 5月20日46

The sooner people and companies realize this, the better they can leverage AI. It makes a lot of sense. We have trained current AI systems to work optimally when paired with human expertise. Things can change in the distant future. More autonomous agents are on the horizon. But even then, human verification and ingenuity will matter a ton.

译人们和公司越早认识到这一点,就越能更好地利用AI。 这很有道理。我们训练当前的AI系统,是为了在与人类专业知识结合时达到最佳效果。 未来可能会有变化。更自主的智能体即将到来。但即便如此,人类的验证和创造力仍将至关重要。 [引用 @balajis]:每个AI智能体最终都有一个人类委托人。

Google DeepMind@GoogleDeepMind · 5月20日81

Introducing Gemini 3.5: our newest family of models combining frontier intelligence with real-world action. The first release is 3.5 Flash, our strongest model yet for agents and coding 🧵

译推出 Gemini 3.5:我们最新的模型系列,将前沿智能与现实行动相结合。 首个发布版本是 3.5 Flash,这是我们迄今为止在智能体和编码方面最强大的模型 🧵

🚨 AI News | TestingCatalog@testingcatalog · 5月20日77

GOOGLE I/O 🔥: ANTIGRAVITY 2.0 HAS BEEN ANNOUNCED WITH LOADS OF NEW AGENTIC SYSTEMS AND REALTIVE VOICE EXPERIENCE! > Available globally for everyone > Gemini 3.5 Flash is 12x faster on Antigravity > New Agent experience and integrations > Antigravity CLI

译谷歌在I/O大会宣布推出Antigravity 2.0平台,面向全球用户开放。该平台集成了新的智能体系统和自然语音交互体验,Gemini 3.5 Flash模型在Antigravity上的运行速度提升了12倍。谷歌展示了其智能体在该平台上仅用12小时,通过93个并行子智能体、超过1.5万次模型调用和处理26亿个token,成功从零构建出一个可运行的操作系统,API调用成本不到1000美元。

François Chollet@fchollet · 5月20日56

Most human tasks are not Markovian, the optimal next action cannot be determined solely by looking at the current state. It depends heavily on the past trajectory, the original intent, and context constraints. An agent that cannot compress and track its past trajectory with absolute fidelity is maybe 20% as useful as one that can.

译大多数人类任务并非马尔可夫过程,最优的下一步行动无法仅凭当前状态决定。它很大程度上取决于过去的轨迹、原始意图和上下文约束。一个无法以绝对保真度压缩和追踪其过去轨迹的智能体,其效用可能只有能做到这一点的智能体的20%。

elvis@omarsar0 · 5月19日62

// Code as Agent Harness // 100+ page report on all things related to agent harnesses. (bookmark it) In particular, the survey summarizes methods and applications of code as agent harness. This paper makes a strong case that code-as-harness might be the key to moving us towards a broader science harness engineering. Is code all you need? Maybe. Regardless, the paper argues that future systems must have the following four properties: executable, inspectable, stateful, and governed. Paper: https://arxiv.org/abs/2605.18747 Learn to build effective AI agents in our academy: https://academy.dair.ai/

译推文聚焦于一篇探讨AI代理(Agent)开发框架的百页报告,其核心主张是“代码作为代理框架”具有重要潜力。报告总结了相关方法与应用,并论证该路径可能推动更广泛的科学框架工程。论文进一步提出,未来的智能系统必须具备四项关键特性:可执行、可检查、有状态以及受控。报告旨在为构建有效AI代理提供参考,并推荐相关学习资源。

OpenRouter@OpenRouter · 5月19日68

Any tool-calling model on OpenRouter can call web search and web fetch agentically. The model decides when to search, what to search for, and how many times. We've added @p0 as a new web search provider. Learn more: https://openrouter.ai/announcements/agentic-web-tools

译OpenRouter上的任何工具调用模型现在都可以自主调用网络搜索和网页抓取功能。 模型可以自行决定何时搜索、搜索什么以及搜索次数。 我们新增了@p0作为新的网络搜索提供商。了解更多:https://openrouter.ai/announcements/agentic-web-tools

凡人小北@frxiaobei · 5月19日59

Google 每次都是想象力满分,产品力拉跨。就看看隔壁 Claude 和 Codex,抄都不屑于抄。 这一点倒是跟我很像😂 不管怎么样,还是再期待一次吧,毕竟之前也做过几个惊艳的产品。

译本次更新亮点在于展现了“操作系统级感知力”的交互新方向。其核心优势并非单一模型,而是Gmail、Drive等服务的深度生态整合,这为重度用户构建了高迁移成本的壁垒。桌面端AI竞争已进入新阶段,谁先实现顺畅的系统级感知体验,谁将占据先机。

🚨 AI News | TestingCatalog@testingcatalog · 5月19日64

GOOGLE I/O 🔥: Google Flow is getting Gemini Omni and a new Flow Agent experience! > Your Agent is active! Ask Gemini to brainstorm concepts, generate image variations, rename assets, or answer questions about Flow. Start typing below or click the expand icon on the top right to open chat mode. Customizable Style Tools are now available as well.

译GOOGLE I/O 🔥:Google Flow即将接入Gemini Omni和全新的Flow Agent体验! > 您的代理已激活!可让Gemini进行创意构思、生成图像变体、重命名资源或回答关于Flow的问题。在下方开始输入,或点击右上角的展开图标开启聊天模式。 自定义风格工具现已推出。

Berryxia.AI@berryxia · 5月19日53

Brothers, Lucius AI just raised $3M to build the Context Layer for your organization. Individuals already ship 10× faster with AI. Organizations? Still stuck rebuilding the same context over and over again. Over 30% of your team’s time disappears chasing decisions that were already made, answers that were already given, and feedback that got buried in Discord. Lucius fixes exactly that. It turns every conversation, every decision, every user message into compounding organizational memory. One request and it: • Analyzes historical community chats to surface real user pain points • Runs full user interview outreach automatically • Builds a self-learning support loop that never repeats the same question twice • Auto-generates and deploys rules in natural language No more guessing. No more meetings to re-explain things that already existed. This is the missing layer that lets teams actually move at AI speed. Try it now: https://luciusai.com

译Lucius AI完成300万美元融资,旨在构建组织的“上下文层”以解决企业协作中的核心痛点:尽管个人借助AI效率大幅提升,但组织仍困于重复构建信息上下文的循环。其产品通过分析历史对话、自动化用户访谈、构建自学习支持系统及生成自然语言规则,将团队内的交流与决策转化为持续积累的“组织记忆”,目标是减少超过30%被浪费在重复确认已有信息上的时间,让团队能真正以AI时代的速度运转。

向阳乔木@vista8 · 5月19日63

发现坚果云同步挺方便的,使用场景: 1. 同步本机 .agents 目录 到另外一台电脑,Skill优化后,也能同步。 2. Obsidian 数据同步,就不用买官方服务了 3. 坚果云支持Webdav,CC Switch配置的各种API都能无缝用。 随时共享文件夹或文件给他人。 个人用户一年199元,相比AI订阅套餐显得便宜 哈哈

译坚果云同步功能可用于跨设备同步本地.agents目录、替代Obsidian官方同步服务,以及通过Webdav支持CC Switch等工具的API配置。其共享功能便于文件协作。个人用户年费199元,在价格上相比各类AI工具订阅更具性价比。

Baidu Inc.@Baidu_Inc · 5月19日67

Here is a quick addition to your metrics vocabulary: DAA. Short for Daily Active Agents, it is the agent era's equivalent of DAU. Where tokenomics tracks cost, DAA tracks output — how much work agents are actually getting done. See the full comparison ↓

译这里快速补充一个指标新词:DAA。 全称 Daily Active Agents(每日活跃智能体),相当于智能体时代的 DAU。 如果说代币经济学追踪成本,那么 DAA 追踪产出——智能体实际完成了多少工作。 完整对比见下文 ↓

Berryxia.AI@berryxia · 5月19日26

我就想知道小Happy这个月的工资可以拿到手吗? 岂不是token爆炸了哈哈 ~~ 同情小编几秒钟~~

译用户调侃AI助手HappyCapy可能产生的巨额Token消耗成本。推文核心是指出通过HappyCapy控制Mac等操作,虽然功能强大,但背后运行所需的Token资源可能远超预期,导致高昂的运营费用。引用内容展示了HappyCapy能通过一条命令连接并控制用户Mac电脑的具体方法,印证了其功能的实现依赖于大量后台计算与交互,从而引发了主推文中对其运营成本(即Token消耗)的调侃。

Berryxia.AI@berryxia · 5月19日29

在𝕏 上大家可以习以为常的使用Claude、Codex 都是稀松平常的事儿,可在现实生活中周围同事和朋友还是停留在豆包的ChatBot模式。 所以这样的小龙虾其实更适合普通人,不需要配key,不需要研究Prompt就行。 上手也快,没有特别乱七八糟复杂的东西。我们不能以自己会,自己有默认普通人都会,都有的。

译科技圈用户熟练使用Claude、Codex等AI工具,但普通用户多停留在基础聊天机器人阶段。AI Agent如Hermes向大众扩散时,上手难度高:需自行编写提示词、配置工作流、选择模型,导致许多安装后闲置。因此,普通用户需要开箱即用的产品。360安全龙虾云端版针对此痛点,内置100多个预训练专家模型,适配各类场景,集成语言、图像、视频生成模型,支持工作流串联。全平台可用,接入微信、飞书等,并提供“龙虾教练”功能辅助定制Agent,有效降低使用门槛。

Chubby♨️@kimmonismus · 5月19日65

A $75M Series A led by Accel - the largest ever raised by a Polish-founded company. But the angel list tells the real story: Stewart Butterfield and Cal Henderson wrote checks into an AI agent that lives inside the product they built. When the Slack co-founders back the AI coworker inside Slack, that's not hype capital, it shows trust. Viktor runs autonomously on a schedule, connects to 3,000+ tools, and delivers finished work products instead of chat replies. The team at Zeta Labs has been building since 2023, 12,000+ teams already use it.

译Viktor是一个AI员工产品,获得由Accel领投的7500万美元A轮融资,创下波兰创始公司史上最大额。投资亮点在于Slack联合创始人Stewart Butterfield和Cal Henderson作为天使投资人参与,这为产品提供了关键信任背书。Viktor能自主按计划运行,连接3000多种工具并直接交付完整工作成果。目前已有12,000多个团队使用,年化收入达1500万美元,在企业效率提升方面展现显著价值,如节省成本、增加收入与恢复团队时间。

Rohan Paul@rohanpaul_ai · 5月19日78

The big problem with AI agents is that they still need custom integration work before they can do anything useful, and Membrane is trying to collapse that work into a single skill for 100,000+ APIs that an agent can call from one command. So Claude Code, ChatGPT, Cursor, Replit, and other agents can call external APIs without every team rebuilding the same integration logic.

译AI代理在实际应用中需为每个外部服务重复构建集成逻辑,成为其发展的主要瓶颈。针对此问题,Membrane推出了一种通用“技能”解决方案。通过该单一技能,Claude Code、ChatGPT、Cursor等主流AI代理能够用一条指令调用超过10万个不同的API,涵盖从Stripe支付服务到NASA火星车数据等各类服务。这极大简化了开发流程,将定制化集成转变为通用的连接能力,降低了使用门槛。同时,Membrane正发起社区挑战,鼓励用户提交小众API以获得演示和免费额度激励,旨在持续扩展其连接生态。

向阳乔木@vista8 · 5月19日26

小龙虾和Hermes的热度在AI科技圈终于降了。 按扩散发展规律看,民间热度估计刚刚开始。 但对于普通用户来说,各种龙虾类Agent产品上手难度还是有点高。 如提示词怎么写、工作流怎么配、模型怎么选,全靠自己摸索。 不少大厂提供了 OpenClaw 和Hermes的安装镜像。 但折腾起来依然费劲,普通人才懒得研究。 结果就是:会用的人锦上添花,不会用的人装完吃灰。 普通用户最需要的是开箱即用的龙虾产品。 不得不说,360还是很懂普通用户痛点,开发了360安全龙虾云端版。 内置了100+预训练好的专家虾,不用自己从零调教,对应场景拿来就用,接入大量语言模型、生图模型和视频生成模型,搭配技能市场,能把各种常见工作流都串起来。 而且手机上也能用,随时对话调教优化。 甚至还准备了个「龙虾教练」,解决普通"不会训龙虾"的问题,让它带着走,10分钟能训出一只针对自己场景的专属虾。 下载安装地址 http://claw.360.cn,全平台都有,微信、飞书、钉钉也能接入,感兴趣可以试试。

译AI Agent如“龙虾”工具热度从专业圈向民间扩散,但普通用户面临提示词编写、工作流配置等上手难题。360推出“安全龙虾云端版”,内置预训练专家模型,提供“龙虾教练”引导,实现开箱即用,支持全平台接入,降低使用门槛。

Berryxia.AI@berryxia · 5月19日44

我靠!我又行了啊,兄弟们~ 真的是Saas 已死,Agent 称王的时代来了 !! 我今天花了2小时,就用Cursor + Claude把海外老哥卖149美元的「Three.js热带海洋实时交互系统」直接手搓复刻出来了。 😄 实时交互全都有:海洋波浪动态、风速实时调节、天空环境光变化…… 一整套物理交互。 原版我不知道实际交付效果如何,但我这个版本视觉和交互已经还原80%以上,还额外加了中英文双语切换、海洋动植物实时互动、更多细节物理反馈。 这个思路还能往天气系统、生态模拟、甚至教育场景里疯狂扩展。 以前要花149美元买的东西,现在AI两小时就能自己造出来。 感兴趣的朋友点赞破100,我就直接把完整代码开源给大家玩! 破不了就算了…… 我消耗的token已经够我心疼的了哈哈。 (附上我现在跑起来的实时演示效果图/视频) 原系统项目见评论区下👇🏻:

译开发者利用Cursor与Claude组合,仅用两小时就复刻了一套海外售价149美元的Three.js热带海洋实时交互系统,并实现了80%以上的功能还原与额外增强。此案例直观体现了“AI Agent开发工具”对复杂应用开发时间和成本的极致压缩。Cursor Auto模式提供了无需特殊网络的技术便利,使这种高效的开发思路具备广泛扩展至天气、生态、教育等场景的潜力。

🚨 AI News | TestingCatalog@testingcatalog · 5月19日46

ClickUp's AI Brain will soon be able to build fully interactive apps from a single prompt, with live data integrations. Some examples 👀 > Sprint tracker - to reshape your team operations into an analytics dashboard for stakeholders. > CRM tool - to have a custom dashboard with customizable controls on top of your existing data. > Live OKR dashboard - to have a dynamic view that can pull the latest updates automatically

译ClickUp的AI大脑将很快能够从单个提示词构建完全交互式的应用程序,并实现实时数据集成。 一些示例 👀 > 冲刺追踪器 - 将您的团队运营重塑为面向利益相关者的分析仪表板。 > CRM工具 - 在现有数据之上,拥有一个带有可自定义控件的自定义仪表板。 > 实时OKR仪表板 - 拥有一个可以自动拉取最新更新的动态视图。

Berryxia.AI@berryxia · 5月19日67

http://x.com/i/article/2056641313874083840 # 黄仁勋说要选会用 AI 的应届生。我追着 AI 追了半年,胖了 10 斤。 「黄仁勋说要选会用 AI 的应届生。这话我同意。但我追着 AI 追了半年,先把自己干掉了 10 斤——是熬出来的。」 最近也看到NVIDIA CEO 黄仁勋 在接受采访直接表态就是: “如果让我在两个应届生之间选: 一个完全不懂AI,   一个是AI使用专家……   我会每次都选后者。 会计、市场、供应链、律师、销售…… 所有岗位都一样。” 他不是在说AI会取代人类。 他是在说:AI已经变成每份工作的基本工具。 凌晨三点看 YC 的访谈,听完又去听各种大神的播客和演讲,听他们讨论 AI 进展速率、人形机器人量产时间表,听完合上电脑下楼便利店买关东煮,回来继续刷 X 肝帖。 很多搞内容、做产品、写代码的朋友过去这一年大概都是这么过来的。 因为AI时代迭代的速度是真的远超自己的速度,你越追越累。 焦虑像潮水一样,从睁眼那一刻开始涨。 但我心里一直有个想法没敢说出来 — 我们这群人整天讨论 AI 取代谁,最先被取代的可能不是会计也不是程序员,是那个还没等到 AI 取代他、就已经被自己的生活方式干掉的人。 > 不是被 AI 取代,AI已经变成每份工作的基本工具。让你成为更精神、更稳定、更健康的一个有血有肉的灵魂。 ## 「你拍这些干嘛?」「发给我的教练。」「……什么教练?」 今天晚上吃完饭去健身房,在健身房上课。 每做完一组动作,我就掏出手机拍一张。从坐姿推胸机,到引体向上,到高位下拉机,再到深蹲和拉伸。 教练看我拍了好几张,问我「你拍这些干嘛」。 我说「发给我的教练」。 他愣了一下。 > 「。。。什么教练?」 我笑着说,「给我的线上的小龙虾教练」。 我索性把手机递过去,让他看了一眼我跟「小 B」的聊天记录。小 B 是我前几天训出来的一只 AI 健身教练,每天下班提醒我开练,我把每组动作的重量和次数发给它,它给我估算热量、记日报、做周报,会顺手画肌肉解剖示意图,还会在我想点外卖炸鸡的时候戳我一下。 他看了一会儿没说话,然后跟我说,「这个东西其实可以推荐给我的学员,让他们下课之后还能监督和给他们提醒什么的!」。 那一刻我觉得挺奇妙的。那只虾不只是在帮我减肥,它还在帮一个干了 10 年的健身教练,想象他下一份工作怎么干。 ## 那只虾,仅需10分钟就可以训出来! 倒回去说一下,那只虾是从哪儿来的。 之前我也想过用通用 AI 当健身教练,它根本记不住上次聊了什么,每次都得重新交代「我是谁、多高、多重、目标是什么」。也试过自带模板的产品,打开就是个让你填字段的表单,连续熬夜的人最不想干的事就是填表。 朋友半夜甩给我一个链接说「试试这个,不用搞prompt」。 那是 360 安全龙虾云端版(claw.360.cn),5 月 13 日刚在「龙虾课堂第一期」直播里发布。 它做了一件挺反常识的事 — 市面上大多数 AI Agent,给你的其实是一只空虾,剩下全靠自己往里填。 360 这边做了一只专门用来训别的虾的虾,叫龙虾教练。 一句话讲清楚,就是「一个帮你配置 AI 的 AI」。 跟它走四步就行: > 聊需求 用人话告诉它你想干嘛 做调研 它自己分析你这一行的背景 装技能 从内置的 50000+ 技能里挑出你需要的 做测试 训完先自己跑一遍,过了关再交给你 下面拆开讲一下我训小 B 的全过程。 ## 第一步:我跟它聊我想要什么 我打开龙虾教练,没废话,直接说我是个长期熬夜的内容博主,最近胖了 10 斤,希望每天有人提醒我喝水、提醒我别太晚吃,每天给我日报、每周给我曲线报告,「不要那种让我填表的健身 App,我已经够累了」。 打开龙虾教练,一段话讲清楚我要什么 — 不用 prompt 模板,不用填表 它没有像普通 AI 那样马上开搞,而是反问了我几个问题: - 「你目前体测怎么样?」 — 我把体测报告截图甩给它,它直接读图,把体重、BMI、体脂率、骨骼肌、内脏脂肪一行行抓出来 - 「你的主要目标是哪种?」 减脂 / 增肌 / 塑型 / 其他 — 我选减脂 - 「每周能训几次?」「有没有运动禁忌?」「饮食上有什么偏好?」 - 「教练风格你想要哪种?」 严厉督促 / 温和鼓励 / 专业分析 — 我选督促型,外加每周一次专业分析 - 「一个月减 10 斤算激进,要不要拉到一个半月?」 — 这个反问我没想到,它自己劝我别太狠 我一边回答它一边觉得,这一段对话比写 prompt 舒服十倍。我只用说人话,剩下的它自己结构化。 ## 第二步:它自己钻进后台,开始配置。 聊完几轮,它消失了一会儿,自己开始写配置。 我们可以看到已经在调用工具和调动Agent帮我们来完成任务了。 点开是一段 JSON,里面写着 agent_type / namiAgentId / role / scene: claw_chat_create / task: 定性项的风格是专业分析型… 这些字段。 我没看懂全部,但意思我看懂了 — 它在替我下单一只新的虾。 然后是更狠的一段,它开始往那只新虾的"脑子"里写东西: - MEMORY.md — 小 B(健身教练)的长期记忆:我是谁、目标多少、用什么语气督促我、什么时候不要联系我 - skill_inventory — 给小 B 挂的技能:humanizer-zh(让回复有人话)、白话改写、内容可视化、长上下文压缩…… - TOOLS — 小 B 可以调用的工具:能用 web_search 查最新营养学文章、能用 web_fetch 抓老板(也就是我)发的链接,但有边界 — "先用记忆,不轻易重新调研" - 安静时间 — 23:00–07:00 不主动联系;工作时间 09:00–18:00 除午餐提醒外不打扰;越级触发条件是身体严重不适、连续疲劳 这些事,如果让我自己用 prompt + workflow + 权限配置一项一项搞,我得花一整个周末。 龙虾教练在我和同事们扯闲篇的时候替我跑完了。 ## 第三步:测试通过,小 B 出生 茶泡完回来,屏幕上跳出一行字:「小 B(健身教练)配置已生成」。 我点开看了一眼角色简介: > 小 B(健身教练)你的专业健身私教,20 年经验的健身与营养双专家,专注减脂塑形、科学训练与饮食管理,用数据和专业帮你实现一个半月减 10 斤的目标。版本号 v20260518-1。 从我打开龙虾教练到小 B 出生,整个过程 10 分钟出头。 ## 健身完,我在椭圆机旁边掏出手机 ‘用语音 + 拍照,把今天的训练量和 Apple Watch 数据丢给小 B 讲回今天健身房。 下完课,我坐在椭圆机旁边喘气,掏出手机点进小 B,按住麦克风开始口播。 我先把今天的引体向上拍下来发上去,配一句话「重量方面,默认配的应该是 15 公斤,你帮我记录一下」。 然后接着口播深蹲三组 30/40/50 个、椭圆机 20 分钟阻力 5、推胸机 15 公斤 3 组 12 次。 最后我又把 iPhone 体能 App 里的 Apple Watch 摘要截图发给它,「这是我今天带的 Apple Watch 记录的体能消耗,你做参考,等下出报告的时候把这个数据结合进来」。 它思考了几秒,回了一张干净的表: > 🔥 预估热量消耗坐姿推胸机(3 组 45 次) ~35 kcal坐姿推肩机(4 组 65 次) ~45 kcal深蹲(3 组 120 次) ~80 kcal椭圆机(20 分钟,阻力 5) ~180 kcal总计 约 340 kcal 下面跟了两句,「你说还有 Apple Watch 数据要给我看?发一下我对照下实际消耗,校准估算量」、「另外,推胸机的重量还没说,大概多少公斤?」 它会追问,它要求交叉验证,它知道哪里数据不够、需要我补。 它没在敷衍我。 定时推送目前偶尔有 5–10 分钟延迟,他们自己也承认还在打磨。但比起一个完美但不主动烦我的助手,我更需要这种「会犯点小错但每天在线」的。 ## 它每天给我一份日报,每周给我一份周报 数据发完,云盘里多了一份 HTML,叫每日训练日报。 不是 GPT 那种纯文字总结,是带颜色、带图标、自己排过版的一张图。 到了周日晚上,它会自动生成一份健身周报。 就会有一份非常专业的训练总结的图表报告给你。 真的比健身房的很多教练给你的数据更准确。 ## 它顺手画了组动作示意图 我跟它提过一句「我对器械的名字搞不清楚,能不能给我一个动作教学的小册子」。 第二天云盘里多了个文件夹「健身动作教学示意图」,里面八张图对应推日、拉日、腿日。 我点开看的时候才意识到,它在背后又调了一只虾。 左边那张是它的「后台」 — 小 B 在调用「AI 生图 Image-2 视觉专家」,一只专门负责出图的虾,把动作要点写成 prompt,让它一张张画。 右边那张是出来的成品,菱形肌、背阔肌、斜方肌按发力部位涂成红色,旁边还配了不同阶段的肌肉激活区域。 我没去配模型API、没调 Prompt、没写工作流。 我跟它说「给我一个动作教学的小册子」。剩下的事,它替我打通了链路。 这里可能有的朋友说,我不想打开 App,我就是觉得直接在微信里或者飞书上跟我的这个“小龙虾”对话更方便,这行不行呢? 其实这个也是支持的。它直接支持飞书、微信、企业微信等主流 IM 软件,全部在电脑上配置完毕之后,你就可以在微信上调教并使用你的小龙虾助手了。 所以说,这种多 IM 主流接入的支持,确实非常友好。 你说它有没有缺点呢?肯定有,现在我也发现了一些不是特别友好的地方: 1. 无法直接在对话框中生成图片 虽然可以使用 SVG 或者生成训练示意图,但生图的入口在另外一个窗口。希望未来可以直接在一个窗口内搞定生图。 2. 历史记录的逻辑问题 多次对话时,默认进入的不是上一次对话,而是需要手动点击一下历史记录。 我希望在未来的版本中能看到这两个方面的更新。其他的就看后续发展了,因为现在“小龙虾”的迭代速度都比较快,我觉得未来可能会更好用。 ## 不只是一只虾,是一支团队 小 B 跑稳了之后,我顺手又训了几只: 我自己需要的AI热点新闻选题虾、深度思考虾等。 加上 360 安全龙虾里本身就内置的 100 多只预训练好的专家虾 — 我没必要全部自己训: - CEO 智囊团 — 巴菲特看价值、乔布斯看产品、马斯克看本质。打开就能三个人吵一架,给我打个商业判断 - 第一性原理策略专家 — 我去年想做的一个内容矩阵,跟它聊了 40 分钟,它直接把"为什么要做"、"做给谁看"、"为什么是你做"三层一层层剥到我哑口无言 - 视频创作专家 / 内容创意专家 — 接了 Seedance 2.0、Seedream、海螺、可灵、万相、Midjourney 这些多模态模型。我有一次需要一个 3 秒的开场动效,直接说"帮我做一个像 Notion 启动动画那种的",半小时后云盘里就有 mp4 你看 — 这一年大家都在讨论"AI 取代人类",我桌面上现在的形态是: 我没被取代。我手机里多了一支团队。 ## 每只虾的背后,都有一台云电脑 过去我用的所有 AI Agent,几乎都是聊天框 — 你说一句,它说一句,关掉就完事。 360安全龙虾,这边做的事情不一样:它在云端给每一只虾配了一台云电脑、一套云桌面、一个云盘。 - 云电脑 — 能开浏览器,能装软件,能跑长任务。我让追热点助理去 X 扫一圈,是它真在云端开了一个 X 标签页扒数据,不是装样子 - 云终端 — 能跑命令、能启服务。OPC 那只虾给我写完一段代码之后,是真的能在云端起一个 Web Server,丢我一个 URL,我点开就是上线了的 demo - 云盘 — 所有产出(小 B 的日报、追热点助理的晨报、写作守门员标红的稿子、OPC 出的代码包)全自动落盘,按虾分文件夹,随时调出来 - 内置 AI 编程高手 — 内置了多个世界顶尖模型,我之前最贵的一笔订阅就是给这几个工具凑齐的。现在一个账号里全有了 最骚的一点是 — 我不需要 24 小时挂一台 Mac mini。 小 B 在云端,追热点助理在云端,OPC 在云端。我手机上只装一个客户端,相当于一个遥控器。 我可以在椭圆机旁边掏出手机让 OPC 给我跑一个改动;可以在地铁上对追热点助理说"这条推荐我加到明天晨报里"; 可以在飞机起火前一分钟告诉小 B"今晚临时聚餐,火锅,提前算热量"。 PC / Mac / 安卓 / iOS 全终端同步在线,微信、飞书、钉钉、QQ 都能直接接进去。 花一份钱,100+ 顶尖大模型按场景切换 — 快模型干日常聊天、强模型干长推理、专用模型干代码 / 读图 / 生图 / 生视频。 50000+ 内置技能全免费,不用一个个找、一个个装、一个个踩坑。 你不需要给每一只虾单独注册海外账号、绑卡、配 API Key、装管控。 云端这件事,是把"养虾"从一个本地玩具变成一支真在工作的团队的最关键一步。 ## 我们写 AI 的人,可能严重低估了「用不上」这三个字 写到这儿我得说一件想了挺久的事。 我身边能稳定用上 Claude、GPT 的人,加起来不到一只手。 能搞定信用卡 + 科学上网 + API Key、还愿意每个月给一个境外账户付费的人,本来就是少数。 剩下 95% 的同事和朋友,AI 对他们要么是抖音上划过的截图,要么是被吹得很神、自己试一次就放下的豆包。 我也想过把我自己最熟的东西推荐给他们 — 推 ChatGPT、Claude,他们打不开 让他们自己写 prompt,他们看我像看一个上岸了但精神状态有点问题的人。 我身边搞 AI 的朋友焦虑的是「国内的 AI 是不是赶不上国外」,整天讨论 GPT、Claude、Gemini 的 benchmark,仿佛差距是一场科学竞赛。 但真正的差距不在 benchmark,是在「一个上不了海外模型、不会写 prompt 的普通人,能不能把 AI 真正用进自己的生活」这件事上。 > 360安全龙虾这一次端出来的不是参数表,是一条让普通人也能进得来的路。 不用费劲折腾网络、配置环境,打开就能跟主龙虾说人话。 不用学 prompt、不用配工作流,跟龙虾教练聊四句话,我那点提词手艺就被它默默翻译成了 MEMORY.md、skill_inventory、TOOLS 调用规则,塞进一只虾里。 不用 24 小时挂电脑,云端给每只虾配好了办公室,手机当遥控器就行。 我那些原本对 AI 隔着一道玻璃的同事,第一次可以直接说一句中文,就把活儿派出去。 国产生产力工具卷的不该是分数。 是有多少具体的人,被这套工具悄悄改变了今天的状态。 ## 回到我那最开始减肥的故事 每天小 B 都会发我一张曲线图,缓慢往下走。 并且我第二天身体不舒服直接告诉他问题,就会收到对应的回复和建议。 比我们去给私教发消息咨询方便更多。 一个月能不能真减到 10 斤我不知道,但有一件事我确定 — 最近这几周我熬夜次数少了。 不是我变自律了,是每天有具体的小事在跟踪。 人一旦盯着具体的小事,就不容易被宏大叙事吸进去。 绝大多数关于 AI 的讨论都在抬头看,看奇点、看 AGI、看人形机器人什么时候量产。 强不强是模型的事,合不合是教练的事。 对了,今天健身房那位真人教练临走时问我,「你那只虾叫什么名字来着?」 我说「小 B」。 他说「行,明天我也去训一只,记得把链接给我一下」。

译NVIDIA CEO 黄仁勋指出,AI已成为每份工作的基本工具。推文作者以自身实践为例,为应对健康与效率焦虑,利用360“龙虾教练”平台在10分钟内训练出个性化AI健身助手“小B”。该AI能记录训练数据、生成专业日报周报,甚至调用其他AI绘制动作示意图,无需用户编写代码或配置复杂工作流。案例展示了AI工具正从概念讨论快速落地为普通人可用的日常助手,也提醒在追赶技术浪潮时,不应牺牲身心健康。

🚨 AI News | TestingCatalog@testingcatalog · 5月19日72

Anthropic announced self-hosted sendboxes and MCP tunnels for Claude Managed Agents during its "Code with Claude" event in London. > With self-hosted sandboxes, you keep sensitive files, packages, and services in your own infrastructure or with a managed sandbox provider. > With MCP tunnels, your agents reach MCP servers inside your private network without exposing them to the public internet.

译Anthropic 在伦敦举办的“Code with Claude”活动上宣布,为 Claude 托管代理推出两项新功能:自托管沙盒(公测版)和 MCP 隧道(研究预览版)。自托管沙盒允许用户在自己的基础设施或托管沙盒提供商中运行代理,从而将敏感文件、软件包和服务保留在私有环境中,确保数据安全。MCP 隧道使代理能够安全访问用户私有网络内的 MCP 服务器,无需将其暴露于公共互联网,增强了访问控制。这两项功能共同支持代理在用户自有的安全边界内执行任务,并默认应用用户的安全策略,有效提升了隐私保护和操作灵活性。

AYi@AYi_AInotes · 5月19日67

说个可能会被骂的判断, 过去十年我们被 Markdown 宠坏了,以为它就是内容交付的终极形态, 但昨晚翻完 html-anything 这个开源项目,上线 7 天,已经 3.3k 星,我突然想通了一件事,就是 AI 时代输出格式的真正的终点应该是 HTML。 这个项目来自 nexu-io,就是那个 4 万星 Open Design 的团队, 它做的事说起来也很简单: 你把任何内容丢进去(MD、CSV、JSON、笔记都行), 按 ⌘+Enter,本地 AI agent 直接生成生产级 HTML,然后一键发到微信、X、知乎,或者下载 HTML/PNG, 整个过程零 API Key、完全本地、流式渲染、随时能中断, 但我真正被吸引住的不是上面这些功能,而是它的设计哲学, 75 个 Skill 模板,每一个都写死了硬约束:8px 网格、CJK 字体栈、对比度 ≥4.5、必须用真实数据,不许放 lorem ipsum, 这些看起来是在限制创意,但实际是把 AI 从 slop 泥潭里拽出来的唯一办法, 没有约束的 AI 永远在 freestyle,花里胡哨、排版崩、字体乱, 有约束的 AI 反而能输出惊艳作品,因为你帮它划定了“设计纪律”的边界, 其实这件事跟我现在对 AI 最大的一个判断完全吻合:AI 最需要的不是自由,是一套合适的枷锁, 继续往下看,三个反直觉的点开始越来越清晰, 第一个,越老的格式在 AI 时代反而越先进, HTML 是 1993 年的东西,但它是 Web 原生、天生响应式、支持动画和暗黑模式,AI 写代码最强的地方就是 HTML/CSS/JS, Markdown 反而成了瓶颈——你写完还得排版、截图、导出、适配不同平台,这些全是损耗, 第二个,不用云 API,生产力反而更高, 零 API Key 听起来像省钱,但你用起来才发现本质是极致的自由:无限调用、零延迟、流式中断不浪费 token, 甚至你本地 用claude login / cursor login 过,它直接复用 session,边际成本 $0, 所以真正的高手往往并不是用最贵的模型,而是用最省的 workflow, 第三个,交付介质的轻量度才是真正的护城河, 几百 KB 的 HTML vs 2MB 的 docx,在微信和手机端加载速度差 10 倍,很多人还在卷内容质量,但很少有人意识到——你交付的介质有多重,读者的打开率就被压得有多低, 以前内容交付是 Markdown → 排版 → 截图 → 调格式 → 发出去, 现在 ⌘+Enter → HTML 直接进剪贴板 → 发出去,中间全砍了, 我才意识到,html-anything 真正在做的不是文档工具,是 Agent 时代的内容生产操作系统——它把创作的终点从草稿拉到了成品,把交付成本直接打到零, 真的强烈推荐,这个项目值得所有内容创作者现在就去 clone 跑起来,选一个 Skill 试试 deck-swiss-international 或 doc-kami-parchment,你会立刻感受到原来内容还可以这么发!

译开源项目html-anything上线7天即获3.3k星,其核心主张是AI时代的内容交付应终结于HTML而非Markdown。项目通过75个预设设计模板(如网格、字体、对比度规范),为本地AI Agent设定明确的“设计纪律”,使其能一键将各类内容转化为生产级HTML并直接发布。文章提出三个反直觉判断:HTML凭借Web原生与响应式特性在AI时代更先进;本地零API调用通过极致自由与零边际成本提升效率;交付介质的轻量化(数百KB的HTML)直接决定用户打开率。该工具正重新定义Agent时代的内容生产工作流。

AYi@AYi_AInotes · 5月19日65

为什么这个项目全网爆火, 拿下10万star,成为2026 AI领域增长最快的开源项目?why?! 先说结论,因为它戳中了咱们所有AI用户的痛点! 现在大家用AI写代码, 最大的问题就是泛泛而谈加幻觉, 让它帮你写个组件,结果给你一堆能用但到处是坑的垃圾🗑 你说帮我做个方案,它给你一堆正确的废话😑 而这个仓库呢,直接把prompt engineering做成了工业级产品, 每个角色都有独特的人格, 标准的工作流程,明确的交付物, 相当于把雇一个10年经验专家的成本降到了0,damn! 所以大家知道我们身边正在发生什么了吧, 未来不会是一个全能AI取代我们所有人, 而是一群专精AI组成的虚拟公司,取代传统公司, 这就是现在以及未来即将发生的事,拭目以待。 #AI趋势 #prompt工程

Alibaba Cloud@alibaba_cloud · 5月19日70

🎨 Introducing Design Desk by QoderWork. An infinite-canvas AI workspace that turns language into running code. 💡 Describe what you want in plain language — get a runnable React + Vite project on an infinite canvas. Designers iterate, devs ship the same files. Seamless handover. ⏬Download QoderWork Now https://www.qoderwork.ai #AI #Qoder #QoderWork #DesignDesk

译🎨 介绍QoderWork的Design Desk。一个将语言转化为可运行代码的无限画布AI工作区。 💡 用自然语言描述你的需求——即可在无限画布上获得可运行的React + Vite项目。设计师迭代,开发者交付相同文件。无缝交接。 ⏬立即下载QoderWork https://www.qoderwork.ai #AI #Qoder #QoderWork #DesignDesk

歸藏(guizang.ai)@op7418 · 5月19日57

藏师傅这个通过前端生成讲解视频的 Skill 其实已经搞完了。 但是还是想优化一下效果,提高一下工程化,以及降低一下 Token 的用量。 所以我让 Claude Code 跑了一个 40 秒钟的案例,然后让他对其中的 Token 进行了一下分析,看一下哪边占比比较多,然后再进行针对性的优化。 看起来其中视频组合消耗的百分比非常大。如果用 Claude Code 的话,会有 92% 的缓存,所以还好。 具体分析如下: 1. 总消耗:一个 40 秒的视频是 145 万 Token 2. 消耗结构: (a) 输入占比非常高 (b) 输出占比很低,仅占 0.7% 视频组合和 Skills 占了最大的大头。

译“藏师傅”前端视频生成技能已完成,当前重点在于提升工程化水平与降低Token消耗。对一段40秒视频案例的分析显示,总消耗达145万Token,其中视频组合部分占比极高,但得益于92%的缓存率成本可控。该方案由PPT Skill(美学动效)、HyperFrames(时间线渲染)、Listenhub Skill(配音)及即梦CLI(生成演示镜头)协同完成。

歸藏(guizang.ai)@op7418 · 5月19日56

CodePilot 令我非常震惊的一个点是,最近因为我用它做 PPT Skills 做的比较多,它把我的风格喜好记下来了。 然后它改掉了生成式 UI widget 里面的视觉样式。 开始用我最喜欢的视觉风格来为我生成可视化的内容解释,这个太顶了! 看一下这三个图,太漂亮了!

译CodePilot展示了强大的个性化能力,能通过用户频繁使用PPT功能的行为,学习并记录其视觉风格偏好。系统随后将这一风格应用于生成式UI组件的视觉样式中,使生成的可视化内容自动适配用户喜好,提升了内容的个性化与美观度。

Luma@LumaLabsAI · 5月19日54

Great advertising doesn't just translate. It resonates. One campaign rarely fits every market. Define the region, set the message, and let Luma Agents handle every localized variation from there. The right creative, the right language, built for every audience you need to reach. Reach every market → http://lumalabs.ai/app

译优秀的广告不止于翻译,更在于共鸣。 单一营销活动很难适用于所有市场。明确目标区域,设定核心信息,然后让 Luma Agents 处理后续所有本地化变体。为每个目标受众打造合适的创意与语言。 触达每个市场 → http://lumalabs.ai/app

歸藏(guizang.ai)@op7418 · 5月19日60

Telegram 上的机器人现在可以直接跟其他机器人对话了 也就是你的群聊可以直接拉多个不同的 Agent 机器人进行交流。

译Telegram上的机器人现在可以直接跟其他机器人对话了 也就是你的群聊可以直接拉多个不同的Agent机器人进行交流。 [引用 @durov]:🤖 AI开发者要求这个功能——我们实现了。 💬 机器人现在可以在Telegram上与其他机器人对话。 🧠 自主智能体现在拥有了人类可理解的通信层。

歸藏(guizang.ai)@op7418 · 5月19日57

英伟达开始交付自己设计的通用 CPU NVIDIA Vera了。 重点优化的是长期高并发和高吞吐的场景,专门用来做Agent 编排和工具调用的中枢。 模型可以在 GPU 上进行推理,但所有的调度编排和调用工具都放在这个 CPU 上。 这种密集 Agent、密集常驻的强 IO、内存和调度压力的工作,其实都是 CPU 的工作,所以他们专门做了一个 CPU。 这次交付由英伟达自己上门,将这个 CPU 送到了:Anthropic、OpenAI、xAI、OCI,其中 xAI 是由老马亲自接待的。

译英伟达正式开始交付其首款自研通用CPU——NVIDIA Vera。该芯片专门针对AI Agent时代高并发、高吞吐的长期运行场景进行优化,核心功能是作为Agent编排与工具调用的调度中枢。它旨在将原本由GPU承担的密集调度与I/O任务分离,由CPU专门处理,从而构建更高效的AI系统。首批Vera CPU由英伟达高管亲自送至Anthropic、OpenAI、xAI及甲骨文云(OCI),其中xAI由马斯克亲自接待。此举标志着英伟达正从GPU主导的推理市场,深入布局为AI Agent时代定制计算基础设施的新赛道。

Alibaba Cloud@alibaba_cloud · 5月19日39

We're excited to share that Alibaba Cloud Singapore will be at ATxEnterprise EXPO Hall 3, Booth 3K3-4! Visit us to discover how Alibaba Cloud is accelerating enterprise transformation with AI through intelligent infrastructure, AI-native technologies, and real-world solutions. What to expect at our booth: Live booth presentations and solution showcases Try out our AI Business Card Studio and take home your own AI-powered business card Experience our latest AI innovations and enterprise solutions - from Happy Horse, the latest powerful AI video content creation tool, to Qoder - agentic AI assistants, TiDB, powered by PingCAP AI-ready database capabilities, and enterprise AI solutions by Lingyang. Come explore how AI is reshaping the future of business with us. See you there! Lumen Technologies Asia Pacific #AlibabaCloudSG #AI #DigitalTransformation #LLM #Qwen #ATxEnterprise

译阿里云新加坡将在ATxEnterprise展会展示其通过智能基础设施、AI原生技术与现实解决方案加速企业转型的成果。重点展示包括AI Business Card Studio、AI视频工具Happy Horse、代理式AI助手Qoder、基于PingCAP AI就绪数据库能力的TiDB,以及Lingyang的企业AI解决方案。其合作伙伴Lumen Technologies亚太区也将参与。

Berryxia.AI@berryxia · 5月19日76

今天就被奥德赛实验室的“实际”模型刷屏! Odyssey刚刚把“世界模型”直接拉进多人模式了。 Agora-1,全球第一个真正实时的多agent世界模型。 人类和AI现在可以同时进同一个模拟世界,实时互动、互相影响。 他们直接拿经典GoldenEye死亡竞赛做了可玩的研究预览。 你现在就能进去,和AI一起开黑、互射、抢旗,模型会实时生成画面和声音,整个世界持续更新。 这已经不是单人生成视频,而是多人共享的活世界。 Odyssey说,长期来看,多agent世界模型会彻底改变游戏、模拟、教育、机器人和AI协作的方式。 大家不再是旁观者,而是真正一起生活在同一个模拟里。 现在就可以去试:https://agora.odyssey.ml 完整介绍在这里:https://odyssey.ml/introducing-agora-1

译奥德赛实验室推出Agora-1,这是全球首个实时多agent世界模型,允许多人与AI同时在同一个模拟世界中实时互动并相互影响。该模型以经典游戏GoldenEye死亡竞赛为演示场景,提供可玩研究预览,用户现在即可体验与AI共同参与动态生成的模拟世界。这标志着从单人生成视频向多人共享“活世界”的转变,长期来看可能重塑游戏、模拟、教育、机器人及AI协作等领域,使人类从旁观者变为与AI共同生活的参与者。

Berryxia.AI@berryxia · 5月19日76

兄弟们,Cursor直接把Composer拉到2.5了。 他们这次喊得特别狠:这是目前最强大的模型。(自己说的哈) 更聪明、长任务持续能力更强、执行复杂指令也更靠谱。 最离谱的是,它在同等能力下能做到10倍效率。 我看完他们的完整发布后发现,这波升级的底层其实是三件事: 训练规模直接拉大、RL环境做得更复杂、还加了文本反馈机制,让模型能在几十万token的长rollout里快速学到正确归因。 更重要的是,Composer 2.5的底座和Moonshot的Kimi K2.5是同一套开源架构。 而Cursor已经和SpaceXAI一起开始训一个更大模型,用10倍算力,依托Colossus 2百万H100等效规模,目标是下一次真正的大跳跃。 以前我们用AI写代码还总担心它半途崩、指令执行飘、长任务忘掉上下文。 现在Cursor直接把这个问题往死里卷。 下周他们还把这个模型的包含用量直接翻倍。 完整介绍在这里:https://cursor.com/blog/composer-2-5

译Cursor正式推出Composer 2.5模型,宣称其为当前最强大的AI模型。该模型在智能性、长任务持续执行及复杂指令遵循等方面均有显著提升,并声称在同等能力下效率提升10倍。此次升级主要基于扩大训练规模、构建更复杂的强化学习环境以及引入文本反馈机制。值得注意的是,Composer 2.5的底层架构与Moonshot的Kimi K2.5同源。同时,Cursor正与SpaceXAI合作,计划用十倍算力训练下一代更大模型。未来一周内,该模型的包含用量将翻倍。

AYi@AYi_AInotes · 5月19日72

Damn,这个GitHub项目,直接给你发了一整个AI公司,都给我收藏拿走! 10万 GitHub star🌟,被称为2026年增长最快的AI项目, 146个专业AI专家,12个完整部门。 一条命令,全部装进你的Claude Code, 从前端开发到安全审计,从产品经理到增长黑客, 不用发工资,不用请假,24小时在线。 #AI #AIAgent #ClaudeCode

译一个GitHub项目引发关注,据称已获得10万星标并被称为2026年增长最快的AI项目。该项目的核心功能是模拟一整家AI公司,包含146个不同领域的AI专家角色和12个完整部门。用户可以通过一条命令,将这些“员工”全部集成到Claude Code中,从而免费获得涵盖前端开发、安全审计、产品管理、增长黑客等多方面的7x24小时AI支持。

meng shao@shao__meng · 5月19日70

HTML 是新的 Markdown? 10 天前 Claude Code 核心开发者 @trq212 发布了「Using Claude Code: The Unreasonable Effectiveness of HTML」,指出「HTML 是新的 Markdown」,引起了极其热烈的讨论,单篇超 1200 万阅读、1 千+ 讨论 https://x.com/trq212/status/2052809885763747935 10 天后,Thariq 在和 @clairevo 的访谈中再次重申这一观点「HTML 是新的 Markdown」,他直接指出:Markdown 作为人与 LLM 的通用语已经触到天花板,一旦任务量变大,人们会直接放弃阅读 Markdown 文件! 而 HTML 提供了可视化、可交互的载体,把人从"被动审阅者"变回"主动协作者",能把人们重新被拉回 Agent Loop 中。在 AI 时代,每个人都正在变成 "算力分配者"——核心工作不再是写代码,而是决定算力该花在哪里。HTML 是帮助人做出这个判断的更好界面。 # 三个可立即落地的工作流 工作流 1:用交互式 HTML 做头脑风暴与规划 把传统的"列个清单"换成"生成一个 HTML 文件"。 输入差异极小,输出差异极大:得到的不是文本列表,而是带 mockup、风险评估、可滚动浏览的可视页面。 进一步推到完整实施方案时,提示词哲学值得注意: · 给足约束,但留出让模型超出预期的空间。 · 拼写错误不重要,意图表达清晰才重要。 · 显式传达信任("I trust you here")会改变输出质量。 工作流 2:为编辑计划而生成"一次性微应用" 针对"HTML 不如 Markdown 易编辑"的质疑,他的答案是反直觉的:不要去编辑 HTML,而是让 Claude 现场造一个专门用来编辑这段内容的 UI。 例如要修改一组数据可视化的决策规则,他让 Claude 生成一个带输入框、下拉、增删按钮、一键复制回 Markdown 的小网页。用完即弃。 这背后是"算力丰裕心态(abundance mindset)":既然生成 UI 几乎零成本,就应该为每一个具体的编辑任务定制最舒适的界面,而不是迁就通用工具。 工作流 3:可执行的"活体设计系统" 让 Claude 扫描代码库(甚至多个 GitHub 仓库)提取设计 DNA,产出一份 design_system.html。 · 它不是静态文档,而是人机双向可读的工件:色板、字号、间距、组件交互态都在页面上活生生地渲染出来。 · 在新功能开发时,把这份 HTML 作为上下文喂给 Claude,即可保证产出符合品牌一致性。 · 配合组件 playground(带可调节旋钮),还能成为非技术同事(市场、设计、视频)自助获取高保真素材的入口,打通工程与公司其他职能之间的鸿沟。 真正值得记住的几个判断 1. 媒介决定参与度。 模型不需要 HTML,人类需要。换载体的本质是把人留在协作回路里。 · 1% 与 99% 的算力分配。 Thariq 估计他生成的 token 只有约 1% 最终进入生产代码,其余 99% 都花在"脚手架"上——计划、临时 UI、状态汇报、设计系统。这恰恰是 compute allocator 的本职:把资源投在对齐与沟通上,以确保那 1% 是对的。 · 一次性软件是新常态。 软件的边际成本趋近于零之后,"为一次编辑造一个 app"不再奢侈,而是高效。 · 信任是提示词的一部分。 显式的授权语句会让模型敢于给出更完整、更有创造性的产出。

译Claude Code核心开发者Thariq认为,Markdown在复杂任务中可读性差,导致人类易脱离协作循环。而HTML作为可视化、可交互的界面,能将人重新拉回人机协作回路,适配AI时代“算力分配者”的新角色。他提出了三个可落地的工作流:用交互式HTML进行头脑风暴;为特定任务生成“一次性微应用”;构建人机双向可读的“活体设计系统”。核心判断包括:媒介选择决定人类参与度;生成式算力应主要投入在对齐与沟通的“脚手架”上;软件边际成本趋零;以及明确信任指令能激发更创造性的输出。

meng shao@shao__meng · 5月19日79

Claude Code 核心开发者 Thariq 带来自己高频使用的「开发日志」提示词 @trq212 这段提示词解决了 AI 协作编码中最棘手的结构性问题:规格永远写不完整,但人又无法实时跟踪 AI 的每一个判断。 传统的两种极端都失败: 1. 过度规约:试图在 spec 里穷举所有边界情况——不现实,且拖慢启动 2. 完全放手:让 agent 自由发挥——结果是大量隐性决策埋藏在 diff 里,code review 时才发现,返工成本极高 这个提示词走的是第三条路:承认歧义不可避免,把"判断"这个动作本身变成可审计的产物。 这种做法为啥有效? · 降低模型的"过度澄清"倾向:模型不必反复打断你问问题,可以自主推进 · 把隐性决策外化:原本藏在代码里的"为什么这样写"被显式写出来,review 时直接对照笔记,而不是逆向工程 diff · 结构化的四个维度正好覆盖了实施中所有"非代码信息": · Design decisions = 填补 spec 的空白 · Deviations = 偏离 spec 的地方(最危险,必须显式) · Tradeoffs = 没走的路(防止 reviewer 重复思考同样的备选) · Open questions = 需要人类回环的点 · HTML/Markdown 作为载体:轻量、可读、可与代码同 PR 提交,不需要额外工具 值得借鉴的 prompt 设计原则 · 给模型一个"合法的出口",而不是逼它在歧义前停下或瞎猜 · 要求结构化产物(四个明确分类),比开放式"写点笔记"质量高一个数量级 · 用单独文件而非 inline 注释——保持代码干净,同时让元信息集中、可搜索 · 二次迭代本身是个示范:第一版凭直觉写,第二版让 Claude 帮忙结构化——这就是这条 prompt 自己倡导的"人机协作"范式 提示词原文: Implement <SPEC>. As you work, maintain a running implementation-notes.html file that captures anything I should know about how the implementation diverges from or interprets the spec, including: · Design decisions: choices you made where the spec was ambiguous · Deviations: places where you intentionally departed from the spec, and why · Tradeoffs: alternatives you considered and why you picked what you did · Open questions: anything you'd want me to confirm or revise

译针对AI协作编码中“规格永难完整”与“决策无法追踪”的核心矛盾,此提示词提出了第三条路径。它要求AI在实现需求时同步维护一份结构化文档,明确记录设计决策、对规格的偏离、考虑过的权衡以及待确认的开放性问题。这种方法的关键在于将AI执行过程中的隐性判断显式化、文档化,从而让Code Review可直接对照决策笔记,而非逆向工程代码。它不仅降低了模型的过度澄清倾向,更通过提供结构化产物,建立了一种可审计、可协作的人机开发新范式。

Berryxia.AI@berryxia · 5月19日77

兄弟们,Claude Design 直接放大招了! Anthropic 官方刚刚宣布:所有计划的 token limit 全部翻倍。 以前用它做完整 UI、生成多页设计稿、跑复杂 Agent 工作流,经常做到一半就撞墙。 现在直接多出一倍空间,连续创作的体验彻底不一样了。 对每天 vibe coding、做原型、生成设计、写产品页的兄弟来说,这波更新把 Claude Design 从“能用”直接推到了“真香”。 以前总觉得 token 限制是最大瓶颈,现在 Anthropic 用实际行动告诉你:他们还在认真把创作工具往死里卷。

译Anthropic宣布Claude Design所有计划的Token限制翻倍。这解决了以往在处理完整UI设计、多页设计稿或复杂Agent工作流时频繁出现的token不足问题。翻倍后的空间显著提升了连续创作的体验,让该工具在vibe coding、原型制作等任务中实用性大增,从“能用”跃升至“真香”。这体现了Anthropic为提升竞争力而对创作工具的持续优化。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月20日
02:09
Google AI@GoogleAI
85
三年前,Gemini从理解世界开始。 随着Gemini 2,模型学会了思考和推理。 去年底,Gemini 3将任何想法变为现实。 今天,我们继续这段旅程,推出Gemini 3.5系列,首先发布Gemini 3.5 Flash,为智能体和编程提供前沿性能。
智能体Google推理模型发布
02:08
Google Gemini@GeminiApp
精选74
Gemini Spark 是你的新全天候个人AI代理。 给它一个任务,它会在后台自主工作,即使你的手机和笔记本电脑已关机。你选择启用它,它被设计为在执行重大操作前会先征询你的意见。#GoogleIO
智能体Google产品更新

推荐理由:Google把AI代理做成了24/7在线的背景进程,手机关机也不停,这是从对话助手到自主执行的一步大跨越,对普通人来说,真正的虚拟助理可能要来了。
02:06
🚨 AI News | TestingCatalog@testingcatalog
66
谷歌在I/O大会上发布了名为Gemini Spark的24/7个人AI代理。该产品基于Gemini 3.5模型与Antigravity平台构建,运行在Google Cloud专用虚拟机上,可无需用户保持设备开机而在后台自主执行长时间任务。Gemini Spark旨在作为用户的数字助手,依据指令采取行动,并计划通过MCP协议与Google现有工具及第三方应用集成。目前该产品已向部分测试者开放,下周将面向美国Ultra用户推出。

Google: Introducing Gemini Spark ✨ It's your 24/7 personal AI agent that helps you navigate your digital life, taking action on ...

智能体GoogleMCP/工具产品更新
02:03
Artificial Analysis@ArtificialAnlys
78
速度智能兼得的新一代AI:谷歌Gemini 3.5 Flash发布

谷歌发布新模型Gemini 3.5 Flash,其在智能指数上提升9分至55分,超越Grok 4.3和Claude Sonnet 4.6,尤其在代理任务和知识真实性(大幅减少幻觉)方面进步显著。输出速度超280 tokens/s,使其位于速度与智能的领先前沿。然而,模型运行成本相比前代增加5.5倍,主要由于输入令牌用量及定价上涨。此外,它在多模态评估MMMU-Pro中取得最高分,支持多模态输入,展现了谷歌的综合优势。

智能体DeepMindGoogle多模态
01:59
Jeff Dean@JeffDean
85
谷歌发布Gemini 3.5 Flash,专为复杂代理工作流设计

在Google I/O大会上,谷歌正式推出Gemini 3.5系列模型,首个发布的Gemini 3.5 Flash专为执行复杂、长周期的代理工作流而设计。该模型在Terminal-Bench和MCP Atlas等编程与代理基准测试中得分超越3.1 Pro,且运行速度可达其他前沿模型的4倍。若在Google Antigravity环境中使用,速度提升可高达12倍。它能高效部署协同工作的子代理,通过高频迭代循环来解决现实世界的大规模问题。

智能体Google模型发布编码
01:59
elvis@omarsar0
46
人们和公司越早认识到这一点,就越能更好地利用AI。 这很有道理。我们训练当前的AI系统,是为了在与人类专业知识结合时达到最佳效果。 未来可能会有变化。更自主的智能体即将到来。但即便如此,人类的验证和创造力仍将至关重要。 【引用 @balajis】:每个AI智能体最终都有一个人类委托人。

Balaji: Every AI agent ultimately has a human principal.

智能体大佬观点
01:41
Google DeepMind@GoogleDeepMind
81
推出 Gemini 3.5:我们最新的模型系列,将前沿智能与现实行动相结合。 首个发布版本是 3.5 Flash,这是我们迄今为止在智能体和编码方面最强大的模型 🧵
智能体Google模型发布编码
01:36
🚨 AI News | TestingCatalog@testingcatalog
77
谷歌在I/O大会宣布推出Antigravity 2.0平台,面向全球用户开放。该平台集成了新的智能体系统和自然语音交互体验,Gemini 3.5 Flash模型在Antigravity上的运行速度提升了12倍。谷歌展示了其智能体在该平台上仅用12小时,通过93个并行子智能体、超过1.5万次模型调用和处理26亿个token,成功从零构建出一个可运行的操作系统,API调用成本不到1000美元。

Google: We asked our agents to build a working operating system from scratch using @Antigravity 2.0 and Gemini 3.5 Flash. It too...

智能体Google产品更新语音
00:59
François Chollet@fchollet
56
大多数人类任务并非马尔可夫过程,最优的下一步行动无法仅凭当前状态决定。它很大程度上取决于过去的轨迹、原始意图和上下文约束。一个无法以绝对保真度压缩和追踪其过去轨迹的智能体,其效用可能只有能做到这一点的智能体的20%。
智能体大佬观点
5月19日
23:58
elvis@omarsar0
62
代码或成AI代理框架的关键路径

推文聚焦于一篇探讨AI代理(Agent)开发框架的百页报告,其核心主张是“代码作为代理框架”具有重要潜力。报告总结了相关方法与应用,并论证该路径可能推动更广泛的科学框架工程。论文进一步提出,未来的智能系统必须具备四项关键特性:可执行、可检查、有状态以及受控。报告旨在为构建有效AI代理提供参考,并推荐相关学习资源。

智能体arXivMCP/工具论文/研究
23:31
OpenRouter@OpenRouter
精选68
OpenRouter上的任何工具调用模型现在都可以自主调用网络搜索和网页抓取功能。 模型可以自行决定何时搜索、搜索什么以及搜索次数。 我们新增了@p0作为新的网络搜索提供商。了解更多:https://openrouter.ai/announcements/agentic-web-tools
智能体产品更新搜索

推荐理由:OpenRouter 把 agentic web search 变成了开关,模型决定何时搜索。对于还在自己搭搜索管道的开发者,这是官方偷懒答案。
23:31
凡人小北@frxiaobei
59
本次更新亮点在于展现了"操作系统级感知力"的交互新方向。其核心优势并非单一模型,而是Gmail、Drive等服务的深度生态整合,这为重度用户构建了高迁移成本的壁垒。桌面端AI竞争已进入新阶段,谁先实现顺畅的系统级感知体验,谁将占据先机。

听澜: 可以!Google这次是认真了, 结合前一段的goolebook看这个消息,光标停在哪个窗口、哪个界面,它就直接读懂那里在干嘛。 这个交互逻辑如果做顺了, 体验会比"点击分享屏幕"自然一个量级。 再加上Spark模式跑本地Agent, 浮窗...

智能体Google大佬观点端侧
23:04
🚨 AI News | TestingCatalog@testingcatalog
64
GOOGLE I/O 🔥:Google Flow即将接入Gemini Omni和全新的Flow Agent体验! > 您的代理已激活!可让Gemini进行创意构思、生成图像变体、重命名资源或回答关于Flow的问题。在下方开始输入,或点击右上角的展开图标开启聊天模式。 自定义风格工具现已推出。
智能体Google产品更新
23:01
Berryxia.AI@berryxia
53
Lucius AI获300万美元融资,构建企业"上下文层"提升协作效率

Lucius AI完成300万美元融资,旨在构建组织的“上下文层”以解决企业协作中的核心痛点:尽管个人借助AI效率大幅提升,但组织仍困于重复构建信息上下文的循环。其产品通过分析历史对话、自动化用户访谈、构建自学习支持系统及生成自然语言规则,将团队内的交流与决策转化为持续积累的“组织记忆”,目标是减少超过30%被浪费在重复确认已有信息上的时间,让团队能真正以AI时代的速度运转。

Lucius: We raised $3M to build Lucius AI - the Context Layer for Your Organization. Backed by Future Capital Discovery Fund, we'...

智能体行业动态
22:56
向阳乔木@vista8
63
坚果云多场景同步方案实测与成本优势

坚果云同步功能可用于跨设备同步本地.agents目录、替代Obsidian官方同步服务,以及通过Webdav支持CC Switch等工具的API配置。其共享功能便于文件协作。个人用户年费199元,在价格上相比各类AI工具订阅更具性价比。

智能体教程/实践
22:26
Baidu Inc.@Baidu_Inc
67
这里快速补充一个指标新词:DAA。 全称 Daily Active Agents(每日活跃智能体),相当于智能体时代的 DAU。 如果说代币经济学追踪成本,那么 DAA 追踪产出--智能体实际完成了多少工作。 完整对比见下文 ↓
智能体现象/趋势
22:01
Berryxia.AI@berryxia
26
用户调侃AI助手HappyCapy可能产生的巨额Token消耗成本。推文核心是指出通过HappyCapy控制Mac等操作,虽然功能强大,但背后运行所需的Token资源可能远超预期,导致高昂的运营费用。引用内容展示了HappyCapy能通过一条命令连接并控制用户Mac电脑的具体方法,印证了其功能的实现依赖于大量后台计算与交互,从而引发了主推文中对其运营成本(即Token消耗)的调侃。

Happycapy: I can control my Mac with hapoycapy! Connect Your Mac in 3 Steps Step 1: Open Terminal on your Mac Press `Cmd + Space`, ...

智能体其他
22:01
Berryxia.AI@berryxia
29
在X 上大家可以习以为常的使用Claude、Codex 都是稀松平常的事儿,可在现实生活中周围同事和朋友还是停留在豆包的ChatBot模式。

科技圈用户熟练使用Claude、Codex等AI工具,但普通用户多停留在基础聊天机器人阶段。AI Agent如Hermes向大众扩散时,上手难度高:需自行编写提示词、配置工作流、选择模型,导致许多安装后闲置。因此,普通用户需要开箱即用的产品。360安全龙虾云端版针对此痛点,内置100多个预训练专家模型,适配各类场景,集成语言、图像、视频生成模型,支持工作流串联。全平台可用,接入微信、飞书等,并提供“龙虾教练”功能辅助定制Agent,有效降低使用门槛。

向阳乔木: 小龙虾和Hermes的热度在AI科技圈终于降了。 按扩散发展规律看,民间热度估计刚刚开始。 但对于普通用户来说,各种龙虾类Agent产品上手难度还是有点高。 如提示词怎么写、工作流怎么配、模型怎么选,全靠自己摸索。 不少大厂提供了 Open...

智能体产品更新
21:57
Chubby♨️@kimmonismus
65
Viktor获Accel领投7500万美元A轮融资,创波兰公司纪录,Slack创始人参投。

Viktor是一个AI员工产品,获得由Accel领投的7500万美元A轮融资,创下波兰创始公司史上最大额。投资亮点在于Slack联合创始人Stewart Butterfield和Cal Henderson作为天使投资人参与,这为产品提供了关键信任背书。Viktor能自主按计划运行,连接3000多种工具并直接交付完整工作成果。目前已有12,000多个团队使用,年化收入达1500万美元,在企业效率提升方面展现显著价值,如节省成本、增加收入与恢复团队时间。

Fryd Wiatrowski: Today, we're announcing Viktor's $75M Series A, led by @Accel . @viktor__com was supposed to be a small experiment. It b...

智能体行业动态
21:29
Rohan Paul@rohanpaul_ai
精选78
AI代理在实际应用中需为每个外部服务重复构建集成逻辑,成为其发展的主要瓶颈。针对此问题,Membrane推出了一种通用"技能"解决方案。通过该单一技能,Claude Code、ChatGPT、Cursor等主流AI代理能够用一条指令调用超过10万个不同的API,涵盖从Stripe支付服务到NASA火星车数据等各类服务。这极大简化了开发流程,将定制化集成转变为通用的连接能力,降低了使用门槛。同时,Membrane正发起社区挑战,鼓励用户提交小众API以获得演示和免费额度激励,旨在持续扩展其连接生态。

Membrane: We built one skill that connects any agent to any API. Stripe. NASA Mars Rover. The ISS tracker. The Evil Insult Generat...

智能体MCP/工具开源/仓库

推荐理由:Membrane 把十万个 API 集成压缩成一行命令,做 agent 的人不用再写胶水代码,直接拿来用就行,省心。
21:26
向阳乔木@vista8
26
小龙虾和Hermes热度向民间扩散,360推出云端版

AI Agent如“龙虾”工具热度从专业圈向民间扩散,但普通用户面临提示词编写、工作流配置等上手难题。360推出“安全龙虾云端版”,内置预训练专家模型,提供“龙虾教练”引导,实现开箱即用,支持全平台接入,降低使用门槛。

智能体产品更新
20:01
Berryxia.AI@berryxia
44
AI Agent开发效率惊人:两小时复刻149美元系统

开发者利用Cursor与Claude组合,仅用两小时就复刻了一套海外售价149美元的Three.js热带海洋实时交互系统,并实现了80%以上的功能还原与额外增强。此案例直观体现了“AI Agent开发工具”对复杂应用开发时间和成本的极致压缩。Cursor Auto模式提供了无需特殊网络的技术便利,使这种高效的开发思路具备广泛扩展至天气、生态、教育等场景的潜力。

Berryxia.AI: 我靠!不是,我是最后一个知道的吗??? 你们的嘴可真严啊,Cursor选择Auto模式下。 居然不需要魔法网络就可以使用啊!

智能体教程/实践编码
19:03
🚨 AI News | TestingCatalog@testingcatalog
46
ClickUp的AI大脑将很快能够从单个提示词构建完全交互式的应用程序,并实现实时数据集成。 一些示例 👀 > 冲刺追踪器 - 将您的团队运营重塑为面向利益相关者的分析仪表板。 > CRM工具 - 在现有数据之上,拥有一个带有可自定义控件的自定义仪表板。 > 实时OKR仪表板 - 拥有一个可以自动拉取最新更新的动态视图。
智能体产品更新
19:01
Berryxia.AI@berryxia
67
10分钟训出AI健身教练,黄仁勋的预言正在照进现实

NVIDIA CEO 黄仁勋指出,AI已成为每份工作的基本工具。推文作者以自身实践为例,为应对健康与效率焦虑,利用360“龙虾教练”平台在10分钟内训练出个性化AI健身助手“小B”。该AI能记录训练数据、生成专业日报周报,甚至调用其他AI绘制动作示意图,无需用户编写代码或配置复杂工作流。案例展示了AI工具正从概念讨论快速落地为普通人可用的日常助手,也提醒在追赶技术浪潮时,不应牺牲身心健康。

智能体多模态教程/实践
18:33
🚨 AI News | TestingCatalog@testingcatalog
72
Anthropic 在伦敦举办的"Code with Claude"活动上宣布,为 Claude 托管代理推出两项新功能:自托管沙盒(公测版)和 MCP 隧道(研究预览版)。自托管沙盒允许用户在自己的基础设施或托管沙盒提供商中运行代理,从而将敏感文件、软件包和服务保留在私有环境中,确保数据安全。MCP 隧道使代理能够安全访问用户私有网络内的 MCP 服务器,无需将其暴露于公共互联网,增强了访问控制。这两项功能共同支持代理在用户自有的安全边界内执行任务,并默认应用用户的安全策略,有效提升了隐私保护和操作灵活性。

Claude: Live from Code with Claude London: we're launching self-hosted sandboxes (public beta) and MCP tunnels (research preview...

智能体AnthropicMCP/工具产品更新
14:51
AYi@AYi_AInotes
67
AI时代内容交付的真正终点是HTML

开源项目html-anything上线7天即获3.3k星,其核心主张是AI时代的内容交付应终结于HTML而非Markdown。项目通过75个预设设计模板(如网格、字体、对比度规范),为本地AI Agent设定明确的“设计纪律”,使其能一键将各类内容转化为生产级HTML并直接发布。文章提出三个反直觉判断:HTML凭借Web原生与响应式特性在AI时代更先进;本地零API调用通过极致自由与零边际成本提升效率;交付介质的轻量化(数百KB的HTML)直接决定用户打开率。该工具正重新定义Agent时代的内容生产工作流。

AYi: http://x.com/i/article/2053129966217277440

智能体开源/仓库现象/趋势
13:50
AYi@AYi_AInotes
65
为什么这个GitHub项目全网爆火并拿下10万star?

summary_zh

AYi: Damn,这个GitHub项目,直接给你发了一整个AI公司,都给我收藏拿走! 10万 GitHub star🌟,被称为2026年增长最快的AI项目, 146个专业AI专家,12个完整部门。 一条命令,全部装进你的Claude Code, ...

智能体AnthropicGitHubMCP/工具
12:12
Alibaba Cloud@alibaba_cloud
70
🎨 介绍QoderWork的Design Desk。一个将语言转化为可运行代码的无限画布AI工作区。 💡 用自然语言描述你的需求--即可在无限画布上获得可运行的React + Vite项目。设计师迭代,开发者交付相同文件。无缝交接。 ⏬立即下载QoderWork https://www.qoderwork.ai #AI #Qoder #QoderWork #DesignDesk
智能体产品更新编码
11:59
歸藏(guizang.ai)@op7418
57
藏师傅前端视频生成Skill完成与优化分析

“藏师傅”前端视频生成技能已完成,当前重点在于提升工程化水平与降低Token消耗。对一段40秒视频案例的分析显示,总消耗达145万Token,其中视频组合部分占比极高,但得益于92%的缓存率成本可控。该方案由PPT Skill(美学动效)、HyperFrames(时间线渲染)、Listenhub Skill(配音)及即梦CLI(生成演示镜头)协同完成。

歸藏(guizang.ai): 让 Codex 自己做了一条视频介绍了一下这个视频生成方案 藏师傅的 PPT Skill 负责美学、版式、动效 HyperFrames 负责时间线和渲染、字幕 Listenhub Skill 负责配音 即梦 CLI 负责 前端无法生成的演示...

智能体MCP/工具教程/实践视频
11:59
歸藏(guizang.ai)@op7418
56
CodePilot学习用户风格并自动调整UI生成样式

CodePilot展示了强大的个性化能力,能通过用户频繁使用PPT功能的行为,学习并记录其视觉风格偏好。系统随后将这一风格应用于生成式UI组件的视觉样式中,使生成的可视化内容自动适配用户喜好,提升了内容的个性化与美观度。

智能体产品更新多模态
11:10
Luma@LumaLabsAI
54
优秀的广告不止于翻译,更在于共鸣。 单一营销活动很难适用于所有市场。明确目标区域,设定核心信息,然后让 Luma Agents 处理后续所有本地化变体。为每个目标受众打造合适的创意与语言。 触达每个市场 → http://lumalabs.ai/app
智能体产品更新视频
10:59
歸藏(guizang.ai)@op7418
60
Telegram上的机器人现在可以直接跟其他机器人对话了 也就是你的群聊可以直接拉多个不同的Agent机器人进行交流。 【引用 @durov】:🤖 AI开发者要求这个功能--我们实现了。 💬 机器人现在可以在Telegram上与其他机器人对话。 🧠 自主智能体现在拥有了人类可理解的通信层。

Pavel Durov: 🤖 AI devs asked for this - and we delivered. 💬 Bots can now talk to other bots on Telegram. 🧠 Autonomous agents now h...

智能体产品更新
10:59
歸藏(guizang.ai)@op7418
57
英伟达首款自研CPU Vera交付

英伟达正式开始交付其首款自研通用CPU——NVIDIA Vera。该芯片专门针对AI Agent时代高并发、高吞吐的长期运行场景进行优化,核心功能是作为Agent编排与工具调用的调度中枢。它旨在将原本由GPU承担的密集调度与I/O任务分离,由CPU专门处理,从而构建更高效的AI系统。首批Vera CPU由英伟达高管亲自送至Anthropic、OpenAI、xAI及甲骨文云(OCI),其中xAI由马斯克亲自接待。此举标志着英伟达正从GPU主导的推理市场,深入布局为AI Agent时代定制计算基础设施的新赛道。

NVIDIA: NVIDIA's Ian Buck hand-delivered the first-ever NVIDIA Vera CPUs to our partners @AnthropicAI, @OpenAI, @SpaceX, and @Or...

智能体AnthropicOpenAI产品更新
10:40
Alibaba Cloud@alibaba_cloud
39
阿里云新加坡展会主推AI企业转型方案

阿里云新加坡将在ATxEnterprise展会展示其通过智能基础设施、AI原生技术与现实解决方案加速企业转型的成果。重点展示包括AI Business Card Studio、AI视频工具Happy Horse、代理式AI助手Qoder、基于PingCAP AI就绪数据库能力的TiDB,以及Lingyang的企业AI解决方案。其合作伙伴Lumen Technologies亚太区也将参与。

智能体行业动态视频
09:56
Berryxia.AI@berryxia
精选76
首个实时多agent世界模型发布,人类可与AI同屏互动

奥德赛实验室推出Agora-1,这是全球首个实时多agent世界模型,允许多人与AI同时在同一个模拟世界中实时互动并相互影响。该模型以经典游戏GoldenEye死亡竞赛为演示场景,提供可玩研究预览,用户现在即可体验与AI共同参与动态生成的模拟世界。这标志着从单人生成视频向多人共享“活世界”的转变,长期来看可能重塑游戏、模拟、教育、机器人及AI协作等领域,使人类从旁观者变为与AI共同生活的参与者。

Odyssey: Introducing Agora-1, a multi-agent world model. Multiple participants-human or AI-can now interact inside the same world...

智能体多模态模型发布

推荐理由:Odyssey把世界模型推进到了多人实时交互,可玩的GoldenEye死亡竞赛预览比任何PPT都有说服力,做游戏和模拟的人得上去打两把。
09:56
Berryxia.AI@berryxia
76
Cursor发布Composer 2.5模型,号称目前最强

Cursor正式推出Composer 2.5模型,宣称其为当前最强大的AI模型。该模型在智能性、长任务持续执行及复杂指令遵循等方面均有显著提升,并声称在同等能力下效率提升10倍。此次升级主要基于扩大训练规模、构建更复杂的强化学习环境以及引入文本反馈机制。值得注意的是,Composer 2.5的底层架构与Moonshot的Kimi K2.5同源。同时,Cursor正与SpaceXAI合作,计划用十倍算力训练下一代更大模型。未来一周内,该模型的包含用量将翻倍。

Cursor: Introducing Composer 2.5, our most powerful model yet. It's more intelligent, better at sustained work on long-running t...

智能体产品更新编码
09:45
AYi@AYi_AInotes
72
GitHub爆火项目一键构建AI公司,集成Claude Code

一个GitHub项目引发关注,据称已获得10万星标并被称为2026年增长最快的AI项目。该项目的核心功能是模拟一整家AI公司,包含146个不同领域的AI专家角色和12个完整部门。用户可以通过一条命令,将这些“员工”全部集成到Claude Code中,从而免费获得涵盖前端开发、安全审计、产品管理、增长黑客等多方面的7x24小时AI支持。

智能体GitHub开源/仓库编码
09:26
meng shao@shao__meng
70
HTML 是新的 Markdown?

Claude Code核心开发者Thariq认为,Markdown在复杂任务中可读性差,导致人类易脱离协作循环。而HTML作为可视化、可交互的界面,能将人重新拉回人机协作回路,适配AI时代“算力分配者”的新角色。他提出了三个可落地的工作流:用交互式HTML进行头脑风暴;为特定任务生成“一次性微应用”;构建人机双向可读的“活体设计系统”。核心判断包括:媒介选择决定人类参与度;生成式算力应主要投入在对齐与沟通的“脚手架”上;软件边际成本趋零;以及明确信任指令能激发更创造性的输出。

claire vo 🖤: Soooo @trq212 has straight up changed my life with these 5 words: "HTML is the new markdown." It's so obvious in hindsig...

智能体AnthropicMCP/工具教程/实践
08:56
meng shao@shao__meng
精选79
「开发日志」提示词:让AI编码决策可审计

针对AI协作编码中“规格永难完整”与“决策无法追踪”的核心矛盾,此提示词提出了第三条路径。它要求AI在实现需求时同步维护一份结构化文档,明确记录设计决策、对规格的偏离、考虑过的权衡以及待确认的开放性问题。这种方法的关键在于将AI执行过程中的隐性判断显式化、文档化,从而让Code Review可直接对照决策笔记,而非逆向工程代码。它不仅降低了模型的过度澄清倾向,更通过提供结构化产物,建立了一种可审计、可协作的人机开发新范式。

Thariq: a prompt I've been using a lot recently: implement <SPEC> and while you do, keep a running implementation-notes.html fil...

智能体Anthropic教程/实践编码

推荐理由:这个提示词解决了AI编码最棘手的问题,spec永远写不全,决策藏在diff里。把判断变成可审计的文件,review时直接对照笔记而非逆向工程,做coding agent的值得随时复制。
08:56
Berryxia.AI@berryxia
77
Claude Design大升级:Token限制翻倍

Anthropic宣布Claude Design所有计划的Token限制翻倍。这解决了以往在处理完整UI设计、多页设计稿或复杂Agent工作流时频繁出现的token不足问题。翻倍后的空间显著提升了连续创作的体验,让该工具在vibe coding、原型制作等任务中实用性大增,从“能用”跃升至“真香”。这体现了Anthropic为提升竞争力而对创作工具的持续优化。

Claude: You can now create more with Claude Design. We've doubled token limits across every plan.

智能体Anthropic产品更新编码
‹ 上一页
1…4142434445…50
下一页 ›