AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Agent」清除
6月24日周三
06:51Andrej Karpathy55Claude Tag 面世:AI 以团队成员身份嵌入 Slack
06:09Google AI Developers60Gemini Interactions API:统一端点加速开发
05:46宝玉54Google 工作近7年的工程师因创建 Workspace CLI 被开除
05:44Orange AI61Claude Tag发布:基于渠道的多智能体协作
05:43xAI50Grok Build上线Firecrawl插件
05:19SemiAnalysis50Anthropic 发布 Claude Tags 对标 Perplexity Computer
04:16宝玉70transitions.dev 动画过渡可安装为 Agent 技能
03:38MiniMax (official)28MiniMax × HUD Evals × Y Combinator Frontier RL 黑客马拉松回顾
03:12AYi62Anthropic 将 Claude Code 嵌入 Slack,推出 Claude Tag
03:05Hacker News 热门(buzzing.cc 中文翻译)77克劳德·塔格
02:29Chubby♨️52Claude Tag 上线 Slack,可@Claude 委派任务
02:19AK43Ling and Ring 2.6 技术报告发布
02:16Rohan Paul70Latitude 开源 AI 智能体监控平台,将对话转化为调试数据
02:16宝玉65今天发布了 Claude Tag,让 Claude 以同事的身份常驻 Slack 频道。
02:12AYi45开源AI投资系统:18位智能体模仿巴菲特芒格等大师
02:08🚨 AI News | TestingCatalog56Anthropic推出Claude Tag:Slack AI同事
02:03HuggingFace Daily Papers(社区热门论文)51提前承诺:LLM智能体过早固守证据的隐藏故障诊断
01:50elvis61Latitude:开源AI智能体可观测性工具
01:49Yuchen Jin46Claude Tag:在Slack中@委派任务
01:46Thariq57Claude Tag:智能体新形态的最佳实践
01:46Rohan Paul66Anthropic 推出 Claude Tag,将 Claude 作为共享队友加入 Slack 频道
01:46Boris Cherny56"Claude Tag 发布,团队可在 Slack 协作"
01:43ClaudeDevs70Claude Code 团队用 Claude Tag 编写了 65% 的产品代码
01:20elvis38Vercel eve框架:一切皆文件,快速构建智能体
01:18TechCrunch:AI(RSS)51Anthropic 发布 Claude Tag 研究预览版:常驻 Slack 的"始终在线"AI 智能体
01:14Claude:Blog(网页)42Claude Tag 的 Agent Identity 访问模型
01:09Anthropic:Newsroom(网页)56精选Anthropic 推出 Claude Tag:在 Slack 中通过 @Claude 协作
01:08Google AI Developers62Google AI for Developers 在 Gemini API 推出 Managed Agents
00:59Chubby♨️70Latitude:开源AI agent可观测性工具,聚合失败原因并支持自然语言搜索
00:50elvis48Vercel的eve智能体框架,一切皆文件速构AI
00:46Rohan Paul51Momentic发布测试平台,解决AI编码的QA瓶颈
00:19AK32世界动作模型:一项综述论文
00:19AK35PlanBench-XL:评估LLM智能体长时域规划
00:16Berryxia.AI43腾讯开源EdgeOne Makers,AI Agent一句话部署应用
00:16Rohan Paul67KroWork:AI对话秒变可重用桌面应用
00:08🚨 AI News | TestingCatalog64Latitude 开源发布:AI 智能体生产监控平台
6月23日周二
23:50elvis27GLM-5大规模RL基础设施详解
23:16Berryxia.AI54Paul Bakaus 成立 Renaissance Geek:获 a16z 投资,与 GitHub 合作推"增强工艺"路线
23:15Rohan Paul66Templafy 发布免费 AI PowerPoint Agent
23:13歸藏(guizang.ai)49Seed 2.1 Pro 测评:胜任 Agent 工作流
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月24日
06:51
Andrej Karpathy@karpathy
55
Claude Tag 面世:AI 以团队成员身份嵌入 Slack

Anthropic 推出 Claude Tag,让 Claude 以团队成员身份加入 Slack 频道,可被 @提及并委派任务。团队可为其配置频道访问权限和工具,从而实现异步协作。Andrej Karpathy 评价这是 LLM UI/UX 的第三次重大重新设计:从访问网站、下载 App,演进为自包含、持久、异步的组织级实体,无缝融入人类工作流,能处理多种工作负载。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体AnthropicMCP/工具大佬观点
06:09
Google AI Developers@googleaidevs
60
Gemini Interactions API 是您处理文本、多模态输入、工具使用和管理智能体的统一接口,所有这些都集成在一个端点上。从提示词到产品,比以往更快。 阅读开发者指南 ⬇️ https://x.com/GoogleAIStudio/status/2069450021955592406

Google AI Studio: http://x.com/i/article/2069439163758170112

智能体GoogleMCP/工具产品更新
05:46
宝玉@dotey
54
Google 工作近7年的工程师因创建 Workspace CLI 被开除

谷歌开发者关系工程师 Justin Poehnelt 今年 3 月初用 Rust 创建了 Google Workspace CLI,支持命令行操作 Gmail、Drive、Calendar 等服务并内置 MCP 服务器。项目发布后登顶 Hacker News,GitHub 获两万多星。谷歌内部反应两极:高管主动请教,法务质疑品牌色。4 月 22–24 日 Google Cloud Next 大会官方宣布即将推出官方 CLI,两天后 Justin 被开除。他怀疑管理层害怕被 AI agent 颠覆。项目仍在 Google GitHub 组织下正常维护(26000+ 星)。

Justin Poehnelt: Two months ago I was fired by Google for creating the Google Workspace CLI. It went viral, hit #1 on Hacker News, gained...

智能体Google开源生态行业动态
05:44
Orange AI@oran_ge
61
Claude Tag发布:基于渠道的多智能体协作

你的 AI 数字员工,Claude Tag 正式发布了 Claude 的思考和其他产品有点不同 不是基于三省六部给身份,也不是基于 team context 让 Agent 知道一切。 他们选择了一个 channel based context,因此来界定 multi Agent 这也是 Claude 内部使用数字员工的方式。 很有意思,正在实践 AI 新组织的可以看看

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体Anthropic产品更新
05:43
xAI@xai
50
尝试 Grok Build 插件市场中的新 Firecrawl 插件。

Firecrawl: Firecrawl is now an official plugin in @grok build 🔥 Your Grok agents can now search the web, scrape, and interact with...

智能体MCP/工具xAI产品更新
05:19
SemiAnalysis@SemiAnalysis_
50
SemiAnalysis 团队测试了 Devin、Mistral、Grok、Perplexity 等多款 AI 工具,发现 Perplexity Computer 的 Slack 集成表现远超 Claude:它可发送图片并返回详细研究报告与可视化,是唯一带来"正向价值"的工具。目前该团队超 96% 的 token 预算用于 Anthropic,但部分可能转向 Perplexity。Anthropic 今日推出 Slack AI 同事工具 Claude Tags,直接对标 Perplexity Computer。团队已开始配置,计划进行对比评测。

SemiAnalysis: This week, the company has been trying out all types of different AI tools including Devin, Mistral, Grok, Perplexity, C...

智能体Anthropic产品更新
04:16
宝玉@dotey
70
transitions.dev 动画过渡可安装为 Agent 技能

http://transitions.dev 这个网站的动画过渡效果很不错👍 还可以安装技能,这样 Agent 可以自己为你的网页添加炫酷的动画 npx skills add jakubantalik/transitions.dev

Jakub Antalik: Added new transitions to http://transitions.dev There are now 21 transitions you can copy as CSS or React code or use as...

智能体开源/仓库编码
03:38
MiniMax (official)@MiniMax_AI
28
MiniMax × HUD Evals × Y Combinator Frontier RL 黑客马拉松回顾

MiniMax 官方回顾了上周末与 HUD Evals、Y Combinator 联合举办的 Frontier RL Environments 黑客马拉松。活动吸引了 200 名顶尖开发者,在 24 小时内利用浏览器使用、机器人、物流和世界模拟等环境进行强化学习。基于 MiniMax M3 构建的出色项目包括:零 token 浏览器使用 RL 环境 Tera(总排名第三)、自主仓库机器人车队协调系统 Warehouse AI,以及火星建筑漫游车仿真项目 Atomz。

智能体具身智能行业动态
03:12
AYi@AYi_AInotes
62
Anthropic 将 Claude Code 嵌入 Slack,推出 Claude Tag

Anthropic 将 Claude Code 嵌入 Slack,推出 Claude Tag。AI 以团队成员身份加入频道,具备频道专属记忆、主动监控、独立跑代码并提 PR,任务完成自动标记 ✅。内部产品团队 65% 新增代码由 Claude Code 产出。三层架构:独立身份+频道隔离记忆(不同项目上下文不混淆,沙箱任务结束销毁);主动自主执行(设置规则后全天盯频道、答疑、汇总);原生 Claude Code 代码能力(拉取仓库、调试、测试、提 PR),多层安全防护。支持知识库检索、新人答疑、代码迭代、故障排查等。仅 Enterprise 与 Team 付费计划开放 Beta。建议低风险频道测试并人工复核。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体Anthropic产品更新编码
03:05
Hacker News 热门(buzzing.cc 中文翻译)
77
克劳德·塔格

Anthropic 推出 Claude Tag,一种在 Slack 上通过 @Claude 进行团队协作的新方式。Claude 可作为团队成员加入指定频道,访问所选工具、数据和代码库,自动构建上下文并分解任务。Anthropic 内部已有 65% 的产品团队代码由内部版 Claude Tag 生成。Claude Tag 支持多人协同(同一频道内共享一个 Claude)、随时间积累知识、主动推送更新和异步执行任务,还可发送直接消息。该功能今天起面向 Claude Enterprise 和 Team 客户开放 Beta 测试。管理员可严格限定工具、数据访问范围及 token 消耗上限。

智能体AnthropicMCP/工具产品更新
关联讨论 2 条Claude:Blog(网页)X:Claude Devs (@ClaudeDevs)
02:29
Chubby♨️@kimmonismus
52
Claude 推出 Claude Tag 功能,支持将 Claude 添加为 Slack 团队成员。用户可选择授权频道与工具,通过 @ 提及 Claude 委派任务,让 Claude 访问选定数据甚至代码库,团队成员可并行推进其他工作。该功能旨在提升团队协作效率,将 Claude 整合进日常沟通流。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体Anthropic产品更新
02:19
AK@_akhaliq
43
Ling and Ring 2.6 Technical Report 高效且即时的万亿参数量级智能体智能
智能体论文/研究
02:16
Rohan Paul@rohanpaul_ai
70
Latitude 开源 AI 智能体监控平台,将对话转化为调试数据

Latitude 发布 MIT 许可的开源监控平台,将 AI 智能体对话转为生产调试数据。多数智能体已比员工接触更多用户,但对话仅存为原始日志,导致团队错过用户不满、未满足请求、重复失败和流失信号。平台提供 see, catch, fix 循环:查看会话、用户、工具、成本、延迟和 behaviors;通过 Signals 捕获重复失败;通过 MCP 从编辑器直接修复。平台面向生产智能体,关注工具使用、用户意图、重试、成本、延迟等,而非仅模型调用。推文称智能体对话是公司最被低估的数据源,Latitude 正改变此局面。

cesar.wtf: Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...

智能体MCP/工具开源/仓库
02:16
宝玉@dotey
65
今天发布了 Claude Tag,让 Claude 以同事的身份常驻 Slack 频道。

Anthropic 发布 Claude Tag,以 research preview 形式将 Claude 作为同事常驻 Slack 频道。团队成员 @Claude 可分配任务,Claude 逐步完成并在线程交付结果。新功能支持多人协作(共享上下文)、持续学习(自动关注频道对话,可授权读取其他频道)和 ambient 模式(主动推送信息、提醒任务)。管理员可精确控制各频道数据访问权限。内部产品团队 65% 的代码由内部版 Claude Tag 生成,底层模型为 Opus 4.8。将替换现有 Claude in Slack 应用,管理员有 30 天迁移窗口,目前仅面向 Claude Enterprise 和 Team 客户。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体AnthropicMCP/工具产品更新
02:12
AYi@AYi_AInotes
45
开源AI投资系统:18位智能体模仿巴菲特芒格等大师

一个4.6万星标、8千次分叉的MIT协议开源项目,提供免费AI投研系统。输入股票代码后,18位分别模仿巴菲特、芒格、木头姐、格雷厄姆等流派的智能体会自动抓取实时财报、新闻,依据各自投资哲学独立分析,风控模块排查仓位风险,最终由组合经理输出买卖持有结论,推理链完全透明。内置回测引擎、可视化网页界面,支持云模型或通过Ollama完全本地运行,核心基础数据永久免费,无需API密钥。

AYi: http://x.com/i/article/2069024565901119488

智能体开源/仓库开源生态
02:08
🚨 AI News | TestingCatalog@testingcatalog
56
Anthropic 为团队和企业用户推出了 Claude Tag。 Claude Tag 在 Slack 中运行,能够处理更复杂的任务、将其分解为更小的里程碑,并与已连接的工具集成。 一位新的 AI 同事 👀

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体Anthropic产品更新部署/工程
02:03
HuggingFace Daily Papers(社区热门论文)
51
提前承诺:LLM智能体过早固守证据的隐藏故障诊断

长周期LLM智能体会出现“过早承诺”故障——早期选定证据解读并固守,最终答案评分无法捕捉。研究用跨运行隐藏状态收敛性作为承诺指标。在Llama-3.1-70B运行ReAct于HotpotQA上,第4步隐藏状态相似性预测下游行为一致性(r=-0.35,偏相关-0.45)。信号在Qwen-2.5-72B、Phi-3-14B及StrategyQA(r=-0.83)复现。承诺不追踪正确性。运行时监测器检测不一致轨迹,AUROC最高0.97(严格拆分0.85-0.88);提示词干预将行为方差降低28%且准确率无显著变化。结果提供了一个隐藏过程故障诊断工具,并明确了局限性。

智能体论文/研究
01:50
elvis@omarsar0
61
DAIR.AI 创始人 Elvis Saravia 推荐开源(MIT 许可)工具 Latitude,用于 AI 智能体可观测性。将 Latitude 指向 Claude Code 配置后,可实时查看哪些任务消耗 token 预算,观察智能体行为、捕获重复失败及其频率与原因,并在编辑器中直接修复。引用推文指出:公司最被低估的数据源是 AI 智能体对话,Latitude 能捕捉这些被浪费的数据。免费试用地址:latitude.so。

cesar.wtf: Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...

智能体教程/实践部署/工程
01:49
Yuchen Jin@Yuchenj_UW
46
在Slack中,Claude 作为团队成员加入,可访问你选择的频道和工具。@Claude 并委派任务给它,让你专注于其他工作。他们和我们一样。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体Anthropic产品更新
01:46
Thariq@trq212
57
Claude Tag 是一种令人难以置信的智能体新形态,因此我认为需要一些时间来摸索最佳实践,但以下是我最喜欢的一些做法 🧵

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体Anthropic产品更新
01:46
Rohan Paul@rohanpaul_ai
66
Anthropic 推出 Claude Tag,将 Claude 作为共享队友加入 Slack 频道

Anthropic 推出 Claude Tag,让 Claude 作为共享队友加入 Slack 频道。Claude 可读取经批准的频道、使用授权工具,在被 @ 后自动分解任务、编写代码、分析数据、打开或合并 PR,并在线程中汇报结果。内部版本已为产品团队创建 65% 的 PR。管理员可为不同团队分别配置工具、记忆、额度及可访问代码库。Claude 拥有独立账号和凭据,操作与员工账号分离且可审计。共享记忆让 Claude 从频道中积累工作上下文,无需私聊重复解释。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体AnthropicMCP/工具产品更新
01:46
Boris Cherny@bcherny
56
我们今日发布 Claude Tag。在 Slack 中 @Claude,它就能与你一起在频道中工作。它主动、支持多人协作、拥有独立身份和记忆。 但它不只是 Slack 中的一个机器人。过去几个月,它彻底改变了我们使用 Claude 的方式。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体Anthropic产品更新
01:43
ClaudeDevs@ClaudeDevs
70
Claude Code 团队全年内部使用 Claude Tag。目前,Claude Tag 已编写了产品团队 65% 的代码,其中大部分代码本身也用于构建 Claude Tag。Claude Tag 是团队协作新工具,在 Slack 中作为成员加入,可访问指定频道和工具,用户通过 @提及 将任务委派给 Claude。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体Anthropic产品更新
关联讨论 2 条Claude:Blog(网页)X:Claude Devs (@ClaudeDevs)
01:20
elvis@omarsar0
38
Vercel 的 eve AI 智能体框架将所有内容(工具、技能、评估)都视为文件,让你能快速上手构建 AI 智能体。如果你喜欢 TypeScript,也会喜欢它。快去试试吧!

elvis: I'm digging the eve agentic framework from Vercel. I like that everything is files, from the tools to the skills to the ...

智能体大佬观点
01:18
TechCrunch:AI(RSS)
51
Anthropic 发布 Claude Tag 研究预览版:常驻 Slack 的"始终在线"AI 智能体

Anthropic 推出 Claude Tag 研究预览版,这是一个常驻 Slack 的“始终在线”AI 智能体。用户可在聊天中 @Claude 获取洞察或分配任务,面向 Claude Enterprise 和 Claude Team 用户。Claude 会持续学习所在频道的工作内容,经管理员授权后还可从组织内其他频道自动收集事实。它支持任务分阶段执行,并提供环境模式——主动跳入对话以更新团队、标记跨组织事项或跟进被遗忘的线程。Anthropic 表示这让人感觉像是在与一位真正了解上下文的同事合作。

智能体Anthropic产品更新
01:14
Claude:Blog(网页)
42
Claude Tag 的 Agent Identity 访问模型

Claude Tag 推出 agent identity(智能体身份)访问模型,让 Claude 在共享频道中以独立身份工作,而非模拟某个用户。管理员在工作区级配置连接器、仓库访问、技能插件和固定指令等权限,每个频道可覆盖继承的基线设置。私有频道拥有独立身份,记忆和访问不跨频道流转;公共频道共享工作区级身份。该模型为自主多玩家 AI 场景设计,允许频道成员通过 Claude 访问已授权工具和数据,同时通过按身份撤销简化权限管理。

智能体Anthropic教程/实践部署/工程
01:09
Anthropic:Newsroom(网页)
精选56
Anthropic 推出 Claude Tag:在 Slack 中通过 @Claude 协作

Anthropic 推出 Claude Tag,一种在 Slack 频道中通过 @Claude 委托任务的新协作方式。Claude 可记住频道上下文,支持多用户交互,经授权后可自动学习其他频道和数据源。开启“环境”行为后,能主动更新未解决的线程或任务。支持异步工作,可自主推进项目数小时或数天。即日起面向 Claude Enterprise 和 Team 客户提供 beta 版。管理员可精细控制工具和渠道访问权限、设置 token 消耗限额,并查看所有操作日志。

智能体Anthropic产品更新编码
关联讨论 2 条Claude:Blog(网页)X:Claude Devs (@ClaudeDevs)
推荐理由:Anthropic 这次把 Claude 从对话助手变成了团队里的主动队友,Slack 里的多人协作、上下文学习和异步代理是个新思路。内部 65% 代码由它生成的数据,让这个方向不再只是实验。
01:08
Google AI Developers@googleaidevs
62
Google AI for Developers 在 Gemini API 推出 Managed Agents

Google AI for Developers 宣布在 Gemini API 中推出 Managed Agents,开发者只需一条提示即可构建自主智能体。该智能体能自动研究主题并从头制作广播节目,包括生成对话音频、音乐、专辑封面等。核心特性:零基础设施设置——API 自动创建安全的临时 Linux 沙箱;自主循环——智能体独立规划、自我纠错并执行代码;多步逻辑——通过 agents.md 和 skills.md 文件定义指令和工具,Gemini 优化理解后在一次 API 调用内完成全部任务。

智能体GoogleMCP/工具产品更新
00:59
Chubby♨️@kimmonismus
70
Latitude 是一款开源的 AI agent 可观测性工具,MIT 许可、可自托管。它不局限于提供 traces,而是将重复失败自动归纳为单个 issue,显示频率和根本原因;还支持用自然语言搜索生产对话。引用推文指出,AI agent 对话是公司最被低估的数据源,Latitude 能改变这一状况。推荐优先尝试其 Claude Code token telemetry 功能。

cesar.wtf: Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...

智能体开源/仓库部署/工程
00:50
elvis@omarsar0
48
我很喜欢 Vercel 的 eve 智能体框架。 我欣赏它的一切都是文件,从工具到技能再到评测。 更重要的是,它能让你快速使用智能体进行开发。非常有前景。 如果你喜欢 TypeScript,你也会喜欢这个。 开始使用 eve ↓
智能体MCP/工具产品更新
00:46
Rohan Paul@rohanpaul_ai
51
AI编码速度提升但QA成为新瓶颈。Momentic推出测试平台,其智能体可读取Linear工单、Notion PRD和PR差异等产品记忆,使测试基于预期行为而非静态脚本。过去几周,该平台已分析7万+次测试失败,创建600个测试,PR合并率达73%并持续增长。客户包括Notion、Xero、Webflow、Retool、Runway和Bilt。

Meer | AI Tools & News: AI is writing more code than ever, but the bugs are scaling right along with it. momentic just put out how they're closi...

智能体MCP/工具产品更新编码
00:19
AK@_akhaliq
32
世界动作模型:一项综述
智能体论文/研究
00:19
AK@_akhaliq
35
PlanBench-XL 评估LLM工具使用智能体在大型工具生态系统中的长时域规划能力
智能体论文/研究评测/基准
00:16
Berryxia.AI@berryxia
43
腾讯开源EdgeOne Makers,AI Agent一句话部署应用

腾讯低调发布EdgeOne Makers平台,无发布会,仅一条推文和一个GitHub仓库。核心理念:让AI Agent一句话部署应用——通过CLI自动完成Git推送、CI/CD触发、边缘函数部署及预览链接生成,无需打开浏览器。底层标准化Skill系统支持边缘函数、云函数、KV存储等能力模块,Claude Code、Cursor等Agent可直接调用。GitHub已开源,支持Node.js、Go、Python云函数和V8边缘运行时,集成LangGraph、Claude SDK、OpenAI Agents等主流框架。这标志着云平台从为人设计转向为Agent设计。

智能体产品更新开源生态部署/工程
00:16
Rohan Paul@rohanpaul_ai
67
KroWork:AI对话秒变可重用桌面应用

KroWork 新发布,解决 AI 智能体每次运行后会话即失效的痛点。用户用自然语言描述任务,AI 自动构建工作流并保存为可重用的桌面应用,无需编程背景。应用完全本地运行,数据不出设备。相比一次性回答,它生成持久、可复用的软件——例如一句指令即可生成免费市场监控应用,替代分散的付费工具。KroWork 将“氛围编码(vibe-coding)”转变为“结果编码(outcome-coding)”。

智能体产品更新端侧部署/工程
00:08
🚨 AI News | TestingCatalog@testingcatalog
64
Latitude 以 MIT 许可证开源发布,用于监控生产环境中的 AI 智能体。平台可揭示智能体与真实用户交互时的行为、捕获重复失败,并将修复反馈回编辑器。用户能将数千条实时对话聚类为单一视图,了解用户需求与流失点,并支持纯英文搜索所有 trace。引用指出:AI 智能体的对话是企业最被低估的数据源,Latitude 改变了这一现状。

cesar.wtf: Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...

智能体产品更新开源生态
6月23日
23:50
elvis@omarsar0
27
一篇博客文章汇总了在 GLM-5 上进行强化学习所需的所有基础设施组件。主推文作者强烈推荐阅读,并认为这对自我改进智能体发展至关重要。

elie: every infra piece you need to know to do RL on GLM-5 https://www.primeintellect.ai/blog/rl-at-1t-scale

智能体教程/实践数据/训练
23:16
Berryxia.AI@berryxia
54
Paul Bakaus 成立 Renaissance Geek:获 a16z 投资,与 GitHub 合作推"增强工艺"路线

Paul Bakaus 宣布成立 Renaissance Geek(Impeccable 母公司),获 a16z 投资并与 GitHub 合作。他认为 AI 降低了创作门槛,但未自动提高上限;真正优秀的工作仍需清晰意图、迭代、判断力与工艺。公司方向为“增强工艺”——让人类深度参与智能体循环的最后 20%。首款产品 Impeccable 为 AI coding agent 提供设计词汇表,支持在真实代码库视觉迭代,避免低质量输出。同时提出“文艺复兴极客”画像:T 型通才、高品味、高主动性、强好奇心,AI 赋能其跨领域移动,而品味与判断力是 AI 最稀缺的能力。

Berryxia.AI: http://x.com/i/article/2069426743950417920

智能体GitHub产品更新编码
23:15
Rohan Paul@rohanpaul_ai
66
Templafy 发布免费 AI PowerPoint Agent

Templafy 推出 AI PowerPoint Agent,用户只需输入提示词、选择主题与深度、添加源文件并审核大纲,即可生成可直接编辑的 .pptx 演示文稿。该工具旨在解决现有 AI 幻灯片工具在编辑、品牌规则应用、图表更新和法律审核环节的易用性问题。产品完全免费、在浏览器中使用,无需注册。引用推文显示本次升级新增聊天历史、自定义颜色和可编辑图表功能,进一步提升了灵活性和创作效率。

Templafy: Our free PowerPoint Agent just got a big upgrade! Now with: 💬 Chat history 🎨 Custom colors 📊 Editable charts Create p...

智能体产品更新
23:13
歸藏(guizang.ai)@op7418
49
Seed 2.1 Pro 测评:胜任 Agent 工作流

Seed 2.1 Pro 正式发布,测评显示它能胜任真实 Agent 工作流。优势包括:复杂任务稳定、视觉内容规划能力强、多模态额外优势。测试通过豆包任务模式(本地电脑 Agent 操作)和火山引擎 API(Cloud Code)进行。复杂 Skills 测试(PPT 生成、社交媒体卡片)表现优秀,能根据内容调整版式。三个前端任务(百叶窗图片动效、WebGL 贝塞尔曲线、跨整页视差滚动网页)均一步到位或结果完整。定位:未必最顶尖,但适合组合工作流——强编码模型负责工程,Seed 2.1 Pro 负责多模态理解、内容规划和视觉表达。限制:视频输入目前为抽帧式处理。API 已在火山引擎全量上线。

智能体多模态编码评测/基准
‹ 上一页
1…1213141516…50
下一页 ›