AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Agent」清除
7月2日周四
11:25歸藏(guizang.ai)71藏师傅社交卡片Skill更新:支持Live Photo生成与编辑
11:25歸藏(guizang.ai)9感觉今天都没什么动静,是不是都在蹬 Fable 5 啊? 我早上起来第一件事,就是找了一个巨大的任务直接塞给他,让他自己跑了
11:03IT之家(RSS)80精选AI 版支付宝开放公测,蚂蚁阿宝无需邀请码即可体验
11:00公众号:昆仑万维(天工)67精选昆仑万维天工3.2发布Skywork Tags,AI智能体加入工作群聊
10:31Berryxia.AI21个人Agent工具Bloome:全平台解析项目并调用本地Cline/Codex
10:10Yuchen Jin38Databricks 凭借 AI 智能体登顶 NVIDIA SOL-ExecBench kernel 排行榜 L1 single operation 赛道
10:08小互56Claude Code 副屏:将回答转为直观页面展示
10:07Alibaba Cloud53阿里云AgentLoop:构建自我进化飞轮
09:07meng shao77精选Emil Kowalski 发布设计工程师 Skills,让 AI 编码工具具备 UI 动画审美
09:05OpenClaw🦞31OpenClaw iOS UI维护者回应批评邀参与
08:02Greg Brockman47Codex 帮你制作个性化每日摘要
07:29ginobefun39今日早报:本地AI补齐工程栈、LongCat万亿模型落地国产算力、美图应用方法论
06:26Peter Steinberger 🦞47Codex 用计算机使用优化 OpenClaw 应用
05:37elvis46SkillComposer:将代码Agent技能组合视为联合决策的论文
05:33Artificial Analysis55Claude Sonnet 5在AA-Briefcase基准上仅次于Fable 5
04:49Claude Code:GitHub Releases(RSS)64精选Claude Code v2.1.198 发布
04:29Ethan Mollick48正式组织结构助力AI智能体思考
04:03Rohan Paul70Meta员工30天消耗超60万亿token,AI使用转向重度用户
03:37elvis59Notion新增HTML块,AI交互式内容一键嵌入
03:28HuggingFace Daily Papers(社区热门论文)35TRIAGE:智能体强化学习的角色类型化信用分配框架
03:26Google Gemini35Gemini Spark 五新功能,打造更强个人 AI 智能体
02:56Google Gemini63Gemini Spark 五项新方式强化个人AI助手
02:22Chubby♨️67ZCode 3.0发布:GLM-5.2深度集成的AI编程IDE
02:21AYi71xAI 发布无代码 Voice Agent Builder,基于 Grok Voice 原生语音架构
01:59Ethan Mollick61针对实际用例对模型做基准测试:Gemini 3.1 Pro vs GPT-5.5 咖啡馆案例
01:38Hacker News 热门(buzzing.cc 中文翻译)64Cloudflare 推出 Monetization Gateway 变现网关
01:21AYi47AI零成本副业:儿童动画月入$5000+,营销Agent Lev8找客户三项Benchmark领先
01:17Google Developers Blog(RSS)41我们为何构建ADK 2.0
00:34宝玉74Anthropic 推出 AI 科研工作台 Claude Science
00:31Berryxia.AI69xAI 推出 Grok Voice Agent Builder Beta,无代码部署语音 AI 助手
00:23凡人小北34飞书 Aily:普通人也能轻松驾驭的 AI 助手
00:20xAI:News(网页)77精选xAI 发布 Voice Agent Builder 测试版
00:17Google Developers Blog(RSS)52用 Genkit 构建智能体全栈应用
00:07AK49LiteResearcher:可扩展深度研究智能体RL训练框架
00:02Andrew Milich67可连接日程、知识库与API的语音智能体
00:02xAI73xAI 推出 Voice Agent Builder 语音智能体平台
7月1日周三
23:31Berryxia.AI47接入小米mimo的AI智能体实测
23:22Jim Fan71Jim Fan团队推出ASPIRE:机器人自我进化的技能库系统
23:21AYi43Lev8:营销领域的 Codex,一人顶一个商务团队
23:03IT之家(RSS)50谷歌 AI 智能体 Gemini Spark 登陆苹果 Mac,可实时追踪资讯动态
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月2日
11:25
歸藏(guizang.ai)@op7418
71
藏师傅社交卡片Skill更新:支持Live Photo生成与编辑

歸藏的guizang-social-card-skill新增Live Photo能力,支持单视频动态卡片、拼图式(二/三/四宫格)、三连Live Photo及长视频筛选。核心细节:第一帧可作为静态图发布;小红书5秒/公众号3秒时长区分;发布需将JPG+MOV打包为.pvt并通过AirDrop传到iPhone。建议先粗剪视频每段10秒左右,让AI判断适合做Live Photo的片段。安装或更新后即可使用。

智能体GitHub产品更新图像生成
11:25
歸藏(guizang.ai)@op7418
9
感觉今天都没什么动静,是不是都在蹬 Fable 5 啊? 我早上起来第一件事,就是找了一个巨大的任务直接塞给他,让他自己跑了
智能体其他
11:03
IT之家(RSS)
精选80
AI 版支付宝开放公测,蚂蚁阿宝无需邀请码即可体验

支付宝阿宝 AI 助手今日正式开放公测,iOS 和安卓用户可在应用商店或支付宝 App 搜索“阿宝”或“蚂蚁阿宝”直接体验。开通后右滑进入新版,以对话方式安排办事,例如说出“查公积金”,阿宝会自动匹配对应小程序和服务入口,用户点击确认即可完成。支付宝承诺所有资金变动与支付环节均需用户本人确认,扫码、转账等功能已预留入口。

智能体产品更新

推荐理由:支付宝把 AI 助手从内测推进公测,对话式办事对普通用户来说很直观,省去了多层菜单跳转,虽然支付等敏感环节还是手动确认,但体验上的进步是实在的。
11:00
公众号:昆仑万维(天工)
精选67
昆仑万维天工3.2发布Skywork Tags,AI智能体加入工作群聊

昆仑万维天工3.2发布Skywork Tags,将AI智能体以团队成员身份接入Slack、飞书、钉钉、Discord、Telegram等即时通讯工具。团队可在原有工作群中@Skywork参与讨论,无需切换窗口或迁移数据。共享版Agent持续吸收多样上下文后表现反超精心调教的个人版,团队最终完全改用共享版。Skywork Tags不要求改变工作方式,让AI积累团队上下文并越用越强。

智能体MCP/工具产品更新

推荐理由:Skywork Tags 的思路走对了——不逼团队搬家,而是让 AI 进群,内部测试也证明共享 Agent 能远超个人调教,做协作工具的产品人可以借鉴。
10:31
Berryxia.AI@berryxia
21
个人Agent工具Bloome:全平台解析项目并调用本地Cline/Codex

Berry Xia 分享个人长期使用的工具 Bloome,支持 Windows、Mac、iOS 及网页端。用户将项目和产品链接丢给 Bloome,它能自动判断是否可运行或解析,然后直接调用本地的 Cline 或 Codex 执行任务。引用推文补充,该工具接入了小米的 mimo 模型,可实现听说读写、下载视频、剪辑等功能,体验优于多数 Agent。作者强调这不是广告。

Berryxia.AI: 我不管别人怎么吹,我觉得切身体会每天都用这玩意。 发现真的比很多Agent什么的好用很多,我接的是小米的mimo模型,听说读写,下载视频、剪辑什么的都可以搞定。 我已经当个小秘在用了哈! PS:不是一条广告😁 如果是就让老板安排打钱吧!

智能体教程/实践
10:10
Yuchen Jin@Yuchenj_UW
38
Databricks 凭借 AI 智能体登顶 NVIDIA SOL-ExecBench kernel 排行榜 L1 single operation 赛道

Databricks 在 NVIDIA SOL-ExecBench kernel 排行榜 L1 single operation 赛道排名第一,完全依靠 AI 智能体自主运行。使用的框架是 KDA、Humanize 和 Omnigent:由 Claude 编写代码,Codex 审查代码,实现了递归自我改进。该工作由 Databricks 的 leshenj15 主导,并与 NVIDIA 及 MIT HAN Lab 的 Ligeng Zhu 和 Dongyun Zou 合作完成。

智能体编码评测/基准
10:08
小互@xiaohu
56
Claude Code 副屏:将回答转为直观页面展示

@xiaohu 开发了一个 Claude Code 副屏工具,解决 CC 回答大段文字时密集难读的问题。副屏将 CC 的回答直接转换成直观页面展示,让用户能快速理解和预览答案,并且支持交互式数据回传。

小互: 给你们看看我开发出一个什么东西 哈哈哈哈 我觉得可玩性还是非常高的😂

智能体教程/实践编码
10:07
Alibaba Cloud@alibaba_cloud
53
还在手动进行Agent评估?阿里云AgentLoop构建了一个自我进化飞轮: ✅ 全栈轨迹可观测性 ✅ 自动数据集管道(Trace2Dataset) ✅ Agent-as-a-Judge(90%一致性) ✅ 记忆/经验库 让Agent更智能、更快、更便宜。加入Beta版! 🚀 https://int.alibabacloud.com/m/1000415066/ #AI #AgentLoop #LLMOps #GenAI #AlibabaCloud
智能体产品更新部署/工程
09:07
meng shao@shao__meng
精选77
Emil Kowalski 发布设计工程师 Skills,让 AI 编码工具具备 UI 动画审美

Emil Kowalski 将多年 UI/动画原则沉淀为三个 Skill,使 Codex、Claude Code、Cursor 等 Coding Agents 具备资深设计工程师的审美判断。核心规则:动画必须有理由;每天 100+ 次的高频操作禁用动画;UI 动画控制在 300ms 内;只动画 transform 和 opacity;入口从 scale(0.95)+opacity:0 开始;尊重 prefers-reduced-motion(仅移除位移动画)。review-animations 以严格标准审查动画代码,输出 Before/After/Why 表格。animation-vocabulary 将模糊描述(如“弹一下的效果”)转为专业动效术语。

智能体GitHub教程/实践编码

推荐理由:Emil 把设计工程直觉变成了 AI 编码代理能理解的规则,clone 下来就能让 Claude Code 和 Cursor 产出有品味的动效,做前端的值得立刻试试。
09:05
OpenClaw🦞@openclaw
31
主推文只是说"把这段留给喷子"。引用推文中,Colin自我介绍:他是OpenClaw iOS UI的主要贡献者之一,作为志愿者维护者,他接受公开批评。他时间有限但对移动端智能体充满热情。他邀请大家与他对话、指出不足,并加入Discord共同改进。

Colin: I want to introduce myself. Hi I'm Colin, I did a lot of the @openclaw iOS UI, so as one of the volunteers responsible, ...

智能体开源/仓库
08:02
Greg Brockman@gdb
47
Codex 现在每天早上为我生成一份"日报",包含未读消息、日历、冲浪报告和新闻。一切能让我直到当天晚些时候都不碰手机的事情都是优先事项。Greg Brockman 表示这是利用 Codex 制作个性化每日摘要的方法。

Ryan Doyle: surprised more people aren't doing something like this Codex now creates a "newspaper" for me every morning Unread messa...

智能体OpenAI现象/趋势
07:29
ginobefun@hongming731
39
今日早报:本地AI补齐工程栈、LongCat万亿模型落地国产算力、美图应用方法论

本地AI倡导者Ahmad Osman指出开源与闭源差距缩至4-8个月,但缺搜索、工具、Agent等基础设施。美团发布LongCat-2.0(1.6T参数/48B激活MoE,30T tokens预训练,原生1M上下文),五万卡国产算力集群训练,SWE-bench Pro 59.5领先Gemini 3.1 Pro等,预览版OpenRouter调用量前三。美图CEO吴欣鸿:2025年营收38.58亿元,净利润9.65亿元同比增64.7%,AI影像收入占比76.6%,海外MAU重回1亿。

智能体Google现象/趋势部署/工程
06:26
Peter Steinberger 🦞@steipete
47
将 Codex 指向 OpenClaw iOS 应用的一些 Twitter 反馈后,它进行了一次初步改进。虽然还不够好,但就两个提示词而言还算不错。 特别酷的是它如何使用 computer use 来添加前后对比截图,因为没有 GitHub API。 https://github.com/openclaw/openclaw/pull/98452
智能体教程/实践编码
05:37
elvis@omarsar0
46
SkillComposer:将代码Agent技能组合视为联合决策的论文

论文提出SkillComposer,将代码Agent的技能选择与组合视为一次联合决策,用约束自回归解码器一次生成完整技能计划(包括技能、数量与顺序),自然处理技能间依赖。在SkillsBench上,使用GPT-5.2-Codex和Gemini-3-Pro-Preview,pass rate分别提升+23.1和+18.2个百分点,超过top-3检索,并以更低prompt token成本匹配gold-skill上界。

智能体编码论文/研究
05:33
Artificial Analysis@ArtificialAnlys
55
Claude Sonnet 5在AA-Briefcase基准上仅次于Fable 5

Anthropic发布Claude Sonnet 5。在AA-Briefcase(智能体知识工作基准,测试模型处理数千文件并产出表格、演示和UI原型)上,Sonnet 5 (max)得1391 Elo,较Sonnet 4.6 (max)提升312分,排第二,仅次于Fable 5。提升来自rubric评分与分析质量,呈现仍落后Opus 4.8。max设置得分最高,但较低设置不处成本-性能帕累托前沿;Opus 4.8 (max)、GLM-5.2 (max)和MiniMax-M3在低努力下性价比更优。Sonnet 5成本较高,因turn数大增:max平均每任务183 turns(Sonnet 4.6 max的4倍多),medium平均55 turns,各设置成本跨度约17倍。

智能体Anthropic评测/基准
04:49
Claude Code:GitHub Releases(RSS)
精选64
Claude Code v2.1.198 发布

Claude Code v2.1.198 更新。Claude in Chrome 现已全面可用。为 claude agents 新增后台智能体通知(agent_needs_input / agent_completed)。新增 /dataviz 技能,提供图表与仪表盘设计指导及配色验证器。Gateway 增加 AWS 上的 Claude Platform 作为上游提供商。后台智能体在 worktree 中完成代码后自动提交、推送并创建草稿 PR。内置 Explore 智能体现继承主会话模型(上限 opus)。修复网络短暂断开导致响应中断、后台任务卡在“Running”状态、智能体团队队友因 API 错误失败等问题。

智能体Anthropic产品更新编码

推荐理由:如果你是Claude Code用户,这次更新很实在,Chrome版终于正式可用,背景agent的自动提PR和通知功能能省不少事,/dataviz也能辅助可视化。
04:29
Ethan Mollick@emollick
48
正式组织结构是思考智能体挑战的有用方式。它们为思考工作如何在聪明的昂贵的智能体与更便宜的弱智能体之间,以及在狭窄的专家与通才之间上下委派提供了模板。
智能体大佬观点
04:03
Rohan Paul@rohanpaul_ai
70
Meta员工30天内消耗超60万亿模型token,单用户最高达2800亿,人均年token成本约5万美元。多数公司设月额度上限250-4000美元,重度用户数天用尽。编程工具贡献OpenAI和Anthropic超70%的ARR。Perplexity CEO指出,AI使用正转向重度用户:单个工程师年花费可达1000万美元于编码工具,Perplexity Computer用户月支出超1万美元,内部员工已建立多智能体循环架构。Agentic AI正从追逐海量普通用户转向服务少数高效能操作者。

Rohan Paul: Perplexity's CEO Aravind Srinivas is pointing to a quiet shift in AI use: the valuable user is no longer the average use...

智能体现象/趋势编码
03:37
elvis@omarsar0
59
Notion上线HTML块,用户可在页面内直接构建交互式HTML,并利用AI将内容转为交互式解释器、原型或图表,支持团队共享和协作。AI专家Elvis Saravia(DAIR.AI)评价称,他超过80%的AI输出依赖交互式HTML,这一方式易于识别低质量内容(slop)并支持快速决策,对Notion终于跟进这一自去年起推广的做法表示欢迎。

Notion: New block in Notion: HTML. Build interactive HTML right on your Notion page. Ask AI to turn your content into interactiv...

智能体产品更新
03:28
HuggingFace Daily Papers(社区热门论文)
35
TRIAGE:智能体强化学习的角色类型化信用分配框架

TRIAGE 提出角色类型化信用分配框架,替代标准 GRPO 的均匀优势信号。结构化判断器将每个智能体片段分类为决定性进展、有用探索、无进展基础设施或回归,并映射为固定角色条件规则下的过程奖励,修正纯结果信用对失败轨迹中有用探索的惩罚和对成功轨迹中冗余/倒退动作的强化。在 ALFWorld、Search-QA 和 WebShop 上,TRIAGE 提升成功率,优于标量判断器过程奖励和结果监督共享主干价值基线。消融实验表明收益来自角色类型化,成功轨迹内的回归检测是主要贡献,探索信用提供二次增益;在完整轨迹上,TRIAGE 分别减少 10.4% 和 14.8% 的环境交互轮数。

智能体数据/训练论文/研究
03:26
Google Gemini@GeminiApp
35
使用 Gemini Spark 的新方式,让您的生活更轻松。 从 macOS 版 Gemini 应用中的集成到智能触发器,我们正在通过五种方式让 Gemini Spark 成为更强大的个人 AI 智能体,帮助您全天候完成任务。
智能体Google产品更新
02:56
Google Gemini@GeminiApp
63
你可以使用 Gemini Spark 的新方式来让生活更轻松。 从 macOS 版 Gemini 应用中的集成到智能触发器,以下是我们让 Gemini Spark 成为更强大的个人 AI 智能体、帮助你全天候完成任务的五种方式。
智能体Google产品更新
02:22
Chubby♨️@kimmonismus
67
ZCode 3.0发布:GLM-5.2深度集成的AI编程IDE

Zai正式发布ZCode 3.0,一款为GLM-5.2深度优化的AI原生编程IDE。支持多智能体协作,可自主执行从规划、编码到审查和部署的长期任务,并可通过Telegram、微信、飞书远程控制。GLM Coding Plan订阅用户在ZCode中享有1.5倍使用配额,同时支持BYOK(自带密钥)。覆盖macOS、Windows、Linux平台,付费计划起价$18/月。

Z.ai: Introducing ZCode, the official development environment for GLM-5.2 - GLM Coding Plan subscribers: now 1.5x usage quota ...

智能体产品更新编码
02:21
AYi@AYi_AInotes
71
xAI 发布无代码 Voice Agent Builder,基于 Grok Voice 原生语音架构

xAI 推出 Voice Agent Builder 无代码平台,基于原生 speech-to-speech 架构 Grok Voice,打通语音识别、大模型、语音合成全链路。用户用自然语言描述流程、上传文档作为知识库,两分钟即可生成带工具调用、安全护栏、全链路监控的完整语音智能体,并免费附赠一个电话号码。支持日历、搜索、工单等内置功能,可接入自有号码和系统。定价 $0.05/分钟,无额外平台费。

xAI: Introducing Voice Agent Builder: a no-code platform to create human-like voice agents with Grok Voice. Available today a...

智能体xAI产品更新语音
01:59
Ethan Mollick@emollick
61
主推文强调必须针对实际用例做基准测试,因为决策层层叠加时模型差异会被放大,标准基准无法反映 Gemini 3.1 比 GPT-5.5 更不关心咖啡馆财务损失。引用案例:Andon Labs 的 AI 智能体用 Gemini 3.1 Pro 在斯德哥尔摩开咖啡馆,过度采购且易被欺骗,支出 $15k、收入仅 $9k,亏损 $6k,现已切换到 GPT-5.5。

Andon Labs: Gemini 3.1 Pro lost $6k running Andon Café. 2 months ago, our AI agent opened a café in Stockholm. It over-ordered and w...

智能体GoogleOpenAI现象/趋势
01:38
Hacker News 热门(buzzing.cc 中文翻译)
64
Cloudflare 推出 Monetization Gateway 变现网关

Cloudflare 宣布推出 Monetization Gateway,允许客户对受 Cloudflare 保护的网页、数据集、API 或 MCP 工具等任意资产收费。该网关提供统一控制面板管理支付策略和访问控制,在边缘处理支付验证和结算,保护源站免受高并发支付请求影响。结算采用基于 x402 协议的稳定币(如 Open USD 和 USDC),支持低于一美分的微支付,数秒内到账。此举旨在适应 AI 代理成为主流互联网用户后的按使用量付费模式,替代传统的广告和订阅制,客户无需自建计费系统即可对任意调用方收费。

智能体MCP/工具产品更新
01:21
AYi@AYi_AInotes
47
AI零成本副业:儿童动画月入$5000+,营销Agent Lev8找客户三项Benchmark领先

主推文介绍零成本AI副业:用AI做YouTube儿童早教动画。五步:搜童谣对标、AI改写脚本、Wan2.7或Pika生成动画、AI配儿童音色+背景音乐、标题标签SEO。日更1-2条,首月见收益,月入$5000-$10000。注意纯原创、专业儿童音色、遵守COPPA关闭个性化广告。另引用营销Agent Lev8,找海外客户场景:有效结果90个(Exa 58.2,Codex 20),匹配精度83.3%(Exa 76.5,Codex 71.8),单条成本$0.052(Exa $0.061)。Lev8聚合50+数据源和10亿+职场人脉,支持5个渠道发送定制破冰消息。

AYi: 真的有点兴奋,终于等来营销圈的 Codex 了,不管你是独立开发还是OPC一人公司,找客户扒联系方式写破冰信这些破事,直接给你干得明明白白! 甚至你用来做副业搞钱都是一个超级神器! 我们都知道,AI现在已经把写代码的门槛拉平了,Codex能...

智能体多模态教程/实践视频
01:17
Google Developers Blog(RSS)
41
我们为何构建ADK 2.0

Google官方博客阐述了构建ADK 2.0的动机——包括核心特性与升级理由,并解释了开发者应考虑迁移的原因。该文章发布于ADK 2.0正式上线次日。

智能体Google产品更新
00:34
宝玉@dotey
74
Anthropic 发布面向科研人员的 AI 工作台 Claude Science,定位为科研领域的 Claude Code。它整合了 PubMed、Jupyter 等 60 多个科学数据库及工具,主 Agent 可调用专业子 Agent 处理查询、生成图表并自动附带完整代码和运行环境以支持可复现性。支持本地运算或 SSH 连接集群,敏感数据可本地处理。早期用户已用它发现 RNA-seq 数据中的实验室病毒污染物,或搭建多 Agent 文献综述系统。即日起公测,Pro 及以上订阅可用。Anthropic 提供最高 3 万美元研究资助(含 Modal 计算资源),申请截止 7 月 15 日。

宝玉: Anthropic 今天发布了 Claude Science,一个面向科学研究者的 AI 工作台。它的定位很明确:做科学研究领域的 Claude Code。 去年 Claude Code 改变了程序员的工作方式,Anthropic CEO ...

智能体Anthropic产品更新
00:31
Berryxia.AI@berryxia
69
xAI 推出 Grok Voice Agent Builder Beta,无代码部署语音 AI 助手

xAI 发布 Grok Voice Agent Builder(Beta),将 Grok 语音模型产品化,支持在浏览器中无代码、2 分钟搭建可打电话的 AI 助手。具备实时对话、亚秒延迟、25+ 语言,并可分配电话号码。相比传统方案门槛大幅降低。体验地址:http://x.ai/voice

智能体xAI产品更新语音
00:23
凡人小北@frxiaobei
34
飞书 Aily:普通人也能轻松驾驭的 AI 助手

推文推荐飞书 Aily,称其对普通人已足够好用。Aily 理解飞书全套数据,通过 MCP 连接外部系统,能自主调用工具,覆盖生态内各类任务。相比需要精细控制的 CLI,Aily 对话交互即可满足多数需求。引用推文则强调,用好飞书文档(类比20年前的 Office)和 AI 调用飞书 CLI,是学渣保住空调房工作的机会。两者共同指向飞书生态内 AI 工具的实用价值。

plantegg: 如果你是一个学渣,马上大学毕业,大学也差/专业也差,大概率找不到送外卖以外的工作的话,强烈建议你好好学习用好飞书文档,这大概就是 20 年的的 office,是你留在空调房最好的机会 顺便要是会用 AI 来调用飞书 cli 就基本不怕没工作...

智能体MCP/工具大佬观点
00:20
xAI:News(网页)
精选77
xAI 发布 Voice Agent Builder 测试版

xAI 推出 Voice Agent Builder 测试版,这是一个基于 Grok Voice 的无代码平台,可在两分钟内创建生产级语音智能体。它集成电话、知识检索、工具、MCP、Guardrails 及可观测性,支持连接现有 SIP 号码、API 和 WebSocket,采用语音到语音路径。在 τ-voice Bench 上,Grok Voice Think Fast 1.0 得分 67.3%,领先 Gemini 3.1 Flash Live(43.8%)和 GPT Realtime 1.5(35.3%)。定价为每分钟音频 0.05 美元、电话费 0.01 美元,提供 80+ 种语音及声音克隆,每个账户附赠一个免费电话号码。

智能体MCP/工具xAI产品更新

推荐理由:xAI 用 Grok Voice 原生的语音到语音路径,把生产级语音代理的搭建门槛降到了无代码、两分钟,计费也简单,做语音业务的人值得试试。
00:17
Google Developers Blog(RSS)
52
用 Genkit 构建智能体全栈应用

开源框架 Genkit 推出 Agents API,将消息历史、工具循环和流式传输封装为单一接口,简化对话 AI 开发。该 API 支持服务器或客户端管理的状态持久化,可实现历史分支、长时间运行的分离任务及多智能体协调等高级工作流,并通过统一线协议连接前后端。目前以 TypeScript 和 Go 预览版发布,集成 Genkit Developer UI,开发者无需编写客户端代码即可测试、调试和检查智能体快照。

智能体Google产品更新部署/工程
00:07
AK@_akhaliq
49
LiteResearcher 用于深度研究智能体的可扩展智能体RL训练框架
智能体数据/训练论文/研究
00:02
Andrew Milich@milichab
67
构建一个连接到你的日程应用、知识库以及任意自定义MCP或API的语音智能体 附带了电话号码,可以开始使用! 【引用 @xai】

xAI: Introducing Voice Agent Builder: a no-code platform to create human-like voice agents with Grok Voice. Available today a...

智能体MCP/工具xAI产品更新
00:02
xAI@xai
73
介绍 Voice Agent Builder:一个无代码平台,可使用 Grok Voice 创建类人语音智能体。 今日可用,$0.05 / 分钟。 http://x.ai/voice
智能体xAI产品更新语音
7月1日
23:31
Berryxia.AI@berryxia
47
接入小米mimo的AI智能体实测

我不管别人怎么吹,我觉得切身体会每天都用这玩意。 发现真的比很多Agent什么的好用很多,我接的是小米的mimo模型,听说读写,下载视频、剪辑什么的都可以搞定。 我已经当个小秘在用了哈! PS:不是一条广告😁 如果是就让老板安排打钱吧!

Bloome: This is what Bloome was built for. Drop Claude Code, Codex and DeepSeek into one group chat and they build competing ver...

智能体多模态教程/实践
23:22
Jim Fan@DrJimFan
71
继EMPIRE后,Jim Fan团队发布ASPIRE,为机器人构建可自我进化、无限累积的技能库。编码智能体观察仿真和真实机器人的多模态感官轨迹,对控制程序进行进化搜索,将最佳策略蒸馏进不断扩展的库中。ASPIRE无需梯度下降或端到端策略,而是通过传递"技能知识"绕过sim2real和跨本体迁移难题,相比从头训练实现约10倍迁移学习token缩减。已在150+任务和90+技能上验证,计划开源全栈。

Jim Fan: Today, we give robots a /skills library that self-evolves and compounds indefinitely! Introducing ASPIRE: a robot solvin...

智能体具身智能开源/仓库论文/研究
23:21
AYi@AYi_AInotes
43
Lev8:营销领域的 Codex,一人顶一个商务团队

Lev8 被定位为营销领域的 Codex,专门解决找客户、写破冰信等脏活。Benchmark 显示:海外找客户场景有效结果量 Lev8 90 个(Exa 58.2,Codex 20),匹配精度 83.3%(Exa 76.5%,Codex 71.8%),单条成本 $0.052(Exa $0.061)。产品聚合 50+ 实时数据源(LinkedIn、X、YouTube 等),覆盖 10 亿+ 职场人脉,自动监控融资、招聘、网站改版等信号,生成定制破冰话术,通过邮件、LinkedIn、WhatsApp、Instagram、X 五个渠道批量发送并统一管理回复。适用于独立开发者、一人公司、猎头、中介等需要精准找人的场景。

AYi: 真的有点兴奋,终于等来营销圈的 Codex 了,不管你是独立开发还是OPC一人公司,找客户扒联系方式写破冰信这些破事,直接给你干得明明白白! 甚至你用来做副业搞钱都是一个超级神器! 我们都知道,AI现在已经把写代码的门槛拉平了,Codex能...

智能体搜索教程/实践
23:03
IT之家(RSS)
50
谷歌 AI 智能体 Gemini Spark 登陆苹果 Mac,可实时追踪资讯动态

谷歌 AI 智能体 Gemini Spark 已登陆 macOS,整合进现有 Gemini 桌面客户端。Mac 版支持实时追踪赛事比分、股价、突发新闻等资讯,并可对接 Google Tasks、Google Keep、Canva、Dropbox、Instacart、OpenTable、Zillow 等应用,执行餐厅订位、生鲜采购、设计海报、预约看房等任务,还能读取本地文件分类整理或生成谷歌办公套件文档。macOS 测试版目前仅面向美国地区谷歌 AI Ultra 订阅会员开放,初期不支持跨设备联动,后续将支持手机端下达复合指令调用桌面端。谷歌同期推出对自定义 MCP 协议的支持。

智能体GoogleMCP/工具产品更新
‹ 上一页
1234…50
下一页 ›