AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 657 条
全部一手资讯X论文
标签「MCP/工具调用」清除
Rohan Paul@rohanpaul_ai · 7天前50

i10X just introduced Superagent, an AI Chief of Staff built to turn business goals into finished work. By giving an AI agent access to 100+ tools, cloud execution, research, writing, prospecting, decks, SEO, and human approval gates. Most AI tools still depend on you to break work into pieces, move files between apps, copy outputs, check quality, and decide what happens next. A Superagent tries to absorb that coordination layer. It plans the steps, gathers information, uses connected tools, produces the asset, and keeps running in the cloud even when you are not sitting there babysitting the process. The important design choice is the approval gate. For low-risk work, it can execute quietly; for consequential actions, such as sending an email or publishing a page, it asks first, which turns autonomy into supervised autonomy rather than blind delegation.

译i10X推出Superagent,号称世界首个AI首席幕僚。用户输入业务目标,即可部署智能体团队端到端处理销售、内容创作和SEO。Superagent的核心设计是吸收协调层:自动规划步骤、收集信息、调用100+工具、云端产出成果,无需人工持续监督。关键创新在于审批门控——低风险任务静默执行,涉及发邮件或发布页面等高后果操作时先请求批准,将自主变为受监督的自主,避免盲目委托。

Replit ⠕@Replit · 7天前54

Replit now supports 450+ integrations. No matter what you're building, Replit Agent can wire it up to the tools you already use: payments, messaging, data, CRMs, design tools, analytics, and hundreds more. Just describe what you want. We'll handle the connection.

译Replit 现已支持 450 多项集成。 无论你在构建什么,Replit Agent 都能将它与你已使用的工具连接起来:支付、消息、数据、CRM、设计工具、分析工具,以及数百种其他工具。 只需描述你的需求,我们来处理连接。

elvis@omarsar0 · 7天前47

I guess MCP won. Jokes aside, this is super cool from OpenRouter. Just making it easier for devs to run their long-running agents with the right level of intelligence. More of this, please.

译我猜 MCP 赢了。 玩笑归玩笑,OpenRouter 这波操作太酷了。 让开发者能更轻松地用合适的智能层级运行他们的长期 Agent。 请多来点这样的。

Rohan Paul@rohanpaul_ai · 7天前38

The model alone is no longer the product. The value is the system that turns a model into reliable action, the harness around the model. Utility per watt. The big lab may own the model, but @viktor__com is betting that the company closest to the workflow owns the user. Viktor is making a workflow layer for Slack and Microsoft Teams that connects into 3,000+ tools that Viktor can read and write to. 2 platforms, one AI employee.

译模型本身不再是产品。 价值在于将模型转化为可靠行动的系统,即模型周围的“缰绳”。每瓦特效用。 大型实验室或许拥有模型,但 @viktor__com 正押注:最贴近工作流的公司才能拥有用户。 Viktor 正在为 Slack 和 Microsoft Teams 构建一个工作流层,可连接 3000 多个工具,Viktor 能对这些工具进行读写。两个平台,一名 AI 员工。

OpenRouter@OpenRouter · 7天前72

Introducing the OpenRouter MCP, live model intelligence right inside your agent Your agent builds and ships, but when it comes to choosing the right model for the right job, it guesses from 6 month old training data Watch it pick, price, and test the right model:

译推出 OpenRouter MCP,将实时模型智能直接嵌入你的智能体 你的智能体负责构建和交付,但在为具体任务选择合适模型时,它只能依据 6 个月前的训练数据来猜测 看它如何挑选、定价并测试合适的模型:

AYi@AYi_AInotes · 7天前61

卧槽,这两个 GitHub 项目必须一起推荐。 做AI投研的人可以省几个月功夫了,有人把A股+美港股的全量免费数据,做成了AI原生Skill, 不用对接接口,不用处理反爬,几乎全零API Key, Claude Cursor Codex里一句话就能拉行情,研报,资金流,龙虎榜, 也就是说一个搞定 A 股全维度数据,一个打通美港股+期权链, 装完 Claude Code 一句话就能拉行情、研报、资金流,零 API Key , 这条线程讲两个开源项目,以及和UZI分析引擎的组合杀招 👇

译两个GitHub开源项目分别提供A股和美港股全量免费数据,做成AI原生Skill,无需对接接口、处理反爬,几乎零API Key。在Claude/Cursor/Codex中一句话即可拉取行情、研报、资金流、龙虎榜。项目与UZI分析引擎可组合使用。

向阳乔木@vista8 · 7天前62

腾讯出了专门给Agent用的邮箱,快去抢注你的邮箱名... 注册以后,会有一段提示词,发给Codex或你的其他Agent来完成cli设置。 地址见评论区

ginobefun@hongming731 · 7天前62

使用 FreeLLMAPI 这个项目光明正大的白嫖,目前看有 1.3B 的 token,还可以选择和自定义策略,真不错

译开发者 @hongming731 分享使用 FreeLLMAPI 项目“光明正大白嫖”,已累计消耗约 1.3B token,支持自定义策略。此外,他还提出基于 Dify 异常分支的省钱方法:增加一个 openrouter/free 节点,当异常时使用 flash 模型兜底,每天可免费调用 1000 次。

AYi@AYi_AInotes · 7天前61

说个反常识的判断, 80% 的 Agent 生产崩溃,跟模型智商没半毛钱关系, 基本都死在上下文溢出、工具调错、子代理失控上, 2026 年真正的分水岭在 Harness 和 Loop,不是模型啊, 兄弟@wizardly_ai 这篇工程笔记写得很肝,但把这件事拆透了。 Harness 是什么, 是给 Agent 配的办公室制度、安保系统和质检流程, 让它不至于一激动就把公司搞砸。 独立验证节点是命脉,分层记忆不是全塞进 prompt, 延迟绑定工具只给目录、用的时候再拉完整 schema。 Loop 是什么? 是让它自己发现该干什么、分派任务、验证结果、记录状态,你不再是坐在电脑前一遍遍打 prompt 的人,你变成设计循环的人。 以前我们学怎么写 Prompt, 后来学怎么编排 Agent, 现在学怎么给 Agent 加运行时, 下一步是学怎么让运行时自己跑。 Google 的 Addy Osmani 和 Anthropic Claude Code 的 Boris Cherny, 现在写的是循环,不是 prompt。 最朴素的那个叫 Ralph Loops 的 bash 循环反复被验证有效, 好模型配差循环出昂贵垃圾,普通模型配好循环加验证反而能稳定出货。 模型是可替换的引擎, Harness 是让你不翻车的底盘和安全系统, Loop 是让你不用 24 小时盯着方向盘的自动驾驶。 这三样加起来,才是能积累、能传承的 Agent 工程能力。 这才是 2026 年真正该卷的东西吧 hhh

译推文指出80%的Agent生产崩溃与模型智商无关,根源在上下文溢出、工具调错、子代理失控。2026年分水岭是Harness(办公室制度、安保系统、质检流程,含独立验证节点、分层记忆、延迟绑定工具)和Loop(自我发现、任务分派、验证结果、状态记录)。好模型配差循环产生昂贵垃圾,普通模型配好循环加验证反而稳定出货。模型是可替换引擎,Harness是底盘安全系统,Loop是自动驾驶。引用@wizardly_ai的工程笔记拆解了该论点。

数字生命卡兹克@Khazix0918 · 7天前52

http://x.com/i/article/2070014478029103104 # 盘点16个把自己蒸馏成Skills的国民级App。 最近看到越来越多的一些国民级产品,开始把自己的一些能力,给封装称Skill或者MCP,来向大家开放,我觉得这个大家逐渐为Agent来做能力的趋势,越来越明显了。 特别是前段时间瑞幸咖啡上线了AI开放平台,支持MCP、CLI、Skill三种接入方式。 能够实现用AI点咖啡、查门店、搜商品等等等等。 我当时发了条小红书,甚至还在微博上贡献了一条热搜。 最近发现群里的很多朋友,对国产产品Skill和MCP化还挺感兴趣的。 所以我专门花了一些时间,把能找到的国产Skill、MCP和CLI都梳理了一遍,虽然平时这些动态我也都有在关注,但一直是零零散散地看到,没有来得及系统地整理过,正好借这次机会,我自己也盘一盘。 然后发现,这个名单比我以为的要长得多。 餐饮、出行、地图、办公、金融、娱乐,几乎每个领域都有人在做了。 真的很有意思,这些主流的服务,可以让你自己的Agent,也能实现与真实世界的交互。 当然,可能大多数读者都已经非常了解Skill了,对MCP和CLI还不是特别了解,不过如果不懂得,其实也不用特别了解,直接就当做更高级能做更多事的Skill就行了,反正对于大家来说,其实都是把网址扔过去然后说给我安装其实就行了。。。 接下来,盘点开始。 # 1. 瑞幸咖啡Skill 先从餐饮开始,因为我觉得瑞幸就是这波浪潮里最出圈的那个。。。 他们网址在此:open.lkcoffee.com 支持Skill、MCP、CLI三种方式。 安装命令跟所有的Agent其实都一个样,说一句话就搞定了。 装好了后,你就能够在自己的agent上面点咖啡啦。 我跟它说,帮我点杯瑞幸,但我最近心脏不舒服,不想喝带咖啡因的,让他帮我进行推荐。 它会先确定你的位置,找最近的门店。 选好门店之后,它推荐了几个这家店里无咖啡因的饮品。 大杯、特大杯、超大杯。 唯独没有中杯。 罗老师看了估计都得沉默。 选择之后,还会再问你是否确认下单。 确认之后,需要你打开网页的二维码,扫码支付。 不过,瑞幸的 skill 目前只支持到店自取,不支持外卖。 下单后会给你取餐码,你就可以去门店扫码取咖啡了。 # 2. 麦当劳MCP 接着餐饮往下聊。 麦当劳,之前也上线了MCP。 网址在此:https://open.mcd.cn/mcp 我试了一下。 它能够查活动日历看最近有什么优惠。 还能领券。 不过,点餐到最后一步还是需要去app里面完成支付。 付钱这件事,感觉大家都不敢打通最后一公里。。。 # 3. 飞猪Skill 说完餐饮,然后还有出行这块。 飞猪之前上线了flyai skill,底层接的是自己的MCP服务。 网站在此:https://flyai.open.fliggy.com/ 能够帮助你完成机票、酒店、门票、用车等等的咨询、规划和预定,而且不需要API Key就能试用。 我让它帮我规划一个周五出发的杭州周末游。 直接拉出了去程和回程的航班表,航司、出发时间、到达时间、时长、价格全列好了,还标了首选、备选和性价比。 酒店也是,位置和价格都有。 如果想要预定,可以点击链接进行购买。 体验版本的数据会缺一些。 如果你需要完整的能力的能力,申请个API Key就可以了。 # 4. 滴滴Skill 滴滴出行在去年九月上线MCP服务,在今年四月上线skill。 网站在此:https://mcp.didichuxing.com/ 能够实现实时叫车、预约出行、订单查询、查看司机位置等等等等。 而且它有一个挺有意思的设计,就是能直接提醒司机的状态。 组合玩法就可以实现,司机已到达的时候,直接用hook触发一个飞书电话,啪的一下,一个电话就打过来了。。。 # 5. 高德地图Skill 出行这块那自然绕不过地图。 高德在去年七月份,推出了MCP服务。 在今年四月份上又线了skill市场,涵盖位置服务、地图开发、Android Agent、iOS Agent及RTOS地图方面,给的东西还挺多的。 高德开放平台链接在此:https://lbs.amap.com/ 我装好以后,让它帮我搜索一下杭州余杭区的酒店。 然后生成了一个5公里范围内的酒店搜索链接。 酒店名称、评分、地址、图片全都列出来了。 还是挺有意思的。 # 6. 腾讯地图Skill 除了高德之外,腾讯地图也推出了Skill和MCP。 网址在此:https://lbs.qq.com Skill提供了搜索、规划、天气查询、模型展示等等等等功能。 这两家功能上高度重叠,但细看还是有差异的。 主要是开发层面,腾讯地图多了一个前端地图开发Skill,支持3D地图、Three.js集成、GLTF模型。 其他的日常对话式的用法,两家差不多。 # 7. 美团跑腿Skill 美团跑腿在上个月发布了Skill。 GitHub链接在此:github.com/meituan/MT-Paotui-For-Client 在选择地址的时候,会优先匹配你的地址簿,不用每次重新输。 每次下单前也会展示完整的订单预览卡片,等你确认后才会提交。 支付同样是需要打开app来操作。 大家逃不过的难题。 # 8. 飞书Skill 然后就是办公协作,这块几乎就是大家开放的最猛的真正的主战场。 一马当先的就是飞书了,也是我们公司自己天天在用的工具。 Skill、CLI、MCP三种形态都有。 网站在此:https://open.feishu.cn/?lang=zh-CN CLI在三月份开源的时候,我还写了一篇文章,想要了解更多的朋友可以看这一篇。 # 9. 钉钉Skill 钉钉同样也推出了Skill、CLI和MCP。 网站在此:https://open.dingtalk.com/ 覆盖面也很广,消息、待办、日程、审批流这些都能通过Agent直接操作。 对于用钉钉的团队来说,该有的都有。 飞书能干的事,钉钉这边基本也都能干,选哪个就看你平时公司用的是哪家。 # 10. 企业微信Skill 企业微信有CLI和Skill和MCP。 GitHub网站在此:github.com/WecomTeam/wecom-cli 核心能力像消息收发、通讯录管理这些日常操作也都覆盖了。 几家反正几乎就是能开放的全都开了。 # 11. 腾讯文档Skill 腾讯文档也推出了Skill和MCP。 网站在此:https://docs.qq.com/open/document/ 能够创建和编辑在线文档、进行知识库管理以及AI PPT生成。 你要是不用那几家在线办公产品,平时只用云文档啥的,那用Agent+腾讯文档也是可以的。 # 12. 支付宝Skill 支付宝在去年四月推出国内首个支付MCP。 开发平台在此:https://open.alipay.com/ 覆盖手机支付、网页支付、订单查询、退款、退款查询五项能力。 后面又推出了支付集成skill。 这两个其实都是给收钱的人用的,面向开发者。可以让AI帮你快速把支付宝的支付能力接入到你的产品或者Agent里,比如自动生成收款链接、创建订单、查订单状态、发起退款,完整的收款闭环都能搞定,甚至没有企业资质的个人开发者也能用。 # 13. 微信支付Skill 微信支付在去年开放了MCP,只能在腾讯自己家的腾讯元器上用。 在今年四月份,上线了skill,这个也是让开发者用AI接入支付的功能,并不是给普通用户用的。 网站在此:https://github.com/wechatpay-apiv3/wechatpay-skills 能帮你判断该用哪种支付产品、直接给你示例代码,同时帮你检查写好的代码有没有安全问题,还能专门搞商品券,发券、核销、查询、退券。 # 14. 微信读书Skill 在五月,微信读书推出Skill。 官方页面:weread.qq.com/r/weread-skills 能查书架、看阅读进度、统计你读了多久读了多少天、检索笔记划线、搜索书籍、查看书籍详情,甚至还能根据你的偏好推荐相似的书。 # 15. 网易云音乐Skill 网易云音乐在今年三月推出了Skill和CLI。 GitHub网站在此:github.com/NetEase/skills 支持搜索、播放音乐、歌单管理、红心歌单偏好画像分析等等。 # 16. 美图Skill 美图推出CLI,并同步上线skill。 网站在此:https://www.miraclevision.com/open-claw 功能还是非常全的,支持图片编辑、文生图、文生视频、AI写真、换脸、虚拟换装、背景替换等等。 # 写在最后 除了这些独立发布Skill的,还有一类是直接在自家AI产品里集成第三方服务的。 千问在1月接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态。 6月开放第三方Skill,肯德基、蜜雪冰城、东方航空首批接入。 豆包也在6月22日上线打车服务,接的是曹操出行,正在灰测中。 WorkBuddy作为腾讯的产品,也内置了大量的Skill和MCP。 像微信支付AI专属卡,以及QQ邮箱、腾讯文档、腾讯ima、腾讯问卷、微云这些腾讯系的能力都已经集成在里面了。 我们正在向一个逐渐全面Agent化的时代过度。 然后有一个细节特别有意思,就是支付。 你会发现,几乎所有涉及付钱的环节,大家都选择了让用户跳出去自己完成,瑞幸是扫码支付,麦当劳是跳app,美团跑腿也是打开app操作。 没有人敢让Agent直接替你把钱付了。 技术上肯定轻轻松松就能做到,但,整个社会的信任上,还没到那一步。。。 这个信任不是靠一两个产品能建起来的,需要整个生态慢慢磨。 反正我觉得,现在这个阶段很像2017年小程序刚出来的时候。 当时大家也觉得这玩意有啥用,结果三年后很多的品牌都在做,特别是跟现实时间交互多的。 Skill和MCP这种Agent的基建,现在也处于这个窗口期,先做的人在探路,大量的品牌还在观望。 但趋势已经不可逆了。 当你的Agent能够点咖啡、叫出租车、查航班、发飞书消息、发邮件、管理文档、搜附近的酒店,最后可以自循环,完成支付那一步。。。 它就不再只是一个工具了,它在慢慢变成你在数字世界里的另一个自己。 或者说,是我们每个人心中的那个贾维斯。 这个名单还会越来越长的。 我坚信。

译卡兹克盘点瑞幸、麦当劳、飞猪、滴滴、高德、腾讯地图、美团跑腿、飞书、钉钉、企业微信、腾讯文档、支付宝、微信支付、微信读书、网易云音乐、美图等16款App,均已推出Skill、MCP或CLI服务。覆盖餐饮点单、出行规划、办公协作、支付收款、娱乐编辑等场景。支付环节普遍需跳转App完成。此外,千问、豆包等AI产品也集成第三方服务,Agent化趋势明显。

Chubby♨️@kimmonismus · 7天前45

Fable 5 already available again for some people on Claude Code. Lets freaking go!

译Fable 5 已对部分用户在 Claude Code 上再次可用。 开搞!

向阳乔木@vista8 · 7天前59

飞书Cli + Codex,连记账软件都不需要了! 做法: 1. 安装飞书cli,终端输入指令: npx @larksuite/cli@latest install 2. Codex中创建一个项目文件夹:日常开销记录 3. 跟 Codex 说:创建个多维表格,用于日常开销记录 对话就能记账,还能持续迭代表头。 手机打开多维表格能查看修改

译通过飞书Cli工具与Codex结合,实现自然语言记账:终端执行`npx @larksuite/cli@latest install`安装飞书Cli,再在Codex中创建“日常开销记录”项目,用对话指令生成多维表格,之后可直接在手机端查看和修改,无需额外记账软件。

向阳乔木@vista8 · 7天前40

看 Readwise 推荐一本书,现在的Workflow变成两个Skill的调用。 1. 一个是zlib 机器人绑定 tg ,本地用telethon跟机器人对话自动下载。 2. 把epub传到Notebooklm递归提问解读快速学习。

译推主分享基于Readwise推荐书籍的个人工作流,包含两个Skill:1)通过Telegram绑定zlib机器人(z-lib),使用telethon库自动与机器人对话下载电子书;2)将epub文件上传至Google NotebookLM,利用其递归提问功能快速解读内容,实现高效学习。

Rohan Paul@rohanpaul_ai · 6月25日59

Agents should not be logging into company tools like a random employee with a password. Runlayer is saying agents need their own identity, scoped permissions, approved app connections, audit trails & a kill switch, i.e. a complete managed infrastructure.

译Runlayer宣布获得Felicis和Khosla Ventures共同投资的3000万美元融资。Runlayer主张AI智能体不应像普通员工一样用密码登录公司工具,而应拥有独立身份、作用域权限、经批准的应用连接、完整审计追踪和一个终止开关,即提供一套完整的管理基础设施。Runlayer将自己定位为AI的金色路径:在一个平台内整合赋能、安全与控制。

Luma@LumaLabsAI · 6月25日64

Luma Connectors is live. Your tools come in. Your work goes further. Plug Airtable, Dropbox, Google Drive into Luma. Pull files into any board, on demand. Try it → http://lumalabs.ai/app

译Luma Connectors 已上线。 你的工具接入,你的工作走得更远。将 Airtable、Dropbox、Google Drive 接入 Luma。按需拉取文件到任意看板。 试试看 → http://lumalabs.ai/app

Alibaba Cloud@alibaba_cloud · 6月24日69

📣📣 Meet Qwen-AgentWorld — a native language world model that simulates 7 agent environments (MCP, Search, Terminal, SWE, Web, OS, Android) within a single model. Environment modeling is the training objective from day one, not a post-hoc adaptation. 🤔 LLMs are trained to be better agents — better at acting in environments. But nobody has trained them to model the environments themselves. 🗺️ Our roadmap: investigate how language world modeling can push the boundaries of general agent capabilities, along two routes: 1️⃣ Build a foundation model for environment simulation — outperforming Claude Opus 4.8 and GPT-5.4 on AgentWorldBench 2️⃣ Investigate how world modeling enhances agent training: 🔬 Controllable Sim RL (agentic RL with LWM as environments) surpasses training in real environments 🧠 Learning to predict environments (LWM warm-up) makes agents stronger — remarkably, even without any agent-specific training, this predictive knowledge transfers to agentic tasks with zero fine-tuning 🔗 Model Studio: https://int.alibabacloud.com/m/1000413253/

译阿里云发布 Qwen-AgentWorld,一个原生语言世界模型,可在单一模型内模拟 7 种智能体环境(MCP、搜索、终端、SWE、Web、OS、Android),环境建模是其初始训练目标而非事后适配。该模型

Qwen@Alibaba_Qwen · 6月24日76

📣📣 Meet Qwen-AgentWorld — a native language world model that simulates 7 agent environments (MCP, Search, Terminal, SWE, Web, OS, Android) within a single model. Environment modeling is the training objective from day one, not a post-hoc adaptation. 🤔 LLMs are trained to be better agents — better at acting in environments. But nobody has trained them to model the environments themselves. 🗺️ Our roadmap: investigate how language world modeling can push the boundaries of general agent capabilities, along two routes: 1️⃣ Build a foundation model for environment simulation — outperforming Claude Opus 4.8 and GPT-5.4 on AgentWorldBench 2️⃣ Investigate how world modeling enhances agent training: 🔬 Controllable Sim RL (agentic RL with LWM as environments) surpasses training in real environments 🧠 Learning to predict environments (LWM warm-up) makes agents stronger — remarkably, even without any agent-specific training, this predictive knowledge transfers to agentic tasks with zero fine-tuning 📑 Paper: https://arxiv.org/abs/2606.24597 📖 Blog: https://qwen.ai/blog?id=qwen-agentworld 💻 GitHub: https://github.com/QwenLM/Qwen-AgentWorld 🤗 HuggingFace: https://huggingface.co/collections/Qwen/qwen-agentworld 🧩 ModelScope: https://modelscope.cn/collections/Qwen/Qwen-AgentWorld

译通义千问发布Qwen-AgentWorld,一款原生语言世界模型,可在单一模型中模拟MCP、搜索、终端、SWE、Web、OS、Android共7种智能体环境。环境建模即训练目标,非事后适配。该模型在AgentWorldBench上性能超越Claude Opus 4.8和GPT-5.4。研究分两条路径:一是构建环境模拟基础模型;二是探索世界模型增强智能体训练——可控Sim RL(以LWM为环境的智能体强化学习)优于真实环境训练,而LWM预热(预测环境的学习)即使不经任何智能体特定微调,也能将预测知识迁移至智能体任务。

数字生命卡兹克@Khazix0918 · 6月24日63

http://x.com/i/article/2069669405785772032 # 体验完微信Agent以后,我觉得这就是微信有史以来最大的更新。 前天晚上,我的微信账号,终于拿到了微信小微的内测资格。 无论怎么说,微信这种十几亿日活国民级别的产品,全面拥抱AI,我觉得在整个互联网行业,都是一个巨大的信号,也是值得大家研究的案例。 在深度玩了一天以后,我想说,微信Agent在跟微信原生能力的打通上,有很多超出我预期的部分,但是在智能程度上,也有蛮多不及我预期的部分。 但是我依然愿意称,这是微信有史以来最大的更新。 还是先聊聊功能上。 当你获得小微的体验资格以后,它就会常驻在你的左上角了,替代了原来的星标区域。 点开以后,其实就是一个大家每天都会见到的对话框。 默认进来是语音输入,点击一下才会变成文本输入框,然后支持上传照片、吊起摄像头拍照、以及上传文件。 在这个对话框里,你可以直接调用大模型来跟微信的很多原生能力进行交互。 小微背后的基座模型,应该是两个,一个是主模型WeLM,这是微信自己做的,另一部分偶尔会借助DeepSeek模型来进行回复。 WeLM目前没有太多的数据,只能通过官方年初发布的部分信息看出端倪。 之前透露出了两个模型型号,一个是WeLM-V4-80B的MoE,激活参数量是3B,一个是第三代的,WeLM-V3-258B,激活22B的MoE。 坦率的讲,微信的算力压力还是巨大的,因为我觉得微信很难在这块进行收费和商业化,他们大概率自己也还没有想清楚,现在内测人数不多,他们还是能扛得住的,但是如果真的哪天全量了,那可是14亿的用户,这个数量级的用户的推理需求,我感觉国内哪家公司都可能都抗不住。 这就是AI时代和互联网时代最大的不同,互联网时代用户的边际成本几乎为0,但是AI时代,那不好意思,每一个用户,那真的背后都是白花花的钱。 这也是我为啥看好端侧算力的原因,因为只有这样,才能让所有用户,享受到真正的AI普惠。 从我的测试直觉上,这次的WeLM有可能就是这个80B激活3B的小模型系列来进行服务的,所以从这个参数上来说,你就不能指望它能完成多么复杂的任务。 这个对话框中,目前支持蛮多的功能。 比如一个很多很多人都觉得没啥蛋用的功能,让Agent给人发消息、发红包、打电话之类的。 我的小微回复的口吻稍微会有点特殊,不是正常回复,是因为我想看到小微背后的工具链具体是咋实现的,学习一下做法,所以强行让他扭了过来,让它每一步都要吐一些工具调用,这个其实是不正常的,大家跟小微对话的时候,它回复的还是正常的预期,就像第一张图一样。 小微有一个其实不是很Agent的点,就是几乎每一步都需要你确认,确认是否要拨打语音电话,确认是否要发消息,确认是否真的给这人转账。 这个我们也能理解,因为通讯录以及人与人之间的交互这个事,实在是太敏感了,不谈隐私问题,有无数的灰产这么多年一直跟微信斗智斗勇,你这个东西如果不进行确认,那基本就炸了,最开心的,就是那群灰产了。 这个思路,也几乎贯穿这小微这个Agent所有的设计中。 比如大家最最想要的方便你我他的,比如批量给人发送消息、定时给人发送消息等等,都不可以。 整个微信通讯录其实被封装成了一个skill,我把skill文档给扒了下来,其实就可以看出来一些端倪了。 比如这一连串的禁止事项。 ## ❌ 绝对禁止的情况 对于涉及以下不支持能力的请求,请明确拒绝,并在回复中包含提示或引导用户的文案。回复时用第一人称:"我"不支持,而不是"系统"不支持。 ### 同时给多联系人/群聊发送消息系统不支持同时给**多个联系人/群聊目标**发送消息,也不支持并行调用多个工具(**绝对禁止在一轮当中调用多个工具**)。- Query示例:「问问张三和李四啥时候有时间,一起吃饭」「帮我打个电话给张三和李四」「帮我在测试群1和测试群2里面发个消息问大家测试好了吗」 ### 同时发送多类型消息禁止在单次请求中同时触发多种消息类型的发送动作。以下情况一律视为违规,必须拒答,并在回复中提示本次只发送其中一种类型的消息(如文字),其他消息由用户手动发送。- 涉及两种及以上消息载体(如文字、图片、文件、链接等)的组合发送- 即使文案依附于图片,也算做多类型,需要拒绝- Query示例:「把这张图片发给小明,说快递到了」「给小组群发个消息说今晚聚餐,并附上饭店截图和定位」 ### 给用户自己发消息/转账系统不支持同时给**用户自己发消息/转账/发红包**,也不支持并行调用多个工具(**绝对禁止在一轮当中调用多个工具**)。- Query示例:「给我自己发一个消息说加油」「给我转20」 ### 转发多条聊天记录系统不支持将多条聊天记录合并转发或逐条转发给他人,需明确拒绝,并提示用户手动操作:在聊天中长按消息 → 点击「多选」→ 选择要转发的消息 → 点击底部「转发」→ 选择合并转发或逐条转发。- Query示例:「把我和小张关于项目方案的聊天记录转发给经理」 ### 转发笔记系统暂不支持将笔记发送、转发给他人,需明确拒绝,并提示用户手动操作:打开该笔记 → 点击右上角「…」→ 选择「发送给朋友」。- Query示例:「把会议记录那条笔记分享给小李」 ### 发送语音消息系统不支持帮用户发送语音消息,需明确拒绝,并提示用户换成发送文本消息。**注意**:「发语音」≠「打语音通话」,请勿混淆。如果用户说发语音,需拒绝,而不是当成打电话的意图。- Query示例:「给小王发一条语音,说我快到了」 ### 发送表情包系统不支持帮用户发送表情包,需明确拒绝,并提示用户手动打开聊天窗口,点击表情面板选择发送。- Query示例:「给闺蜜发个比心的表情包」 ### 读取聊天记录本SKILL不支持读取用户聊天记录。例如:「找一下xx群的聊天记录」。 其实微信在通讯录和消息这块的处理,从这个skill我都能感受到,压力也挺大的。 所以开放的能力都非常谨慎,目前基于通讯录开放的能力中,就是给个人/群聊发消息,给个人发起视频通话,给个人发红包或者转账这几个场景比较好,但是同时,就跟很多人说的一样,不够便捷,反而鸡肋。 因为本质上用户的交互成本差不多。 比如我要给鲜虾包打电话。 Agent交互流程是:点击小微 - 输入“我要给鲜虾包打电话” - 等待 - 确认。 常规GUI流程是:点击搜索框 - 输入鲜虾包 - 点击头像 - 点击菜单 - 点击语音通话。 其实只是把点击成本转化为了输入成本,在便利性上,并没有方便特别多。 基于通讯录这块,比较期待微信后续对Agent能力的开放了,比如是不是可以批量或者定时发消息之类的,这些我觉得就能真正的体现出Agent的价值了。 当然,也不是说完全就没有用了,因为如果你只做这一件事,那确实是意义不是很大,但是如果是个稍微复杂一点点的长程任务,这就会方便非常多了。 比如说,我明天要找鲜虾包中午吃饭,那我可以直接给自己设置一个明天中午吃饭的日程提醒,同时也要把这个消息直接发给鲜虾包。 这种就简单很多了。 Agent真正的价值,我还是觉得在未来的长程复杂任务上,能帮我们更便捷的省心省力。 在这个主入口中,还有一些其他的能力,比如打通了朋友圈,你可以问,今天最装逼的朋友是谁。。。 不过其实朋友圈本质是先筛选,并且限制了最多只能拿到最近2天的时间,所以,你想总结过去所有的朋友圈之类的操作,其实就不是特别现实了。 不过最后挑出来的朋友圈,右边那个小按钮,是可以直接点开浮起一个弹窗,支持跳转到朋友圈原文的,这个好评的。 除了朋友圈,也支持公众号和视频号的查询和搜索。 也支持创建提醒,处理文件,创建笔记,这种就是常规操作了。 不过我本来还挺期待,Agent可以跟我的微信收藏打通,但是这个权限并没有开放,小微只能操作他自己创建的笔记。 还有个好玩的事,就是也跟微信支付打通了,可以进行一些好玩的查询操作,比如说,我可以授权以后,来查我今年发了多少红包出去。 不过整体所有你跟小微的交互,都有一个比较核心的特点,我总结成了4个字: 只读不动。 微信目前已经在尽可能的给小微开权限了,但是还是人口基数过于庞大,你不能保证每一个人都是能熟练操作手机的,更别提是能熟练使用Agent了,如果操作权限也给了一部分,你很难说,会发生什么样的舆情。 所以像一些帮我删掉加了超过一年但从来没有说过话的好友、比如取消关注我3个月以上没有打开的公众号等等,全都无法操作。 因为这是微信,所以这个谨慎的态度,是可以理解的。 而在小程序操作上,目前支持很多小程序,这块我也直接列一个我扒拉出来的官方skill的边界吧。 ## 触发条件用户明确说"打开 / 用 / 通过 …(某小程序名)做 X"本地生活类下单/预约:外卖、奶茶咖啡、扫码点餐、堂食排队、KTV、洗车、家政出行类:打车(滴滴等)、共享单车、查公交地铁、查驾车路线/耗时、查火车票机票、订酒店票务类:电影票、演唱会票、景点门票、展览门票、博物馆预约查询类:快递物流查询、订单状态查询、附近商家/POI 检索、营业时间查询充值缴费类:手机充话费、加油卡、水电燃气、ETC模糊本地服务表述:"我想吃饭","附近有什么好玩的","帮我找个能 X 的小程序"基于上一次小程序操作截图的追问/微调(如"换成大杯","看第二家","下一场") ## 不触发条件纯知识/资讯问答 → 走通用问答用户明确要求用 App、网页、桌面客户端完成(非小程序)→ 走对应渠道调用非微信生态平台(如直接调淘宝API、抖音内部操作)→ 不属本 Skill与微信账号/支付/隐私设置相关的系统级操作 → 走客服/系统设置用户只是闲聊、打招呼、表达情绪 → 走通用对话 比如说,我说定个周六晚上的我家附近的电影票,因为我让他记住我家在哪了,所以他知道,然后他会列出目前他可以操作的小程序,然后使用第一个来为我们服务。 小程序支持的还真的蛮多的。 一个电影就列出了5个,然后他选了第一个猫眼进行操作。 小微有一个很棒的点就是,他虽然没有办法帮你直接操作完小程序,但是他会一直操作到,他能操作的部分,然后把剩下的交给你,你接着Agent的步骤,做完后续的部分就行。 比如猫眼这个。 因为我没有指定电影院,我只说了家附近,所以他会先自己操作一会猫眼,最后给我停在玩具总动员5的影院选择界面,我点进去就是列表页,我选个影院就行了。 小微在小程序的操作适配上,这一点我觉得做的还是非常棒的。 除了这个主入口之外,小微的各种小入口,依然还是无处不在。 我能找到的,就有5个。。。 本质上都是一些快捷入口,不过比较特别的就是在群聊对话界面和个人对话界面,这两个的底部菜单栏唤出的小微,是带有了聊天记录的上下文的,这个是主入口里也做不到的。 而且微信居然会把聊天记录的权限在特定的入口里给小微开放出来,这个点,就已经完完全全的超出我的预期了,我以为这个纯粹的0.0.1的内测版本,是不会有聊天记录的,因为这个对于微信来说,就是纯粹的命根子。 比如我直接在两个群聊里面问。 不过这个时效性,跟朋友圈是一样,只能拿到最近2天的数据,拿不到更久以前的。 私聊也是如此,只能拿到最近2天的聊天记录,这个微信卡的非常严格。 除了这些东西之外,你从主入口的小微点进去,右上角的更多里面,其实还藏了一些功能。 比如这个记忆,其实就是会记录下你的部分的信息,比如我就让它记下了我家和公司的地址。 我就可以实现,直接说帮我打车去公司。 然后还有一个比较离谱的东西,就是那个小工具。 点进去以后,你就发现,你是可以,直接用一句话,来创建你想要的小工具的。 比如我就直接昨天一句话,创建了一个体重变化的小工具,这个玩意,是纯粹给我自己用的。 我其实觉得,这玩意有点杀死比赛的意味了。 因为,这个小工具,是完完全全复用的小程序的逻辑和架构。 现在虽然不能转发,但是做这个页面,明显就是未来为了分发而预留的口子。 过去一年时间,出现了无数的AI生成小程序小游戏的平台,大家都觉得,这感觉是个很棒的市场,因为有很多的创作者来这个平台上面做应用,然后就有可能,成为未来的新时代的APP store。 软件这个形态未来还是不是主流咱们另说,咱就说一个点,做过互联网产品的人应该都知道一个概念,双边市场。 平台的价值来源于同时连接两端,供给侧和需求侧。 平台最难的事情,永远是同时把两端的用户聚起来,也就是经典的冷启动困境,没有消费者就没有创造者,没有创造者就没有消费者。 但是过去一年多时间,大家最大的困境都是,只有创造者,但是,消费者不来。 但微信没有这个问题,微信有14亿用户,他的起点,是无数产品这一生的终点。 在微信里生成一个小程序,它天然就在全中国最大的消费者池子里,分发路径、用户基数、支付体系、社交关系链,全是现成的。 你做的每一个小程序,从诞生那一刻起就自带分发能力,因为微信本身就是分发。 所以,当微信自己进军,用AI直接生成小工具的赛道,很多其他的AI生小程序的产品,我觉得就非常的难受了。 整个小微大概就是这样。 能体验的部分、他们的部分技术调度我也都给大家展示了。 整个第一版,虽然还是只读不动。 但其实权限开放的已经有一点超我预期了。 毕竟,平台的信任是一种不可再生资源,透支了就很难恢复。 对于微信来说,出一点点的事,那都是无比大的大事。 而今天,微信也在用着非常微信的方式,把自己十几年积累的上下文资产和分发网络,用一种极其微信的节奏,接入AI时代。 我是从2012年开始用微信的。 到今天为止,差不多用了14年。 回望过去我印象中所有的大更新,我觉得没有什么,比这次更大了。 这是新时代和旧时代的区别。 也会在互联网和AI历史上,留下浓墨重彩的一笔。

译微信小微Agent常驻左上角,支持语音/文本输入,基座模型为微信自研WeLM(WeLM-V4-80B MoE,激活3B)及DeepSeek。可发消息、红包、语音通话,但每一步需用户确认,且禁止批量发送、读取聊天记录、转发笔记等。已打通朋友圈(限最近2天)、公众号、视频号,支持通过小程序进行本地生活、出行、充值等操作。当前权限“只读不动”,不能删除好友或取消关注。作者认为这是微信最大更新,但在智能程度和便捷性上仍有不足。

歸藏(guizang.ai)@op7418 · 6月24日54

我用的素材收集产品 mymind 终于有 mcp 了 找参考不需要我自己从上面搬运了,舒服,又自动化了一部分

译素材收集产品 mymind 现已提供 API、MCP、Claude 连接和 ChatGPT 连接,即日起开启公开测试。用户稱「终于有 MCP了,又自动化了一部分」。

Berryxia.AI@berryxia · 6月24日47

Claude 可以直接开启了你的数字分身! 我知道你很兴奋,但普通用户还用不了😂 Claude现在可以直接在Slack里当团队成员了,你@它就能让它干活。 新功能叫Claude Tag,它能加入指定频道和工具,别人@它就能让它拆解任务、写PR、跑数据分析、处理各种故障。 频道里只有一个Claude,大家可以接力使用,它还会积累上下文。 开启环境模式后,它甚至会主动跟进沉寂的线程,提醒相关信息。 这算是Claude Code的团队版进化,Anthropic自己内部已经在大量使用。 目前在Enterprise和Team计划的beta阶段。 不过看评论区,大部分人反应是:“行吧行吧…… Fable呢?”

译Anthropic 推出 Claude Tag,让 Claude 以团队成员身份加入 Slack。用户可指定频道和工具,通过 @Claude 委托任务(拆解任务、写 PR、跑数据分析、处理故障)。频道内一个 Claude 实例可供多人接力使用,并积累上下文;开启环境模式后,它会主动跟进沉寂线程并提醒相关信息。该功能被视为 Claude Code 的团队版进化,Anthropic 内部已大量使用。目前面向 Enterprise 和 Team 计划开放 beta 测试。

Andrej Karpathy@karpathy · 6月24日55

This is a new paradigm for interacting with Claude that is significantly more "inline" with all the other human activity org-wide. Once you do all of the under the hood engineering work to make this "just work" (e.g. across tools, integrations, compute environments, memory, security, etc.), Claude basically joins the team in a seamless way - you can talk to it as you would talk to a person and it can help with a very large variety of workloads. Imo this is the 3rd major redesign of LLM UIUX. The first paradigm was that the LLM is a website you go to, the second was that it is an app you download to your computer. This third one is that it is a self-contained, persistent, asynchronous entity with org-wide tools and context, working alongside teams of humans. It really takes a while to wrap your head around it, but it works and it is awesome.

译Anthropic 推出 Claude Tag,让 Claude 以团队成员身份加入 Slack 频道,可被 @提及并委派任务。团队可为其配置频道访问权限和工具,从而实现异步协作。Andrej Karpathy 评价这是 LLM UI/UX 的第三次重大重新设计:从访问网站、下载 App,演进为自包含、持久、异步的组织级实体,无缝融入人类工作流,能处理多种工作负载。

Google AI Developers@googleaidevs · 6月24日60

The Gemini Interactions API is your unified interface for text, multimodal inputs, tool use, and managed agents all in a single endpoint. Go from prompt to production faster than ever. Read the developer guide ⬇️ https://x.com/GoogleAIStudio/status/2069450021955592406

译Gemini Interactions API 是您处理文本、多模态输入、工具使用和管理智能体的统一接口,所有这些都集成在一个端点上。从提示词到产品,比以往更快。 阅读开发者指南 ⬇️ https://x.com/GoogleAIStudio/status/2069450021955592406

xAI@xai · 6月24日50

Try the new Firecrawl plugin in the Grok Build Plugin Marketplace

译尝试 Grok Build 插件市场中的新 Firecrawl 插件。

Rohan Paul@rohanpaul_ai · 6月24日70

Agents token burn needs more visibility. Latitude just launched an open-source, MIT licensed monitoring platform that turns AI agent conversations into production debugging data. Most agents already talk to more users than any teammate, but those chats usually sit as raw logs, so teams miss frustration, unmet requests, repeated failures, and churn signals. Latitude organizes that mess into a see, catch, fix loop: see sessions, users, tools, cost, latency, and behaviors; catch repeated failures through Signals; fix them from your editor through MCP. The product is built for production agents, not just model calls, because agent quality depends on tool use, user intent, retries, cost, latency, and the gap between what the user expected and what the system did.

译Latitude 发布 MIT 许可的开源监控平台,将 AI 智能体对话转为生产调试数据。多数智能体已比员工接触更多用户,但对话仅存为原始日志,导致团队错过用户不满、未满足请求、重复失败和流失信号。平台提供 see, catch, fix 循环:查看会话、用户、工具、成本、延迟和 behaviors;通过 Signals 捕获重复失败;通过 MCP 从编辑器直接修复。平台面向生产智能体,关注工具使用、用户意图、重试、成本、延迟等,而非仅模型调用。推文称智能体对话是公司最被低估的数据源,Latitude 正改变此局面。

宝玉@dotey · 6月24日65

今天发布了 Claude Tag,让 Claude 以同事的身份常驻 Slack 频道。团队成员在频道里 @Claude 就能分配任务,Claude 会把任务拆成几个步骤,逐步完成后在 Slack 线程里交付结果。 目前以 research preview 形式提供,Claude Enterprise 和 Team 客户可以使用。 跟之前 Slack 里给 Claude 发私信或者在频道里临时呼叫不同,Claude Tag 有几个变化。 一是多人协作。 一个频道里只有一个 Claude 身份,所有人共享同一个对话上下文。你让 Claude 做了一半的事,同事可以接着往下聊,不用从头解释。 二是持续学习。 Claude 会持续关注频道里的对话,逐渐积累对团队工作的理解,不需要每次都重新交代背景。管理员可以授权它读取其他频道的信息,让它更快了解整个组织的情况。 三是主动干活。 开启 ambient 模式后,Claude 会主动推送它认为你需要知道的信息,跟进没人回复的线程,提醒被遗忘的任务。Anthropic Claude Code 产品负责人 Cat Wu 举了个例子:她把自己的 Claude Tag 连上了 Gmail,Claude 会自动读邮件,遇到重要邮件就在 Slack 里通知她。 权限控制方面,管理员可以精确指定每个频道的 Claude 能访问哪些工具和数据。法务频道的 Claude 不会把信息带到工程频道,也不会让工程师接触到法务数据。 Anthropic 自己已经是重度用户。目前产品团队 65% 的代码由内部版 Claude Tag 生成。用途也不限于写代码,团队还用它查产品数据、处理客服工单、排查疑难 bug。 Claude Tag 会替换现有的 Claude in Slack 应用,管理员有 30 天的迁移窗口。Anthropic 会给符合条件的企业和团队账户发放体验额度。底层模型用的是 Opus 4.8。

译Anthropic 发布 Claude Tag,以 research preview 形式将 Claude 作为同事常驻 Slack 频道。团队成员 @Claude 可分配任务,Claude 逐步完成并在线程交付结果。新功能支持多人协作(共享上下文)、持续学习(自动关注频道对话,可授权读取其他频道)和 ambient 模式(主动推送信息、提醒任务)。管理员可精确控制各频道数据访问权限。内部产品团队 65% 的代码由内部版 Claude Tag 生成,底层模型为 Opus 4.8。将替换现有 Claude in Slack 应用,管理员有 30 天迁移窗口,目前仅面向 Claude Enterprise 和 Team 客户。

Rohan Paul@rohanpaul_ai · 6月24日66

Anthropic just turned Claude into a shared Slack teammate that can read approved channels, use approved tools, and handle work after someone tags Claude. Anthropic says its internal version now creates 65% of its product team’s PR. So the point is to move Claude into the place where team decisions, bugs, metrics, and handoffs happen. The big shift is shared memory, because here Claude sits inside a channel and builds work context from the channel instead of forcing every person to restart the explanation in a private chat. A person can tag @ Claude with a request like “investigate this bug,” and Claude can split the task into steps, inspect connected tools, write code, analyze data, open or merge pull requests, and report back inside the Slack thread. Access is scoped by admins, so a sales Claude and an engineering Claude can have separate tools, memories, spend limits, and separate codebases or documents it can see. Claude then gets its own account and credentials, so its actions are separate from any employee’s account and can be logged. When someone writes @ Claude in a thread, Claude reads the thread, uses the channel’s past context, checks any allowed tools, breaks the task into steps, and starts doing the work.

译Anthropic 推出 Claude Tag,让 Claude 作为共享队友加入 Slack 频道。Claude 可读取经批准的频道、使用授权工具,在被 @ 后自动分解任务、编写代码、分析数据、打开或合并 PR,并在线程中汇报结果。内部版本已为产品团队创建 65% 的 PR。管理员可为不同团队分别配置工具、记忆、额度及可访问代码库。Claude 拥有独立账号和凭据,操作与员工账号分离且可审计。共享记忆让 Claude 从频道中积累工作上下文,无需私聊重复解释。

Google AI Developers@googleaidevs · 6月24日62

🗣️We built Managed Agents in the Gemini API to handle the plumbing so you can focus on building smart, autonomous agents. With just a single prompt, see how the agent researches a topic and builds a radio show from scratch. Here’s how it works: - [Zero infrastructure setup] The API automatically spins up a secure, temporary Linux sandbox. - [Autonomous loops] The agent independently plans, self-corrects, and executes its own code. - [Multi-step logic] With instructions and tools defined via industry-standard agents.md and skills.md files, the agent uses its Gemini-optimized understanding to draft and produce a dynamic, back-and-forth audio dialogue, generate music, create album art and more, all in a single API call. https://x.com/_philschmid/status/2062908191634076056/video/1

译Google AI for Developers 宣布在 Gemini API 中推出 Managed Agents,开发者只需一条提示即可构建自主智能体。该智能体能自动研究主题并从头制作广播节目,包括生成对话音频、音乐、专辑封面等。核心特性:零基础设施设置——API 自动创建安全的临时 Linux 沙箱;自主循环——智能体独立规划、自我纠错并执行代码;多步逻辑——通过 agents.md 和 skills.md 文件定义指令和工具,Gemini 优化理解后在一次 API 调用内完成全部任务。

elvis@omarsar0 · 6月24日48

I'm digging the eve agentic framework from Vercel. I like that everything is files, from the tools to the skills to the evals. More importantly, it's gets you building with agents fast. Very promising. If you like TypeScript you will dig this too. Get started with eve ↓

译我很喜欢 Vercel 的 eve 智能体框架。 我欣赏它的一切都是文件,从工具到技能再到评测。 更重要的是,它能让你快速使用智能体进行开发。非常有前景。 如果你喜欢 TypeScript,你也会喜欢这个。 开始使用 eve ↓

Rohan Paul@rohanpaul_ai · 6月24日51

AI coding has a QA problem. And Momentic just released a testing platform around that bottleneck: faster code means little if QA cannot scale with it. So Momentic's testing agents read the same product memory humans use, including Linear tickets, Notion PRDs, and PR diffs, so tests are based on intended behavior rather than blind script matching. They are claiming in the past few weeks, its agents analyzed 70K+ test failures, created 600 tests, and reached a 73% PR merge rate.

译AI编码速度提升但QA成为新瓶颈。Momentic推出测试平台,其智能体可读取Linear工单、Notion PRD和PR差异等产品记忆,使测试基于预期行为而非静态脚本。过去几周,该平台已分析7万+次测试失败,创建600个测试,PR合并率达73%并持续增长。客户包括Notion、Xero、Webflow、Retool、Runway和Bilt。

SenseTime@SenseTime_AI · 6月23日18

⚽️ 2026 𝗙𝗜𝗙𝗔 𝗪𝗼𝗿𝗹𝗱 𝗖𝘂𝗽 𝗚𝗿𝗼𝘂𝗽 𝗦𝘁𝗮𝗴𝗲 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝗶𝗼𝗻𝘀 𝗮𝗿𝗲 𝗜𝗡! 🔥 Using the advanced 𝗱𝗮𝘁𝗮 𝗮𝗻𝗮𝗹𝘆𝘁𝗶𝗰𝘀 capabilities of 𝗢𝗳𝗳𝗶𝗰𝗲 𝗥𝗮𝗰𝗰𝗼𝗼𝗻 and 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮-𝗦𝗸𝗶𝗹𝗹𝘀, we've built a data-driven prediction engine to forecast the outcomes of the matches. We've combined insights from high-value football datasets, including: 📌 FIFA Rankings & Elo Ratings 📌 Transfermarkt Squad Values 📌 WinnersAndWhiners Odds 📌 RotoWire Tactical Analysis 📌 FootballBerry Alternative Rankings 📌 ESPN Market Data We also evaluated every team across several key dimensions: 📌 Long-Term Squad Capability 📌 Recent Form & Momentum 📌 Squad Completeness 📌 Tactical Adaptability The predictions are locked in! 💥 Let’s watch the games and see if our data hits a perfect bullseye! 🎯 👇 𝗗𝗿𝗼𝗽 𝘆𝗼𝘂𝗿 𝗵𝗼𝘁 𝘁𝗮𝗸𝗲𝘀 𝗮𝗻𝗱 𝗽𝗿𝗲𝗱𝗶𝗰𝘁𝗶𝗼𝗻𝘀 𝗶𝗻 𝘁𝗵𝗲 𝗰𝗼𝗺𝗺𝗲𝗻𝘁𝘀! 👇 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮-𝗦𝗸𝗶𝗹𝗹𝘀: GitHub https://github.com/OpenSenseNova/SenseNova-Skills Quick installation (bundled with Hermes Agent & OpenClaw) https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/INSTALL.md Discord https://discord.gg/BuTXPHmQub 𝗢𝗳𝗳𝗶𝗰𝗲 𝗥𝗮𝗰𝗰𝗼𝗼𝗻: https://office.xiaohuanxiong.com/home

译商汤科技利用 Office Raccoon 与 SenseNova-Skills 构建数据驱动预测引擎,用于 2026 年世界杯小组赛结果预测。引擎整合 FIFA 排名、Elo 评分、Transfermarkt 球队身价、WinnersAndWhiners 赔率、RotoWire 战术分析、FootballBerry 排名及 ESPN 市场数据,并从长期阵容能力、近期状态、阵容完整度、战术适应性四个维度评估各队。相关项目已开源:SenseNova-Skills 的 GitHub 仓库(含 Hermes Agent 与 OpenClaw 安装指南)及 Office Raccoon 官网已公布。

fofr@fofrAI · 6月23日72

For your agents: > npx skills add google-gemini/gemini-skills --skill gemini-interactions-api --global

译今天,Interactions API 正式可用,作为 Gemini 模型和智能体的主要接口。该 API 基于开发者反馈构建,针对有状态、智能体的工作流优化,带来 Managed Agents、后台执行、扩展工具支持、多模态生成以及即将推出的 Gemini Omni 等新能力。开发者可通过 `npx skills add google-gemini/gemini-skills --skill gemini-interactions-api --global` 为其 agent 添加该 API 技能。

Berryxia.AI@berryxia · 6月23日46

刚刚看到YouMind已经第一时间接入了Doubao Seed2.1 Pro 于是乎我试了一把,就是这几个字,自己理解来帮我做了个网页游戏。 反正看着还行,至少逻辑关系、审美都还可以。 后面我谢谢Skills 看看效果如何!

译YouMind 已支持豆包(Doubao)Seed2.1 Pro 模型,据称性能可媲美 Opus 4.6,且积分消耗更低。有用户试用该模型仅凭简单提示词生成网页游戏,评价其逻辑关系与审美表现尚可,并计划后续测试 Skills 功能。

Berryxia.AI@berryxia · 6月23日72

有人把自己的剪辑 Skills 接上 Codex,现在能让Agent从口播素材直接跑到最终成片。 成峰之前开源了一个2000+ Star的剪辑Skills,这次和Codex结合后,整个流程打通了。 把原始口播视频和文字稿丢给Agent,它就能自动剪辑、分镜、做动画,最后合成完整视频。已经帮他跑出好几条千赞内容。 具体流程是这样的: 先让Codex安装他的剪辑Skills,然后用斜杠命令 /剪口播 把素材和稿子扔进去,Agent会生成审核页,确认后直接输出剪好带字幕的视频。 接下来用 /口播成片 命令,Agent会生成一个HTML分镜核对页,左边是画面,右边是字幕和任务描述。 你可以直接反馈哪一段需要改,Codex用Computer Use自己去调整。 确认没问题后进入时间线预览,最后用HyperFrames合成最终MP4。 以前做视频是人围着时间线操作,现在是人给方向,Agent围着工作流跑。 视频生产正在从“手动执行”变成“流程编排”。 地址见评论区👇

译成峰开源了一款2000+ Star的剪辑Skills,与Codex结合后,Agent可自动完成口播视频的剪辑、分镜、动画及合成。流程:先安装Skills,用/剪口播命令上传素材和文稿,生成审核页并输出带字幕视频;再用/口播成片命令生成HTML分镜核对页,用户反馈后Codex通过Computer Use自动调整,最后用HyperFrames合成最终MP4。视频生产从手动执行转向流程编排。

meng shao@shao__meng · 6月23日59

AI:你永远想象不到人类对可视化的执念?! 前不久 Claude Code 开发者 @trq212 发布了 Using Claude Code: The Unreasonable Effectiveness of HTML https://x.com/trq212/status/2052809885763747935 用 HTML 代替 Markdown 来给人类做解释,今天 @HeyGen 甚至把它做成了视频「pr-to video Skill」 https://x.com/trq212/status/2052809885763747935 Markdown -> HTML -> Video 人类的最佳信息输入源,真的是视频吗?这么说,我要把荒废了很久的视频内容重新做起来了!

译继 Claude Code 开发者用 HTML 代替 Markdown 向人类解释模型输出后,HeyGen 为其 HyperFrames 平台推出新技能 pr-to-video。智能体可将无人阅读的 Pull Request(PR)直接转化为简短解释性视频,用户可通过命令 `npx skills add heygen-com/hyperframes` 添加该技能。作者感叹视频或为人类最佳信息输入源,并表示将重启视频内容。

xAI@xai · 6月23日45

You can now connect Grok to Interactive Brokers, delivering high quality, up-to-date information on your portfolio

译你现在可以将Grok连接到Interactive Brokers,获取关于你投资组合的高质量、最新信息。

Chubby♨️@kimmonismus · 6月23日61

OpenAI is practically calling for regulation by the US government. Jokes aside: GPT Cyber ​​New outperforms Claude Mythos on CyberGym.

译OpenAI 宣布扩展 Daybreak 项目,旨在以机器速度民主化修复脆弱软件。主要发布包括:Codex Security 插件(在 Codex 内发现、验证并修复漏洞);完整版 GPT-5.5-Cyber 模型(面向受信防御者的安全专用模型);Cyber Partner Program(支持安全公司基于 OpenAI 顶级网络能力构建产品);以及 Patch the Planet(与维护者合作保护关键开源项目)。据主推文称,GPT-5.5-Cyber 在 CyberGym 基准上表现优于 Claude Mythos。

凡人小北@frxiaobei · 6月23日42

关于微信 Agent 小微的一点看法: 一年前的帖子

译推文分析微信成为超级Agent OS的潜力。对比手机厂商(端侧感知型,偏向控制硬件,但服务碎片化)与微信(云端调度型,依靠小程序作为类MCP工具池,聊天作为天然上下文窗口)。微信可深度操控自身生态(页面跳转、功能触发),但缺端侧长期记忆和规划能力。结论认为真正跑得动的Agent应云负责理解、编排与聚合服务,端负责感知与控制,统一调用链、上下文管理与服务编排者有望成为智能体OS。

elvis@omarsar0 · 6月22日53

Great report on LLM agent communication protocols. Communication is a huge bottleneck in multi-agent systems. (worth bookmarking) The report builds a five-dimensional taxonomy (counterparty, payload, interaction state, discovery mechanism, schema flexibility) across nine actively maintained open-source agent protocols, so it maps the real MCP and A2A landscape. Two patterns stand out. Every agent-to-agent protocol sampled pairs of hybrid payloads with session-state persistence, and decentralized discovery is still rare. So the field is quietly standardizing on stateful sessions while leaving discovery and policy enforcement open. Why does it matter? If you are choosing a communication layer this year, this discusses what nine real protocols actually do. Paper: https://arxiv.org/abs/2606.19135 Learn to build effective AI agents in our academy: https://academy.dair.ai/

译该报告针对LLM多智能体系统的通信瓶颈,构建了五维分类法(对方、有效载荷、交互状态、发现机制、模式灵活性),系统梳理了9个积极维护的开源智能体协议,覆盖MCP和A2A的实际格局。报告发现两个突出模式:每个智能体间协议都采用混合有效载荷与会话状态持久化组合,而去中心化发现机制仍极为罕见。领域正悄然标准化有状态会话,但发现与策略执行层仍留白。该报告为今年选择通信层时提供了九大协议的真实对比参考。

🚨 AI News | TestingCatalog@testingcatalog · 6月22日64

BREAKING 🔥: Sakana AI announced the Sakana Fugu and Sakana Fugu Ultra systems, which perform on par with Claude Fable 5 and Mythos 5 across many benchmarks. > Sakana AI is an AI lab from Japan, and Fugu is an orchestration model trained to operate other LLMs. > It is available as an API but not yet accessible in the EEA region. That's a natural evolution. Orchestration multi-model systems will outperform single-model systems, and they will become much more accessible for smaller labs and companies to build. Big players will have to consider building orchestrating systems that rely on models built by competitors. It is already happening at Meta, Apple, and Microsoft, and will likely catch Google, Anthropic, and OpenAI as well eventually.

译Sakana AI 宣布推出 Fugu 和 Fugu Ultra 系统。Fugu 是一个多智能体编排模型,训练用于操控其他 LLM,通过单一模型 API 访问。其中 Fugu Ultra 在多项基准测试中性能匹敌 Claude Fable 5 和 Mythos 5,并宣称提供前沿能力且规避出口管制风险。该系统目前通过 API 提供服务,但暂不支持 EEA 地区。推文指出,编排式多模型系统将超越单一模型,使小型实验室和企业更易构建,并已促使 Meta、Apple、微软等巨头考虑采用竞争对手的模型搭建编排系统。

meng shao@shao__meng · 6月22日67

前 Meta/Microsoft/Atlassian 主任工程师的 Agentic 工程工作流 用这套工作流 @kunchenguid 每天 ship 40-50 个经测试的生产级 PR,他这么形容它:「你是船长,agent 是你的船员,分四层递进: 造船 → 训练船员 → 与单个船员协作 → 并行指挥多个船员 + 一位大副」。 https://www.youtube.com/watch?v=iQyg-KypKAA # 终端中心主义(造船) 坚持全终端工作,核心理由: · 手不离键盘 = 维持心流,鼠标切换会强制上下文切换 · 跨设备一致性——同一套工作流可在手机/不同机器上接续 工具栈:WezTerm (跨平台、Lua 配置、热重载) + tmux (会话持久化、多 pane、可远程 attach) + Neovim (键盘优先、相对行号)。 # 船员的入职培训(Memory + Skills) agent 是新兵,不知道你的偏好。两类机制 ramp up:Memory 和 Skills 1. Memory · 全局 memory(如 ~/.claude/CLAUDE.md):保持精简(27 行),因为内容会注入每次会话的系统提示词,过长会"静默"消耗 token · 几条有洞察的偏好规则: 1. 不要用 em-dash(—)——AI 默认会用,显得机械 2. 做技术决策时不要高估开发成本——模型用人类数据训练,会高估耗时(预估"天/周",实际几分钟出可玩版本),这种偏差会让模型偏向"便宜但低质量"方案。这条是纠正模型训练偏差 3. bug 修复优先端到端复现,而非依赖单元测试 · 项目级 memory:核心方法不是手写,而是每次纠正 agent 后让它把教训写进去——项目集体学习的沉淀 2. Skills · 把条件性内容(如仅改代码时才需要的 E2E 说明)从 memory 抽到 skill · skill 启动时只加载简短描述,用到才读全文——避免无谓 token 消耗 3. 关于 skills 的重要警告 · Karpathy 的 skills 仓库(17.7 万 star)经 program-bench 评测后,使用反而多耗 5% token 且结果更差,且并非 Karpathy 本人所写 · 安全风险:skill 可在机器上执行任意命令,可能泄露 API key 甚至银行凭证 · 结论:流行 ≠ 优质。不要装声称"神奇提升"却无严格评测的 skill # 与单个船员协作 1. 语音输入 · 几乎全用语音替代打字(Stanford 论文:说话比打字快 3 倍) · 工具 OpenSuperWhisper:本地 whisper,免费开源,通过 system prompt 注入自定义词汇表提升专有名词识别 2. AXI 标准 (Agent ergonomics) 自创的为 agent 优化工具的设计标准: · 实测:同样 GitHub 任务,MCP server 比 CLI 多耗 3 倍 token + 2 倍延迟 · 设计原则之一:token 高效输出格式比 JSON 节省 ~40% token · 启示:给 agent 的工具本身的效率,直接决定 agent 的"油耗" 3. Lavish (交互式规划工件) 针对"agent 返回一堵文字墙难以评审"的痛点:让 agent 生成 HTML 可视化工件,复用项目设计系统,可针对具体元素批注反馈并在浏览器内回传。 # 验证:no-mistakes 流水线(质量基石) 反直觉主张:不要逐个 review diff。 · 理由:AI 写代码太快,逐 diff 审查会让人成为瓶颈且无趣 · 类比:像工程总监一样思考——总监不审 PR,而是通过文化和流程把控质量 流水线在隔离 worktree 中执行: · 分析会话还原真实意图 · rebase 到最新 main,提前解决冲突 · 对抗式 review(独立上下文窗口)——多数问题在此被捕获自愈,模糊的升级人类 · E2E 测试并录制证据(截图/视频/日志) · 文档更新 + 链接检查 · 推分支开 PR,持续 babysit 直到合并 PR 呈现:原始意图、变更摘要、测试证据、流水线发现并修复的问题、风险评估。 评审策略:看风险评估决定投入精力。低风险几乎不看 diff(因流水线已覆盖),只对高风险深入。 工作分布洞察:时间花在任务开头(用 Lavish 澄清需求)和结尾(把质量关),中间全交给 AI。中间腾出越多,并行越多。 # 长时间运行:good-night-have-fun 解决"睡觉 8 小时如何让 agent 持续干活":给目标和停止条件,在循环中迭代。 相比 Claude Code/Codex 的 /go,优势是可精确设置 token 上限 / 迭代上限 / 停止条件——避免睡醒发现周配额耗尽。 # 并行:treehouse + worktree git worktree 的痛点:起名、记状态、手动清理 = 认知债。treehouse:运行即落入空闲 worktree,关闭 tab 自动释放,treehouse status 一目了然。 # First Mate:大副编排器 并行会话变多后,上下文切换疲惫。 First Mate 是元 agent,替你管理所有船员:你只跟它对话,它自动拆并行子任务、调用 treehouse 建 worktree、跑 no-mistakes、准备 PR。 关键观察:用了 First Mate 后,瓶颈从"agent 执行力"转移到"你想让它做什么"——船长的价值转向战略:理解用户、研究竞争、画好"藏宝图"。

译kunchenguid发布45分钟视频,讲解每天交付40-50个生产级PR的工作流。四层:1)终端中心(WezTerm+tmux+Neovim);2)船员入职:全局memory精简27行,项目级memory由agent自写;3)协作:语音输入OpenSuperWhisper,AXI标准(MCP比CLI多耗3倍token+2倍延迟),Lavish交互式HTML工件;4)验证:no-mistakes流水线在隔离worktree中对抗式review+E2E测试。并行用treehouse管理worktree,First Mate元agent调度。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月26日
02:53
Rohan Paul@rohanpaul_ai
50
i10X发布Superagent:AI首席幕僚实现业务自动化

i10X推出Superagent,号称世界首个AI首席幕僚。用户输入业务目标,即可部署智能体团队端到端处理销售、内容创作和SEO。Superagent的核心设计是吸收协调层:自动规划步骤、收集信息、调用100+工具、云端产出成果,无需人工持续监督。关键创新在于审批门控——低风险任务静默执行,涉及发邮件或发布页面等高后果操作时先请求批准,将自主变为受监督的自主,避免盲目委托。

i10X: Today we're introducing the world's first AI Chief of Staff. Enter your business goal and it deploys a team of AI agents...

智能体MCP/工具产品更新
02:42
Replit ⠕@Replit
54
Replit 现已支持 450 多项集成。 无论你在构建什么,Replit Agent 都能将它与你已使用的工具连接起来:支付、消息、数据、CRM、设计工具、分析工具,以及数百种其他工具。 只需描述你的需求,我们来处理连接。
智能体MCP/工具产品更新
01:25
elvis@omarsar0
47
我猜 MCP 赢了。 玩笑归玩笑,OpenRouter 这波操作太酷了。 让开发者能更轻松地用合适的智能层级运行他们的长期 Agent。 请多来点这样的。

OpenRouter: Introducing the OpenRouter MCP, live model intelligence right inside your agent Your agent builds and ships, but when it...

智能体MCP/工具产品更新
00:53
Rohan Paul@rohanpaul_ai
38
模型本身不再是产品。 价值在于将模型转化为可靠行动的系统,即模型周围的"缰绳"。每瓦特效用。 大型实验室或许拥有模型,但 @viktor__com 正押注:最贴近工作流的公司才能拥有用户。 Viktor 正在为 Slack 和 Microsoft Teams 构建一个工作流层,可连接 3000 多个工具,Viktor 能对这些工具进行读写。两个平台,一名 AI 员工。

Fryd Wiatrowski: http://x.com/i/article/2070125273790492672

智能体MCP/工具大佬观点
6月25日
23:14
OpenRouter@OpenRouter
72
推出 OpenRouter MCP,将实时模型智能直接嵌入你的智能体 你的智能体负责构建和交付,但在为具体任务选择合适模型时,它只能依据 6 个月前的训练数据来猜测 看它如何挑选、定价并测试合适的模型:
智能体MCP/工具产品更新
关联讨论 1 条OpenRouter:Announcements(RSS)
22:14
AYi@AYi_AInotes
61
两款AI投研GitHub开源项目推荐

两个GitHub开源项目分别提供A股和美港股全量免费数据,做成AI原生Skill,无需对接接口、处理反爬,几乎零API Key。在Claude/Cursor/Codex中一句话即可拉取行情、研报、资金流、龙虎榜。项目与UZI分析引擎可组合使用。

AYi: http://x.com/i/article/2069024565901119488

GitHubMCP/工具开源/仓库
22:08
向阳乔木@vista8
62
腾讯出了专门给Agent用的邮箱,快去抢注你的邮箱名… 注册以后,会有一段提示词,发给Codex或你的其他Agent来完成cli设置。 地址见评论区
智能体MCP/工具产品更新
21:20
ginobefun@hongming731
62
开发者 @hongming731 分享使用 FreeLLMAPI 项目"光明正大白嫖",已累计消耗约 1.3B token,支持自定义策略。此外,他还提出基于 Dify 异常分支的省钱方法:增加一个 openrouter/free 节点,当异常时使用 flash 模型兜底,每天可免费调用 1000 次。

ginobefun: 基于 Dify 异常分支的省钱小妙招 增加一个 openrouter/free 节点处理,异常时使用 flash 模型兜底,每天可以调用 1000 次

MCP/工具教程/实践部署/工程
19:14
AYi@AYi_AInotes
61
Agent生产崩溃80%与模型无关,Harness与Loop才是2026分水岭

推文指出80%的Agent生产崩溃与模型智商无关,根源在上下文溢出、工具调错、子代理失控。2026年分水岭是Harness(办公室制度、安保系统、质检流程,含独立验证节点、分层记忆、延迟绑定工具)和Loop(自我发现、任务分派、验证结果、状态记录)。好模型配差循环产生昂贵垃圾,普通模型配好循环加验证反而稳定出货。模型是可替换引擎,Harness是底盘安全系统,Loop是自动驾驶。引用@wizardly_ai的工程笔记拆解了该论点。

Wizard: http://x.com/i/article/2069720576693022720

智能体MCP/工具大佬观点
15:38
数字生命卡兹克@Khazix0918
52
16个国民级App推出Skill/MCP/CLI服务,支持Agent调用真实世界能力

卡兹克盘点瑞幸、麦当劳、飞猪、滴滴、高德、腾讯地图、美团跑腿、飞书、钉钉、企业微信、腾讯文档、支付宝、微信支付、微信读书、网易云音乐、美图等16款App,均已推出Skill、MCP或CLI服务。覆盖餐饮点单、出行规划、办公协作、支付收款、娱乐编辑等场景。支付环节普遍需跳转App完成。此外,千问、豆包等AI产品也集成第三方服务,Agent化趋势明显。

智能体MCP/工具现象/趋势
15:35
Chubby♨️@kimmonismus
45
Fable 5 已对部分用户在 Claude Code 上再次可用。 开搞!

sanchay: 🚨 You can already use fable 5 by selecting the model after resuming it with /remote control on ios

AnthropicMCP/工具教程/实践
12:07
向阳乔木@vista8
59
飞书Cli+Codex实现对话记账

通过飞书Cli工具与Codex结合,实现自然语言记账:终端执行npx @larksuite/cli@latest install安装飞书Cli,再在Codex中创建“日常开销记录”项目,用对话指令生成多维表格,之后可直接在手机端查看和修改,无需额外记账软件。

MCP/工具教程/实践编码
10:07
向阳乔木@vista8
40
个人读书工作流:zlib机器人+NotebookLM快速学习

推主分享基于Readwise推荐书籍的个人工作流,包含两个Skill:1)通过Telegram绑定zlib机器人(z-lib),使用telethon库自动与机器人对话下载电子书;2)将epub文件上传至Google NotebookLM,利用其递归提问功能快速解读内容,实现高效学习。

MCP/工具教程/实践
01:49
Rohan Paul@rohanpaul_ai
59
Runlayer宣布获得Felicis和Khosla Ventures共同投资的3000万美元融资。Runlayer主张AI智能体不应像普通员工一样用密码登录公司工具,而应拥有独立身份、作用域权限、经批准的应用连接、完整审计追踪和一个终止开关,即提供一套完整的管理基础设施。Runlayer将自己定位为AI的金色路径:在一个平台内整合赋能、安全与控制。

Andy Berman: Today, we're announcing Runlayer has raised $30M from Felicis and Khosla Ventures to help companies go all in on AI. Run...

智能体MCP/工具行业动态
01:11
Luma@LumaLabsAI
64
Luma Connectors 已上线。 你的工具接入,你的工作走得更远。将 Airtable、Dropbox、Google Drive 接入 Luma。按需拉取文件到任意看板。 试试看 → http://lumalabs.ai/app
MCP/工具产品更新
6月24日
18:22
Alibaba Cloud@alibaba_cloud
69
Qwen-AgentWorld 超越 Claude Opus 4.8 和 GPT-5.4

阿里云发布 Qwen-AgentWorld,一个原生语言世界模型,可在单一模型内模拟 7 种智能体环境(MCP、搜索、终端、SWE、Web、OS、Android),环境建模是其初始训练目标而非事后适配。该模型

智能体MCP/工具模型发布
18:12
Qwen@Alibaba_Qwen
76
通义千问发布Qwen-AgentWorld原生语言世界模型

通义千问发布Qwen-AgentWorld,一款原生语言世界模型,可在单一模型中模拟MCP、搜索、终端、SWE、Web、OS、Android共7种智能体环境。环境建模即训练目标,非事后适配。该模型在AgentWorldBench上性能超越Claude Opus 4.8和GPT-5.4。研究分两条路径:一是构建环境模拟基础模型;二是探索世界模型增强智能体训练——可控Sim RL(以LWM为环境的智能体强化学习)优于真实环境训练,而LWM预热(预测环境的学习)即使不经任何智能体特定微调,也能将预测知识迁移至智能体任务。

智能体arXivMCP/工具模型发布
关联讨论 5 条Hacker News 热门(buzzing.cc 中文翻译)X:Berry Xia (@berryxia)HuggingFace Daily Papers(社区热门论文)公众号:通义实验室(千问)Qwen:Blog Retrieval(API)
15:04
数字生命卡兹克@Khazix0918
63
体验微信小微Agent:微信有史以来最大更新,但智能与便捷仍有不足

微信小微Agent常驻左上角,支持语音/文本输入,基座模型为微信自研WeLM(WeLM-V4-80B MoE,激活3B)及DeepSeek。可发消息、红包、语音通话,但每一步需用户确认,且禁止批量发送、读取聊天记录、转发笔记等。已打通朋友圈(限最近2天)、公众号、视频号,支持通过小程序进行本地生活、出行、充值等操作。当前权限“只读不动”,不能删除好友或取消关注。作者认为这是微信最大更新,但在智能程度和便捷性上仍有不足。

智能体MCP/工具评测/基准
11:15
歸藏(guizang.ai)@op7418
54
素材收集产品 mymind 现已提供 API、MCP、Claude 连接和 ChatGPT 连接,即日起开启公开测试。用户稱「终于有 MCP了,又自动化了一部分」。

mymind: ˗ˏˋ BIG NEWS ˎˊ˗ We now have an API. We have an MCP. We have a Claude Connection. We have a ChatGPT Connection. All of t...

MCP/工具产品更新
08:17
Berryxia.AI@berryxia
47
Claude Tag:在Slack里@Claude让它当团队成员干活

Anthropic 推出 Claude Tag,让 Claude 以团队成员身份加入 Slack。用户可指定频道和工具,通过 @Claude 委托任务(拆解任务、写 PR、跑数据分析、处理故障)。频道内一个 Claude 实例可供多人接力使用,并积累上下文;开启环境模式后,它会主动跟进沉寂线程并提醒相关信息。该功能被视为 Claude Code 的团队版进化,Anthropic 内部已大量使用。目前面向 Enterprise 和 Team 计划开放 beta 测试。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体AnthropicMCP/工具产品更新
06:51
Andrej Karpathy@karpathy
55
Claude Tag 面世:AI 以团队成员身份嵌入 Slack

Anthropic 推出 Claude Tag,让 Claude 以团队成员身份加入 Slack 频道,可被 @提及并委派任务。团队可为其配置频道访问权限和工具,从而实现异步协作。Andrej Karpathy 评价这是 LLM UI/UX 的第三次重大重新设计:从访问网站、下载 App,演进为自包含、持久、异步的组织级实体,无缝融入人类工作流,能处理多种工作负载。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体AnthropicMCP/工具大佬观点
06:09
Google AI Developers@googleaidevs
60
Gemini Interactions API 是您处理文本、多模态输入、工具使用和管理智能体的统一接口,所有这些都集成在一个端点上。从提示词到产品,比以往更快。 阅读开发者指南 ⬇️ https://x.com/GoogleAIStudio/status/2069450021955592406

Google AI Studio: http://x.com/i/article/2069439163758170112

智能体GoogleMCP/工具产品更新
05:43
xAI@xai
50
尝试 Grok Build 插件市场中的新 Firecrawl 插件。

Firecrawl: Firecrawl is now an official plugin in @grok build 🔥 Your Grok agents can now search the web, scrape, and interact with...

智能体MCP/工具xAI产品更新
02:16
Rohan Paul@rohanpaul_ai
70
Latitude 开源 AI 智能体监控平台,将对话转化为调试数据

Latitude 发布 MIT 许可的开源监控平台,将 AI 智能体对话转为生产调试数据。多数智能体已比员工接触更多用户,但对话仅存为原始日志,导致团队错过用户不满、未满足请求、重复失败和流失信号。平台提供 see, catch, fix 循环:查看会话、用户、工具、成本、延迟和 behaviors;通过 Signals 捕获重复失败;通过 MCP 从编辑器直接修复。平台面向生产智能体,关注工具使用、用户意图、重试、成本、延迟等,而非仅模型调用。推文称智能体对话是公司最被低估的数据源,Latitude 正改变此局面。

cesar.wtf: Most underrated data source in a company: your AI agent's conversations. Your agent talks to more customers than any emp...

智能体MCP/工具开源/仓库
02:16
宝玉@dotey
65
今天发布了 Claude Tag,让 Claude 以同事的身份常驻 Slack 频道。

Anthropic 发布 Claude Tag,以 research preview 形式将 Claude 作为同事常驻 Slack 频道。团队成员 @Claude 可分配任务,Claude 逐步完成并在线程交付结果。新功能支持多人协作(共享上下文)、持续学习(自动关注频道对话,可授权读取其他频道)和 ambient 模式(主动推送信息、提醒任务)。管理员可精确控制各频道数据访问权限。内部产品团队 65% 的代码由内部版 Claude Tag 生成,底层模型为 Opus 4.8。将替换现有 Claude in Slack 应用,管理员有 30 天迁移窗口,目前仅面向 Claude Enterprise 和 Team 客户。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体AnthropicMCP/工具产品更新
01:46
Rohan Paul@rohanpaul_ai
66
Anthropic 推出 Claude Tag,将 Claude 作为共享队友加入 Slack 频道

Anthropic 推出 Claude Tag,让 Claude 作为共享队友加入 Slack 频道。Claude 可读取经批准的频道、使用授权工具,在被 @ 后自动分解任务、编写代码、分析数据、打开或合并 PR,并在线程中汇报结果。内部版本已为产品团队创建 65% 的 PR。管理员可为不同团队分别配置工具、记忆、额度及可访问代码库。Claude 拥有独立账号和凭据,操作与员工账号分离且可审计。共享记忆让 Claude 从频道中积累工作上下文,无需私聊重复解释。

Claude: Introducing Claude Tag, a new way for teams to work with Claude. In Slack, Claude joins as a team member with access to ...

智能体AnthropicMCP/工具产品更新
01:08
Google AI Developers@googleaidevs
62
Google AI for Developers 在 Gemini API 推出 Managed Agents

Google AI for Developers 宣布在 Gemini API 中推出 Managed Agents,开发者只需一条提示即可构建自主智能体。该智能体能自动研究主题并从头制作广播节目,包括生成对话音频、音乐、专辑封面等。核心特性:零基础设施设置——API 自动创建安全的临时 Linux 沙箱;自主循环——智能体独立规划、自我纠错并执行代码;多步逻辑——通过 agents.md 和 skills.md 文件定义指令和工具,Gemini 优化理解后在一次 API 调用内完成全部任务。

智能体GoogleMCP/工具产品更新
00:50
elvis@omarsar0
48
我很喜欢 Vercel 的 eve 智能体框架。 我欣赏它的一切都是文件,从工具到技能再到评测。 更重要的是,它能让你快速使用智能体进行开发。非常有前景。 如果你喜欢 TypeScript,你也会喜欢这个。 开始使用 eve ↓
智能体MCP/工具产品更新
00:46
Rohan Paul@rohanpaul_ai
51
AI编码速度提升但QA成为新瓶颈。Momentic推出测试平台,其智能体可读取Linear工单、Notion PRD和PR差异等产品记忆,使测试基于预期行为而非静态脚本。过去几周,该平台已分析7万+次测试失败,创建600个测试,PR合并率达73%并持续增长。客户包括Notion、Xero、Webflow、Retool、Runway和Bilt。

Meer | AI Tools & News: AI is writing more code than ever, but the bugs are scaling right along with it. momentic just put out how they're closi...

智能体MCP/工具产品更新编码
6月23日
23:20
SenseTime@SenseTime_AI
18
商汤科技发布基于 Office Raccoon 和 SenseNova-Skills 的 2026 世界杯小组赛预测引擎

商汤科技利用 Office Raccoon 与 SenseNova-Skills 构建数据驱动预测引擎,用于 2026 年世界杯小组赛结果预测。引擎整合 FIFA 排名、Elo 评分、Transfermarkt 球队身价、WinnersAndWhiners 赔率、RotoWire 战术分析、FootballBerry 排名及 ESPN 市场数据,并从长期阵容能力、近期状态、阵容完整度、战术适应性四个维度评估各队。相关项目已开源:SenseNova-Skills 的 GitHub 仓库(含 Hermes Agent 与 OpenClaw 安装指南)及 Office Raccoon 官网已公布。

GitHubMCP/工具行业动态
18:03
fofr@fofrAI
72
今天,Interactions API 正式可用,作为 Gemini 模型和智能体的主要接口。该 API 基于开发者反馈构建,针对有状态、智能体的工作流优化,带来 Managed Agents、后台执行、扩展工具支持、多模态生成以及即将推出的 Gemini Omni 等新能力。开发者可通过 `npx skills add google-gemini/gemini-skills --skill gemini-interactions-api --global` 为其 agent 添加该 API 技能。

Google: Today, the Interactions API is now generally available as our primary interface for Gemini models and agents. Built base...

智能体GoogleMCP/工具教程/实践
11:14
Berryxia.AI@berryxia
46
YouMind 接入豆包 Seed2.1 Pro 实测

YouMind 已支持豆包(Doubao)Seed2.1 Pro 模型,据称性能可媲美 Opus 4.6,且积分消耗更低。有用户试用该模型仅凭简单提示词生成网页游戏,评价其逻辑关系与审美表现尚可,并计划后续测试 Skills 功能。

Frank Wang 玉伯: YouMind 已支持 Seed 2.1 模型,据说媲美 Opus 4.6 积分消耗少很多,欢迎试用

MCP/工具教程/实践
09:13
Berryxia.AI@berryxia
72
成峰开源剪辑Skills接入Codex,Agent自动完成口播视频剪辑与合成

成峰开源了一款2000+ Star的剪辑Skills,与Codex结合后,Agent可自动完成口播视频的剪辑、分镜、动画及合成。流程:先安装Skills,用/剪口播命令上传素材和文稿,生成审核页并输出带字幕视频;再用/口播成片命令生成HTML分镜核对页,用户反馈后Codex通过Computer Use自动调整,最后用HyperFrames合成最终MP4。视频生产从手动执行转向流程编排。

Agent成峰: http://x.com/i/article/2068926393719685120

智能体MCP/工具开源/仓库教程/实践
08:40
meng shao@shao__meng
59
继 Claude Code 开发者用 HTML 代替 Markdown 向人类解释模型输出后,HeyGen 为其 HyperFrames 平台推出新技能 pr-to-video。智能体可将无人阅读的 Pull Request(PR)直接转化为简短解释性视频,用户可通过命令 `npx skills add heygen-com/hyperframes` 添加该技能。作者感叹视频或为人类最佳信息输入源,并表示将重启视频内容。

HeyGen: This week we're launching new skills for HyperFrames, each built around a workflow Today is pr-to-video Nobody reads pul...

MCP/工具产品更新编码视频
07:39
xAI@xai
45
你现在可以将Grok连接到Interactive Brokers,获取关于你投资组合的高质量、最新信息。

Interactive Brokers: Interactive Brokers integrates with Grok. Research investments and analyze your portfolio using AI. AI informs. Approve ...

MCP/工具xAI产品更新
01:56
Chubby♨️@kimmonismus
61
OpenAI 宣布扩展 Daybreak 项目,旨在以机器速度民主化修复脆弱软件。主要发布包括:Codex Security 插件(在 Codex 内发现、验证并修复漏洞);完整版 GPT-5.5-Cyber 模型(面向受信防御者的安全专用模型);Cyber Partner Program(支持安全公司基于 OpenAI 顶级网络能力构建产品);以及 Patch the Planet(与维护者合作保护关键开源项目)。据主推文称,GPT-5.5-Cyber 在 CyberGym 基准上表现优于 Claude Mythos。

OpenAI: We're expanding OpenAI Daybreak to help democratize patching vulnerable software at machine speed: - Codex Security plug...

MCP/工具OpenAI产品更新安全/对齐
00:33
凡人小北@frxiaobei
42
推文分析微信成为超级Agent OS的潜力。对比手机厂商(端侧感知型,偏向控制硬件,但服务碎片化)与微信(云端调度型,依靠小程序作为类MCP工具池,聊天作为天然上下文窗口)。微信可深度操控自身生态(页面跳转、功能触发),但缺端侧长期记忆和规划能力。结论认为真正跑得动的Agent应云负责理解、编排与聚合服务,端负责感知与控制,统一调用链、上下文管理与服务编排者有望成为智能体OS。

凡人小北: 很多人都在说 Agent 是未来的操作系统。但问题是,你让谁来当操作系统?看openai现在的骚操作就有点这个意思。 这就引出一个问题,现在的巨无霸们谁具备打造超级 Agent 的机会? 1)做个聪明的 Agent OS 不难,难的是你能真...

智能体MCP/工具大佬观点
6月22日
22:37
elvis@omarsar0
53
多智能体通信协议五维分类法报告发布

该报告针对LLM多智能体系统的通信瓶颈,构建了五维分类法(对方、有效载荷、交互状态、发现机制、模式灵活性),系统梳理了9个积极维护的开源智能体协议,覆盖MCP和A2A的实际格局。报告发现两个突出模式:每个智能体间协议都采用混合有效载荷与会话状态持久化组合,而去中心化发现机制仍极为罕见。领域正悄然标准化有状态会话,但发现与策略执行层仍留白。该报告为今年选择通信层时提供了九大协议的真实对比参考。

智能体arXivMCP/工具论文/研究
16:05
🚨 AI News | TestingCatalog@testingcatalog
64
Sakana AI 发布 Fugu 和 Fugu Ultra 多智能体编排系统

Sakana AI 宣布推出 Fugu 和 Fugu Ultra 系统。Fugu 是一个多智能体编排模型,训练用于操控其他 LLM,通过单一模型 API 访问。其中 Fugu Ultra 在多项基准测试中性能匹敌 Claude Fable 5 和 Mythos 5,并宣称提供前沿能力且规避出口管制风险。该系统目前通过 API 提供服务,但暂不支持 EEA 地区。推文指出,编排式多模型系统将超越单一模型,使小型实验室和企业更易构建,并已促使 Meta、Apple、微软等巨头考虑采用竞争对手的模型搭建编排系统。

Sakana AI: Introducing Sakana Fugu: A full multi-agent orchestration system accessible via a single model API. Our 'Fugu Ultra' mod...

智能体MCP/工具模型发布
08:36
meng shao@shao__meng
67
前Meta/Microsoft主任工程师kunchenguid的Agentic工程工作流

kunchenguid发布45分钟视频,讲解每天交付40-50个生产级PR的工作流。四层:1)终端中心(WezTerm+tmux+Neovim);2)船员入职:全局memory精简27行,项目级memory由agent自写;3)协作:语音输入OpenSuperWhisper,AXI标准(MCP比CLI多耗3倍token+2倍延迟),Lavish交互式HTML工件;4)验证:no-mistakes流水线在隔离worktree中对抗式review+E2E测试。并行用treehouse管理worktree,First Mate元agent调度。

Kun Chen: many people asked me to make a video about my complete agentic engineering workflow excited to share it's finally here!!...

智能体MCP/工具教程/实践编码
‹ 上一页
1234…17
下一页 ›