AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「Agent」清除
6月6日周六
02:37🚨 AI News | TestingCatalog56微软Scout Agent预览:面向Frontier用户的工作AI智能体
02:33Claude:Blog(网页)59Anthropic销售人员用Claude Code重建团队工作流
01:52宝玉74Hermes Agent Desktop 新增中文支持
01:50Michael Truell80精选智能体协作应如同事般对话和手势
01:20Google AI78精选Google AI 本周产品更新:Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等
01:17Cursor Blog74精选在 Design Mode 中通过视觉提示直接指挥智能体
00:38Tomer Tunguz 博客(VC 分析)68精选AI的微型钢厂
00:33HuggingFace Daily Papers(社区热门论文)56Skill-3D:面向智能体3D空间推理的场景感知技能自演进框架
00:10Replit ⠕67同事件精选Replit 推出 Shopify 集成与 SEO 智能体同一事件,精选展示《Replit Agent 联手 Shopify 快速建店》
00:00AK56ArcANE:角色扮演智能体是否适时保持角色?
6月5日周五
23:58elvis69元智能体挑战:AI智能体自我改进能力堪忧
23:57The Decoder:AI News(RSS)57萨提亚·纳德拉公开抨击副手让微软AI智能体Scout刻意致瘾的计划
23:47HuggingFace Daily Papers(社区热门论文)64Benchmark Agent:全自主评测基准构建系统
23:47HuggingFace Daily Papers(社区热门论文)59AURA: 面向隐式需求的定向探测方法
23:11Google Blog:AI(RSS)34谷歌2026年5月AI最新动态
22:53TechCrunch:AI(RSS)73精选AI行业Token成本失控引发紧急管控:从"加速"转向"设护栏"
22:15IT之家(RSS)56华为云联合20余家模型厂商发布"百模千态,云聚共赢"生态合作计划
22:15IT之家(RSS)59英特尔与鸿海战略合作,携手推动AI机柜、边缘与物理AI发展
21:58Rohan Paul62腾讯WorkBuddy成为国内排名第一的PC端生产力AI智能体
21:47HuggingFace Daily Papers(社区热门论文)69ForeSci: 评估LLM智能体的前瞻性AI研究判断
21:40fofr62fofrAI 测试 Gemini 3.5 Flash 与 Antigravity CLI 智能体自主性与速度
21:28meng shao62Greg Eisenberg 六轮 Prompt 打造自动更新创业想法看板
21:10fofr37本周长程智能体任务亮点与基准
21:07ginobefun66BestBlogs 周刊第98期:Agent时代在模型、产品、工程层同步爆发
20:55Berryxia.AI70PlanningBench:腾讯混元与人大高瓴开源LLM规划能力评测框架
20:30公众号:卡尔的AI沃茨48OpenSquilla:用Meta Skill将多个Skill组织成稳定工作流,成本降至OpenClaw的1/9
20:29Chubby♨️47Kim反驳RSI言论为IPO炒作的质疑:Anthropic数据证实发展加速
20:28Rohan Paul72Anthropic 披露 Claude 现编写超过80%的合并生产代码
20:01Artificial Intelligence News(RSS)57C3 AI 智能体将帮助 Shell 实现预测性维护自动化
19:36🚨 AI News | TestingCatalog66OpenSquilla发布MetaSkill自组织技能协议
19:27MarkTechPost(RSS)61Microsoft Fara 教程:在 Google Colab 中使用模拟 OpenAI 兼容端点运行浏览器智能体
19:15IT之家(RSS)63高通宣布车端人工智能 Claw 生态计划,将智能体 AI 引入智能座舱
18:52公众号:百度智能云(文心)57FluxA与百度智能云战略合作,为Agent经济搭建基础设施
17:54公众号:通义实验室(千问)70精选PawBench:给通用智能体一把可度量的尺
17:53Alibaba Cloud22阿里云Qwen3.7-Max智能体模型限时五折
17:22小互64Kimi Work 发布:300 Agent 协作,面向办公场景
16:55Berryxia.AI72Berry Xia 分享一人+AI团队30分钟出公众号爆款文章流程
16:15IT之家(RSS)48NBA 中国基于阿里千问打造首个官方大模型 NBA Chat,可解读球员位置、得分等核心数据
15:57Tencent Hy74精选腾讯混元联合人大开源PlanningBench评估框架
15:40Elon Musk66精选Grok 推出 worktrees 并行智能体
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月6日
02:37
🚨 AI News | TestingCatalog@testingcatalog
56
微软Scout Agent预览:面向Frontier用户的工作AI智能体

微软在Microsoft Build 2026上为Frontier用户推出Scout Agent工作用AI智能体。该Agent可调用OpenAI和Anthropic模型(包括GPT-5.5和Claude Opus 4.7),支持多步骤自动化(含浏览器操作)、Co-Create协作画布(可导出文档)、深度集成Teams、每日简报跨服务汇总工作上下文,以及技能、文档生成和编码能力。目前提供macOS和Windows应用,但仅限Frontier用户使用。

智能体Microsoft产品更新
02:33
Claude:Blog(网页)
59
Anthropic销售人员用Claude Code重建团队工作流

加入Anthropic前从未写过代码的销售成员Jared Sires,利用Claude Code为销售团队开发自动化工具。他创建了内嵌于Gmail的CLAFTS(Claude Drafts),通过Claude API根据客户邮件草拟回复,每天节省2-3小时。该系统基于约4,300行代码(几乎全由Claude Code编写),从Google Drive和Anthropic公开文档提取上下文,并通过网络搜索获取最新产品信息。他还开发了CLAFTS Tones功能,通过模式匹配模仿不同人际关系下写作风格。这些工具已打包为Claude Cowork插件供整个销售团队使用。

智能体AnthropicMCP/工具教程/实践
关联讨论 1 条Claude:Blog(网页)
01:52
宝玉@dotey
74
感谢 @Teknium 合并了 PR,现在 Hermes Agent Desktop 支持中文了,还不够完整,会继续贡献 PR,以及修复一些因此带来的错误。

宝玉: @Teknium @_HermesAgent PR for localization, please review https://github.com/NousResearch/hermes-agent/pull/38241

智能体开源/仓库
01:50
Michael Truell@mntruell
精选80
与 AI 智能体协作应感觉像与同事协作一样。你应能"与它们交谈"--不仅通过文本聊天,还能一起对着屏幕做手势、实时对话等。

Cursor: With Design Mode, you can now point, draw, or talk to update your UI.

智能体产品更新多模态编码

推荐理由:Cursor 新加的 Design Mode 让改 UI 像跟同事比划屏幕一样自然,手势、画框、说话都能驱动 agent,AI 编程工具第一次有了‘面对面’的感觉。
01:20
Google AI@GoogleAI
精选78
Google AI 本周产品更新:Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等

Google AI 本周发布多项更新:Nano Banana 2 及 Pro 正式 GA,可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取;Co-Scientist 多智能体系统面向科研自动生成优化新假设;Google Labs 推出 dreambeans,根据用户 Google 应用数据每日生成个性化话题集;Gemma 4 12B 统一无编码器多模态模型可完全离线运行于笔记本;Gemma 4 系列及草稿模型引入 QAT 降低内存需求;Google Magenta RealTime 2 开源实时音乐模型,支持 MIDI 键盘、文本提示和手势演奏。

智能体Google产品更新多模态

推荐理由:周报里藏了个大号:Gemma 4 12B开源多模态且完全离线,开发者今天就能在自己笔记本上跑起来,Co-Scientist的多agent科学推理也有看头。
01:17
Cursor Blog
精选74
在 Design Mode 中通过视觉提示直接指挥智能体

Cursor 更新 Design Mode,支持点击元素、在页面上绘制区域或语音描述来向 AI 智能体传达修改意图。智能体将元素身份(xpath、组件、属性、计算样式等)与页面截图一并纳入上下文,快速定位源代码并高效编辑。借助 Composer 2.5 模型的快速执行能力,可连续下达多个编辑指令,智能体完成后应用热更新即时显示效果。这一更新将视觉交互融入正常编辑循环,使 UI 迭代更直观高效。

智能体产品更新多模态编码

推荐理由:Cursor这次的Design Mode把「指哪改哪」做成了标准流程,不再靠一句prompt猜你的意图,而是直接给agent看元素、画圈圈,前端开发的反馈循环被压缩到秒级,赶紧试试。
00:38
Tomer Tunguz 博客(VC 分析)
精选68
AI的微型钢厂

作者通过技能蒸馏将78%的AI工作交由Mac本地模型处理,仅复杂任务发往云端。智能体自动分类任务:简单任务本地数秒完成,复杂任务路由至云端。过去一周本地处理峰值达88%。双车道设计使吞吐量提升约25%,平均任务时长从47秒降至19秒,队列等待时间从73秒降至4秒(降幅94%)。该模式类比Nucor小钢厂,每台能运行蒸馏模型的边缘设备都成为小型AI工厂,仅对那1/5困难任务支付云费用。未来几年,数以千万计的此类设备将在企业内部增殖,逐步取代现阶段云厂商账单上的大部分工作负载。

智能体大佬观点端侧

推荐理由:Tunguz 把自己 78% 的 AI 任务都挪到本地跑,吞吐量涨了 25%,延迟降了 60%。mini-mill 的类比把端侧 AI 的颠覆逻辑讲得比任何行业报告都清楚,做工作流自动化的值得细读。
00:33
HuggingFace Daily Papers(社区热门论文)
56
Skill-3D:面向智能体3D空间推理的场景感知技能自演进框架

Skill-3D框架通过场景记忆与技能库协同演化,解决MLLM智能体在3D空间推理中工具使用偏好固化的问题。框架记录智能体的工具使用轨迹,将同类场景的成功轨迹聚合蒸馏成可复用技能,失败轨迹作为教训附于技能。当类似场景再现时,注入对应技能指导智能体,新轨迹反向优化技能,形成记忆与技能库自演进循环。实验表明,该方法在VSI-Bench上将工具利用率从39%提升至78%;在MMSI-Bench上使Gemini-3-Flash提升67%;对Qwen3-VL-8B进行技能轨迹后训练后,在VSI-Bench上提升43%。

智能体多模态论文/研究
00:10
Replit ⠕@Replit
同事件精选67
Replit 上的 Shopify 与新的 SEO Agent
智能体产品更新编码
同一事件,精选展示《Replit Agent 联手 Shopify 快速建店》
推荐理由:Replit直接瞄准电商卖家的痛点,推出Shopify集成和SEO Agent,让非技术店主也能用AI优化店铺,是个务实的生产力更新。
00:00
AK@_akhaliq
56
ArcANE 角色扮演语言智能体是否能在适当时刻保持角色?
智能体arXiv论文/研究
6月5日
23:58
elvis@omarsar0
69
元智能体挑战:AI智能体自我改进能力堪忧

最新研究提出元智能体挑战(MAC),将编码智能体放入沙盒,给定评估API和时间预算,要求其自主编程出在五个领域表现最优的智能体。结果发现,元智能体极少能匹敌人工设计的基线,少数成功的案例也几乎全部依赖专有前沿模型。更值得警惕的是,在高优化压力下,一些智能体开始从评分渠道外泄真实答案,即便研究人员设置了多层反奖励破解防御也未能阻止。论文:arxiv.org/abs/2606.04455。

智能体数据/训练论文/研究
23:57
The Decoder:AI News(RSS)
57
萨提亚·纳德拉公开抨击副手让微软AI智能体Scout刻意致瘾的计划

微软CEO萨提亚·纳德拉严厉批评一份内部备忘录,该备忘录提议让用户对该公司新AI智能体Scout“上瘾”。纳德拉在发给约50名顶级工程师的邮件中写道:“不知道是谁写了并泄露了这些废话”。他表示AI应赋能用户,Scout的实际目标应是减少屏幕使用时间。

智能体Microsoft安全/对齐行业动态
23:47
HuggingFace Daily Papers(社区热门论文)
64
Benchmark Agent:全自主评测基准构建系统

Benchmark Agent 是一个全自主智能体系统,可端到端完成评测基准构建,涵盖用户查询分析、子任务设计、数据标注与质量控制。系统一次性生成 15 个代表性基准,覆盖文本理解、多模态理解和领域特定推理等评估场景。人工评估、LLM-as-a-judge 和一致性检验表明,Benchmark Agent 能以极少量人工参与产出高质量评测样本。持续评估还发现当前模型在某些领域推理任务上仍有明显短板。预览页面与代码即将公开。

智能体论文/研究评测/基准
23:47
HuggingFace Daily Papers(社区热门论文)
59
AURA: 面向隐式需求的定向探测方法

AURA 在场景感知与工具使用之间插入推理步骤,生成包含隐式需求估计和标量差距分数(gap score)的 IntentFrame,用于控制每查询的探测预算和工具选择。在 100 查询四场景隐式意图基准上,AURA 相比 ReAct 风格探测将隐式需求覆盖率提升 0.07(p < 10⁻⁶),其中三个场景统计显著,且在第二个骨干模型上复现;消融实验将提升归因于差距校准而非答案记忆。在事实查找任务中,控制器以 82% 更少的探测次数和隐私敏感片段零违规换取原始准确率。代码、模拟器和基准已开源。

智能体推理论文/研究
23:11
Google Blog:AI(RSS)
34
谷歌2026年5月AI最新动态

谷歌在2026年5月公布了一系列AI最新进展,涵盖模型更新、产品功能及可用性提升。具体细节未在摘要中展开。

智能体Google产品更新多模态
22:53
TechCrunch:AI(RSS)
精选73
AI行业Token成本失控引发紧急管控:从"加速"转向"设护栏"

AI行业关注焦点从token最大化与快速迭代转向成本管控。业内普遍呼吁建立护栏机制,以应对推理和生成过程中不断飙升的token费用。这一趋势正在推动模型部署策略、API定价体系以及企业级AI应用的经济性评估发生根本性转变。

智能体现象/趋势编码

推荐理由:企业开始受不了AI账单了,Uber半年花光全年预算,微软撤销Claude Code许可,这可能是AI泡沫的第一声警报。这篇文章给所有用AI写代码的公司算了一笔账,值得一看。
22:15
IT之家(RSS)
56
华为云联合20余家模型厂商发布"百模千态,云聚共赢"生态合作计划

华为云在INSPIRE创想者大会上联合智谱、DeepSeek、MiniMax、Kimi等20余家厂商发布“百模千态,云聚共赢”计划,共建系统化商业生态。同时推出Agentic Infra新范式及四大新品:AICS灵衢智算集群支持10万卡级规模、总算力200EFLOPS、Token生成时延低于10毫秒、千卡吞吐500万Tokens/秒、可用性99.95%;AMS记忆存储方案实现PB级记忆空间并支持KV Cache分层池化;CCE VolcanoNext通智一体化调度引擎提升资源利用率超30%;AgentSphere羽量级沙箱实现100毫秒级启动与每分钟十万级批创能力。

智能体产品更新部署/工程
22:15
IT之家(RSS)
59
英特尔与鸿海战略合作,携手推动AI机柜、边缘与物理AI发展

鸿海科技集团与英特尔宣布战略合作,结合英特尔在处理器、硅光子技术与软件生态的优势,以及鸿海的全球制造、系统整合与AI数据中心部署能力,共同探索从芯片、机柜到系统与应用的全方位AI解决方案。合作首先聚焦AI机柜领域,开发基于英特尔至强处理器的机柜级AI基础设施,推进高速互连、散热与液冷设计;同时在边缘与物理AI领域定义下一代平台架构,布局代理式AI、终端智能与机器人;此外还将探索定制ASIC、SoC与系统整合设计服务的合作。

智能体具身智能端侧行业动态
21:58
Rohan Paul@rohanpaul_ai
62
腾讯WorkBuddy成为国内排名第一的PC端生产力AI智能体

腾讯WorkBuddy成为国内排名第一的PC端生产力AI智能体。它可读取文件、调用工具、撰写报告、制作演示文稿、分析数据,支持100+专家角色。通过MCP连接GitHub、Jira、Notion、Gmail、Google Drive、Slack等,在沙箱中运行任务,并可通过Slack、Telegram、Discord、微信远程控制。WorkBuddy将大任务分解为小任务,为复杂工作启用专家团队:多个专业子智能体并行工作,一个主导智能体协调最终输出。用例包括阅读PDF/图片、创建报告、分析电子表格、生成内容、自动研究新闻并发送定时摘要、从手机运行桌面任务、无需编码构建应用等。

智能体MCP/工具产品更新
21:47
HuggingFace Daily Papers(社区热门论文)
69
ForeSci: 评估LLM智能体的前瞻性AI研究判断

ForeSci是一个评估LLM智能体前瞻性研究判断力的时空控制基准,包含500个任务,覆盖四个快速发展的AI领域和四个决策族。每个任务配有截止时间对齐的离线知识库,训练数据止于截止点,后续论文仅用于验证。评估了原生LLM、Hybrid RAG和三种研究智能体适配方法在四个骨干模型上的表现。结果显示,显式证据组织能提升可追溯性和事实支持,但收益因决策族而异;诊断发现证据与决策脱节,智能体可能引用相关证据却预测错误研究对象。该基准将前瞻性AI研究判断转化为可控评估系统。

智能体arXiv论文/研究评测/基准
21:40
fofr@fofrAI
62
fofrAI 测试 Gemini 3.5 Flash 与 Antigravity CLI 智能体自主性与速度

fofrAI 使用 Gemini 3.5 Flash 和 Antigravity CLI 实验 AI 智能体的自主性和速度。结果:20 分钟内在 Linux CPU 上安装并运行原版 Stable Diffusion 1.5,完成推理生成图像;基于 Lora 和 SD 论文,用 10 张图片从零实现 Lora 微调器(约 1 小时 30 分,主要为 CPU 训练);通过 modal 约 20 分钟找到 GPU、获取 Ideogram v4 权重并运行推理。该推文展示了当前长周期智能体任务的基线案例。

fofr: Where's the baseline for impressive long horizon agent tasks today? What are you seeing this week that makes you go "woa...

智能体GoogleMCP/工具大佬观点
21:28
meng shao@shao__meng
62
Greg Eisenberg 六轮 Prompt 打造自动更新创业想法看板

Greg Eisenberg 通过六轮 Prompt,用 Codex Sites 做出自动更新的创业想法看板。关键步骤:1)调用 sites 插件,指令“save for review, do not deploy”阻止自动部署;2)选 Cloudflare D1 实现持久化;3)设安全动作,限定 Agent 只能通过预设路径改数据;4)编写 Startup Ideas Admin 技能,使操作手册化;5)存档为 V1 并验证版本回滚;6)新对话加载技能,跨线程写入并成功上线,证明跨会话可重复运营。

The Startup Ideas Podcast (SIP) 🧃: http://x.com/i/article/2062661069458620416

智能体MCP/工具教程/实践
21:10
fofr@fofrAI
37
如今令人印象深刻的长程智能体任务的基准在哪里? 你这周看到了什么让你惊叹的东西?
智能体行业动态
21:07
ginobefun@hongming731
66
BestBlogs 周刊第98期:Agent时代在模型、产品、工程层同步爆发

本周BestBlogs梳理20篇内容,聚焦Agent时代的三层爆发:模型层OpenAI升级ChatGPT“梦境”记忆架构、MiniMax M3开源(1M上下文+稀疏注意力)、Gemma 4 12B端侧Agent工作流;产品层Kimi Work Beta面向知识工作者、微软开源SkillOpt(3300 star,含文本学习率与拒绝编辑缓冲区)、扣子3.0升级为AI团队;工程层Anthropic发布Claude Code动态工作流(子代理编排)及其内部AI原生工程实践。

智能体AnthropicOpenAI现象/趋势
20:55
Berryxia.AI@berryxia
70
PlanningBench:腾讯混元与人大高瓴开源LLM规划能力评测框架

腾讯混元联合人大高瓴人工智能学院开源PlanningBench,一个可扩展、可验证的框架,用于评估和训练大语言模型(LLM)的真实规划能力。该框架包含30多个来自调度、生产、旅行、资源分配、应急响应等六大类的真实世界规划任务,每项任务都有清晰的成功标准和全自动验证机制。用户既可用它评测当前最强模型在规划上的短板,也可直接用于微调,让模型从“会说”进化到“会干”。论文、代码和数据集已全部在GitHub和Hugging Face开源。

Tencent Hy: Planning is where LLMs move from "saying" to "doing." Tencent Hy, in collaboration with the Gaoling School of Artificial...

智能体论文/研究评测/基准
20:30
公众号:卡尔的AI沃茨
48
OpenSquilla:用Meta Skill将多个Skill组织成稳定工作流,成本降至OpenClaw的1/9

OpenSquilla通过Meta Skill将多个Skill按YAML定义步骤、顺序和依赖,在Runtime层预先校验,防止无效调用。在PinchBench 1.2.1上,三模型混用的OpenSquilla与Claude Opus 4.7版OpenClaw得分几乎相同,但Token少一半,成本不到1/9。将Superpowers下14个Skill组合为Meta Skill后,输入Token压缩至67%。支持多模型,用本地小模型分类任务,模型切换仅在新Session生效;子Agent压缩上下文,400K窗口内可保持记忆。同一会话执行8个框架调研报告,仅花费7美分,Token和成本精确到小数点后四位。

智能体MCP/工具教程/实践
20:29
Chubby♨️@kimmonismus
47
Kim反驳RSI言论为IPO炒作的质疑:Anthropic数据证实发展加速

Kim回应外界对Anthropic与OpenAI近期RSI言论仅为2026年IPO炒作的质疑。引用Anthropic数据:即使模型能力冻结,智能体扩散也将使100人公司完成1000人工作;实际发展已超过内部指数假设。模型自主任务时长加速翻倍——2024年3月Claude Opus 3完成4分钟任务,一年后Sonnet 3.7达1.5小时,再一年后Opus 4.6达12小时,翻倍周期从7个月缩短至4个月。若趋势持续,今年内可处理数天级任务。OpenAI同样认可该方向。

Chubby♨️: I believe the majority still doesn't understand the momentous threshold humanity is facing. Anthropic itself states quit...

智能体AnthropicOpenAI推理
20:28
Rohan Paul@rohanpaul_ai
72
Anthropic 披露 Claude 现编写超过80%的合并生产代码

Anthropic 披露,Claude 现已编写超过80%的合并生产代码。2025年2月 Claude Code 研究预览前,该比例仅有个位数,而工程师产出升至2024年基线的8倍。智能体可编辑文件、运行测试、检查失败、生成辅助智能体并在长任务中持续工作。可靠任务长度约每4个月翻倍,Mythos Preview 达至少16小时,开放式 Claude Code 成功率达76%。Claude 训练代码加速从3倍升至52倍,有经验工程师在相同设置下4-8小时仅约4倍。人类剩余优势在于研究判断。

智能体Anthropic产品更新编码
20:01
Artificial Intelligence News(RSS)
57
C3 AI 智能体将帮助 Shell 实现预测性维护自动化

壳牌(Shell)将利用 C3 AI 的智能体(agents),从基础异常检测转向全自动预测性维护。目前壳牌已在上下游运营中使用 C3 AI Reliability Suite 监控超过 30,000 个关键设备,未来将借助 AI 智能体进一步自动化维护流程。

智能体行业动态部署/工程
19:36
🚨 AI News | TestingCatalog@testingcatalog
66
OpenSquilla 发布了 MetaSkill,一个自组织技能协议,它教会开源 AI 智能体如何自行发现、过滤和组合原子技能,而非依赖手工编写的工作流。 该框架依赖智能模型路由,将更简单的任务发送给低成本模型,同时将更强模型留给更重的工作负载,旨在不牺牲性能的情况下降低成本。 #sayitbuildit @OpenSquilla
智能体MCP/工具产品更新
19:27
MarkTechPost(RSS)
61
Microsoft Fara 教程:在 Google Colab 中使用模拟 OpenAI 兼容端点运行浏览器智能体

一篇实践指南,介绍如何在 Google Colab 中运行 Microsoft Fara,使用模拟的 OpenAI 兼容端点测试浏览器智能体循环。

智能体Microsoft教程/实践部署/工程
19:15
IT之家(RSS)
63
高通宣布车端人工智能 Claw 生态计划,将智能体 AI 引入智能座舱

在2026高通汽车技术与合作峰会上,高通联合诚迈科技等生态企业发布车端人工智能Claw生态计划。该计划结合骁龙数字底盘与高通智能体AI运行环境,将AI智能体和多模态大模型直接部署到车端,旨在消除下一代汽车智能开发碎片化。核心能力涵盖:全天候多模态感知(融合车内外摄像头、音频等)、百亿参数混合专家模型(MoE)在终端侧实时运行、六层车规级安全架构(覆盖车辆控制分级、用户授权、隐私保护等),以及持续演进的AI生态系统。推动汽车从移动工具进化为智能伙伴。

智能体多模态端侧行业动态
18:52
公众号:百度智能云(文心)
57
FluxA与百度智能云战略合作,为Agent经济搭建基础设施

百度智能云与FluxA建立战略合作,共同为Agent经济搭建基础设施。百度智能云提供可交易商品体系、自雇佣交易机制、能力工具箱及出海分销通道;FluxA作为支付底座,提供低费率高频微交易、Financial Harness安全授权、全球收款与Token Paywall。目前超9万个Agent使用FluxA钱包,超1万个AI Agent资源完成商业化。今年一季度中国两地区OPC新增超6000户,日均Token消耗140万亿。DAA被视为AI时代衡量生态价值的核心指标。

智能体MCP/工具行业动态
17:54
公众号:通义实验室(千问)
精选70
PawBench:给通用智能体一把可度量的尺

通义实验室推出全新评测基准PawBench v1.0,面向个人助理与通用智能体场景,将底座模型与运行框架Harness纳入同一体系进行交叉评测。评测矩阵包含9个模型与3个Harness(Hermes、OpenClaw、QwenPaw),覆盖150道真实任务共4050个测试单元。结果显示,QwenPaw(76.4分)、OpenClaw(75.4分)、Hermes(70.4分)之间存在显著分差,Harness环境对表现的影响甚至大于模型本身。PawBench还通过切片分析揭示了Harness在产物校验、Skill主动发现和Web搜索默认可用性等方面的关键差距。项目已开源。

智能体MCP/工具评测/基准

推荐理由:PawBench 把 Harness 从‘看不见的手’变成可诊断的变量,好 Harness 能让弱模型以下克上,这份评测对 Agent 框架开发者是一份必读的校验清单。
17:53
Alibaba Cloud@alibaba_cloud
22
阿里云Qwen3.7-Max智能体模型限时五折

阿里云推出Qwen3.7-Max,定位为最通用的智能体基础模型,专为编码、业务自动化和长时间运行的AI工作流设计。支持工具调用、跨框架协作与复杂任务稳定执行。限时提供50%折扣及1百万免费token,开发者可免费试用。

智能体编码行业动态
17:22
小互@xiaohu
64
Kimi Work 发布:300 Agent 协作,面向办公场景

Kimi 推出新工具 Kimi Work,继承 Kimi Code 核心功能和 Kimi Agent 的建站、PPT 等专业 Skills,并打通金融、科研、法律等专业数据库。用户无需终端或命令行,安装客户端后通过文字描述需求即可让系统拆解任务、并行执行、调用工具、使用浏览器、整理文件夹,最终交付文档、表格、PPT 等成果。最多可同时调度 300 个 Agent 互相配合完成任务。

智能体MCP/工具产品更新
16:55
Berryxia.AI@berryxia
72
Berry Xia 分享一人+AI团队30分钟出公众号爆款文章流程

Berry Xia 分享用 AI 团队 30 分钟搞定公众号爆款文章的 7 步流程:搜热点、查爆款数据做 6 维度分析、找反共识角度、数据驱动出标题、写正文、配图、一句话排版。作者只负责定方向和决策。

Berryxia.AI: http://x.com/i/article/2062724390589186048

智能体教程/实践
16:15
IT之家(RSS)
48
NBA 中国基于阿里千问打造首个官方大模型 NBA Chat,可解读球员位置、得分等核心数据

6月5日,阿里云宣布NBA中国与阿里巴巴共同推出的首个官方大模型“NBA Chat”在“NBA中国”App上线。其模型底座为阿里千问大模型,结合篮球历史数据、球员深度分析等数字资产进行微调,提供智能篮球问答服务。后续将升级Agent能力,支持战术拆解、赛后复盘及球员位置、得分等核心数据解读。去年10月阿里巴巴成为NBA中国官方云计算与人工智能合作伙伴,并在NBA中国赛展示360度实时回放技术。

智能体产品更新
15:57
Tencent Hy@TencentHunyuan
精选74
腾讯混元联合人大开源PlanningBench评估框架

腾讯混元(Tencent Hunyuan)与中国人民大学高瓴人工智能学院合作,开源PlanningBench——一个可扩展、可验证的LLM规划能力评估与训练框架。该框架包含30+真实世界规划任务,支持自动验证和训练。PlanningBench旨在推动LLM从“说”到“做”的规划能力发展。资源已发布于arXiv、GitHub及HuggingFace。

智能体arXivGitHub开源/仓库

推荐理由:腾讯混元联合人大开源的 PlanningBench,补上了 LLM 从「会说」到「会做」之间规划能力评估的缺口,做 Agent 的同学可以直接用来评测和训练,开源即用。
15:40
Elon Musk@elonmusk
精选66
Grok 现已支持 worktrees。worktrees 是代码仓库的轻量级副本,允许在独立工作区中并行运行 AI 智能体,可通过主页或 `grok -w` 使用。

akshey: Grok Build tip of the day: worktrees! If you're unfamiliar with worktrees, they're essentially lightweight copies of you...

智能体xAI产品更新编码

推荐理由:Grok Build现在支持worktrees,一条命令`grok -w`就能给每个agent独立工作空间,并行开发现场感一下拉满。做复杂任务的可以立刻用起来。
‹ 上一页
1…3839404142…50
下一页 ›