AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 3063 条
全部一手资讯X论文
标签「Agent」清除
ginobefun@hongming731 · 5月22日45

#BestBlogs 早报 05-22 今日主题:Agent 记忆原语、Qwen3.7-Max、自动化与人类专家

Berryxia.AI@berryxia · 5月22日66

兄弟们,Codex 这个功能更新是非常实用了啊! 当你在Mac 上正在用 Codex 聊天的时候,你突然按两下 Command 键。 Codex 立刻截取了你当前应用窗口的画面,还把窗口里所有文字内容,包括没显示在屏幕上的部分,一起抓了过来。 这就是他们今天刚推的 Appshots。 更进一步的是 /goal 模式。 你直接扔给它一个明确目标,比如把某个功能完整跑通、写完测试、或者把页面改到符合要求。 它会自己干活,跨好几个小时甚至好几天都不停。 你想中途 看进度就看,想调整方向就调整,还能单独开个小聊天问它目前干了什么,完全不打断主任务。 可现实是,这些最能体现 agent 能力的更新,目前主要只在 Mac 上体验最好。 Windows 用户还在等最基础的远程控制和功能同步。

译Codex近期推出Appshots功能,用户可在Mac上双击Command键,快速将当前应用窗口的截图与文字内容(包括屏幕外部分)投喂给AI。同时上线的/goal模式支持用户设定明确任务目标(如跑通功能、编写测试),AI可自主跨时执行,允许用户随时查看进度或调整方向。这些更新凸显了AI Agent的自主能力,但目前Mac端体验最佳,Windows用户仍在等待基础远程控制与功能同步。

OpenClaw🦞@openclaw · 5月22日59

OpenClaw 2026.5.20 🦞 🎙️ Discord voice follows you 🔐 Doctor catches plaintext secrets 🧭 Model status explains surprises 🪟 Windows install gets unstuck Still into boring fixes. https://github.com/openclaw/openclaw/releases/tag/v2026.5.20

译OpenClaw 2026.5.20 🦞 🎙️ Discord 语音跟随你 🔐 Doctor 捕获明文密钥 🧭 模型状态解释意外情况 🪟 Windows 安装问题解决 依然专注于那些枯燥的修复。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.20

Tibo@thsottiaux · 5月22日66

Dark magic. Codex.

译黑魔法。Codex。 现在你的Mac无需解锁,Codex也能使用你的电脑。 通过手机,Codex可以安全地操作你Mac上的应用,即使屏幕关闭且处于锁定状态。 https://developers.openai.com/codex/app/computer-use#locked-use

🚨 AI News | TestingCatalog@testingcatalog · 5月22日65

GOOGLE 🔥: Pomelli can now generate and host a landing page website based on your Brand DNA in 2 clicks! Brand Books generation is now available as well. Testing time 👀

译Google为Pomelli平台引入了“代理”能力,旨在帮助企业更便捷地创建符合品牌调性的内容。用户现在可以从现有文件和图片中提取信息来构建品牌的“DNA”,并基于此在两次点击内生成并托管一个着陆页网站。此外,平台还新增了品牌手册的生成功能。这些更新标志着品牌内容创作正朝着更自动化、个性化的方向发展。

elvis@omarsar0 · 5月22日59

New VIDEO: From LLM Wikis to LLM Artifacts Shared all my thoughts on why LLM wikis and HTML artifacts are a big deal. Plus, new tools to help you build wikis and artifacts with agents. Just getting started!

译新视频:从LLM维基到LLM工件 分享了我对LLM维基和HTML工件为何重要的全部思考。 此外,还有新工具可帮助你用智能体构建维基和工件。 这只是个开始!

小互@xiaohu · 5月22日60

OpenAI 给 Codex 加了一个新的功能,叫 Appshots。 将任意窗口上下文传输给 Codex: 你在 Mac 上开发、设计、写文档、看网页时,可以直接把“当前正在操作的窗口上下文”发给 Codex。 操作方式: 在 Mac 上按两次 Command 键(⌘⌘),就能把当前应用窗口附加到 Codex 对话线程里。 重点不是单纯截图。 Codex 会同时获取: • 当前窗口的截图 • 窗口里的文本内容 • 甚至包括屏幕上没显示出来的部分内容 比如: 你现在在 VS Code 里写代码。 虽然屏幕只显示前 50 行,但整个文件其实有几百行。 Appshots 不只是拍一张图片,它还能读取编辑器里的文本上下文,所以 Codex 能理解完整代码结构。 再比如: 你在 Figma、Notion、浏览器、终端里工作。 按 ⌘⌘ 后,Codex 可以直接看到: • 当前 UI 长什么样 • 页面文字内容 • 控制台报错 • 文档说明 • 设计稿结构 这样你就不用: “复制粘贴代码 + 截图 + 手动解释半天”。 它更像: 把你的当前工作界面“共享”给 AI。

译OpenAI为Codex推出Appshots功能,允许用户将Mac上任意窗口的实时上下文传输至AI。通过双击Command键,Codex不仅能获取当前窗口截图,还可读取完整文本内容(包括未滚动显示的部分)。该功能旨在简化开发、设计等工作流,用户无需手动复制代码或截图,即可让AI直接理解如VS Code、Figma、Notion等界面的代码结构、页面内容或设计框架,实现工作界面的智能共享。

宝玉@dotey · 5月22日64

OpenAI 今天发了一波 Codex 更新。 【1】Appshots:把屏幕上的东西直接发送到 Codex Mac 上同时点击左右 Command 键(这个快捷键在设置里面能修改),就能把当前窗口截屏后发送给 Codex。 不只是截图,它还能读取窗口里的文字内容,包括屏幕上没显示出来的部分。 这解决了一个很实际的痛点:你在浏览器里看到一个 bug、在设计稿里看到一个需要实现的界面,以前得自己截图粘贴,现在一个快捷键就把完整上下文带进去了。 所有付费计划都能用,企业版还在路上。 【2】桌面版正式支持/goal(Goal 模式) 之前还是实验功能,现在正式上线了。你给 Codex 一个目标,它会持续工作直到完成,哪怕跨越几小时甚至几天。中途可以随时查看进度、调整方向、暂停。还能开 side chat 来了解当前进展,不打断主任务。 适合那种拆解下来步骤很多、需要反复迭代的大任务。 需要运行一下下面的指令: > codex features enable goals 【3】高级标注模式:设计师终于能直接指哪改哪了 在 Codex 内置浏览器里预览页面时,可以直接拖拽、调整页面元素,同时留批注,改完即时预览。多条修改可以攒一批一起提交。 这个功能明显是给设计师和前端协作场景准备的,不用再截图画圈写"这里往左移 10px"了。 【4】插件可以团队共享了 Business 用户现在可以把自定义插件分发给团队,统一管理工作区内可用的工具。企业版需要联系开通。 另外 Analytics 面板也做了升级,能看到活跃用户、Token 消耗、代码生成行数、插件使用情况这些细粒度数据,API 也同步更新了。 看起来 Codex 在从个人编程助手往团队协作平台的方向走。Appshots 和标注模式降低了非工程师参与开发流程的门槛,插件共享和 Analytics 则是典型的企业级功能。

译OpenAI 为编程助手 Codex 推出一系列重要更新,旨在降低参与门槛并提升团队协作效率。主要更新包括:“Appshots”功能,用户可通过快捷键将当前应用窗口的截图与文本内容(含屏幕外部分)直接发送至 Codex;桌面版正式支持“/goal”模式,允许 Codex 自主执行跨时长的复杂任务;新增高级标注模式,设计师可在预览中直接拖拽调整元素并提交修改。此外,Business 用户现可共享自定义插件,Analytics 面板也升级了细粒度数据监控。这些举措标志着 Codex 正从个人编程助手向团队协作平台演进。

Sam Altman@sama · 5月22日73

new codex ships today!

译新版Codex今日发布! [引用 @OpenAIDevs]:今天是Codex周四,我们带来了更新。 首先是Appshots,一种将你正在处理的应用上下文带入Codex的新方式。 在Mac上,按Command-Command键即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac的所有套餐中可用,企业版访问权限即将推出。

swyx🛬 SFO@swyx · 5月22日51

working on a "take this vibecoded slop app and make it a production-ready, e2e tested, maintainable, parallelizable agent repo" skill. this thing ran for ~16 hours yesterday and made 103 commits all told and i ended up with exactly the same app but instead of fragile mvp it now looks like a codebase i can actually build on for th elong run

译正在开发一项技能,用于将“Vibe编码的粗糙应用”转化为“生产就绪、端到端测试、可维护、可并行化的智能体代码库”。 这个过程昨天运行了约16小时,共产生103次提交,最终得到了完全相同的应用程序——但不再是脆弱的MVP,而是一个可以长期构建的代码库。

Greg Brockman@gdb · 5月22日82

ChatGPT for PowerPoint:

译ChatGPT for PowerPoint: [引用 @ryanbrewer]:很高兴宣布ChatGPT for PowerPoint!这是另一个非常有趣的构建。可以创建新幻灯片、在整个演示文稿中提问,并直接在PowerPoint中进行更新。https://chatgpt.com/apps/powerpoint/

Google Gemini@GeminiApp · 5月22日67

Gemini can now connect to even more apps, including @OpenTable, @Canva, and @Instacart. Whether you're booking a table at a restaurant, creating a flyer, or ordering groceries, Gemini doesn’t just find info, it helps you take action seamlessly with connected apps.

译Gemini现在可以连接更多应用,包括@OpenTable、@Canva和@Instacart。 无论您是预订餐厅、制作传单还是订购杂货,Gemini不仅能查找信息,还能通过连接的应用帮助您无缝采取行动。

Rohan Paul@rohanpaul_ai · 5月22日62

Qwen 3.7 Max is super close to the frontier models for coding and agentic abilities. And and it’s now available on AI/ML API. Agent reliability the center of the story and also on Artificial Analysis it's sitting at 5th, pretty much on par with GPT 5.4 (xhigh) and a notch above the just released Gemini 3.5 Flash. AI/ML API is also giving away free codes for users who want to try it. see the quoted tweet.

译阿里云的 Qwen 3.7 Max 在编码与智能体(Agent)能力上已非常接近前沿模型,并现已在 AI/ML API 平台上线。根据 Artificial Analysis 的评测,其智能体可靠性排名第五,性能与 GPT 5.4 (xhigh) 相当,并略高于新发布的 Gemini 3.5 Flash。AI/ML API 将其定位为面向智能体时代的模型,突出其能支持超过35小时的自主执行,并兼容 Claude Code 等工具。平台还提供了包括 GPQA Diamond(92.4分)在内的基准测试成绩,并为用户提供免费试用码。

OpenAI Developers@OpenAIDevs · 5月22日75

Codex anywhere and everywhere, all the time. Now your Mac doesn’t have to be unlocked for Codex to use your computer. From your phone, Codex can securely use apps on your Mac, even when the screen is off and locked. https://developers.openai.com/codex/app/computer-use#locked-use

译Codex随时随地,无处不在。 现在您的Mac无需解锁,Codex即可使用您的电脑。 通过手机,Codex可以安全地使用您Mac上的应用程序,即使屏幕关闭且处于锁定状态。 https://developers.openai.com/codex/app/computer-use#locked-use

Sundar Pichai@sundarpichai · 5月22日72

Really enjoyed this conversation with @MatthewBerman at I/O 👇

译谷歌CEO Sundar Pichai在I/O大会上与MatthewBerman进行了深入对话,全面探讨了当前人工智能发展的多个核心方面。Pichai重点关注了AI代理如何可能取代部分互联网功能,并改变用户的信息获取方式,甚至威胁原始互联网的形态。对话还深入讨论了开源AI模型面临的商业模式困境、中美在AI领域的激烈竞争格局,以及网络安全威胁,包括AI可能引发的攻击和谷歌的应对策略。此外,Pichai指出谷歌正面临巨大的AI算力需求,计算资源已成为主要瓶颈,并探讨了发布强大AI模型的阈值判断问题。他强调了谷歌致力于开发低成本、高效率的AI模型的原因,以应对资源挑战。整体而言,这次对话覆盖了AGI竞赛、AI代理、信息饮食等关键议题,深入分析了AI发展的挑战、机遇和未来趋势。

Rohan Paul@rohanpaul_ai · 5月22日68

WSJ: Anthropic is now projected to hit its first operating profit in Q2, with revenue jumping 130% to $10.9B after expecting profitability only around 2028. The shock is not only the profit, but the speed at which enterprise AI spending is converting into real revenue. Anthropic made $4.8B in Q1, then told investors it expects $559M in operating profit in the June quarter. The driver is agentic coding, where Claude does longer software tasks instead of only answering one prompt at a time. That changes the product from a chatbot into rented digital labor, so customers can justify much bigger bills. The cost story also changed, because Anthropic spent 71 cents of every revenue dollar on compute in Q1 but expects 56 cents in Q2. Compute is still the main tax on AI, but lower compute per dollar means scale is starting to work in Anthropic’s favor. Anthropic also benefits from using more Google and Amazon chips, a smaller free consumer base, and fewer giant data-center promises than OpenAI. --- wsj. com/tech/ai/mind-blowing-growth-is-about-to-propel-anthropic-into-its-first-profitable-quarter-7edbf2f4

译据《华尔街日报》报道,Anthropic预计将大幅提前盈利,计划于2026年第二季度实现首次运营利润,而非此前预计的2028年。该公司收入预计同比增长130%,达到109亿美元,二季度运营利润可达5.59亿美元。核心驱动力是“代理式编程”,使Claude能处理更长的软件任务,提供可租赁的数字劳动力,从而显著提升客户价值。同时,成本结构持续改善,计算成本占收入比预计从一季度的71%降至56%,规模效应开始显现。此外,更广泛地使用谷歌和亚马逊芯片、较小的免费用户群体以及更少的超大型数据中心投资承诺,也为其带来了竞争优势。

Alibaba Cloud@alibaba_cloud · 5月22日75

Qwen3.7-Max is live on @OpenRouter https://x.com/OpenRouter/status/2057500097206976983?s=20

译Qwen3.7-Max已在@OpenRouter上线 https://x.com/OpenRouter/status/2057500097206976983?s=20

Rohan Paul@rohanpaul_ai · 5月22日84

Alibaba just released Qwen3.7-Max. Their best flagship model built for real-world tasks and production environments. - Agent reliability the center of the story, where the model must plan steps, call tools, inspect results, fix mistakes, and continue without collapsing after the first wrong turn. - 56.6 on the Artificial Analysis Intelligence Index, up 4.8 points from Qwen3.6-Max. Qwen 3.7 Max sitting at 5th, pretty much on par with GPT 5.4 (xhigh) - The Intelligence Index gains over Qwen3.6 Max Preview are concentrated in scientific reasoning, agentic capability and coding. - One important layer of the serving stack, the inference kernel, was optimized heavily. from near-baseline speed to 10.0x geometric mean speedup after many rounds of low-level GPU optimization.

译阿里巴巴正式推出最新旗舰模型Qwen3.7-Max,定位为Agent时代的生产级基础模型。该模型在权威评测中得分56.6,较前代显著提升,性能与GPT-5.4相当。其核心优势在于卓越的Agent可靠性,能够在复杂任务中自主规划、调用工具、纠错并持续执行。通过底层深度优化,模型实现了10倍推理加速,并支持长达数小时的自主运行与多工具协作。该模型现已上线阿里云模型工作室,并兼容Claude Code、OpenClaw等主流开发框架,助力开发者构建实际应用。

AK@_akhaliq · 5月22日68

Mix-Quant Quantized Prefilling, Precise Decoding for Agentic LLMs

译Mix-Quant 量化预填充,精确解码,面向智能体LLM

向阳乔木@vista8 · 5月22日71

感动!有了Codex和Claude Code。 再也不怕配置海外 VPS,连宝塔都不用装,只需提供SSH账号密码,AI 全搞定。 如果域名解析在Cloudflare,给个DNS zone读写权限的API。 连域名都自动配好,还能免费申请https证书,自动续期... 对普通人来说,AI现在就是顶级运维工程师!

译推文展示了AI工具(如Codex和Claude Code)在服务器运维领域的强大能力。仅需提供SSH账号密码,AI即可自动配置海外VPS,无需手动安装宝塔等控制面板。若域名使用Cloudflare,提供DNS API权限后,AI能自动完成域名解析、SSL证书申请及续期等全流程配置。这标志着AI已能承担专业级运维任务,显著降低技术门槛,使普通人也能轻松管理服务器与域名。

Google Gemini@GeminiApp · 5月22日63

Get a head start on your day with Daily Brief. Gemini can now proactively flag what matters most in an easily digestible to-do list, so you’re ready for the day before you even finish breakfast.

译用Daily Brief开启高效一天。 Gemini现在能主动将最重要的事项整理成易于理解的待办清单,让你在早餐结束前就为一天做好准备。

OpenRouter@OpenRouter · 5月22日78

The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centric work: coding, office and productivity tasks, and long-horizon autonomous execution. Big jumps in coding and agent benchmarks over Qwen3.6, with explicit prompt caching for repeated context.

译阿里巴巴通义千问团队的全新Qwen3.7-Max现已登陆OpenRouter。 作为Qwen3.7系列的旗舰模型,专为以智能体为核心的工作场景打造:编程、办公与生产力任务,以及长周期自主执行。在编程和智能体基准测试中较Qwen3.6有显著提升,并支持显式提示缓存以处理重复上下文。

Luma@LumaLabsAI · 5月22日28

A great webinar starts with a promo that makes people clear their calendar. Set the topic. Define the energy. Luma Agents handle every promo asset from there. Get them there → http://lumalabs.ai/app

译一场精彩的网络研讨会始于一则能让人们清空日程的宣传。 设定主题。定义氛围。Luma Agents 从此接手所有宣传素材。 让他们到场 → http://lumalabs.ai/app

AK@_akhaliq · 5月22日56

LongMINT Evaluating Memory under Multi-Target Interference in Long-Horizon Agent Systems

译LongMINT 评估长期智能体系统中多目标干扰下的记忆能力

Boris Cherny@bcherny · 5月21日57

In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next

译在下一版 Claude Code 中:运行 /usage 可查看各项技能、代理、MCP 和插件的 token 使用明细 CLI 功能现已推出,桌面版即将跟进

凡人小北@frxiaobei · 5月21日47

最近团队在非 coding 方向,尝试把自己从杂事中解放出来。 分享几个最近团队内部解放生产力的idea(skill)。 我做的对我有用的两个: 1. 例会全程录音,形成 todo @相关人,我的 openclaw 会使用钉钉 cli 跟进任务,在合适的时间点在群@相关人跟进(cli 支持直接用我的账号),其他会议同理; 2. 自动抓取邮件,不相关的按批次总结下自动归档,相关的提醒我关注或审批(依赖知识库); 我认为团队同学产出非常有用的两个: 1. 要定会议室直接群里@机器人,小秘书到点自动抢,再也不用 12 点抢会议室了; 2. 跟进媒体/政府/协会最新资讯和通知,给出价值锚点是否跟进; etc.

译团队通过开发和应用一系列自动化技能,旨在将成员从日常琐事中解放出来,专注于核心工作。具体实践包括:利用自动化工具(如openclaw结合钉钉cli)在会议后自动提取待办事项并跟进;基于知识库自动处理邮件,进行摘要、归档和提醒;部署群内机器人自动完成会议室预订;以及自动监控外部资讯并评估其跟进价值。这些方案均有效提升了工作效率,减少了重复性人工操作。

Alibaba Cloud@alibaba_cloud · 5月21日76

Qwen3.7-Max just landed at 56.6 on the Artificial Analysis Intelligence Index — a solid 4.8pt jump over Qwen3.6-Max-Preview. @ArtificialAnlys Sharper sci reasoning, stronger agentic chops, better coding, and it hallucinates less.

译阿里巴巴推出其最新闭源旗舰大模型Qwen3.7 Max,在Artificial Analysis智能指数上获得56.6分,较上代预览版提升4.8分,是其迄今最接近国际顶尖水平的模型。此次分数提升主要得益于科学推理、代理和编码能力的增强,其中模型的幻觉率大幅降低(从44.2%降至22.9%)是主要贡献因素。模型的上下文窗口已扩展至100万tokens,仍仅支持文本输入输出,具体定价尚未公布。

Berryxia.AI@berryxia · 5月21日64

兄弟们,MemOS 2.0 开源项目又更新了! Github 已经斩获9.3K Star ⭐️~ 这次直接把“AI记忆”从高级剪贴板升级成了真·执行即学习。 以前很多记忆方案,就是把聊天记录存下来,加个语义检索,看起来有记忆,实际上还是RAG那一套。 这次MemOS Local Plugin 2.0最狠的功能,叫“执行即学习”。 它不只记你说过什么,而是当Agent帮你完成任务的时候,把整个执行过程拆成可学习的单元。 哪一步找到了关键线索,哪一步只是低效试探,哪次反思带来了后续成功。 这些经验会自动分层提炼: 最底层是原始轨迹,往上是通用套路,再往上是长期世界模型,最上层变成肌肉记忆的技能。 双重反馈机制自动评分,有用的反复强化,低效的慢慢淡忘。 以前用OpenClaw写工具,第一轮磨出来的代码风格、命名习惯、错误处理方式,换个对话或者过两天基本就丢了,又得从头讲一遍。 现在2.0上线后,第二天新任务,它自己就把上一轮我们一起磨出来的那套写法直接用上了。 这已经不是“记住上下文”了,而是Agent在帮你干活的同时,自动在复盘、提炼、进化。 越用越懂你,越用越像你的专属助手。 这次还支持Hermes和OpenClaw无缝迁移,一行命令就能装,Memory Viewer把整条记忆链路看得清清楚楚。 还是有点意思给Hermes 和OpenClaw 都可以整起来 地址见评论区~~~

译MemOS 2.0开源项目发布,其核心功能“执行即学习”将AI记忆从语义检索升级为自主学习系统。该功能在Agent完成任务时,将执行过程自动拆解为可评分、可复用的经验单元,并通过双重反馈机制分层提炼、强化高效路径。这使得Agent能自动复用已习得的工作模式(如代码风格、处理逻辑),实现持续进化,越用越懂用户。更新同时支持Hermes与OpenClaw工具无缝迁移。

Luma@LumaLabsAI · 5月21日29

Great event graphics don't just inform. They create anticipation. Define the moment. Set the direction. Luma Agents build every promo graphic from save the date to final call. Consistent creative, built for every format and channel, designed to fill the room. Fill the room → http://lumalabs.ai/app

译优秀的活动视觉设计不仅传递信息,更能激发期待。 定义关键时刻,指引方向。Luma Agents为每场活动制作从预告到最终号召的全套宣传视觉。统一创意,适配所有格式与渠道,旨在座无虚席。 座无虚席 → http://lumalabs.ai/app

Chubby♨️@kimmonismus · 5月21日66

Alibaba released Qwen 3.7 max. Benchmarks incredible. Their new model ran autonomously for 35 hours, made 1,158 tool calls, and achieved a 10x speedup - on a single attention kernel. This isn't "AI improving itself across the board." It's a model grinding through compile-profile-rewrite loops on one well-defined optimization target. Impressive? Absolutely. The kind of self-improvement people will imagine when they see the headline? Not yet. The actually interesting claim is buried deeper: Qwen says agentic capabilities generalize from diverse training environments the same way language capabilities generalize from diverse text. If that holds, it's a bigger deal than any benchmark number.

译阿里云发布新旗舰模型Qwen3.7 Max,定位为“代理时代”的基础模型,强调其在端到端编码、办公自动化等实际任务中的执行能力。模型在一个内核优化任务中展示了35小时无人干预的自主运行能力,完成了超过1000次工具调用。但这并非模型的全面自我进化,而是针对特定优化目标的迭代改进。更值得关注的是,Qwen声称其代理能力能从多样化的训练环境中泛化,如同语言能力从文本中泛化。这一观点若成立,其意义将远超任何基准测试成绩。

Alibaba Cloud@alibaba_cloud · 5月21日85

(1/6) 📣Meet Qwen3.7-Max — our latest flagship, made for the Agent Era. A versatile foundation for agents that actually get things done: 🧑‍💻 Coding agent, end-to-end. Frontend prototypes, multi-file refactors, real debugging — nails it. 🗂️ A reliable office and productivity assistant. Get your work done through MCP integrations and multi-agent orchestration. ⏱️ Long-horizon autonomy.  35 hours straight on a kernel optimization task — 1,000+ tool calls, zero hand-holding. 🔌 Scaffold-agnostic. Claude Code, OpenClaw, Qwen Code, or your own stack. Consistent reliability everywhere. API's up on Model Studio: https://int.alibabacloud.com/m/1000413187/ Go build something wild!

译阿里云发布了通义千问系列的新旗舰模型Qwen3.7-Max,定位为面向智能体时代的通用基础模型。该模型旨在为“能真正完成任务”的智能体提供强大支撑,其核心能力包括:支持端到端的复杂编码任务,可作为集成多智能体协作的办公助手,并能执行超过35小时的长期自主任务。该模型具有框架无关的兼容性,可适配Claude Code、OpenClaw等多种工具链。目前,用户已可通过Model Studio平台调用其API。

Qwen@Alibaba_Qwen · 5月21日82

📣Meet Qwen3.7-Max — our latest flagship, made for the Agent Era. A versatile foundation for agents that actually get things done: 🧑‍💻 Coding agent, end to end. Frontend prototypes, multi-file refactors, real debugging — nails it. 🗂️ A reliable office and productivity assistant. Get your work done through MCP integrations and multi-agent orchestration. ⏱️ Long-horizon autonomy. 35 hours straight on a kernel optimization task — 1,000+ tool calls, zero hand-holding. 🔌 Scaffold-agnostic. Claude Code, OpenClaw, Qwen Code, or your own stack. Consistent reliability everywhere. API's up on Alibaba Model Studio. You can also take it for a spin on Qwen Studio. Go build something wild!🏃🏃‍♂️ 📖 Blog: https://qwen.ai/blog?id=qwen3.7 ✅ Qwen Studio: https://chat.qwen.ai/?models=qwen3.7-max ⚡️ API:https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.7-max&serviceSite=international

译Qwen3.7-Max是Qwen系列面向Agent时代推出的最新旗舰模型,旨在为能完成实际任务的智能体提供强大基础。其核心能力包括:可作为端到端编码智能体,处理前端原型与多文件重构;作为可靠的办公助手,通过MCP集成与多智能体编排协同工作;并支持超长时间(超过35小时)的自主运行,执行复杂任务链。该模型兼容Claude Code、OpenClaw等主流开发框架,现已上线阿里云模型工作室与Qwen Studio提供服务。

Qwen@Alibaba_Qwen · 5月21日76

🚀Qwen3.7-Max just landed at 56.6 on the Artificial Analysis Intelligence Index — a solid 4.8pt jump over Qwen3.6-Max-Preview. @ArtificialAnlys ⚡️Sharper sci reasoning, stronger agentic chops, better coding, and it hallucinates less.

译阿里巴巴近期推出了新一代闭源旗舰模型Qwen3.7 Max。该模型在Artificial Analysis智能指数上获得56.6分,较前代Qwen3.6 Max Preview提升了4.8分,创下阿里系模型最接近全球前沿水平的记录。此次升级主要体现在科学推理、智能体能力和代码生成方面,同时显著降低了模型幻觉率。值得注意的是,其分数提升部分源于模型更倾向于拒绝回答,而非完全依靠事实准确率的提高。技术上,其上下文窗口已扩大至100万tokens,仍保持闭源权重。尽管如此,该模型在整体能力上仍落后于OpenAI、Anthropic和Google的同类产品。

🚨 AI News | TestingCatalog@testingcatalog · 5月21日72

Alibaba released Qwen 3.7 Max, its latest proprietary model for agentic coding. Qwen 3.7 Max scores 56.6 on the Artificial Analysis Intelligence Index, outperforming recently released Gemini 3.5 Flash and Kimi K2.6.

译阿里巴巴发布了其最新的专有模型 Qwen 3.7 Max,专为智能体编码设计。 Qwen 3.7 Max 在人工智能分析智能指数上获得 56.6 分,超越了近期发布的 Gemini 3.5 Flash 和 Kimi K2.6。

Berryxia.AI@berryxia · 5月21日61

发现不少人用skills还有个误区,以为存在的形式只能是CLI终端中。 其实如果写了skills或者用别人的skills,你发现每次不习惯使用终端完全可以自己写个皮用起来就更顺手了。 (小白新手用户非常友好)

译AI技能(skills)的使用不应局限于CLI终端命令行界面。用户可以根据个人习惯开发或配置自定义前端界面,从而提升操作便利性和用户体验。这种方式对新手用户尤为友好,降低了技术使用门槛,使技能的应用更加直观灵活。

🚨 AI News | TestingCatalog@testingcatalog · 5月21日65

Tycoon launched as the world's first operating system for one-person companies, giving every solo founder an AI CEO named Astra and a virtually unlimited workforce of AI employees across coding, marketing, research, SEO, finance, legal, and ops. Astra manages up to 1,000 agents in parallel, 24/7, and can orchestrate external tools such as Claude Code and Hermes Agent!

译Tycoon发布了全球首个专为一人公司设计的操作系统。每位创始人将获得一个名为Astra的AI CEO,以及几乎无限的AI员工,覆盖编程、营销、研究、财务等多领域。Astra能并行管理多达1000个智能体,实现7x24小时运作,并可调度Claude Code等外部工具。该系统的核心理念是反驳“AI将减少就业”的观点,旨在通过AI赋能,让单个创业者具备运营整个公司的能力,将执行工作交给机器,而人类专注于愿景与决策。

Alibaba Cloud@alibaba_cloud · 5月21日30

AI agents are transforming how teams analyze data. Join our webinar: Quick BI Skills: Data Analysis for the Agent Era See how Agent Skills support ecommerce analysis, inventory optimization, trading insights, dashboard reading, and report generation. 📅 June 2, 2026 🕑 14:00 UTC+8 👉 Reserve your spot now! https://int.alibabacloud.com/m/1000413140/

译AI智能体正在改变团队分析数据的方式。 加入我们的网络研讨会:快速BI技能:智能体时代的数据分析 了解智能体技能如何支持电商分析、库存优化、交易洞察、仪表盘解读和报告生成。 📅 2026年6月2日 🕑 北京时间14:00 👉 立即预约席位!https://int.alibabacloud.com/m/1000413140/

Elon Musk@elonmusk · 5月21日59

Tips for using Grok Build

译Grok Build 使用技巧 感谢 @skcd24 的提示。现在我可以完全在主 Grok Build 实例中工作,无需为其他集群打开额外标签页。

Orange AI@oran_ge · 5月21日60

看晚点对豆包的报道,还是挺感慨的 豆包赢下了 AI chatbot 的胜利 只是这场胜利的价值几何,没有人能衡量 一些有趣的点: 朱骏在 2024 年 5 月的演讲中特意提到,豆包已经拥有 800 万个智能体。这次尝试没过多久便失败了。一段时间过后,团队发现除了 “豆包” 这个主智能体以外,其它智能体的用户活跃度都不高。 他们做了一次实验,将豆包以外的智能体全部下架,结果用户活跃、留存没有受到任何影响。 2024 年上半年,豆包的 “多 bot” 尝试受挫后,团队一度陷入迷茫,开始寻找新的突破口。他们曾考虑根据用户在豆包对话中表达的兴趣进行主动的内容推荐,推荐内容包括抖音短视频,类似后来 ChatGPT 做的 Pulse,但最终决定不上线。 一位知情人士说,当时豆包对用户留存不满,所以想借抖音这款公司留存最好的产品来提高数据,“有些病急乱投医”。 抖音的单用户日均使用时长曾经从 30 分钟涨到 120 分钟,而豆包仍稳定在 10 分钟以内,尚不足以对传统的互联网产品造成威胁。

译豆包在AI聊天机器人市场赢得了用户规模上的胜利,但这场胜利的实际价值与可持续性存疑。其早期尝试的百万智能体生态活跃度极低,移除后对核心数据毫无影响,显示用户需求仍高度集中于主智能体。在“多bot”策略受挫后,团队曾迷茫地考虑借助抖音内容来提升豆包用户留存,但并未执行。目前,豆包的用户日均使用时长仍远低于抖音,尚未对传统互联网产品形成实质威胁。

歸藏(guizang.ai)@op7418 · 5月21日50

这个会打包成 Skill,任何 Agent 都能控制里面显示什么。 可以通过配合定时任务去定期刷新里面的信息和数据,配合磁吸把它吸在你的屏幕边,就是一个常态化的看板。 关机休眠的时候会展示你的介绍信息和二维码,这样你外出就直接可以加好友

译该推文展示了一种将墨水屏硬件与AI Agent结合的创新应用。核心思路是通过打包为Skill,使任意AI Agent都能控制墨水屏显示内容:设备开机时,AI可推送待办事项、日历等信息,配合磁吸安装和定时任务刷新,形成常态化桌面看板;关机或休眠时,屏幕则利用墨水屏特性静态显示个人介绍与二维码,便捷实现数字名片功能。项目计划以Skills形式开源,便于拥有类似硬件的用户复用开发。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月22日
07:30
ginobefun@hongming731
45
#BestBlogs 早报 05-22 今日主题:Agent 记忆原语、Qwen3.7-Max、自动化与人类专家
智能体行业动态
07:12
Berryxia.AI@berryxia
66
Codex新增应用截图抓取与长期目标执行功能

Codex近期推出Appshots功能,用户可在Mac上双击Command键,快速将当前应用窗口的截图与文字内容(包括屏幕外部分)投喂给AI。同时上线的/goal模式支持用户设定明确任务目标(如跑通功能、编写测试),AI可自主跨时执行,允许用户随时查看进度或调整方向。这些更新凸显了AI Agent的自主能力,但目前Mac端体验最佳,Windows用户仍在等待基础远程控制与功能同步。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码
06:38
OpenClaw🦞@openclaw
59
OpenClaw 2026.5.20 🦞 🎙️ Discord 语音跟随你 🔐 Doctor 捕获明文密钥 🧭 模型状态解释意外情况 🪟 Windows 安装问题解决 依然专注于那些枯燥的修复。 https://github.com/openclaw/openclaw/releases/tag/v2026.5.20
智能体产品更新开源/仓库语音
06:08
Tibo@thsottiaux
66
黑魔法。Codex。 现在你的Mac无需解锁,Codex也能使用你的电脑。 通过手机,Codex可以安全地操作你Mac上的应用,即使屏幕关闭且处于锁定状态。 https://developers.openai.com/codex/app/computer-use#locked-use

OpenAI Developers: Codex anywhere and everywhere, all the time. Now your Mac doesn't have to be unlocked for Codex to use your computer. Fr...

智能体OpenAI产品更新
06:06
🚨 AI News | TestingCatalog@testingcatalog
65
Google为Pomelli平台引入了"代理"能力,旨在帮助企业更便捷地创建符合品牌调性的内容。用户现在可以从现有文件和图片中提取信息来构建品牌的"DNA",并基于此在两次点击内生成并托管一个着陆页网站。此外,平台还新增了品牌手册的生成功能。这些更新标志着品牌内容创作正朝着更自动化、个性化的方向发展。

Google: We're bringing agentic capabilities to @PomelliByGoogle to make it easier for businesses to create on-brand content. 🚀 ...

智能体Google产品更新
04:43
elvis@omarsar0
59
新视频:从LLM维基到LLM工件 分享了我对LLM维基和HTML工件为何重要的全部思考。 此外,还有新工具可帮助你用智能体构建维基和工件。 这只是个开始!
智能体大佬观点
04:38
小互@xiaohu
60
OpenAI Codex新增Appshots功能,窗口上下文一键传输

OpenAI为Codex推出Appshots功能,允许用户将Mac上任意窗口的实时上下文传输至AI。通过双击Command键,Codex不仅能获取当前窗口截图,还可读取完整文本内容(包括未滚动显示的部分)。该功能旨在简化开发、设计等工作流,用户无需手动复制代码或截图,即可让AI直接理解如VS Code、Figma、Notion等界面的代码结构、页面内容或设计框架,实现工作界面的智能共享。

智能体OpenAI产品更新多模态
04:38
宝玉@dotey
64
OpenAI Codex 重大更新:推出多项协作新功能

OpenAI 为编程助手 Codex 推出一系列重要更新,旨在降低参与门槛并提升团队协作效率。主要更新包括:“Appshots”功能,用户可通过快捷键将当前应用窗口的截图与文本内容(含屏幕外部分)直接发送至 Codex;桌面版正式支持“/goal”模式,允许 Codex 自主执行跨时长的复杂任务;新增高级标注模式,设计师可在预览中直接拖拽调整元素并提交修改。此外,Business 用户现可共享自定义插件,Analytics 面板也升级了细粒度数据监控。这些举措标志着 Codex 正从个人编程助手向团队协作平台演进。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码
04:38
Sam Altman@sama
精选73
新版Codex今日发布! 【引用 @OpenAIDevs】:今天是Codex周四,我们带来了更新。 首先是Appshots,一种将你正在处理的应用上下文带入Codex的新方式。 在Mac上,按Command-Command键即可将应用窗口附加到Codex线程。Codex会获取窗口的截图和文本,包括屏幕上不可见的内容。 Appshots已在Mac的所有套餐中可用,企业版访问权限即将推出。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体OpenAI产品更新编码

推荐理由:Codex 这次更新的 Appshots 看似一个小功能,但把应用窗口上下文直接喂给 Agent 的思路是质的跳跃,Mac 开发者现在就能用,这个交互范式可能会被抄很久。
04:36
swyx🛬 SFO@swyx
51
正在开发一项技能,用于将"Vibe编码的粗糙应用"转化为"生产就绪、端到端测试、可维护、可并行化的智能体代码库"。 这个过程昨天运行了约16小时,共产生103次提交,最终得到了完全相同的应用程序--但不再是脆弱的MVP,而是一个可以长期构建的代码库。
智能体教程/实践编码
04:35
Greg Brockman@gdb
82
ChatGPT for PowerPoint: 【引用 @ryanbrewer】:很高兴宣布ChatGPT for PowerPoint!这是另一个非常有趣的构建。可以创建新幻灯片、在整个演示文稿中提问,并直接在PowerPoint中进行更新。https://chatgpt.com/apps/powerpoint/

Ryan Brewer: Excited to announce ChatGPT for Powerpoint! This was another super interesting build. Create new slides, ask questions a...

智能体OpenAI产品更新
关联讨论 4 条X:Testing Catalog (@testingcatalog)IT之家(RSS)X:ChatGPT (@ChatGPTapp)X:小互 (@xiaohu)
04:06
Google Gemini@GeminiApp
精选67
Gemini现在可以连接更多应用,包括@OpenTable、@Canva和@Instacart。 无论您是预订餐厅、制作传单还是订购杂货,Gemini不仅能查找信息,还能通过连接的应用帮助您无缝采取行动。
智能体Google产品更新

推荐理由:Gemini 开始连接 Canva 和 Instacart 了,从“查信息”到“帮干活”的边界又模糊了一点,这是智能助手变成真 Agent 的关键一步,用这些服务的人可以试试。
03:26
Rohan Paul@rohanpaul_ai
62
阿里云的 Qwen 3.7 Max 在编码与智能体(Agent)能力上已非常接近前沿模型,并现已在 AI/ML API 平台上线。根据 Artificial Analysis 的评测,其智能体可靠性排名第五,性能与 GPT 5.4 (xhigh) 相当,并略高于新发布的 Gemini 3.5 Flash。AI/ML API 将其定位为面向智能体时代的模型,突出其能支持超过35小时的自主执行,并兼容 Claude Code 等工具。平台还提供了包括 GPQA Diamond(92.4分)在内的基准测试成绩,并为用户提供免费试用码。

AI/ML API: Qwen3.7-Max on AI/ML API - built for the agent era GPQA Diamond (92.4), HMMT (97.1), Apex (44.5) Sustains 35+ hours of a...

智能体大佬观点编码
03:03
OpenAI Developers@OpenAIDevs
同事件精选75
Codex随时随地,无处不在。 现在您的Mac无需解锁,Codex即可使用您的电脑。 通过手机,Codex可以安全地使用您Mac上的应用程序,即使屏幕关闭且处于锁定状态。 https://developers.openai.com/codex/app/computer-use#locked-use
智能体MCP/工具OpenAI产品更新
同一事件,精选展示《ChatGPT移动端支持Codex,实现跨设备协作》
推荐理由:Codex 现在能在 Mac 锁屏甚至熄屏时远程操控应用,相当于给 AI Agent 装了个「开关机」,脚本和自动化任务终于不用等人在电脑前了。
02:44
Sundar Pichai@sundarpichai
同事件精选72
谷歌CEO Sundar Pichai在I/O大会上与MatthewBerman进行了深入对话,全面探讨了当前人工智能发展的多个核心方面。Pichai重点关注了AI代理如何可能取代部分互联网功能,并改变用户的信息获取方式,甚至威胁原始互联网的形态。对话还深入讨论了开源AI模型面临的商业模式困境、中美在AI领域的激烈竞争格局,以及网络安全威胁,包括AI可能引发的攻击和谷歌的应对策略。此外,Pichai指出谷歌正面临巨大的AI算力需求,计算资源已成为主要瓶颈,并探讨了发布强大AI模型的阈值判断问题。他强调了谷歌致力于开发低成本、高效率的AI模型的原因,以应对资源挑战。整体而言,这次对话覆盖了AGI竞赛、AI代理、信息饮食等关键议题,深入分析了AI发展的挑战、机遇和未来趋势。

Matthew Berman: Sundar Pichai (@sundarpichai), Google CEO, on: 🔹Race to AGI 🔹Agents 🔹AI & Information Diet 🔹Open Source 🔹Cybersecur...

智能体Google大佬观点安全/对齐
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Sundar 罕见聊了不开源大模型、算力瓶颈和中美 AI 生态风险,不是 PR 套话,做基础设施和战略的人值得看。
02:26
Rohan Paul@rohanpaul_ai
68
Anthropic将提前至2026年Q2实现首次盈利,年收入增长130%

据《华尔街日报》报道,Anthropic预计将大幅提前盈利,计划于2026年第二季度实现首次运营利润,而非此前预计的2028年。该公司收入预计同比增长130%,达到109亿美元,二季度运营利润可达5.59亿美元。核心驱动力是“代理式编程”,使Claude能处理更长的软件任务,提供可租赁的数字劳动力,从而显著提升客户价值。同时,成本结构持续改善,计算成本占收入比预计从一季度的71%降至56%,规模效应开始显现。此外,更广泛地使用谷歌和亚马逊芯片、较小的免费用户群体以及更少的超大型数据中心投资承诺,也为其带来了竞争优势。

智能体Anthropic行业动态
02:13
Alibaba Cloud@alibaba_cloud
75
Qwen3.7-Max已在@OpenRouter上线 https://x.com/OpenRouter/status/2057500097206976983?s=20

OpenRouter: The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...

智能体模型发布编码
关联讨论 7 条公众号:通义实验室(千问)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:通义千问 / Qwen (@Alibaba_Qwen)X:X.PIN (@thexpin)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
01:56
Rohan Paul@rohanpaul_ai
84
阿里巴巴发布旗舰模型Qwen3.7-Max,专为Agent时代打造

阿里巴巴正式推出最新旗舰模型Qwen3.7-Max,定位为Agent时代的生产级基础模型。该模型在权威评测中得分56.6,较前代显著提升,性能与GPT-5.4相当。其核心优势在于卓越的Agent可靠性,能够在复杂任务中自主规划、调用工具、纠错并持续执行。通过底层深度优化,模型实现了10倍推理加速,并支持长达数小时的自主运行与多工具协作。该模型现已上线阿里云模型工作室,并兼容Claude Code、OpenClaw等主流开发框架,助力开发者构建实际应用。

Qwen: 📣Meet Qwen3.7-Max - our latest flagship, made for the Agent Era. A versatile foundation for agents that actually get th...

智能体MCP/工具推理模型发布
关联讨论 7 条公众号:通义实验室(千问)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:通义千问 / Qwen (@Alibaba_Qwen)X:X.PIN (@thexpin)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
01:26
AK@_akhaliq
68
Mix-Quant 量化预填充,精确解码,面向智能体LLM
智能体论文/研究部署/工程
01:13
向阳乔木@vista8
71
AI秒变顶级运维:一键搞定VPS与域名配置

推文展示了AI工具(如Codex和Claude Code)在服务器运维领域的强大能力。仅需提供SSH账号密码,AI即可自动配置海外VPS,无需手动安装宝塔等控制面板。若域名使用Cloudflare,提供DNS API权限后,AI能自动完成域名解析、SSL证书申请及续期等全流程配置。这标志着AI已能承担专业级运维任务,显著降低技术门槛,使普通人也能轻松管理服务器与域名。

智能体教程/实践部署/工程
00:36
Google Gemini@GeminiApp
63
用Daily Brief开启高效一天。 Gemini现在能主动将最重要的事项整理成易于理解的待办清单,让你在早餐结束前就为一天做好准备。
智能体Google产品更新
00:36
OpenRouter@OpenRouter
同事件精选78
阿里巴巴通义千问团队的全新Qwen3.7-Max现已登陆OpenRouter。 作为Qwen3.7系列的旗舰模型,专为以智能体为核心的工作场景打造:编程、办公与生产力任务,以及长周期自主执行。在编程和智能体基准测试中较Qwen3.6有显著提升,并支持显式提示缓存以处理重复上下文。
智能体模型发布编码
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
推荐理由:阿里旗舰迭代,重点转向 agent 和长程任务,这次 benchmark 跳跃不是挤牙膏,做 coding agent 的可以认真试试。
00:35
Luma@LumaLabsAI
28
一场精彩的网络研讨会始于一则能让人们清空日程的宣传。 设定主题。定义氛围。Luma Agents 从此接手所有宣传素材。 让他们到场 → http://lumalabs.ai/app
智能体产品更新
00:26
AK@_akhaliq
56
LongMINT 评估长期智能体系统中多目标干扰下的记忆能力
智能体arXiv推理论文/研究
5月21日
23:30
Boris Cherny@bcherny
57
在下一版 Claude Code 中:运行 /usage 可查看各项技能、代理、MCP 和插件的 token 使用明细 CLI 功能现已推出,桌面版即将跟进
智能体AnthropicMCP/工具产品更新
23:00
凡人小北@frxiaobei
47
AI赋能办公自动化:从杂务中解放生产力

团队通过开发和应用一系列自动化技能,旨在将成员从日常琐事中解放出来,专注于核心工作。具体实践包括:利用自动化工具(如openclaw结合钉钉cli)在会议后自动提取待办事项并跟进;基于知识库自动处理邮件,进行摘要、归档和提醒;部署群内机器人自动完成会议室预订;以及自动监控外部资讯并评估其跟进价值。这些方案均有效提升了工作效率,减少了重复性人工操作。

智能体MCP/工具教程/实践
22:12
Alibaba Cloud@alibaba_cloud
76
阿里巴巴推出其最新闭源旗舰大模型Qwen3.7 Max,在Artificial Analysis智能指数上获得56.6分,较上代预览版提升4.8分,是其迄今最接近国际顶尖水平的模型。此次分数提升主要得益于科学推理、代理和编码能力的增强,其中模型的幻觉率大幅降低(从44.2%降至22.9%)是主要贡献因素。模型的上下文窗口已扩展至100万tokens,仍仅支持文本输入输出,具体定价尚未公布。

Artificial Analysis: Alibaba's new Qwen3.7 Max model scores 56.6 on the Artificial Analysis Intelligence Index, 4.8 points higher than Qwen3....

智能体推理模型发布编码
关联讨论 7 条公众号:通义实验室(千问)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:通义千问 / Qwen (@Alibaba_Qwen)X:X.PIN (@thexpin)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
22:11
Berryxia.AI@berryxia
64
MemOS 2.0开源更新,实现AI"执行即学习"

MemOS 2.0开源项目发布,其核心功能“执行即学习”将AI记忆从语义检索升级为自主学习系统。该功能在Agent完成任务时,将执行过程自动拆解为可评分、可复用的经验单元,并通过双重反馈机制分层提炼、强化高效路径。这使得Agent能自动复用已习得的工作模式(如代码风格、处理逻辑),实现持续进化,越用越懂用户。更新同时支持Hermes与OpenClaw工具无缝迁移。

耳朵: MemOS 又有新进展了。 现在搞 AI Memory 的方案不少,但很多还是把聊天记录存下来这个层面,看着像有记忆,实际上就是给 markdown 加了一个语义检索。 @MemOS_dev 做记忆系统已经有一段时间了,从 1.0 一路走到...

智能体产品更新开源生态
22:05
Luma@LumaLabsAI
29
优秀的活动视觉设计不仅传递信息,更能激发期待。 定义关键时刻,指引方向。Luma Agents为每场活动制作从预告到最终号召的全套宣传视觉。统一创意,适配所有格式与渠道,旨在座无虚席。 座无虚席 → http://lumalabs.ai/app
智能体产品更新图像生成
21:56
Chubby♨️@kimmonismus
66
阿里云发布Qwen3.7 Max:代理能力泛化或比性能突破更重要

阿里云发布新旗舰模型Qwen3.7 Max,定位为“代理时代”的基础模型,强调其在端到端编码、办公自动化等实际任务中的执行能力。模型在一个内核优化任务中展示了35小时无人干预的自主运行能力,完成了超过1000次工具调用。但这并非模型的全面自我进化,而是针对特定优化目标的迭代改进。更值得关注的是,Qwen声称其代理能力能从多样化的训练环境中泛化,如同语言能力从文本中泛化。这一观点若成立,其意义将远超任何基准测试成绩。

Qwen: 📣Meet Qwen3.7-Max - our latest flagship, made for the Agent Era. A versatile foundation for agents that actually get th...

智能体模型发布编码
21:42
Alibaba Cloud@alibaba_cloud
85
通义千问旗舰模型Qwen3.7-Max发布

阿里云发布了通义千问系列的新旗舰模型Qwen3.7-Max,定位为面向智能体时代的通用基础模型。该模型旨在为“能真正完成任务”的智能体提供强大支撑,其核心能力包括:支持端到端的复杂编码任务,可作为集成多智能体协作的办公助手,并能执行超过35小时的长期自主任务。该模型具有框架无关的兼容性,可适配Claude Code、OpenClaw等多种工具链。目前,用户已可通过Model Studio平台调用其API。

智能体MCP/工具模型发布编码
关联讨论 7 条公众号:通义实验室(千问)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:通义千问 / Qwen (@Alibaba_Qwen)X:X.PIN (@thexpin)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
21:40
Qwen@Alibaba_Qwen
同事件精选82
Qwen3.7-Max:面向Agent时代的旗舰模型

Qwen3.7-Max是Qwen系列面向Agent时代推出的最新旗舰模型,旨在为能完成实际任务的智能体提供强大基础。其核心能力包括:可作为端到端编码智能体,处理前端原型与多文件重构;作为可靠的办公助手,通过MCP集成与多智能体编排协同工作;并支持超长时间(超过35小时)的自主运行,执行复杂任务链。该模型兼容Claude Code、OpenClaw等主流开发框架,现已上线阿里云模型工作室与Qwen Studio提供服务。

智能体MCP/工具模型发布
同一事件,精选展示《Qwen3.7-Max:面向智能体时代的最新专有模型》
推荐理由:Qwen 3.7-Max 的亮点不在榜上分数,而是它瞄准 Agent 场景的连贯执行能力,35 小时不间断跑 kernel 优化,对需要长线任务的开发者是直接可用的探索方向。
21:40
Qwen@Alibaba_Qwen
76
阿里巴巴近期推出了新一代闭源旗舰模型Qwen3.7 Max。该模型在Artificial Analysis智能指数上获得56.6分,较前代Qwen3.6 Max Preview提升了4.8分,创下阿里系模型最接近全球前沿水平的记录。此次升级主要体现在科学推理、智能体能力和代码生成方面,同时显著降低了模型幻觉率。值得注意的是,其分数提升部分源于模型更倾向于拒绝回答,而非完全依靠事实准确率的提高。技术上,其上下文窗口已扩大至100万tokens,仍保持闭源权重。尽管如此,该模型在整体能力上仍落后于OpenAI、Anthropic和Google的同类产品。

Artificial Analysis: Alibaba's new Qwen3.7 Max model scores 56.6 on the Artificial Analysis Intelligence Index, 4.8 points higher than Qwen3....

智能体推理模型发布编码
关联讨论 7 条公众号:通义实验室(千问)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:通义千问 / Qwen (@Alibaba_Qwen)X:X.PIN (@thexpin)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)
19:29
🚨 AI News | TestingCatalog@testingcatalog
72
阿里巴巴发布了其最新的专有模型 Qwen 3.7 Max,专为智能体编码设计。 Qwen 3.7 Max 在人工智能分析智能指数上获得 56.6 分,超越了近期发布的 Gemini 3.5 Flash 和 Kimi K2.6。

Alibaba Group: Qwen3.7-Max is live! 🚀 Introducing the latest proprietary model, built for advanced agentic coding, complex reasoning, ...

智能体推理模型发布编码
18:10
Berryxia.AI@berryxia
61
AI技能使用方式突破终端限制,界面自定义更友好

AI技能(skills)的使用不应局限于CLI终端命令行界面。用户可以根据个人习惯开发或配置自定义前端界面,从而提升操作便利性和用户体验。这种方式对新手用户尤为友好,降低了技术使用门槛,使技能的应用更加直观灵活。

智能体教程/实践
17:59
🚨 AI News | TestingCatalog@testingcatalog
65
Tycoon发布了全球首个专为一人公司设计的操作系统。每位创始人将获得一个名为Astra的AI CEO,以及几乎无限的AI员工,覆盖编程、营销、研究、财务等多领域。Astra能并行管理多达1000个智能体,实现7x24小时运作,并可调度Claude Code等外部工具。该系统的核心理念是反驳"AI将减少就业"的观点,旨在通过AI赋能,让单个创业者具备运营整个公司的能力,将执行工作交给机器,而人类专注于愿景与决策。

Xiaoyin Qu: Today, we launch http://Tycoon.us @tycoonai: the world's first operating system for one-person companies. Everyone gets ...

智能体MCP/工具产品更新
14:39
Alibaba Cloud@alibaba_cloud
30
AI智能体正在改变团队分析数据的方式。 加入我们的网络研讨会:快速BI技能:智能体时代的数据分析 了解智能体技能如何支持电商分析、库存优化、交易洞察、仪表盘解读和报告生成。 📅 2026年6月2日 🕑 北京时间14:00 👉 立即预约席位!https://int.alibabacloud.com/m/1000413140/
智能体产品更新教程/实践
14:27
Elon Musk@elonmusk
59
Grok Build 使用技巧 感谢 @skcd24 的提示。现在我可以完全在主 Grok Build 实例中工作,无需为其他集群打开额外标签页。

Yun-Ta Tsai: If you are managing multiple machines across clusters and farms, you could ask Grok Build to spin off a sub-agent SSH tu...

智能体MCP/工具xAI教程/实践
14:27
Orange AI@oran_ge
60
豆包赢了,但代价是什么?

豆包在AI聊天机器人市场赢得了用户规模上的胜利,但这场胜利的实际价值与可持续性存疑。其早期尝试的百万智能体生态活跃度极低,移除后对核心数据毫无影响,显示用户需求仍高度集中于主智能体。在“多bot”策略受挫后,团队曾迷茫地考虑借助抖音内容来提升豆包用户留存,但并未执行。目前,豆包的用户日均使用时长仍远低于抖音,尚未对传统互联网产品形成实质威胁。

智能体现象/趋势
13:17
歸藏(guizang.ai)@op7418
50
AI赋能墨水屏:从智能看板到数字名片

该推文展示了一种将墨水屏硬件与AI Agent结合的创新应用。核心思路是通过打包为Skill,使任意AI Agent都能控制墨水屏显示内容:设备开机时,AI可推送待办事项、日历等信息,配合磁吸安装和定时任务刷新,形成常态化桌面看板;关机或休眠时,屏幕则利用墨水屏特性静态显示个人介绍与二维码,便捷实现数字名片功能。项目计划以Skills形式开源,便于拥有类似硬件的用户复用开发。

歸藏(guizang.ai): 终于找到了这种墨水屏硬件最适合的场景: 开机的时候,让 AI 往里边推一个 To-do、日历,一些基础的需要记的信息 把它挂在屏幕边上(用磁吸) 关机的时候,利用墨水屏的特性让它显示名片,这样大家加好友什么的直接看就行 太实用了! 到时候打...

智能体MCP/工具教程/实践
‹ 上一页
1…3839404142…50
下一页 ›