Supports Kimi Code CLI, Claude Code, Cursor, Codex, Hermes, and more. Try it at: http://kimi.com/features/webbridge and ...
Supports Kimi Code CLI, Claude Code, Cursor, Codex, Hermes, and more. Try it at: http://kimi.com/features/webbridge and ...
Raycast Beta版本新增了对Agent和Skill的支持,用户可通过该版本免费使用多种顶级AI模型。然而,当前版本存在较多Bug,且暂不支持Cloud同步功能,这意味着用户的快捷键设置和自定义Prompt等个人化配置无法云端备份,需要在新安装时重新手动设置。
本文通过教师离职导致知识断层的事件,批判当前企业AI工具过度聚焦堆叠上下文长度。作者指出,Tanka创新地采用“记忆图谱”架构,将人、决策等作为实体并以关系连接,能直接展示复杂决策背后的完整关系子图。其采用稀疏注意力机制降低成本,推行固定月费模式,并提供免费试用。
http://x.com/i/article/2054904722663133186
Kimi近日发布Web Bridge浏览器扩展,标志着AI Agent能力实现从“只能对话”到“像人一样操作浏览器”的实质性跨越。通过该扩展,Agent可自主执行搜索、滚动、点击、输入等操作,完成跨平台信息搜集整理、网页结构分析与复制、自动创建表单等复杂任务。它原生支持Kimi Code CLI、Claude Code、Cursor等多种开发工具,极大提升了AI助手的工作流自动化水平与生产力维度。该扩展已在Chrome应用商店正式上线。
Meet Kimi Web Bridge - Kimi's browser extension. Agent can now interact with websites like a human: search, scroll, clic...
腾讯AI团队耗时6个月,针对AI agent在长会话中频繁丢失上下文的问题,开发并开源了一套记忆系统。该系统通过三大核心操作提升性能:实时压缩过期上下文,将token消耗降低61%;利用mermaid语法生成结构化任务地图,使agent在30多步复杂工作流中不易迷失;建立专用Persona记忆,将人格一致性从48%提升至76%。方案基于实际踩坑经验,强调agent记忆的难点在于在正确时间以正确方式回忆正确信息,而非单纯堆叠token。项目已在GitHub开源,为AI agent发展提供实用解决方案。
We spent 6 months on one problem: agents losing context in long sessions. Ended up building and open-sourcing an agent m...
Kimi 近日推出了名为 Kimi Web Bridge 的浏览器扩展。该扩展能将现有的编码型或通用型 AI Agent 接入用户本地的 Chrome 或 Edge 浏览器,使其获得如点击、滚动、输入、抓取和截图等真实的网页交互能力。其设计核心在于复用用户真实浏览器环境、完全本地化执行,并采用开放接入模式。官方展示了跨平台搜索制表、网站复刻等应用案例。目前,该扩展已支持 Kimi Code CLI、Claude Code、Cursor 等多种 Agent 工具,用户可通过官网和 Chrome 应用商店获取。
Meet Kimi Web Bridge - Kimi's browser extension. Agent can now interact with websites like a human: search, scroll, clic...
正式开源 html-anything 🚀 1:1 让你感受全网爆火 Claude code 作者提的 HTML 效果! 你的 Agent 现在可以将任何数据转为世界级设计水准的 HTML 🔥 历时 3 天,1万五千行代码!支持 75 套...
Notion发布开发者平台,其战略并非简单追逐AI Agent风口,而是让Agent成为平台的核心用户。其CLI工具设计精简、自描述且token占用低,专为Agent优化。平台提供包括数据同步、工具调用和托管沙盒在内的完整基础设施,并允许第三方Agent(如Claude)通过API无缝接入,统一工作空间以解决上下文碎片化和工具调用不稳定等痛点。Notion整合了CLI、Workers、数据库同步等组件,旨在成为Agent时代的操作系统,未来可能由Agent替代人类进行构建。早期采用者与观望者之间的差距或将迅速拉大。
BIG one for devs today. Introducing the Notion Developer Platform: - Notion CLI, ntn (Notion in your terminal) - Workers...
Long-running agents shouldn't pay frontier-model prices for every turn. We've been quietly building our agent with conte...
宝玉老师基于卡比的wx-cli写了一个微信群聊总结Skill。 安装成功,正在总结下AI产品蝗虫今天的消息。 wx-cli不错啊,解密本地的微信数据库,甚至连SIP都不用关,如果报错,可以发给Codex或Claude Code解就行。 卡比...
腾讯云开源了TencentDB Agent Memory,旨在解决Agent长任务中上下文窗口易满、Token成本高的问题。该方案采用“上下文卸载”与“Mermaid任务画布”两项核心技术,将完整信息卸载至外部存储,同时用结构化任务图保留关键状态与执行路径。实验显示,该方案在多任务连续会话中最高可降低61%的Token消耗,并提升任务成功率。项目已适配OpenClaw等主流框架,支持一键集成与本地SQLite存储。
Anthropic发布Claude for Small Business,将AI直接集成到QuickBooks、PayPal、HubSpot、Canva、DocuSign等小企业日常工具中。用户可通过Claude桌面端一键启动15项预设技能,覆盖工资核算、现金流预测、营销素材制作、合同签署及新员工入职等流程。收费仅为Claude订阅费加原有SaaS工具费用,无额外加价。工作流需人工启动审批,数据安全有保障。Anthropic瞄准占美国GDP44%的小企业市场,将提供免费线下培训及线上课程。此举可能冲击传统SaaS厂商,因其将工具变为后台,用户无需打开原界面。
宝玉老师基于卡比开发的wx-cli工具,编写了一个自动总结微信群聊消息的Skill。该工具通过解密本地微信数据库获取聊天记录,无需关闭系统完整性保护。用户可对指定群聊当天的消息进行内容总结,若遇报错可借助AI编程助手解决。相关工具源代码已在GitHub开源。
Get笔记的价值被严重低估,其会员年费仅99元,性价比极高。核心功能在于用户只需提供链接,即可解读来自小宇宙、B站、抖音、YouTube、TikTok等多个平台的内容,并能获取原始转写文本。此外,它还通过提供Skill和Cli工具,允许用户将Codex分析功能接入自己的网站,实现了服务的深度集成与扩展。
Anthropic近期调整了Claude的计费策略,自6月15日起将自动化使用从订阅额度剥离,改为独立信用额度,导致重度用户成本激增。随后,官方宣布为Claude Code提供截至7月13日的周限额50%临时提升,并与前期福利叠加。分析认为,此举旨在通过短期福利缓解开发者情绪,同时引导高消耗的自动化用户转向高付费API模式,而普通交互式编程用户则被临时福利留住,以适应新的计费规则。
Claude Code weekly limits are increasing 50%, now through July 13. Live now for all Pro, Max, Team, and seat-based Enter...
Shopify工程师Paulo Arruda分享构建多Agent系统的实战经验。最初为应对AI生成代码导致的PR质量问题,尝试用AI补充测试,但依赖图等方案成本过高。Claude Code预览版的推出带来转机,其基于Grep的代码搜索无需维护索引,使Agent能直接操作任意代码库。核心教训是:专才Agent(任务拆分)效果远优于通才Agent;为领域专家适配现有工作流的AI工具,比组建全能AI小队更高效、更易获得信任。
Anthropic 宣布 Claude Code 每周限额临时增加 50%,持续至 7 月 13 日。但从 6 月 15 日起,配额系统改为双轨制:在 Claude Code 官方界面内,Max 和 Pro 账户可享受原有订阅额度;若通过 Agent SDK 构建的第三方应用(如 OpenClaw、Codepilot)使用服务,额度将按 API 费率折算成等值金额,导致实际可用额度骤降。例如,Max 账户的 200 美元 API 额度在密集使用时可能半天耗尽。官方澄清月费不变,但额度分为“交互使用”和“程序化使用”两个独立池,后者按 API 速率计费。
To add some clarity: you don't pay extra. It's the same subscription, same price per month. What's new our sub now cover...
Claude 工具发布 v2.1.141 版本,带来多项功能新增与优化。主要更新包括:为钩子输出添加 terminalSequence 字段以支持无控制终端的桌面通知;新增 CLAUDE_CODE_PLUGIN_PREFER_HTTPS 环境变量,便于通过 HTTPS 克隆插件源码;引入 ANTHROPIC_WORKSPACE_ID 变量以在多工作区联盟中限定令牌范围。会话管理方面,claude agents 命令新增 --cwd 参数用于按目录筛选,并优化后台代理的状态归类。用户体验改进包括:在倒带菜单添加“总结至此”选项以压缩早期上下文;长思考超时后旋转指示器变色提供更明确反馈;此外,还修复了 Markdown 表格渲染异常、权限提示逻辑、历史记录管理等超过 30 项问题。
Anthropic工程师鲍里斯・切尔尼透露,他利用Claude Code的循环指令和例行任务功能,在夜间自动运行数千个AI智能体进行编程开发。他通常同时开启5至10个会话,每个会话包含多个智能体,并通过手机应用管理这些任务。这种模式标志着工程师将AI从聊天机器人转变为全天候自主助手。切尔尼此前在社交平台分享的智能体配置方案已获得超10.4万次收藏和810万次浏览。
New in @openclaw beta: one path scheme to rule them all. `openclaw path read|write|append` works the same across md, jso...
http://x.com/i/article/2053655813877870592
oMLX项目更新至0.3.9.dev2版本,集成了Gemma 4的MTP视觉路径、DFlash引擎和ParoQuant技术,显著提升了图文处理速度。新增一键启动copilot功能,可便捷接入Claude等工具,并通过oQ自动代理解决显存瓶颈。这些改进大幅增强了本地AI在速度、集成与易用性上的表现,正推动AI能力从云端向个人电脑回归。
腾讯元宝App宣布新增支持总结微信聊天记录功能。用户将微信和元宝升级至最新版本后,可通过转发聊天记录至元宝,由AI自动提炼对话要点、生成清单或表单,并能整理成攻略,例如报销发票表格、旅行方案等。该消费者端AI助手于2024年5月正式发布,今年3月更新了更拟人化的Logo设计。
Claude通过四大组件实现自动化任务:Skill是领域工作流指南(如nda-review),指导操作但不执行;Agent是执行主体,Subagent用于并行处理子任务,Scheduled agent则定时自动运行(如合同到期监控);MCP connector连接外部数据源(如合同库),使Agent能访问真实数据;Plugin将上述组件打包,提供完整功能集(如commercial-legal plugin实现企业合同审查)。这些组件共同协作,使Claude能高效处理复杂工作流。
@dotey 大佬能否解释一下,这个 Claude 一会插件的,一会 Skills 的,一会这个 Agent 的,它他到底想干什么呀?
OpenAI为Codex引入Computer Use能力,使其从操作代码扩展到本地GUI应用。Codex拥有独立光标,不接管用户输入,允许用户并行工作。技术架构混合视觉模态截图和无障碍框架API,Spark模型依赖无障碍数据加速任务执行。安全层面采用逐应用权限授权,在用户允许前无法访问任何应用,保护隐私。目前该功能已在Mac上可用,Windows支持即将推出。
本期探讨AI Agent从演示走向生产环境的核心挑战。首先,在LLM时代,工程师的核心竞争力转向为问题域构建精准的概念模型与通用语言。其次,构建可靠的长流程Agent需进行关键架构转变:用持久化状态机替代对话历史来管理状态,采用事件驱动机制处理空闲等待,并通过多Agent委托实现职责分离。最后,GUI操控Agent的实践表明,执行自动化仅解决一半问题,对业务逻辑的深度理解才是关键。此外,基础设施需应对大规模并发访问的挑战。
Claude Code推出/goal功能,允许用户通过一行命令让Claude持续工作直至任务完成,无需额外指令。该功能旨在实现开发任务的自动化,减少人工干预,提高工作效率。
研究发现大语言模型在工具使用上存在系统性“知行差距”——模型认知判断需要工具与实际调用工具的行为存在显著不匹配。基于模型自适应定义评估显示,算术与事实问答场景下不匹配率分别达26.5%-54.0%和30.8%-41.8%。通过对模型内部表征的探测分析发现,不匹配主要发生在从认知判断到动作执行的转换环节,而非认知判断本身。这表明提升工具使用可靠性需同步优化认知识别和行动执行两个层面。
工业LLM代理系统常将规划与执行分离,但LLM规划器易产生结构无效或过长的流程,导致脆弱失败和额外成本。SPIN是一种规划封装器,结合验证有向无环图(DAG)规划和基于前缀的执行控制。它通过验证与修复提示强制执行严格的DAG契约,在下游执行前生成可执行计划,并增量评估DAG前缀以在满足查询时提前停止。在AssetOpsBench的261个场景中,SPIN将执行任务数从1061降至623,任务完成率从0.638提升至0.706,每次运行的工具调用数从11.81减少至6.82。在MCP Bench上,该封装器同样提升了GPT OSS1和Llama 4 Maverick在规划、落地和依赖关系方面的评分。
Statewright 是一个通过状态机为AI智能体提供约束的系统,能控制其在各阶段可使用的工具,从而聚焦推理并提升可靠性。它将工作流定义为规划、实施、测试等多个阶段,自动执行工具限制与状态转换。在本地模型测试中,两个模型在5项SWE-bench子任务上应用约束后,正确率从2/10显著提升至10/10。该系统已集成到Claude Code等平台,一个修复测试失败的典型工作流可在46秒内完成。
Anthropic正式开源“Claude for Legal”项目,针对法律行业推出12个具体岗位的AI插件和超过20个连接行业常用软件的MCP连接器。用户通过简短的“冷启动访谈”定制本地CLAUDE.md文件,使插件能遵循团队特定的风格与标准,解决AI法律工具输出内容过于通用的问题。插件功能覆盖合同审阅、NDA分级、专利侵权对比表生成等重复性工作,并深度集成Thomson Reuters CoCounsel、iManage、DocuSign等主流平台。项目基于Claude Opus 4.7模型,但强调所有输出仅为律师审阅的草稿,不能替代专业法律判断。
Skills in Grok Web can be used by typing /
研究团队发布了名为Needle的轻量级模型,它将谷歌Gemini的工具调用能力浓缩至仅2600万参数。该模型在保持核心功能的同时,体积显著缩小,旨在实现更高效的部署与应用。项目代码已在GitHub开源,并在Hacker News社区获得了超过100点的关注度。
Anthropic公司为法律行业发布20多个新的MCP连接器及12个专用插件,将Claude深度集成至合同管理、文档处理等法律核心软件栈。Claude现可直接在Microsoft Word、Outlook等办公应用中无缝工作,具备起草、修订、条款比对等可复用技能,并能自动化处理日常法律事务。公司同时宣布与多个司法公益组织合作,以扩大法律服务的可及性。
在Code w/ Claude SF 2026开发者大会上,Anthropic宣布提升开发者工具能力。Claude Code的速率限制翻倍,Claude Opus的API限制提高,以支持大规模可靠开发。同时,Claude平台上的托管智能体新增四项功能:“梦想”功能通过回顾会话优化记忆;多智能体编排支持主智能体并行委派子任务;“成果”功能通过定义输出标准提升任务成功率,内部测试显示最难问题成功率最多提升10%;Webhooks提供任务完成通知。大会主题演讲和分组会议录像已上线,并计划在伦敦和东京举办后续活动。
飞书CLI近期悄然更新了100多项能力,允许用户通过AI Agent自动化编排飞书内的多项功能,如Bot、画板、妙记、审批和知识库。这旨在将AI能力从开发层延伸至日常协作层,解决工作碎片化问题。引用推文指出,管理者可为下属配置专属Agent,实现Agent间的自动化沟通与任务处理,从而让人专注于核心决策,提升个人与团队效率。官方提供了能力清单和使用案例以供参考。
我给每个下属都配了一个专属 Agent,跑在飞书上。现在是他们的 Agent 在跟我的 Agent 对话,我在旁边看着。 带团队这些年,我最大的感受不是累,是碎。 各种项目要跟,各种进展要盯,各种需求要确认。AI 让每个程序员的产出翻了好几...
当在多轮代理会话中启用小米MiMo思考模式,且对话历史包含工具调用时,后续用户回合中传回的助手消息必须保留完整的reasoning_content字段,否则API将返回400错误。缺失该字段会导致模型上下文不完整,进而削弱指令跟随能力、增加幻觉并显著降低用户体验。受影响的框架包括TRAE、Cursor、Roo Code等,受影响模型涵盖MiMo-V2.5-Pro、MiMo-V2.5等多个系列。开发团队正与相关维护者合作推送兼容性更新以解决此问题。更多详情请参阅官方文档。