一篇新论文从自主性、效率和工人移交任务的范围三个维度,分析AI智能体如何重塑知识工作。研究指出,当前人们使用智能体的主要障碍并非模型质量,而是几乎没有人接受过如何以这种方式工作的培训。
一篇新论文从自主性、效率和工人移交任务的范围三个维度,分析AI智能体如何重塑知识工作。研究指出,当前人们使用智能体的主要障碍并非模型质量,而是几乎没有人接受过如何以这种方式工作的培训。
Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...
在 2026 全球开发者大会(WWDC)上,苹果发布 Xcode 27 Beta 并推出 Core AI 框架。新版 Foundation Models 框架支持图像输入,开发者可将图片与文本一并传给设备端模型,处理多模态任务。Xcode 编码助手升级为智能体式编码工作流,已覆盖应用本地化、与模拟设备交互以及测试与调试环节。苹果软件工程高级副总裁 Craig Federighi 称 Xcode 已成为构建智能体 AI 应用的“最佳场所”。
Apple 发布了 Siri AI,一款由 Apple Intelligence 驱动的个人助理,具备个人上下文、世界知识和屏幕感知能力,能提供更强大、更个性化的交互体验。
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning...
苹果在 2026 年全球开发者大会(WWDC)上发布 Siri AI,称为“全新版本的 Siri”,具备更强的对话能力和表现力,用户可自定义语速、语气和口音。Siri AI 支持系统范围内读取屏幕内容并与应用互动,配有独立 App,灵动岛会显示大气泡。苹果强调每一步以隐私为重。语音优化同时适用于 CarPlay 和 AirPods,可用于查询演唱会信息、提醒报名抽奖、搜索照片等场景。
关联讨论 8 条TechCrunch:AI(RSS)X:Kim (@kimmonismus)Apple:Newsroom(RSS)IT之家(RSS)公众号:数字生命卡兹克The Verge:AI(RSS)X:Testing Catalog (@testingcatalog)Apple Machine Learning Research(RSS)Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...
OpenAI Developers 五月发布多项更新:Codex 用户突破 500 万;新增 ChatGPT 移动端持续运行、Mac 后台运行、跨 Mac 应用电脑使用、Chrome 插件支持网页测试与 DevTools;⌘+⌘ 快捷键截图直达 Codex;Windows 版也支持电脑使用。Realtime API 推出新模型 Realtime-2,用于语音智能体、实时翻译与转录,并提供提示词指南。Agents SDK 新增 TypeScript 支持、沙箱智能体和开源 harness。私有 MCP 服务器可通过 HTTPS 连接 OpenAI 产品。
Claude Code's first demo got two Slack reactions. One year after GA, @bcherny and @_catwu look back: verification best p...
一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后,准确率接近100%。研究指出,当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题,导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键,生物学数据库需为智能体作为规模化用户而设计。
新论文构建 CL-BENCH 基准,评估 AI 智能体在编程、数据库、预测、无线电信号、扑克、疾病研究 6 个领域中的持续学习能力。每个任务隐藏可随时间习得的模式,考察智能体能否超越预训练知识。测试前沿 LLM 系统采用全上下文记忆、草稿笔记、检索记忆、剧本式记忆及编码智能体设置,结果发现当前记忆密集型 AI 智能体并未可靠优于简单保留完整对话上下文。Claude Sonnet 4.6 使用普通上下文取得最佳总体分数。论文指出智能体仍需更好方法记住有用经验、遗忘过时信息并适应环境变化。
Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...
微信发布《开发者接入微信 AI 生态的指引》,引导小程序开发者接入微信 AI,让 AI 控制小程序。宝玉对此评论称,微信试图通过让 AI 操作小程序来维持自身超级入口地位,但未来年轻人不会主动打开微信,而是直接向自己的 Agent(如"帮我总结群聊"或"给妈妈发消息")发出指令。承担超级入口职责的很可能不是微信 AI。
微信终于要加 AI Agent 能力了? 微信发布了《开发者接入微信 AI 生态的指引》这篇文章,引导小程序开发者接入微信 AI 生态,让微信的 AI 控制小程序。 感觉这个可能是未来微信 AI 上一个非常重要的功能
Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning...
关联讨论 1 条X:NotebookLM (@NotebookLM)NotebookLM updates soon 👀 We are expecting Gemini 3.5 Flash and Gemini Omni upgrades, aside a bunch of new features. Wh...
New server tool: Advisor Let smaller models consult a higher-intelligence "advisor" model. Helps them escape doom loops,...
关联讨论 1 条OpenRouter:Announcements(RSS)Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...
苹果 WWDC 2026 临近,Siri 备受期待的改造、Apple Intelligence 和 iOS 27 是本次大会的主要看点。
微信宣布向开发者提供 AI 生态接入功能,目前处于内测阶段。美团作为首批内测团队,已与微信联合开发并测试接入。未来用户可通过微信 Agent 调用美团外卖等本地生活服务,实现智能便捷的 AI 生活服务体验。此前携程已官宣接入微信 AI 生态,围绕酒店预订、机票等核心场景接入微信 AI Agent。另有传闻称京东也已作为首批内测团队接入。
月之暗面 Kimi 宣布调度 300 个子 Agent 并行分析 104 场世界杯赛事。每个 Agent 有独立视角,覆盖战术、球员、伤病、赛程、历史、舆情、赔率等维度,采用 Elo、FIFA 排名、Poisson、Dixon-Coles、xG/xT、Monte Carlo 模拟、贝叶斯等模型。最终以概率呈现并标注风险,不简单多数决。Kimi 框架认为西班牙、法国是夺冠热门,但模型发现德国队夺冠概率可能被市场低估。历史回测显示高置信度预测准确率约 85%-90%,中等约 55%-65%,低置信度接近随机。官方提示结果不构成投注建议。
Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。
Coding agents that actually get better the more your team uses them. Introducing Hivemind: continual learning for AI cod...
🔗Try it now: https://www.kimi.com/products/kimi-work We're just getting started. More data sources, more tools, more ag...
Kimi发布Kimi Work,一款本地运行的桌面AI智能体。支持最多300个AI智能体同时在本地机器并行运行;配合WebBridge浏览器扩展,智能体可在浏览器中导航、搜索、点击、填写并完成任务;内置全球市场数据工具,可直接调用Yahoo Finance和世界银行数据,无需复杂API设置;记忆系统会记录用户偏好、过往决策和上下文。支持macOS(Apple Silicon)和Windows。
同一事件,精选展示《Kimi Work Beta版发布:面向知识工作者的本地Agent》Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...
生成式AI商业模式正从月订阅制转向按token消耗计费。智能体工作流消耗数倍于传统对话的token,可自主运行数小时,使固定费率不可持续。token价格因响应速度、专业化程度及结果经济价值而异。本期报告梳理订阅制向消费制迁移、看似低廉的token单价背后的实际成本,以及为何仅凭token消耗量衡量AI价值创造是片面的。
Kimi Code 开源 Coding Agent 迎来大版本升级:一行命令安装,毫秒级启动;新增视频理解能力,支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码;集成同花顺、天眼查等权威数据源,可查询股票价格、财报、学术论文;支持 ACP 协议,可在 JetBrains、Zed 中使用;丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。
同一事件,精选展示《Kimi Code 焕新升级(附视频教程)》今日,Hugging Face 宣布 OpenEnv 项目进一步开放,由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调,并获得 PyTorch Foundation、vLLM、SkyRL(UCB)等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具,定位为训练器与环境间的互操作层,标准化环境的发布、部署和消费,但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API(reset()、step()、state()),支持 HTTP、WebSocket、Docker 打包,并将 MCP 作为一等公民,使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证,以推动开源智能体 RL 基础建设。
用五个不同实验室的AI模型(OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型)各自驱动一个智能体构建经济市场,试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积,导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格,使崩溃成为设计事实。实验表明,AI智能体的涌现行为是偶然的而非稳健的,有效系统需在涌现纹理与确定性控制之间找到精确接缝。
Kimi Code 开源 Coding Agent 大版本升级:一行命令安装,毫秒级启动;新增视频理解,可提取参考视频色调生成 LUT、将长视频切分为短视频、根据录屏生成代码;接入同花顺、天眼查等权威数据源,支持实时查询股票价格、财报和学术论文;兼容 ACP 协议,可在 JetBrains、Zed 等 IDE 使用;拓展 hook 生态方便集成。视频理解基于 Kimi K2.6 模型。通过 /plugins 安装 kimi-datasource 插件即可使用权威数据源。
字节跳动火山引擎宣布Agent Plan和Coding Plan限时优惠,两款套餐均集成MiniMax M3、DeepSeek V4系列、GLM-5.1等模型。即日起至2026年8月27日,新购、升级或续费Coding Plan Lite(原价40元/月)和Coding Plan Pro(原价200元/月),以及Agent Plan Small(原价40元/月)和Agent Plan Medium(原价200元/月),首两个月享2.5折,对应限时价9.9元/月和49.9元/月,第三个月起恢复原价。Agent Plan为火山引擎首推的“Agent套餐包”,内置字节自研Doubao-Seed、Seedance、Seedream模型,支持文本、代码、视频等多模态任务。
6 月 8 日,微信开放平台发布指引,为开发者提供接入微信 AI 生态的能力,开发者可主动授权接入。携程小程序已作为首批内测开发者完成初步适配,未来将围绕酒店预订、机票查询、旅游度假、出行服务等核心场景接入微信 AI Agent。微信提供两种接入模式:自动模式(授权平台读取小程序源码,无需额外开发)和开发模式(开发者自主个性化开发,通过评测后可被微信 AI 调用),两种模式可同时开启。
小互分享个人经验:此前追求完全自动化,导致不断与AI扯皮、对技能和系统频繁修改,效果反而更差。现在删除所有规则,只在关键节点人工介入,与AI共同完成任务,不仅效果更好,人也轻松许多,不再频繁抱怨AI。
Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...