LangChain在演讲中指出,Agent生产架构已明确分化为长时程知识型与低延迟响应型两类,工程路径各异。Notion CEO分享了公司转向更灵活的“爵士乐队”模式,并采用“哑铃型”人才结构以适应AI开发。智谱同期发布GLM-5.1高速版,在保持旗舰能力的同时实现400 tokens/s的输出速度。三者共同揭示了AI应用在底层架构、组织形态与基础性能上的演进方向。
谷歌宣布Gemini应用月活用户已突破9亿。在此次更新中,Gemini正从工具演变为更主动的个人AI代理。主要更新包括新一代模型Gemini 3.5 Flash、全新的“Neural Expressive”设计语言,以及能将提示转化为高质量视频的Gemini Omni模型。核心亮点是两项代理功能:“Daily Brief”提供个性化每日简报,“Gemini Spark”则作为24/7的个人代理,在用户授权下主动管理任务与数字生活。这些更新标志着AI助手向更主动、更整合的方向发展。
关联讨论 19 条Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Google AI (@GoogleAI)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)基准测试显示,Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18,更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率:完成全部测试仅消耗1.6M token,远低于同类模型的5.7M。效率方面,其平均任务完成时间约9分钟,比行业平均水平快约1.3倍,其快速版本更可将时间缩短至约7分钟。
其实远程服务器上并不需要安装一个完整版的 Codex app,只需要安装 CLI 版的 Codex,并运行: codex remote-control 这样手机上 ChatGPT 应用里的 Codex 就会显示出一个有「终端」图标的服务器名...
We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀
谷歌在I/O开发者大会宣布,系统性构建面向AI代理(Agent)的开发与部署工具链。核心更新包括:独立桌面应用Antigravity 2.0及其命令行工具、SDK面世;Google AI Studio新增Kotlin支持,可一键开发安卓应用并发布,同时推出移动端App。此外,Gemini API推出托管代理服务,实现一键部署;WebMCP作为开放标准在Chrome 149中推出,允许网页向代理暴露工具;Chrome DevTools也开放给AI代理以自动化调试。企业级客户可直接连接Google Cloud项目,而DeepMind的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整AI代理生态系统。
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》Polsia just raised $30M at a $250M valuation. Approaching $10M annual run rate. One Founder + AI. Zero employees. Polsia...
Airtable团队推出Hyperagent平台,为每个会话提供完整云端环境,包括浏览器、Shell和代码执行能力,支持用户无本地设置即可快速构建AI智能体,并可部署到Slack等工作平台实现自动化工作流。Airtable资金超10亿美元,已服务80%的财富100强企业。其“创始500”计划为500位创始人提供2万美元推理信用额度,总投入1000万美元,旨在推动“智能体优先”创业趋势,押注自主、主动的AI智能体将成为未来企业核心驱动力。
We're giving away $10,000,000 to founders building agent-first businesses. Autonomous, proactive agents will run tomorro...
AI Desk Card 是一款 4.7 寸磁吸墨水屏,结合 AI Agent(如 Claude Code),通过预置模板与数据填充,动态显示日历、待办、GitHub PR 队列、天气等内容。它解决了传统便签纸的静态限制,实现内容自适应和场景切换(如夜间变为电子名片)。核心理念是将硬件从固定功能中解放,使显示能力由 AI 可获取的信息动态定义,从而提升效率并减少手动配置。
红杉AI Ascent 2026闭门峰会提出,“长周期智能体”将成为2026年的商业定义。但这引发了“AI生产力悖论”:尽管Cursor、Claude、NotebookLM等AI工具显著提升了个人效率,但这些工具的“记忆”绑定于个人账号和设备,无法迁移、共享或在团队间累积。因此,个体效率的提升难以转化为组织层面的生产力增益,每个员工都像一座座彼此孤立的“信息孤岛”。
http://x.com/i/article/2057668634579714048
Qwen 3.7-max beats Opus 4.7 and GPT-5.5 We tested three frontier models on a real agentic task: write a Tetris bot that ...
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)用户实测SenseNova 6.7 Skills Agent,称其为“牛马人套装”。该AI agent能够自主执行长时间、重复性的数据处理任务,例如爬取网站、整理数据并生成结构化文件(如MD格式),以完成一份市场调研报告。由于任务复杂,执行耗时较长,但因产品处于公测阶段,目前免费使用。用户后续还将测试其自动生成报告PPT的功能,并提醒大家抓紧机会体验其免费的CodingPlan。
前字节员工推荐飞书作为连接AI工具的平台。通过Zara开源的lark-channel-bridge工具,可将本地Claude Code变为飞书机器人,实现手机端随时进行复杂任务对话。该工具能将飞书消息转给Claude Code处理,支持可交互卡片和文件图片的直接显示,并结合飞书的全量搜索功能,提供流畅、可控的“AI工作助理”体验,被作者强烈推荐。
一位创作者分享了其开发的通用AI海报提示词,适用于产品、人文、科技、展会等多个领域,但因使用复杂,部分用户难以驾驭。为此,他在Bloome平台将这套方法封装成一个海报设计Agent。用户现在可通过自然对话快速生成高质量海报,无需复杂提示词操作。工具设置了1美元的付费门槛以过滤免费滥用,该费用可解锁约100次生成额度,且该优惠可能限时一周。
VSCode团队提出Agent-First Development框架,核心理念是开发主体从“人+编辑器”转向“人+Agent+编辑器”,人的角色转变为选择模型、提供上下文、定义意图和设定边界。五大支柱为:模型(匹配任务深度,按需选择思考档位)、执行边界(从问答到自主规划的渐进信任模式)、上下文(显式提供关键信息以避免错误)、提示(需清晰包含目标、范围与约束)与工具(能力需可控、可审计)。该框架旨在系统化指导人与AI代理高效协作开发。
The @code team released a new Introduction to Agent-First Development series. It breaks down these 5 pillars behind grea...
Grok Imagine Agent Mode is now available on Grok iOS app With Agent Mode, you can generate: • Consistent characters acro...
本次分享开源了8套被称作“神级”的Prompt模板,宣称总价值超过万元。这些模板覆盖了工作、生活、学习、副业等多领域场景,包括KERNEL-X、AI工作流专家、深度研究等具体系统,旨在帮助用户提升效率、解决实际问题,实现从焦虑到豁然开朗的状态转变。
http://x.com/i/article/2057300084354670592
本文指出当前AI应用存在一个“生产力悖论”:个人使用AI工具效率大幅提升,但组织整体效能却未同步增长。核心原因在于,组织普遍缺乏有效的“记忆系统”,导致大量时间(据MIT报告超30%)被消耗在重复构建上下文中,使个体提升的效率无法在组织层面累加与沉淀。MIT报告显示,高达95%的企业AI投入未产生可衡量回报。作者认为,未来竞争的关键不在于使用最强的AI模型,而在于构建最深厚的“组织记忆”,将对话、决策等资产系统化沉淀,这比单纯追求工具本身更为重要。
Codex发布重要更新,核心提升在于上下文获取与任务自动化。新推出的“Appshots”功能,通过同时按住左右Command键,即可截取当前窗口并将屏幕内外的可见与不可见文本一并自动填入对话,极大简化背景提供流程。已正式上线的“/goal”功能支持设定长期目标,Codex可持续自主执行数小时至数天,且允许中途调整与暂停。此外,应用内浏览器速度提升,并新增可直接编辑页面元素的高级注释模式。团队版本则新增了批量安装插件的功能,提升了协作效率。
It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...
OpenAI宣布Codex的/goal模式已结束实验,成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用,通过设定具体里程碑,让AI持续工作直至完成,任务可运行数小时甚至数天。过程中支持随时检查、调整方向及暂停。使用前需升级应用并启用该功能(可通过命令行指令或手动修改配置文件实现)。开启后,可在输入框管理任务,并利用侧边对话查看进度而不中断主任务。该功能旨在高效处理各类复杂任务。
🥅 /goal has graduated from an experiment-for tasks big and small, Codex gets your work done. Use goal mode in the Codex...
🚀 We're launching Qwen3.7-Max from @AlibabaGroup on Novita AI as a Day-0 launch partner. Built for the Agent Era - wher...
关联讨论 9 条公众号:通义实验室(千问)X:通义千问 / Qwen (@Alibaba_Qwen)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)Qwen:Blog Retrieval(API)Hacker News 热门(buzzing.cc 中文翻译)X:OpenRouter (@OpenRouter)IT之家(RSS)Another one: today we released Remote Computer Use in Codex! This means you can use all the apps on your Mac from Codex ...
OpenAI Codex推出周四常规更新,本次重点功能是远程Mac控制:用户可通过手机安全操作处于锁屏状态的Mac,实现“无人值守”执行任务。同时新增Appshots功能,可直接捕捉屏幕上下文注入对话。新增的Goal Mode支持数小时至数天的长期自主执行,标志着Codex从即时响应工具向长期智能体的转变。此外,高级标注模式提升了前端协作的直观性。
Highlights from today's Codex Thursday launches: 1️⃣ Codex can now securely use apps on your Mac from your phone, even w...
华为于上海举办智能金融峰会2026(HiFS 2026),与全球金融业领袖探讨AI驱动的数字化转型。华为基于全栈云化的计算、存储与网络能力,通过软硬件系统级协同,构建了坚实的金融基础设施。在此之上,华为正打造一个支持多种模型与场景的金融级AI Agent赋能平台,旨在推动金融业向智能化阶段跃迁。
Cursor 团队内部广泛使用的代码审查技能“thermo-nuclear-code-quality-review”,其核心目标是在代码合并前,拦截那些“能运行但会使代码库变糟”的提交。它基于四条硬性原则:强制实现复杂度净简化而非转移、限制单文件不超过1000行、标记无用的封装与散落的逻辑、坚持维护性与功能同等重要。该技能采用父子Agent两阶段协作机制:父Agent并行收集结构化差异与文件内容,再交由审计Agent进行单次、聚焦的严格评判。即使插件未安装,也会触发一套对齐上述原则的可维护性降级审计。
the most used skill internally at cursor right now /thermo-nuclear-code-quality-review - deletes complexity instead of m...
Google Gemini上线Daily Brief功能,能在早晨主动扫描用户的邮件、日历与最新动态,提炼出当日需优先处理的事项,生成一份简洁的待办清单,帮助用户快速把握全天重点。该功能目前面向Google AI Plus、Pro和Ultra用户在美国地区开放。
Get a head start on your day with Daily Brief. Gemini can now proactively flag what matters most in an easily digestible...
Bloome正式上线,定位为首款将人类与AI Agent置于同一群聊的消息应用。其核心设计是Multi-Agent One Room,即多个AI Agent与人类用户共同在同一个“房间”内协作,如同添加同事一样将不同职能的Agent拉入对话。产品强调AI Agent作为队友而非工具,能共同处理任务(如协作修复Bug、完成写作流程),显著提升协作效率。目前仅开放1000个邀请码,产品迭代更新速度快。
Bloome is officially live. The first messaging app where humans and AI agents share the same group chat - as teammates, ...