iOS 27 开发者测试版上线多项基于 Apple Intelligence 的实用 AI 功能。账单分摊:拍照识别收据,通过 Apple Cash 分账。密码更新:AI 自动识别弱密码并代理登录网站升级。Messages 一键建议:根据对话内容提示添加提醒、分享照片、添加日历事件。通话时提取邮件中的确认码。支持自然语言添加或修改日历事件。Shortcuts 应用可通过描述自动化任务。这些功能将在今年秋季正式发布。
iOS 27 开发者测试版上线多项基于 Apple Intelligence 的实用 AI 功能。账单分摊:拍照识别收据,通过 Apple Cash 分账。密码更新:AI 自动识别弱密码并代理登录网站升级。Messages 一键建议:根据对话内容提示添加提醒、分享照片、添加日历事件。通话时提取邮件中的确认码。支持自然语言添加或修改日历事件。Shortcuts 应用可通过描述自动化任务。这些功能将在今年秋季正式发布。
AI Native组织由人、Agent、上下文三层构成。人退守两端:战略/品味/判断与沟通/评审,AI吃掉中间执行。Agent自治需Clear Goal、Skills、Tools、Context四要素,并通过Skill Chain串联多个skill对抗幻觉。上下文层是护城河,五阶段循环:Capture→Curate→Store→Execute→Experience→回流。两个Live Demo验证:提案微站3-4分钟生成个性化页面,已带来数百万美元收入;10分钟产品闭环实现语音口述到高保真原型。创业方向是将三层系统打包服务,聚焦行业/职能/公司规模。
华为开发者官网发布 HarmonyOS 7 (API 26) 新能力一览,新增智能化 Skill(Vibe Coding 助力开发)、Agent(支持 A2A 接入)、视觉 AI;空间化沉浸光感组件、3DGS 端侧重建;全场景碰一碰精准分享;空间音频;多窗互动卡片(摇一摇触发)、闪控窗;安全星盾机密风控引擎、分布式数字身份 DID 框架、数字盾;性能游戏快启、鸿蒙内核应用快启;通讯冷启网络预建链、QUIC 长连接、弱网直播优化;低功耗 LTPO 可变帧率。该系统于 HDC 2026 发布,开发者 Beta 1 版已公开招募,正式版秋季向消费者开放。
作为新成立的部门,DeepSeek Harness 组的目标远大、工作繁重,仍然非常缺人。我每天都在面试,以及各种地方张贴小广告......一共有三种职位: Harness 研究员(实习全职均可):https://app.mokahr.co...
OpenAI Codex 新增 Record & Replay 功能,用户可通过“演示一次工作流”创建可复用的 AI Skill。底层将 Skill 作为结构化上下文,回放时具备适应性,能调用当前环境中的工具完成任务。流程分两阶段:录制时 Codex 分析操作并自动起草 Skill(含使用时机、输入、步骤、验证);回放时用户提供新参数,Codex 自动执行。官方总结了五条高质量录制原则:短而完整、提前声明变量、真实但脱敏、补录隐性规则、及时停止。该功能与 Plugin 形成互补:适合个人快速 Skill 化,而非团队级分发。
CREAO is hiring 这是一艘刚刚开始提速的新船。 我们正身处AI时代的乱纪元。组织形态和财富分配方式都在被重塑。接下来最大的机会,会属于那些敢在秩序尚未形成时下场,用产品和结果定义新生态的人。 前不久,CREAO刚完成了3000...
兄弟们,喜大普奔哈哈! DeepSeek-V4-Flash 免费到6月28号,直接冲啊! 284B MoE,1M上下文,编码和Agent能力都不错,直接可以用起来,截止日期到6月28号。 链接:https://www.openmodel.ai
DeepSeek-V4-Flash is FREE until June 28! OpenModel Limited-Time Event: → Input: $0.00 / M → Output: $0.00 / M Powerful 2...
拜耳与Thoughtworks合作开发了云端平台PRINCE,利用Agentic RAG和Text-to-SQL整合数十年临床前安全研究报告。该系统从关键词搜索演进为能回答复杂问题并起草监管文档的智能研究助手。架构通过上下文工程控制信息路由,通过驾驭工程实现编排、错误恢复与可观测性。系统以透明度、可解释性和人工参与为核心信任机制,显著提升数据可访问性与研究效率,同时确保治理与合规。
ClickUp Brain AI 新增自主创建 agent 的能力:当检测到适合委派的任务时,Brain 会提议构建一个专用 agent,预配置好触发器、规则和范围。agent 接管重复性工作后,原来主流程可继续推进。例如,用户只需让 Brain 一次性分流新上报的 bug,它就能提议一个常驻 agent,持续监控新报告、分配严重性、标记重复并自动归档任务。
在纽约AWS峰会上,亚马逊云发布AWS Continuum和AWS Context两项服务。Continuum覆盖代码漏洞从检测、排序、验证到修复的全生命周期,引用Anthropic Claude Mythos等安全模型,支持学习模式与强制执行模式。Context自动从数据库、文档、邮件等企业数据构建知识图谱,为所有智能体提供共享业务知识,内置访问控制。DevOps Agent新增发布就绪审查(在GitHub/GitLab以注释反馈)和从变更推导测试计划并在类生产环境运行的功能,预览版在美国东部免费开放。智能体Kiro推出iOS原生应用,用于移动端启动任务和审批代码。Bedrock AgentCore扩展托管知识库连接器(S3、SharePoint等)和内置网络搜索。
BestBlogs周刊第100期特刊回顾两年AI发展,核心洞察:答案变便宜,判断变贵。模型层:DeepSeek-V3(6700亿参数、每次激活370亿、训练成本约557万美元)和R1(纯强化学习推理开源)将效率与开源变成新范式。AI编程层:Codex案例中模型7小时迭代200轮测试仅改动500行代码,验证成为新瓶颈;Claude Code内部编写约80%代码。工程范式从提示词转向上下文工程。两年间模型从问答知识库长成独立执行器,人从写代码退到判断、验证和为结果负责的位置。
微软证实将在 Edge 浏览器中移除文件互传功能 Drop。此前 Edge 149 版本已取消侧边栏和集锦功能,侧边栏区域仅留给 Copilot。Drop 依托 OneDrive 实现跨设备传输,不限文件大小,停用后文字笔记将被清除,需用户导出备份。Edge 已划归微软人工智能业务线,由 Copilot 项目负责人统筹,正围绕 AI 重新设计浏览器框架,视觉风格将向独立 Copilot 应用靠拢。
25岁创业者徐子文(Ziwen Xu)启动自制《GTA6》项目GT-Caliber,使用Anthropic旗下Claude Max 20x大模型,配合多款AI智能体循环运行,实时收集社区需求并自动生成代码。开发首周先后从Godot引擎迁移至虚幻引擎,最终选定Unity。九天进展包括路人NPC自主行走、道路交通、武器系统及仿Instagram游戏手机,第七日生成洛杉矶风格居民区。项目开源托管于GitHub,无发行商支持。R星官方已公布《GTA6》预购6月25日开启,11月19日登陆PS5、Xbox Series X|S。
李飞飞与David Roger提出“哑铃效应”:文本智能成本趋零,劳动力向顶尖1%专家和高能动性通才两极坍缩,中间岗位萎缩。Tokenmaxxing三月潮起——OpenAI工程师周耗2100亿token,Claude Code重度用户月花15万美元;五月迅速退烧——Amazon关闭排行榜,Uber烧光2026年全年预算,微软将工程师迁回Copilot CLI。数据揭示Agentic coding token消耗是普通问答千倍,70%耗于探索与修复;写代码效率增180%,但传导到发布仅剩30%增量。Claude Code八种上下文注入机制为高能动性通才提供工程抓手。
李飞飞提出“哑铃效应”,未来劳动力两极分化:顶尖工匠与高能动性通才。Tokenmaxxing 揭示,Agentic coding 真实成本是普通问答千倍,七成消耗在试错;写代码效率提升180%,但发布上线增量仅30%。Claude Code 详解八种上下文注入机制,引出 Dynamic Workflows。Microsoft 披露 AutoJack 攻击,浏览型AI Agent 被诱骗利用 MCP WebSocket 在 AutoGen Studio 主机实现代码执行。Vercel 推出 Agent Stack,集成 AI SDK、Gateway、Workflow SDK 等构建生产级 Agent。
http://x.com/i/article/2068480429980876800
Libretto是一个面向LLM智能体的符号音乐生成与修订框架,采用包含显式onset槽、声部和小节组织的LLM原生语法,并在节奏、和声、旋律、织体、形式与变奏的语料校准统计空间中评估每首作品。同一结构轴支持检索、诊断、复制风险控制及迭代自修订。在填空生成、参考引导整曲生成、渐变变形与教育音乐生成等任务中,Libretto将符号音乐从原始token序列转化为语言模型智能体可测量、可编辑的对象。
PlanBench-XL是一个交互式基准测试,包含327个零售任务和1,665个工具,用于评估LLM智能体在检索受限工具可见性下的长时域规划能力。智能体需迭代检索并调用工具以逐步逼近最终目标。可选阻塞机制通过缺失、失败或干扰的工具函数模拟不确定性,迫使智能体检测中断路径并运行时自适应。在10个领先LLM上的实验显示,GPT-5.4在无阻塞条件下准确率为51.90%,最严重阻塞下骤降至11.36%。分析表明,当故障缺乏明确错误信号或恢复需要更长替代工具路径时,智能体尤其脆弱。PlanBench-XL为诊断智能体规划失败提供了测试平台。
Nous Research 为其开源 AI 智能体框架 Hermes Agent 新增 Blank Slate 设置模式。该模式默认仅开启 provider & model、File Operations 和 Terminal 三项,Web、浏览器、代码执行、视觉、记忆、委托、cron、技能、插件及 MCP 等全部禁用。配置被写入 platform_toolsets.cli 和 agent.disabled_toolsets 并固化到磁盘,即使执行 hermes update 也不会静默启用未选工具。用户可在极简基线后选择完全禁用或逐项启用。该模式适用于安全敏感部署、可复现团队设置和教学审计场景。本地运行要求模型至少 64K 上下文窗口。
Cloudflare 上线面向 AI 智能体的临时账户。智能体无需注册,直接运行 wrangler deploy --temporary 即可部署 Worker,部署持续 60 分钟,期间可通过链接认领为永久账户,超时自动删除。专为无人类参与的后台 AI
Greg 列出当下最有价值的六项技能:搭建管理 agent 并运行本地 AI 模型、懂渠道的营销、全能机器人、短内容策展、能出产品又能分发的 builder-distributor、线下社区建设。主推文指出 AI 抹平单一工具门槛,纯写提示词或代码贬值,真正拉开差距的是打通 builder 与 distributor 全链路。具体解读:本地部署保留应急控制权;内容策展是稀缺筛选力;管理 agent 需监控重试。建议三件事:迁核心工作流到本地并搭观测面板;精准分发产品给 20 个潜在用户;线下聊天获真实反馈。
The most valuable skill sets on the planet right now: 1. people who can set up agents properly, manage them, and run loc...
现在 Codex 能将代码线程从笔记本无缝 handoff 到远程服务器,再随时接回。过程自动打包 Git 状态、未提交变更、分支、工作树等全部上下文,无需手动 sync 或重建环境。该功能消除了本地开发与远程重型计算之间的摩擦,让 agent 自动管理状态流动,用户可根据需要自由切换场景。
Codex can now hand off threads between local and remote hosts. Start work on your laptop, send it to a remote box before...
@aijoey 用 MiniCPM-V 4.6 搭建了视觉智能体安全监控 demo:四个 CCTV 实时画面,模型观察近期帧窗口,判断活动是否正常,仅在识别到真实事件时调用 raise_alert(reason, severity)。模型持续将场景分类为“常规/无紧急”,只在高速公路出现警车蓝灯时触发警报,推理为“警车蓝灯亮起,可能表示紧急情况”。该演示展示了小 VLM 超越图像描述、实现实际智能体行为的潜力。
Built a vision-agent security monitoring demo with MiniCPM-V 4.6. @OpenBMB Four CCTV style feeds run on a live clock. Mi...
面壁智能OpenBMB感谢@aijoey用MiniCPM5-1B构建后端智能体集群。128个并发智能体在DGX Spark上运行,通过vLLM连续批处理提供服务,每个智能体独立处理发票审核、退款路由、合规检查等8种业务队列。系统在1.48秒内跨智能体流式传输6604个chunks。该案例表明,1B模型的价值在于同时做出大量有用业务决策——用一群小型廉价worker并行清理队列。
Built a back-office agent swarm demo with MiniCPM5-1B. 128 concurrent agents on DGX Spark, served through vLLM continuou...
OpenAI 为 macOS 版 Codex 新增 Record & Replay 功能。用户可先演示一次操作(如上传 YouTube 视频并添加元数据、缩略图和字幕),Codex 将其录制成可复用的“skill”,随后自主重复执行。该功能需开启 Computer Use,在欧盟、英国和瑞士不可用;Computer Use 自 6 月 16 日起已在欧盟上线。版本 26.616 还新增了 Automations 历史批量操作及本地与远程主机间线程交接能力。Codex 是 OpenAI 面向编程和白领工作自动化的 AI 智能体,应用免费下载,但需付费 ChatGPT 账号才能实际使用。
高通 CEO 安蒙认为,AI 智能体将改变应用和设备使用方式。他设想的入口之一是内置摄像头和显示屏的智能眼镜,用户告诉数字助理需求,AI 智能体即可协调多个应用完成流程。安蒙指出应用不会消失但会变化,智能体将成为新应用。苹果 Siri、三星 Bixby 等数字助理能力持续提升。未来手机和新设备将围绕 AI 智能体重新设计。高通正参与 40 多种 AI 设备设计,包括智能首饰、带摄像头的耳机、智能胸针和手表。安蒙最看好智能眼镜,预计其规模最终可与智能手机相当——去年全球智能手机出货超 12 亿部。
LangChain 官方认证大使 @zhanghaili0610 推出开源教程《Deep Agents 实战》,基于 LangChain / LangGraph 生态,讲解如何用 Deep Agents Harness 框架构建真实 Agent 应用。核心是“三层架构”:Runtime(LangGraph)、Framework(LangChain)、Harness(Deep Agents)。技术内核为上下文工程,通过虚拟文件系统实现按需读取、中间结果落盘、大文件局部读取。教程共 8 章 + 2 准备篇,覆盖虚拟文件系统(六大工具)、任务规划、子 Agent 委派(异步并行)及 Skills 复用(可在 Claude Code、Cursor 等 30+ 工具中通用)。
A gift to the Chinese developer community for anyone building agents on @LangChain: After 2 books on the ecosystem, I op...
LandingAI Agentic Document Extraction(ADE)现支持在 Parse 或 Parse Jobs 调用中传入 password 参数,同一请求完成解密、解析及结构化输出。该功能要求启用 Zero Data Retention(ZDR)模式,文档仅在内存处理,不持久化,适用于 HIPAA/PHI/PII 合规场景。支持 PDF、DOC、DOCX、ODT、PPT、PPTX、XLSX 格式。集成成本低:单一可选参数,非加密文件不受影响;缺密码返回 422 错误。密码经 HTTPS 传输,ZDR 下服务端不持久化,建议配合最小权限 API Key 与审计日志。REST API 及 Python/TypeScript 库均可用。
Parse password-protected documents! Agentic Document Extraction (ADE) accepts a password parameter directly in the Parse...
Data2Story是牛津和斯坦福研究人员基于Claude Code构建的技能,通过Detective、Analyst、Editor、Designer、Programmer、Auditor、Inspector七个专用AI智能体,将CSV文件自动生成包含研究背景、统计图表和可追溯来源的交互式在线文章。核心“检查员”面板为每个声明和图表提供结构化证据,93%的可见陈述可溯源(人类文章基线为25%)。在53位读者对18个数据集的评测中,AI文章在视觉设计、叙事节奏、数据透明度、可验证性和洞察力五个类别均胜出,74%的读者更偏好AI版本。但人类在编辑视角、创意设计和密集图形方面仍保持优势。项目已开源。
微信原生 AI 助手“小微”今日扩大灰度测试,支持文字或语音操作微信原生功能(调整设置、发送消息、拨打电话、点外卖、生成图片等),集成文件总结、提醒设置、音乐推荐。用户可一句话生成小程序(仅限个人使用,暂不支持分享),并可通过多轮对话修改风格。该功能由微信技术架构负责人周颢带队推进,计划 2026 年第三季度向更多用户推出。此前微信开放平台已于 6 月 8 日开放 AI 生态接入能力,微信支付同步发布 AI 专属卡。
同一事件,精选展示《微信AI官宣内测:两种接入模式供开发者选择》OpenAI 为 ChatGPT 新增「Scheduled」侧边栏页面,集中管理所有定时任务。用户可查看、暂停、编辑或删除任务。研究任务可搜索网页和已连接应用,仅在内容变化时发送提醒。所有任务速度更快、可靠性更高,用户可按具体时间或早晨、下午、晚间时段触发。该功能面向 Plus、Pro、Business、Enterprise 用户,活跃任务数量因套餐而异,最多每小时执行一次,用户不活跃时自动暂停。原有「Pulse」功能已整合进定时任务中。
上海交通大学等六所高校于6月18日在arXiv发布研究,提出BabelTele文本压缩方法。该方法融合多语言词汇、符号、表情,生成人类几乎无法阅读但大语言模型能准确理解的“AI语言”,可将文本压缩至27.9%,语义准确率保持99.5%。在QuALITY问答中,人类阅读压缩文本后准确率下降,而Gemini 3.1 Pro稳定。BabelTele在MeetingBank、QuALITY基准上优于传统摘要和LLMLingua-2,支持零样本跨模型传递。多智能体通信测试中可减少约40%通信Token,任务完成度超96%。
6月19日,马斯克旗下SpaceXAI面向微软Word、Excel、PowerPoint推出Grok扩展。安装后Office应用右侧出现侧边栏,支持自然语言指令操控。Word中,Grok可根据草稿和格式自动生成文档,识别语法错误并提出表述建议,还能调用X平台及互联网实时信息补充数据。Excel中,Grok可分析选中区域数据,进行统计、趋势识别并一键生成图表。PowerPoint中,输入主题、页数和风格,Grok自动生成幻灯片框架并填充内容。
同一事件,精选展示《xAI 发布 Grok for Word 插件》宝玉认为处理错误应先恢复生产(回滚或打补丁,保留日志),再找根因(逻辑错误、边界条件、需求理解偏差),最后根据根因决定如何避免。仅当根因是AI对项目特有约定缺乏了解时(如命名规范、API隐含限制、团队测试规范),才应更新AGENTS.md。其他情况应分别用新增测试用例、重构架构、改进Code Review等方式解决。将一切塞入AGENTS.md会导致文件臃肿、规则繁多,AI反而忽略关键规则。
错误发生 → 修复问题 → 追问原因 → 写入 AGENTS.md → 以后 AI 记住规则。
GPT-5.6 Pro 预计下周四发布,泄露信息显示其三项关键能力:视觉复刻已近乎能完全复刻设计;SVG 3D 生成表现超越 Fable 5,支持浏览器内旋转缩放;Playwright 浏览器自动化可真实操作网页(点击、输入、跳转、抓取)。这三项能力表明 OpenAI 正将 GPT 从语言模型进化为能执行物理操作的 Agent——不仅能“思考”,还能打开浏览器、移动鼠标、复制设计并保存到桌面。
金山办公副总裁王少康在“2026人民数据大会”上透露,将于下月(7月)正式推出组织级AI办公产品“企业大脑”WPS Comate,后续将规模化交付。该产品面向知识密集的中大型组织,主打复杂业务场景,整合并激活组织内结构化与非结构化数据,利用AI理解组织结构与协作关系,生成数字员工等AI产品融入业务运营与决策,帮助员工跨工具协同完成专业任务。后续金山办公将对接客户,根据不同公司情况定制专属“企业大脑”,实现数据、系统、流程和知识资源的高效连接,打造AI统一入口。
博客详解 Claude Code 的七种指令配置(CLAUDE.md、Rules、Skills、Subagents、Hooks、Output Styles、追加系统提示),从加载时机、压缩后保留性、token消耗与权威性三个维度对比。CLAUDE.md 分根目录(全程驻留)和子目录(按需加载);Rules 支持路径作用域节省 token;Skills 仅加载名称和描述,调用时载入完整内容;Subagents 独立上下文运行,只返回结果;Hooks 绕过压缩实现确定性控制;Output Styles 直接注入系统提示且永不被压缩;追加系统提示仅单次生效。文章给出实用决策原则,如用 Hook 跑 lint、用 Skills 封装部署流程等。
Show Codex a workflow once. Reuse it as a skill. Record & Replay lets you show Codex a recurring task, like filing an ex...