阿里云发布面向AI智能体的约束基础设施(Constraint Infra),提供治理层解决Agent混乱问题。核心能力包括:通过Nacos热更新提示词与规则实现动态控制;支持token限制及多智能体安全的细粒度治理;已在生产环境验证,StarOps SRE智能体在该边界内安全运行高风险任务;通过AgentLoop数据飞轮驱动规则自我进化。
阿里云发布面向AI智能体的约束基础设施(Constraint Infra),提供治理层解决Agent混乱问题。核心能力包括:通过Nacos热更新提示词与规则实现动态控制;支持token限制及多智能体安全的细粒度治理;已在生产环境验证,StarOps SRE智能体在该边界内安全运行高风险任务;通过AgentLoop数据飞轮驱动规则自我进化。
Happy Horse 1.1 is now live on fal! Generate video with synchronized native audio and multilingual lip-sync Text to Vide...
Happy Horse 1.1 is live!
JoyAI APP 上线「欢乐足球季」主题活动,用户上传一张人像照片即可生成沉浸式赛场动态视频,支持近 20 款视频模板(看台抓拍、进球巅峰时刻、足球手势舞等),内置全景推进、特写定格等多类运镜逻辑,人物动作与表情自然拟合,赛场光影与人群动效同步渲染。同时上线近 50 款足球主题 AI 智能体,覆盖战术复盘、趣味评球、互动陪伴等方向。活动上线首周日均互动增长率超 158%。
OpenAI与Broadcom合作开发的ASIC芯片Jalapeño专为大语言模型推理设计,旨在降低对Nvidia硬件的依赖。OpenAI提供架构,Broadcom负责硅工程,TSMC制造,Celestica构建板卡系统。早期样品已运行未发布的GPT-5.3-Codex-Spark模型,达到目标频率和功耗。芯片集成Broadcom Tomahawk网络硅,通过最小化数据移动提高实际利用率。去年ChatGPT成本84亿美元,今年预计达140亿美元,周用户9亿。公司未来八年承诺约1.4万亿美元计算投入,年收入250亿美元。
谷歌升级 Gemini 3.5 Flash 模型,原生引入“Computer Use”工具,并搭配 Chrome 149 浏览器增强 AI 交互。Chrome 新增“Select from screen”功能,用户可框选屏幕上的图片或文字,直接送入 Gemini 提示词,获得针对性 AI 交互,例如在鞋类网站选中多双运动鞋询问适合的跑步风格。该功能类似 Google Lens,但由对话式 AI 处理。Computer Use 工具使 AI 智能体能在网页、桌面、移动端执行访问网站、填写表单、点击按钮等复杂任务。
iOS 27 引入独立 Siri 应用,采用聊天机器人风格,用户可在文本框输入发起 AI 聊天,支持上传图片和文件附件、查看历史对话。该应用默认调用 Siri AI,用户需长按输入框并点击“Ask…”按钮,在弹出的选择窗口中手动切换至 ChatGPT。目前仅支持 Siri AI 和 ChatGPT 两个选项,且关闭并重新打开应用后选择会回到 Siri,设置中暂不支持永久将 ChatGPT 设为默认模型。
6月25日0时起,文心一言官网提问入口关闭。用户可在6月25日至7月25日登录官网下载对话记录等个人数据,7月25日后截止导出。7月26日服务升级至百度文心网站,用户可继续使用智能对话、内容创作等功能,并体验AI志愿报告、AI PPT等新功能。2025年2月13日前购买的付费会员未完成退款可申请按剩余时长比例退还。
理想AI眼镜Livis六月OTA升级,新增6项功能、优化6项功能。新增同声传译(聆听模式与对话模式),韩语、日语等19种语言8月上线。新增手机端语音助手唤醒(长按触控区),支持单次指令与多轮对话。新增按键与触控区个性化设置(可自定义拍照/录像/录音,长按唤醒“理想同学”或手机语音助手)。新增眼镜盒低电量弹窗提醒(低于20%)。新增理想同学拟人化知性音色。单次录音时长放开至最高7小时。优化竖版视频画质(影像数据处理能力提升42%),优化视频传输(同画质下传输时间缩短约20%)。
谷歌于六月推出Open Knowledge Format(OKF)规范,参考AK的LLM wiki思路。核心是用Markdown加YAML frontmatter将知识组织为可读、可版本控制、可直接被AI智能体(Agent)消费的文件包。示例中,Codex读取该文章后,将自身做过的项目整理为OKF格式并添加到系统记忆索引中。文章见评论区。
一款开源路由框架(非API售卖),让用户自行申请各厂商免费API密钥,通过配置实现自动负载均衡与故障切换,从而零成本使用10亿+免费LLM Token。操作极简:克隆仓库、填入密钥、将应用指向本地端点,30秒即可运行,无需手写回退逻辑。项目几周前刚发布,作者开放改进建议,GitHub链接见评论。
http://x.com/i/article/2069352641423896576
iOS 27 版苹果日历应用升级,引入基于 Apple 智能的“智能事件详情”功能,支持自然语言输入事件和提醒,系统自动补全标题、时间、地点和受邀者,可手动关闭。界面改为卡片式浮层,图标辅助操作。iCloud 日历补齐忙碌/空闲标记。新增 List 和 Up Next 两个超大尺寸小组件,显示更多事件和提醒。新版 Siri 加入屏幕感知与个人上下文理解,管理日程更便捷。
阿里云发布 HappyHorse 1.1 版本,同时启动 HorsePower AI Cinema Awards 全球竞赛。短片《向日葵》作为宣传内容,讲述了出租车司机老周与重病小女孩之间的温情故事,展现该平台在情感叙事与 AI 创意生成方面的能力。
PaddleOCR 的 PP-OCRv6(对应 PaddleOCR 3.7)正式上线 HuggingFace,精度进一步提升,并新增 transformers 和 ONNX Runtime 两个推理后端。用户可通过统一 API 在不同后端之间无缝切换,无需大幅修改代码。PP-OCRv6 是工业界广泛使用的开源 OCR 方案,此次上架 HF 并支持多后端,降低了工程接入门槛,尤其利好希望在 transformers 生态中直接使用高性能 OCR 的开发者。
PP-OCRv6 is now on @HuggingFace! 🎉 Not just better accuracy- PaddleOCR 3.7 also adds transformers & ONNX Runtime backen...
高通在投资者日发布 Dragonfly 方案,含 HBC 分离式架构(2D 基板+TSV 堆叠 LPDDR DRAM,能效与 TCO 优于 HBM)、C1000 CPU(250+ Oryon 内核、>5GHz,能效达竞品 2 倍,2028 年上市)及 AI300 推理平台(HBC Gen 2,每 W 带宽较今天 GPU 提升 4~8 倍,有效内存带宽为 AI200 的 54 倍,2028 年送样)。HBC Gen 1 的 AI250 加速器单卡读写 133TB/s,有效带宽为 AI200 的 18 倍,2027 年中启动样品测试。高通另提供芯片设计服务与 800G/1.6T 互连方案。
6 月 24 日,科技媒体报道苹果在 iOS 27 Beta 2 更新中收紧 Siri AI 规则,禁止其对用户提供的 URL 链接进行总结、阅读或提取信息。Siri AI 系统提示词新增指令,明确无法跳转访问网页,且不提供后续建议或变通方案。该调整可能关联苹果网页生态策略,防止 AI 直接抓取内容冲击网站流量。不过,在 iOS 27 版 Safari 浏览器中打开网页后,仍可通过 Apple Intelligence 摘要页面内容。
盈透证券(Interactive Brokers)近日与 Grok 集成,用户可在几分钟内免费关联现有账户,无需注册新账户。通过自然语言与 Grok 对话,可完成组合收益分析(如股息与利息预测)、行业/地区/经济事件的风险敞口情景建模、市场趋势研究,并直接生成对冲订单等实时交易指令,实现从数据洞察到执行决策的一体化。
Simon Willison 受 Mozilla 新 MDN MCP 服务启发,将 mdn/browser-compat-data 的浏览器兼容性数据转为 SQLite 数据库。他用 Claude Code for web (Opus 4.8) 生成基于 sqlite-utils 的转换脚本,再用 Codex Desktop (GPT-5.5) 编写 GitHub Actions 工作流,将约 66MB 数据库 force-push 到仓库的 db 孤立分支,使其可通过 GitHub CDN 访问并附带开放 CORS 头。用户可直接下载或通过 Datasette Lite 在线探索。
Claude Code v2.1.191 新增 /rewind 命令,支持从 /clear 前恢复对话。修复流式响应时滚动位置跳到底部、后台智能体停止后复活等问题。改进 MCP 服务器可靠性,对 tools/list 等请求增加短暂退避重试;优化 OAuth 流程,无头环境直接跳过浏览器弹窗。流式响应 CPU 使用率降低约 37%(通过合并文本更新间隔至 100ms),并减少终端输出缓存带来的内存增长。
OpenAI与Broadcom宣布推出名为Jalapeño的定制ASIC芯片,专为数据中心大规模大语言模型推理设计。该芯片基于OpenAI研究人员提供的洞察及未来模型路线图,研发耗时9个月。早期测试显示其能效显著优于当前最先进方案,但完整性能数据尚未公布,详细技术报告将在未来数月内发布。该项目旨在通过垂直整合降低对Nvidia等外部供应商的依赖,首批芯片计划于今年年底部署到数据中心。
Artificial Analysis 发布 AA-Briefcase 基准测试,测试模型在多周项目语境下生成财务模型、董事会演示等交付物。关键结果:Claude Opus 4.8 平均每任务 23 分钟,得分最高但最慢;GPT-5.5 (xhigh) 仅 11 分钟,效率最高且 Elo 前五;GLM-5.2 得 1261 分耗时 16.3 分钟,为开源模型最佳;MiniMax-M3 得 1113 分。已下架的 Claude Fable 5 约需 28.5 分钟。工具调用仅占耗时 12%,其余由输出冗余、回合数和推理速度决定。
Google Flow Agent 新增 Google Maps Street View 实景锚定功能,支持根据用户提示中的地名或街道地址,为图片和视频生成提供真实世界细节。用户需启用 Agent 模式并在提示词中包含具体地点。目前该功能仅限美国街景位置可用。
Google Flow 🤝 @GoogleMaps Street View Your agent in Google Flow can now generate images and videos grounded in @GoogleM...
Notion 通过 Cursor SDK 在数周内将编码智能体嵌入产品。用户可在文档中@Cursor、在讨论串中提及或向数据库指派任务,Cursor 即可端到端完成规划、构建、测试、验证并自动创建 PR。集成基于一套 Provider 无关的智能体框架,Notion 的讨论串对应一个 Cursor 智能体,每条消息对应一次智能体运行;结果通过 SSE 流式传输,支持断连恢复。Cursor SDK 提供与生产环境相同的模型、运行时和远程 MCP 支持,让 Notion 无需自建智能体基础设施即可获得完整栈编码能力。用户还可自定义模板、MCP 服务器、技能和子智能体,并设置自动触发规则。
Gradium 发布两款实时语音翻译模型:stt-translate(语音转文本)和 s2s-translate(语音转语音)。两者覆盖英语、法语、德语、西班牙语、葡萄牙语共 5 种语言、20 个语言对,将转录和翻译合并为一步,传统 3 模型级联缩减为 2 模型。stt-translate 在 BLEU 和 MetricX 指标上领先 gemini-3.5-live-translate,BLEU 领先 gpt-realtime-translate,MetricX 可比。s2s-translate 平均延迟 3.0s,优于 gpt-realtime-translate(3.6s),略逊于 gemini-3.5-live-translate(2.9s)。支持从目录选择输出语音或克隆自己的声音,通过单条双工 WebSocket 传输。
http://x.com/i/article/2069789657777225729
Excited to introduce Computer Use support for Gemini 3.5 Flash!🔥 This enables Gemini to reason and act across platforms...
OpenAI 本周三发布首款定制推理处理器 Jalapeño,由博通制造,OpenAI 自有 AI 模型参与了芯片开发。该芯片专为推理系统设计,早期测试显示单位功耗性能显著优于当前业界替代方案,运行实时编码模型时运营成本低。此举旨在降低对 NVIDIA GPU 的依赖,并优化 Codex 等 Agent 产品及底层基础设施。OpenAI 正从芯片架构、内核、内存系统到部署体验进行全栈协同优化,以使模型更快、更可靠、更经济。
AI 生成假设的速度已超过湿实验室验证能力。Tetsuwan 构建了浏览器端云生物学平台:研究者上传或描述实验协议,添加样本、体积、浓度、处理条件、仪器设置等变量,ResearchOS 将其转化为可编辑的实验规范,再编译为机器人可执行脚本(PDL/VDL 语言捕获流程与变量上下文,Ariadne 转为机器人指令)。用户可远程审查与模拟,随后云实验室自动执行,无需进入物理实验室。平台经两年试点验证,今年晚些时候将上线首项服务,聚焦蛋白质设计功能筛选。
Automating the lab bench is the best thing we can do for AI in biology. Most experiments are still run by hand. Every bi...
We've designed and built our first AI chip: Jalapeño. Designed from the ground up by OpenAI and brought to production wi...
The 100x org went viral. Half the internet hated it. The other half was curious. One month later: output is up. producti...
Facebook 近日宣布将 Creator Studio 工具重新打造为独立 AI 伴侣应用,帮助创作者扩大受众。应用内置了近期推出的 AI 创作者助理,可根据内容风格、表现、受众互动和目标提供个性化建议。创作者可通过对话向 AI 助理提问“何时发布”及“评论里人们在说什么”,并追问受众变化趋势。应用还包含 AI 评论工具,可高亮重要评论并以创作者的语气草拟回复,创作者在发布前可编辑确认。每日打开应用会看到优先事项信息流,包括最新帖子表现、目标进度和需回复的评论。目前该应用正在与部分创作者测试中。
OpenAI 与博通(Broadcom)联合发布一款专为大语言模型(LLM)推理优化的芯片。该消息发布于 2026 年 6 月 24 日,在 Hacker News 上获得 105 个点赞。