新加坡公司Sapiens AI旗下Agnes AI推出免费视频创作平台Pavo。用户提供一句话初始需求,平台自动生成需求、大纲、角色场景道具设计、分镜、关键帧及分镜视频,用户逐环节微调确认即可成片。Pavo免费使用Agnes自研模型,包括文本模型Agnes-2.0-Flash、图片模型Agnes-Image-2.1-Flash、视频模型Agnes-Video-2.0。即将上线的Agnes-Video-2.5-Preview在动作、角色、相机移动和场景连贯性上接近Veo 3。
万得推出面向个人金融从业者的AI原生工作平台万得AI,由豆包大模型2.0提供技术支撑,火山引擎提供弹性AI算力。万得AI采用多Agent推理模式,主智能体根据任务实时创建子智能体,调用数百个专业金融MCP工具和Agent,协同完成数据检索、策略分析、财务建模、图表生成等全流程金融工作。在实际评测中,豆包大模型2.0在内容忠实性、金融摘要、事实遵循、Agent规划与工具调用等维度均处于业界第一梯队。专业金融AI能力从机构场景走向个人用户,实现“一个账号即一支全建制金融团队”。
Scam.ai 今日宣布与高通合作,并推出面向实时视频通话的本地深度伪造检测模型 Halo。Halo 可在任何视频会议后台被动运行,实时标记合成或 AI 生成的视频,所有处理均在本地完成,不依赖云端。典型应用场景包括 HR 视频面试和高管通话。调查显示仅 31% 的 HR 主管认为自己能检测深度伪造,过去三年深度伪造欺诈尝试增加超 2000%。Halo 于 2026 年 6 月上线,企业集成细节将在未来几个月公布。
xFusion 在 ISC 2026 推出从边缘到数据中心的四层 AI 硬件:边缘级 FusionXtation X3 8000 Gen2 支持 70B-200B 参数模型本地运行,8K 渲染快 70%、AI 性能提升 50%;工作组级 FusionXpark 可双机联合处理 405B 参数模型,数据隔离外部 API;企业级 TokenBox 单机承载 1.6 万亿参数模型,液冷噪音 35 分贝;数据中心级 FusionServer G6550 V8 配合液冷平台,单柜 240kW,PUE 1.06,采用石墨烯垫片和钻石冷板,FusionOne DFS 三节点 72 NVMe 阵列实现 200 GB/s 顺序读取、94.1% 存储利用率。
Android 平台最新版谷歌翻译应用(版本号 10.23.29.934758792.2-release)出现了名为“连续打卡天数”的桌面小组件,可显示当前连续练习天数。用户点击小组件即可直接进入练习模式,小组件支持自由调整大小。该功能基于谷歌翻译练习模式原有的“连续练习”机制——用户每天完成一次练习即可增加连续打卡天数,类似多邻国的“连续学习天数”,旨在鼓励语言学习习惯养成。
高德正在内测一款名为“袋马”的 Vibe Coding 产品,用户通过自然语言描述功能需求,即可生成可直接上线、真机可用的微信小程序与 iOS 原生 App,无需编程知识或专业开发环境。产品面向无技术团队的个人从业者与中小主体,支持生成后通过二维码在微信端真机测试,并用自然语言提出修改需求,由 AI 自动迭代。高德官方暂未公布上线时间、行业合作模式及商业化细则。
由中国科学院计算机网络信息中心等单位联合研发的“异算方舟”国产计算系统软件生态全栈平台今日上线。平台底层搭载“九衍枢算法库”,汇集16款高性能计算工具,核心运算性能可实现十倍以上提速;代码转换大模型BoundX可自动适配多种国产算力环境,替代人工改写。平台实现算法、代码、应用全链条打通,解决国产算力下软件适配难、代码迁移难等痛点。
RepoPrompt 已开源,社区版上线GitHub。作者Provencher被OpenAI招安,条件是为付费用户做好安排:先免费再开源,付费用户获赠Codex Credits。该工具从仓库挑选文件生成prompt,解决超32K token使模型变笨的问题,称为“上下文工程”。开源版反转架构:内置MCP server为主控,底层CLI工具可替换,支持推理模型规划并并行分发子任务。目前仅支持macOS,可通过Homebrew安装。
RepoPrompt 作者被 OpenAI 招安了,然后这软件现在免费了,即将开源。 如果你是 RepoPrompt 付费用户会给你送 Codex 的 Credits。
We open-sourced BrowserBC: A system that turns human browser trajectories into reusable agent skills. Just one recording...
Wayfinder Router 通过分析提示词的结构(长度、标题、列表、代码)和措辞(证明、数学、硬约束),在微秒级完成路由决策,完全离线且无需调用其他模型。默认仅使用结构特征,词汇线索因盲测未泛化而默认为关闭。对比依赖模型调用的路由器(如 RouteLLM、NotDiamond),它避免了延迟、成本和随机性。用户可在自有数据上校准评分阈值。支持任何 OpenAI 兼容 API(含 Ollama、Anthropic、Groq、vLLM 等),可自托管。提供终端和网页演示(--dry-run 无需密钥),以及基准测试和 FAQ。
DeepSeek 开源 DSpark,一个面向生产环境的投机解码框架。核心解决传统投机解码中 draft 模型猜测后期 token 错误率高、浪费算力的问题。DSpark 采用并行 backbone + 顺序 Markov head 混合架构,消除后缀衰减;并引入置信度 head 和负载感知调度器,动态控制验证数量。在 DeepSeek-V4 生产系统中,单用户生成速度比 MTP-1 基线快 60-85%,吞吐提升 1.5x 至 5x。开源内容包括基于 V4 权重的 DeepSeek-V4-Pro-DSpark/Flash-DSpark checkpoint,以及 MIT 协议的 DeepSpec 训练代码,与北京大学联合开发。
DSpark from @deepseek_ai ingeniously integrates many speculative decoding ideas to achieve 1.5x to 5x higher throughput ...
据鸿蒙智行近日披露,华为途灵平台自2023年11月推出已完成三轮结构性技术升级,技术成果已应用于智界S7、问界M9(2023年)、尊界S800、享界S9/S9T(2025年)以及全新问界M9、尊界S800 Grand Design(2026年)。该平台让底盘具备感知与思考能力,实现“看-想-动”。余承东在5月全新问界M9发布会上表示,全新华为途灵龙行平台首创全域融合架构与全链路八大冗余设计,为L3时代做好准备。
中国网络安全公司360安全科技发布两款AI工具:“屠龙锋”用于自动化漏洞挖掘,“倚天镇”用于自动化网络防御。创始人周鸿祎称“屠龙锋”已发现3432个漏洞。他认为中国顶级AI模型仍落后西方20%-30%,因此采用基于智能体的方法将模型与安全专业知识及自动化工具结合。周鸿祎将Mythos类模型比作“AI时代的网络核武器”,呼吁中国建立对等战略威慑能力,避免美国垄断。清华大学教授唐杰(Z.ai创始人,近期发布GLM-5.2)预测中国“类Mythos”模型将在2027年第一季度前出现。
6月28日,法拉第未来在芝加哥Automate展会上推出“全美首款工业级轮臂机器人”Faber系列(U/T/S三款),应用于工业上下料与物流转运等场景。同时发布全新Futurist人形机器人标准版:身高173cm、重55kg(减重14%)、全身31自由度、膝关节峰值扭矩320N·m、1152Wh双电池续航6小时(上代3倍),支持7×24小时商用部署,定价89900美元(约61.2万元)。Ultra版年内发布,搭载Jetson Thor芯片,支持自主充电,面向高强度场景。
Adrafinil 是一款 macOS 菜单栏应用,仅在 Claude Code、Codex、Cursor、Gemini CLI、Aider、Hermes、OpenCode、Cline、Pi 等 9 种 AI coding agent 持有活跃会话时阻止系统睡眠(包括合盖睡眠)。无 agent 工作时,合盖后 Mac 正常睡眠。它通过各 agent 的钩子系统调用 CLI,往返延迟低于 50ms,支持引用计数断言、热切出(温度阈值强制释放)、空闲释放及进程嗅探。需要 macOS Tahoe 26.4,Xcode 26+ 构建,以签名公证的磁盘映像提供。
深圳开鸿数字产业发展有限公司 CEO 王成录宣布,全国首个开源鸿蒙机器人操作系统 M-Robots OS 正式完整捐献至开放原子开源基金会,专属一级根社区同步启动运营。该系统 1.0 版本于 2025 年 4 月发布,今年 5 月升级至 2.0 版本。2.0 版本具备积木式框架、混合部署、自研 M-DDS 分布式通信、硬件能力及算法共享、AI 原生及中间件生态兼容等核心能力,其中本体间音视频时延低至 4 毫秒,应用迁移成本降低 80%。
红魔游戏平板5 Pro公布软件功能:内置AI战术教练,支持赛前赛中提供选英雄、出装等指导;AI魔姬嘴替接入DeepSeek,实现自然回复交流。投屏助手支持1080P 185Hz/4K 144Hz无黑边低延迟投屏;新增剪辑应用和电子书模式(彩墨/黑白两种方案,可指定App开启)。该平板搭载第五代骁龙8至尊版(CPU主频4.6GHz),配备185Hz OLED电竞屏、新思S3930触控芯片(2000Hz瞬时报点率、300Hz多指原生触控采样率、10X超分辨率触控),升级红魔CUBE擎天游戏引擎3.0,支持2K 144Hz超分超帧并发及PC模拟器Steam直连。外观提供氘锋透明银翼/暗夜两款配色,RGB水冷灯效均匀度提升200%。
元宝与QQ浏览器联合推出的元宝高考通可帮助考生填报志愿。输入广东物理类612分等基本信息后,还能填写MBTI性格、就业偏好(直接就业/考研/考公/国企)。系统按“冲稳保”结构推荐院校,标注211/985/双一流标签,展示招生代码、计划人数、往年分数与分差。点击专业可查看校区地址、专业代码、学费。Agent对话支持追问宿舍空调、独卫等细节,信息源来自教育在线、掌上高考等官方平台。针对“既要就业好又不愿太痛苦”的复合需求,从交叉赛道给出分层建议,避免盲目追热门。该工具解决了信息分散难题,但最终选择仍需考生与家庭自主决定。
Codex 本周推出多项体验改进。超长线程处理更流畅,导航栏悬浮可预览和跳转对话回合。设置搜索覆盖更多控制项,外观与主机过滤选项更清晰,自定义提供商设置更易找到。缩放时工具提示、对话框、菜单等不再错位。复制到 Slack 保留 Markdown 格式,大文本粘贴不冻结 UI。此外还新增了专属 Pets 面板。
🆕 Codex quality-of-life updates landed this week Starting with long threads: scrolling is smoother now, and your place ...
Naver 于 6 月 26 日正式上线 AI 对话搜索服务“AI Tab”,定位为 AI 智能体搜索,旨在引导用户完成购买与预约。该服务整合 Naver 自家电商、地图、Cafe 社区、博客和本地生活服务,挑战谷歌 AI Mode。AI Tab 在回答深度和推理能力上不及 ChatGPT/Gemini,但在韩国本地餐厅推荐、商品发现及信息整理方面体验优于传统搜索。Naver 计划后续推出个性化房地产推荐和健康智能体服务。
博主 @旺仔百事通 透露,荣耀 Robot Phone 机器人手机将于 8 月上市,并确认后续有迭代版本。该机型于今年 3 月发布,顶部配备三轴云台相机,搭载 2 亿像素传感器,支持前后翻转;具备 AI 物体追踪、AI 视频剪辑与智能拍摄功能,可实现实时感知与补偿,保证视频稳定。荣耀 CEO 李健此前表示,首款 Robot Phone 将于三季度上市。研发历时一年,修改 5 版才完成雏形。
ViDA 团队开源的 BrowserBC 项目,探索更高效的 web agent 运行方式:先用强模型录制一次人类浏览器操作流程,将其蒸馏为可复用技能,再交给更小更便宜的模型执行。一次录制即可泛化技能。在 WebArena-Hard 上,tool calls 降低 27%,成功率从 60% 升至 81%。
We open-sourced BrowserBC: A system that turns human browser trajectories into reusable agent skills. Just one recording...
Weave 发布智能模型路由工具,通过 npx @workweave/router 安装,作为本地代理运行在 localhost:8080。它采用基于 Avengers-Pro 1 的集群评分器,每个请求自动选择最佳模型。支持 Anthropic、OpenAI、Gemini 原生 API,并通过 OpenRouter 接入 DeepSeek、Kimi、GLM、Qwen、Llama、Mistral 等开源模型。用户自行保管提供商密钥,数据本地加密存储。工具兼容 Claude Code、Codex、Cursor 等客户端,并提供 OTLP 追踪,支持自托管部署。
这个开源视频制作工作流真爽啊! 单日斩获3000 Star,真的牛~ 又一个把AI coding agent直接变成视频制作工作室的项目开源了,叫OpenMontage。 它把整个视频生产流程拆成12条结构化pipeline(动画解说、纪录...
Claude Code 桌面版更新,支持原生多会话拖拽分屏,将并行 Agent 工作流可视化。用户可在桌面 App 中开多个会话,左侧侧边栏统一管理,拖拽即可排列并排窗格,支持单独弹出窗口。内置终端、文件编辑器、预览面板均可分屏排布,底部同时显示多个会话的输入区。相比此前依赖 tmux 和终端窗口切换,效率大幅提升。
Vercel 开源了框架 Eve,将智能体视为一个目录:agent/instructions.md 定义系统提示,agent/agent.ts 配置模型等运行时参数;工具(agent/tools/ 下的类型化文件)、技能(agent/skills/ 下的 Markdown 文件,按需加载)、子智能体(内置 agent 工具实现委托)和人工审批(needsApproval 标记)均以文件形式存放,无需注册步骤。Eve 内置持久会话、沙箱、追踪和评估等生产级基础设施。
New in Runway, you can now localize ads. One image in, any language out. Input a single ad and get a version for every m...