# GPT-5.6 Pro 泄露：下周四发布，视觉复刻、SVG 3D、浏览器自动化三大能力曝光

- 来源：AYi (@AYi_AInotes)
- 发布时间：2026-06-20 14:38
- AIHOT 分数：52
- AIHOT 链接：https://aihot.virxact.com/items/cmqm0elho009esliiktwil2mc
- 原文链接：https://x.com/AYi_AInotes/status/2068222025919856720

## AI 摘要

GPT-5.6 Pro 预计下周四发布，泄露信息显示其三项关键能力：视觉复刻已近乎能完全复刻设计；SVG 3D 生成表现超越 Fable 5，支持浏览器内旋转缩放；Playwright 浏览器自动化可真实操作网页（点击、输入、跳转、抓取）。这三项能力表明 OpenAI 正将 GPT 从语言模型进化为能执行物理操作的 Agent——不仅能“思考”，还能打开浏览器、移动鼠标、复制设计并保存到桌面。

## 正文

GPT-5.6 Pro 泄露了，大概下周四发布，

发现大家都在讨论Juice Value 960 又涨了多少，但如果你把视觉复刻、SVG 3D、Playwright 浏览器自动化这三个词连起来看，会发现一件很重要的事，

OpenAI 在尝试把 GPT 从脑子变成手，

先看这三个词各自说了什么，
视觉复刻已经做到"几乎可以复刻设计"，以前 GPT 能描述你的设计哪里不对，现在它能直接复刻一个给你看

SVG 3D 生成表现优异，甚至超越了 Fable 5--不是生成一张静态图就完事儿，能生成可以在浏览器里旋转缩放的三维对象，

Playwright 浏览器自动化，这是最容易被忽略的技术点， ChatGPT 现在都能打开浏览器了̋（ˊ•͈ꇴ•͈ˋ）

不是假装打开，是真正操作网页：点击、输入、跳转、抓取

这三个词放在一起指向的已经不只是一个更强的语言模型了，已经是一个能做物理动作的 Agent 了，

以前 OpenAI 的比赛是谁的脑子最聪明，现在这场比赛多了一个项目：谁的手最稳

一个能和你聊天、告诉你该怎么做的人，现在能打开你的浏览器，移动你的鼠标，复制一个设计，生成一个 3D 图标，保存到桌面上。脑子还是那个脑子，但他已经长出手了
