# OpenAI ChatGPT 解锁 AI 填表技能：图像识别、语音输入和自动补全

- 来源：IT之家（RSS）
- 发布时间：2026-05-23 14:38
- AIHOT 分数：63
- AIHOT 链接：https://aihot.virxact.com/items/cmpi0dh3y0t0jsljw5gsml4i7
- 原文链接：https://www.ithome.com/0/954/309.htm

## AI 摘要

OpenAI于5月23日宣布为ChatGPT新增“AI填表”功能。用户上传表单图像后，可通过语音或文字指令描述需填写内容，系统将自动识别表单字段并完成信息补全。该功能整合了图像理解、语音交互与内容生成技术，实现“对话式”自动填写。目前输出为静态图片而非可编辑文档，且对上传文件清晰度有一定要求。

## 正文

IT之家 5 月 23 日消息，OpenAI 今天（5 月 23 日）发布公告，宣布 ChatGPT 解锁新技能，用户上传表单后，可直接用语音或文字说明填写内容，系统会识别表单字段、自动补全信息。

在最新演示中，用户上传一份健身会员表单后，只需口头说明姓名、地址和健身目标，ChatGPT 便能识别表单内容并自动填写。整个过程不是逐项手动录入资料，更像与助手对话。

在演示过程中，ChatGPT 成功串联图像理解、语音交互和内容生成整套工作流，支持一边读取上传图片中的表单字段，一边接收语音指令，并依据上下文生成填写内容。表单完成后，系统还能继续生成相关图片。

当前输出主要是静态图片，而不是可直接编辑的 PDF（便携式文档格式）或交互式文档，因此部分场景仍需人工二次转录。与此同时，上传文件必须足够清晰，否则提取和填写可能出错。

IT之家附上相关截图如下：