# LandingAI 推出 Agentic Document Extraction 的 Agent Skills

- 来源：meng shao (@shao__meng)
- 发布时间：2026-06-16 20:00
- AIHOT 分数：60
- AIHOT 链接：https://aihot.virxact.com/items/cmqgmcs0u00zjslic2du7t7h5
- 原文链接：https://x.com/shao__meng/status/2066853435618869361

## AI 摘要

LandingAI 将 Agentic Document Extraction 升级为 Agent Skills，支持在 Codex、Claude Code、Cursor 等 coding agent 的对话中直接调用，实现零脚本文档处理流水线。两个 Skill 分工明确：document-extraction 提供结构化 Markdown/层级 JSON 解析、基于 JSON Schema/Pydantic 的字段抽取、按文档类型拆分、按页分类路由（预览）、目录生成（预览）、异步大文件处理（最高约 1GB/6000 页）及元素级坐标与置信度可视化；document-workflows 封装并行批处理、Classify→Extract 混合流水线、RAG 准备（语义分块、embedding、ChromaDB/FAISS）、DataFrame/CSV/Snowflake 导出、bbox 标注叠加及 Streamlit 交互 UI。安装命令：`/plugin marketplace add landing-ai/ade-document-processing-skills`。

## 正文

LandingAI 把 Agentic Document Extraction 从「API 文档 + 手写脚本」升级成 Agent Skills --让 Codex、Claude Code、Cursor 等 Coding Agents 在对话里直接写出可用的文档处理流水线
http://github.com/landing-ai/ade-document-processing-skills

# 两个 Skill 的分工

1. document-extraction - 原子操作
· Parse：结构化 Markdown + 层级 JSON
· Extract：JSON Schema / Pydantic 字段抽取（发票、表单、表格等）
· Split：混合批次按文档类型拆分
· Classify：按页分类路由（Preview）
· TOC：生成目录结构（Preview）
· 大文件：异步处理（最高约 1GB / 6000 页）
· Visual grounding：元素级坐标与置信度

2. document-workflows - 生产级组合
· 并行批处理（ThreadPool / async）
· Classify → Extract 混合文档流水线
· RAG 准备：语义分块、embedding、ChromaDB/FAISS
· 导出 DataFrame / CSV / Snowflake
· 可视化标注（bbox 叠加、词级高亮）
· Streamlit 交互 UI

### 引用推文

> LandingAI：Turn Claude Code into a Document Processing Agent! We just released Agentic Document Extraction (ADE) skills for AI coding agents. Install them in Claude Code, ...
