# Show HN： 基于 TypeScript 的稳健 LLM 网页数据提取工具

- 来源：Hacker News：AI 热帖
- 作者：andrew_zhong
- 发布时间：2026-03-26 11:55
- AIHOT 链接：https://aihot.virxact.com/items/cmnw1z0iz023rslc3bkr9z9b7
- 原文链接：https://github.com/lightfeed/extractor

## AI 摘要

Lightfeed Extractor 发布基于 TypeScript 的 LLM 网页数据提取库，支持通过自然语言提示和 Zod schema 从 HTML、Markdown 或纯文本中提取结构化数据。核心功能包括 HTML 转 Markdown 预处理、JSON 模式输出、失败 JSON 自动修复及 token 追踪。可与 Playwright 集成加载动态页面，或配合 browser-agent 实现自然语言导航后提取，适用于电商竞品监控等生产级场景。

## 正文

该来源未收录可展示正文，站内仅提供摘要。
