Hacker News:AI 热帖
Show HN: 基于 TypeScript 的稳健 LLM 网页数据提取工具
AI 摘要
Lightfeed Extractor 发布基于 TypeScript 的 LLM 网页数据提取库,支持通过自然语言提示和 Zod schema 从 HTML、Markdown 或纯文本中提取结构化数据。核心功能包括 HTML 转 Markdown 预处理、JSON 模式输出、失败 JSON 自动修复及 token 追踪。可与 Playwright 集成加载动态页面,或配合 browser-agent 实现自然语言导航后提取,适用于电商竞品监控等生产级场景。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文github.com