跳转到主要内容

概述

ADP 是来也科技基于大模型通用理解能力的智能体文档处理产品(Agentic Document Processing,简称 ADP):不依赖规则与标注,具备多语种、多模态、多场景的通用理解能力;智能体自主规划与执行,能理解任务目标、自主拆解步骤、调用工具、完成复杂任务;从文档输入到业务决策再到人机协同,形成端到端的业务自动化闭环。 agentic-doc-parse-and-extract(简称 ADP CLI)是 ADP 的官方开源命令行工具,同时支持手动终端调用与 AI Skill 自动调用。一句命令即可完成:结构化文档解析 + 关键字段智能抽取,覆盖发票、订单、证件、票据、通用文档等全场景,输出标准 JSON,无缝接入自动化与 AI 工作流。

GitHub

laiye-ai/adp-cli

NPM

@laiye-adp/agentic-doc-parse-and-extract-cli

PyPI

agentic-doc-parse-and-extract

Releases

预编译二进制包

核心功能

agentic-doc-parse-and-extract 专注于文档全流程的智能化处理,兼顾手动终端调用与 AI Agent 自动调用。核心功能覆盖解析、抽取、批处理全场景,无需复杂配置,一句命令即可完成:
功能描述适用场景
Document Parsing自动识别 PDF、图片等多格式文档,将杂乱的非结构化内容(扫描件、手写本、复杂版面)转为标准化结构化数据,同时保留原始层级与关键关系将非结构化文档转为 LLM 可读的结构化数据,供后续抽取
Out-of-the-Box Extraction基于 ADP 大模型原生 AI 能力,内置发票/收据/订单/中国常用证件等标准化抽取模型,无需配置规则或人工标注,一键抽取关键字段并输出标准 JSONAP 自动化、费用管理、采购自动化、卡证信息快速入库
Custom Extraction支持自主创建、编辑与管理个性化抽取应用,为企业专属文档与行业定制表单配置专属字段与识别逻辑企业专属/行业定制/非标准化文档的私有抽取需求
Task Query支持异步任务提交与状态查询,快速查看任务执行进度、成功/失败状态与最终处理结果批量任务处理、异步文档处理、问题追溯与记录追踪
Application Management提供完整的应用管理能力,可查看全部可用抽取应用(系统内置 + 自定义)、查询应用详情、管理应用标签多场景业务切换、应用全生命周期管理、自定义应用管理

安装与更新

pip install -e .
PyPI 包不再维护,请通过 npm 更新到最新版本。

配置

adp-global.laiye.com 获取 API Key(新用户每月 100 免费 credits)。
adp config set --api-key <your-api-key>
adp config set --api-base-url https://adp-global.laiye.com
adp config get

快速示例

# 列出可用应用
adp app-id list

# 解析本地文档
adp parse local ./invoice.pdf --app-id <app-id>

# 抽取关键字段
adp extract local ./invoice.pdf --app-id <app-id>

# 异步批量处理目录
adp parse local ./documents/ --app-id <app-id> --async

# 远程 URL 处理
adp extract url https://example.com/file.pdf --app-id <app-id>

# 查询异步任务
adp parse query <task-id>

# 两阶段异步(提交与查询分离,可恢复)
adp extract local ./documents/ --app-id <app-id> --async --no-wait --export tasks.json
adp extract query --watch --file tasks.json

# 失败自动重试(最多 2 次)
adp parse local ./documents/ --app-id <app-id> --retry 2

# 查看剩余额度
adp credit

命令列表

AI Agent 应调用 adp schema 获取机器可读的权威命令规范。下表为人类友好的速查摘要。
命令说明
adp version输出版本
adp config set设置 API key / base URL
adp config get显示当前配置
adp config clear清除配置
adp app-id list列出可用应用
adp app-id cache从本地缓存读取应用列表
adp parse local <path>解析本地文件/目录
adp parse url <url>解析远程文件(支持 URL 列表文件)
adp parse base64 <data>解析 Base64 内容
adp parse query <task-id...>查询异步解析任务(支持多个 ID 或 --file
adp extract local <path>抽取本地文件/目录
adp extract url <url>抽取远程文件
adp extract base64 <data>抽取 Base64 内容
adp extract query <task-id...>查询异步抽取任务(支持多个 ID 或 --file
adp custom-app create创建自定义抽取应用
adp custom-app update更新自定义应用配置
adp custom-app get-config显示应用配置
adp custom-app delete删除自定义应用
adp custom-app delete-version删除指定配置版本
adp custom-app ai-generateAI 推荐抽取字段
adp credit显示剩余额度
adp schema输出命令 schema(供 AI Agent 使用)

Flags

Flag说明
--jsonJSON 输出
--quiet静默模式,仅输出结果
--lang <en|zh>界面语言
--app-id应用 ID(parse / extract 必填)
--async异步模式
--no-wait仅提交任务、不等待结果(与 --async 配合)
--export <path>导出结果到文件(单文件)或目录(批量)
--timeout <seconds>超时(默认 900s)
--concurrency <n>并发数(免费版最大 1,付费版最大 2)
--retry <n>可重试错误的重试次数(默认 0)
--file <path>从 JSON 文件读取任务 ID(--no-wait 的输出,仅查询用)

异步工作流

对于大文件或批量任务,使用 --async 提交,CLI 返回 task-id,再通过 parse query / extract query 轮询结果:
adp parse local ./big.pdf --app-id <app-id> --async
# 返回 task-id

adp parse query <task-id>

两阶段异步(--no-wait

默认情况下 --async 会提交并轮询直到完成——适合 AI Agent。对于可恢复的工作流,使用两阶段模式: Phase 1 提交任务:
adp extract local ./documents/ --app-id <app-id> --async --no-wait --export tasks.json
输出为带任务 ID 的 JSON 数组:
[
  { "path": "invoice.pdf", "task_id": "task_abc123" },
  { "path": "contract.pdf", "task_id": "task_def456" }
]
Phase 2 查询结果:
adp extract query --watch --file tasks.json
adp extract query --watch --file tasks.json --export ./results/
即使 CLI 中途崩溃,tasks.json 中的任务 ID 仍保留——随时可用 query --file 恢复。

批处理

处理多个文件/URL 时,CLI 会将每个结果写入独立文件:
adp_results_20250417_153020/
├── _summary.json              # 汇总:总数、成功、失败、逐件状态
├── invoice_01.pdf.json        # 成功结果
├── contract_02.docx.json
└── report_03.pdf.error.json   # 错误详情
  • --export <dir> — 指定输出目录
  • 不带 --export — 自动创建 adp_results_<timestamp>/
  • 单文件 — 输出到 stdout 或 --export 指定的文件路径

Exit Codes

Code含义
0全部成功
1全部失败 / 系统错误
2参数错误
3资源不存在
4权限不足
5冲突
6部分失败(批量中部分任务失败)

环境变量

变量说明
ADP_API_KEYAPI key(覆盖配置文件)
ADP_API_BASE_URL服务 URL
ADP_LANG界面语言(en / zh
ADP_LOG_LEVEL日志级别(debug / info / warn / error

配置存储

  • 配置目录:~/.adp/
  • 配置文件:~/.adp/config.json
  • 加密 API key:~/.adp/key.enc(AES-256-GCM)
  • 应用缓存:~/.adp/app_cache.json
  • 版本检查缓存:~/.adp/version_check.json(每 24 小时刷新)

许可证

采用开源工具 + 付费服务的组合模式:CLI 工具完全免费开源,便于快速集成;核心 ADP 智能解析能力为公有云商业服务,按实际用量计费,旨在提供高准确率、稳定的文档处理体验。
  • CLI 工具:MIT 开源,可自由使用、修改与分发
  • ADP 服务:基于公有云的 AI 文档处理服务,按使用量计费
免费额度:新用户注册后每月可获得 100 免费 credits,体验全部功能。

支持与联系

ADP CLI 使用指南

CLI 文档

OpenAPI 使用指南

API 文档

公有云操作手册

用户指南

GitHub Issues

问题反馈