Skip to content

查询文档列表

POST api.duxiele.com/v1/dataset/documents

上传完成文档后,开发者可以通过GET 到 v1/dataset/documents 接口查询历史上传过的所有文档列表。

请求参数

请求头说明
authorization认证数据(Bearer xxxxxxxx)

当任务处理完成后,可以通过返回结果中url字段下载原始文件,同时该文件会可以解析成多个segments,文件被解析后分段数据,包含分段ID、内容、类型所处于pdf文件中的位置、坐标信息等

返回结构

返回体说明
dataDATA结构体(文档列表数据)
has_more状态解释说明
limit一页多少条
total总分页数
page当前分页位置
DATA结构体(文档列表数据)说明
id文档id
name文档名字
mime_type文档版本/类型
status激活状态(active为已索引)
extension文档的类型
word_count文档解析后总字数
created_at创建时间

示例

请求体:
curl 'https://api.duxiele.com/v1/dataset/documents' \
--header 'authorization: Bearer dT7vae8FWqIflQ4PfSXWFZwWHIbd4vDMGCLu' \
返回体:
{
    "data": [
        {
            "id": "fd24d4dc-31a3-469b-b147-8052789c2d61",
            "name": "katyguo.pdf",
            "mime_type": "application/pdf",
            "status": "active",
            "extension": "pdf",
            "word_count": 2018,
            "created_at": 1703568951
        },
        {
            "id": "66a1680b-4158-409d-8b53-0eb91b5df642",
            "name": "发挥党组织和党员作用全力抗击疫情.pdf",
            "mime_type": "application/pdf",
            "status": "active",
            "extension": "pdf",
            "word_count": 1357,
            "created_at": 1703231879
        },
        {
            "id": "111a1bb3-c2e7-4e18-af09-385638b4a9b8",
            "name": "成123.pdf",
            "mime_type": "application/pdf",
            "status": "active",
            "extension": "pdf",
            "word_count": 12,
            "created_at": 1703232404
        }
    ],
    "has_more": false,
    "limit": 20,
    "total": 3,
    "page": 1
}