查询文档列表
POST api.duxiele.com/v1/dataset/documents
上传完成文档后,开发者可以通过GET 到 v1/dataset/documents
接口查询历史上传过的所有文档列表。
请求参数
请求头 | 说明 |
---|---|
authorization | 认证数据(Bearer xxxxxxxx) |
当任务处理完成后,可以通过返回结果中url
字段下载原始文件,同时该文件会可以解析成多个segments
,文件被解析后分段数据,包含分段ID、内容、类型所处于pdf文件中的位置、坐标信息等
返回结构
返回体 | 说明 |
---|---|
data | DATA结构体(文档列表数据) |
has_more | 状态解释说明 |
limit | 一页多少条 |
total | 总分页数 |
page | 当前分页位置 |
DATA结构体(文档列表数据) | 说明 |
---|---|
id | 文档id |
name | 文档名字 |
mime_type | 文档版本/类型 |
status | 激活状态(active为已索引) |
extension | 文档的类型 |
word_count | 文档解析后总字数 |
created_at | 创建时间 |
示例
请求体:
curl 'https://api.duxiele.com/v1/dataset/documents' \
--header 'authorization: Bearer dT7vae8FWqIflQ4PfSXWFZwWHIbd4vDMGCLu' \
返回体:
{
"data": [
{
"id": "fd24d4dc-31a3-469b-b147-8052789c2d61",
"name": "katyguo.pdf",
"mime_type": "application/pdf",
"status": "active",
"extension": "pdf",
"word_count": 2018,
"created_at": 1703568951
},
{
"id": "66a1680b-4158-409d-8b53-0eb91b5df642",
"name": "发挥党组织和党员作用全力抗击疫情.pdf",
"mime_type": "application/pdf",
"status": "active",
"extension": "pdf",
"word_count": 1357,
"created_at": 1703231879
},
{
"id": "111a1bb3-c2e7-4e18-af09-385638b4a9b8",
"name": "成123.pdf",
"mime_type": "application/pdf",
"status": "active",
"extension": "pdf",
"word_count": 12,
"created_at": 1703232404
}
],
"has_more": false,
"limit": 20,
"total": 3,
"page": 1
}