|
|
3aee6af9ae
|
```
feat(server): 增加对PDF公告内容的解析支持
- 新增 `fetchPdfUrlFromApi` 函数,用于从 jszbcg.com 的 API 接口获取 PDF 文件链接
- 新增 `extractPdfUrl` 函数,作为备选方案从 HTML 页面中提取 PDF 地址
- 新增 `fetchPdfContent` 函数,使用 pdf-parse 库下载并解析 PDF 内容
- 新增 `parseDetailEnhanced` 函数,整合 HTML 和 PDF 解析逻辑,优先使用 PDF 内容
- 修改预算金额验证范围上限,从 1000000 万元提升至 100000000 万元
- 在 /api/details、/api/report、/api/report-daterange 接口中启用增强解析逻辑
- 新增 /api/test-pdf 接口用于测试 PDF 解析功能
- 添加 pdf-parse 依赖到 package.json
```
|
2025-12-15 11:40:58 +08:00 |
|
|
|
b044e918aa
|
```
feat(readme): 对部分文本进行格式调整,包括金额数字空格分隔、API 参数说明优化、标题层级对齐等,提升可读性。
```
|
2025-12-15 10:36:18 +08:00 |
|
|
|
745faa0ecc
|
```
feat(public): 实现按数量抓取多页数据功能
在普通模式下,支持根据用户指定的数量抓取多页列表数据,直到满足所需数量或达到最大页数限制。增加分页请求逻辑与延时控制,提升数据获取稳定性。
feat(server): 改进详情页解析与预算金额提取逻辑
增强标题、发布时间和正文内容的选择器容错能力,支持多种页面结构。优化预算金额提取规则,引入优先级匹配机制,并支持元转万元计算,提高数据准确性。
```
|
2025-12-14 19:21:19 +08:00 |
|
|
|
83a8a3bb9a
|
初始化
|
2025-12-12 15:54:04 +08:00 |
|