2. 图像上传区功能与参数
↑ 图像上传区
上图为图片上传区,其中有很多参数可以自定义。具体如下:
1. 上传1-N个图片或PDF
支持一次批量上传1-N张图片,或上传1-N个PDF。
2. 选择OCR模型
支持用户根据不同的文献,选择不同的OCR模型。具体如下:
- 古籍拓片OCR模型:擅长刻本+稿本(手写宋体/楷体/行书/隶书)+竖排汉字+不带标点符号的文字
- 民国报刊OCR模型:擅长铅印+新旧式标点符号+竖排汉字
- 手写行草OCR模型:擅长手写(行书/草书)+竖排汉字+标点符号+中英文混排
- 横排OCR模型:擅长横排繁简体+中英文混排+铅印+手写(楷书/行草)汉字
3. 按“文本框”或“整列”返回OCR结果
支持用户根据需要按单个文本框、或整列返回OCR结果。
4. 最长边大小
支持用户根据不同文献的幅面调整最长边大小,最长边过大或过小都会影响识别的准确率。具体如下:
- 普通古籍:最佳最长边大小设定为800-1200,默认为800
- 模糊不清或文字密集:最长边大小设定为1200-1500
- 卷轴或长宽比例过大:需要试验调整,一般设定为2000-3000内的值就有很好的识别效果;如果识别效果不佳,可以调整为更小(最小不低于800)、或更大(最大不超过4000)
5. 上传图片时是否OCR
- 默认勾选状态,表示上传图片时进行OCR自动识别。由于上传时需要OCR识别,等待时间会比较长。
- 取消勾选,表示上传图片时只按最长边大小resize图片但不进行OCR。由于上传时不需要OCR识别,等待时间不长,但后续需要人工拉框识别。
是否“勾选”的原则:如果可预见识别效果不佳必须要人工手动干预时(例如,犬牙交错的文本必须手工干预),可以去掉“勾选”不进行OCR,以免浪费时间;如果可预见识别效果会很好,或者可预见只有少数地方需要人工干预,可以默认“勾选”。