在售产品

在售产品

目录
< 所有主题

2. 图像上传区功能与参数

 

2. 图像上传区功能与参数

↑ 图像上传区

上图为图片上传区,其中有很多参数可以自定义。具体如下:


1. 上传1-N个图片或PDF

支持一次批量上传1-N张图片,或上传1-N个PDF。

2. 图像上传区功能与参数


2. 选择OCR模型

支持用户根据不同的文献,选择不同的OCR模型。具体如下:

  • 古籍拓片OCR模型:擅长刻本+稿本(手写宋体/楷体/行书/隶书)+竖排汉字+不带标点符号的文字
  • 民国报刊OCR模型:擅长铅印+新旧式标点符号+竖排汉字
  • 手写行草OCR模型:擅长手写(行书/草书)+竖排汉字+标点符号+中英文混排
  • 横排OCR模型:擅长横排繁简体+中英文混排+铅印+手写(楷书/行草)汉字

2. 图像上传区功能与参数


3. 按“文本框”或“整列”返回OCR结果

支持用户根据需要按单个文本框、或整列返回OCR结果。

2. 图像上传区功能与参数

4. 最长边大小

支持用户根据不同文献的幅面调整最长边大小,最长边过大或过小都会影响识别的准确率。具体如下:

  • 普通古籍:最佳最长边大小设定为800-1200,默认为800
  • 模糊不清或文字密集:最长边大小设定为1200-1500
  • 卷轴或长宽比例过大:需要试验调整,一般设定为2000-3000内的值就有很好的识别效果;如果识别效果不佳,可以调整为更小(最小不低于800)、或更大(最大不超过4000)

2. 图像上传区功能与参数

5. 上传图片时是否OCR

  • 默认勾选状态,表示上传图片时进行OCR自动识别。由于上传时需要OCR识别,等待时间会比较长。
  • 取消勾选,表示上传图片时只按最长边大小resize图片但不进行OCR。由于上传时不需要OCR识别,等待时间不长,但后续需要人工拉框识别。

是否“勾选”的原则:如果可预见识别效果不佳必须要人工手动干预时(例如,犬牙交错的文本必须手工干预),可以去掉“勾选”不进行OCR,以免浪费时间;如果可预见识别效果会很好,或者可预见只有少数地方需要人工干预,可以默认“勾选”。

2. 图像上传区功能与参数

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信