13. 我希望OCR模型能覆盖所有文献,可否购买1拖N个OCR模型的一体机?
当然可以!具体原因和方案如下:
1. 要认识到,不同的“OCR模型”擅长处理的文献能力不一样。OCR文字的转录识别能力,主要取决于“OCR模型”。目前,我们已经推出了:
-
- “古籍拓片OCR模型”(用于处理竖排、端正字体(楷体、宋体、仿宋、隶书等)的古籍、拓片等文献)
- “民国报刊OCR模型”(用于处理晚清民国时期竖排、带新旧式标点符号、中英文混排的铅印、油印文献,包括民国报纸、民国图书、民国期刊等)
- “手写文书档案OCR模型”(用于处理竖排、手写行书草书类、中英文混排类文献,例如书信、档案、契约、合同等民间文献)
- “横排中英日OCR模型”(用于处理繁简体中文、英文、日文语种的横排、印刷体、手写行书草书类文献,例如印刷体图书、报纸、期刊,手抄写文献等)
2. 目前发售的“一体机”只携带单一模型。目前,我们发售的“古籍拓片OCR一体机”、“民国报刊OCR一体机”、“手写文书档案OCR一体机”、“横排中英日文OCR一体机”,都只携带单一模型。而事实上,图书馆、博物馆、档案馆要处理的文献类型比较多,有刻印、手写、油印、铅印,有横排、竖排,实际文献整理工作中,一定是希望实现全文献场景的覆盖,也就是任何文献都能通过OCR识别。那么,在单模型一体机的基础上进行OCR模型扩展,是必然之举。
3. 1拖N个OCR模型的一体机非常简单
整合后的使用界面
整合多个OCR模型后的使用界面与单一模型一模一样,只是在模型选择下拉框中选择即可。如下图所示:
整合多个OCR模型的好处
如果一个页面既有刻写的、又有手写的,那么对不同的文字选不同的模型进行识别就可以了。示例如下:
整合多个OCR模型会自动升级GPU算力
由于一台机器携带多个OCR模型,会增加算力消耗。我们对首次采购时即采用1拖N个OCR模型的一体机硬件进行升级,具体如下:
-
- 1台机器1个OCR模型,默认GPU为英伟达RTX4060 8GB
- 1台机器2个OCR模型,GPU显卡从默认的英伟达RTX4060 8GB→升级至英伟达RTX4070 16GB
- 1台机器3个以上OCR模型,GPU显卡从默认的英伟达RTX4060 8GB→升级至英伟达RTX4090 24GB
(更新日期:2025年5月29日)