2. 民国报刊OCR一体机

一、详细配置
· 民国报刊OCR AI模型1个。民国报刊OCR模型的特点:
-
- 支持Unicode13.0的9.9万汉字识别,轻松识别民国报纸、期刊中的繁体字、异体字、俗体字、避讳字、生僻字
- 独家排序算法,支持一页2栏、一页3栏、一页多栏文本的自动排序
- 支持人工校正的手动拉框识别,自主掌控识别精度
- 支持本地离线断网部署,OCR源代码和模型全部部署在一体机上,离线断网保证珍贵文献的安全不外泄
· Pro版用户界面1套(用户界面详见演示系统http://www.deepcivi.com/mgocr-demo.php)
-
- 支持1-N张图片或1-N个PDF文件批量上传
- 支持自定义古籍幅面最长边自定义,支持普通幅面图书、期刊、超大幅面报纸、超小幅面的碎片古文字识别
- 支持手动拉框识别,在自动OCR识别+手动拉框识别双重配合下,将复杂的图书、报纸、期刊场景一网打尽
- 支持后处理,用户可以对报纸的卷次、章节、墨围、墨盖子、序跋等进行标注
- 支持在线图文校对、文本编辑、在线效果预览
- 支持图文混排的图表截取
- 支持集外字原图截取
- 支持导出word文本、导出图文校对的图片
- 支持异体字-转繁体、转简体(需扩展定制)
- 支持AI自动标点(需扩展定制)
· 搭载OCR AI模型+用户界面的本地私有化部署一体机1台(单机版,可离线断网)。软硬件配置:
-
- 英伟达RTX4060 8GB GPU显卡1张,支持CUDA;
- 酷睿14代i9-14900k CPU 1块;
- 主板1块;32GB 内存;
- 512GB固态+4TB STATA硬盘1块;
- 1000W电源1个;
- DELL 机箱;
- 21吋 显示器1个;
- 鼠标键盘1套;
- CentOS7.9可视化操作系统
- 可个性化定制扩展模块。用户可根据要处理文献的实际需求,购买扩展模块一并进行本地化部署。可扩展的模块(不单独销售):
-
- 异体字-繁体字/简体字转换模块(准确率接近100%,购买后将直接集成到Pro版用户界面)
- 模型扩展(OCR模型工作时会消耗算力,同时购买2个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4070 12GB;同时购买3个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4080 16GB;同时购买4个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4090 24GB)
- 古籍拓片OCR模型(准确率99.36%,购买后模型将直接集成到Pro版用户界面)
- 手写文书档案OCR模型(即将推出,购买后模型将直接集成到Pro版用户界面)
- 横排简繁体中英日文OCR模型(即将推出,购买后模型将直接集成到Pro版用户界面)
- AI自动标点
- 智慧整理模块
- 文献级(Plus版):在OCR模型的基础上,新增 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理 等功能
- 文章级(Pro版):在OCR模型的基础上,新增 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理+单篇文章/片段提取 等功能,相当于在Plus版的基础上增加了“单篇文章/片段内容提取”模块。
- 命名实体级(Max版):在OCR模型的基础上,新增 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理+单篇文章/片段提取+命名实体标引与关联,相当于在Pro版的基础上增加了“命名实体标引与关联”模块。