在售产品

在售产品

目录
< 所有主题

2. 民国报刊OCR一体机

2. 民国报刊OCR一体机

一、详细配置

民国报刊OCR一体机的包括:

· 民国报刊OCR AI模型1个。民国报刊OCR模型的特点:

    • 支持Unicode13.0的9.9万汉字识别,轻松识别民国报纸、期刊中的繁体字、异体字、俗体字、避讳字、生僻字
    • 独家排序算法,支持一页2栏、一页3栏、一页多栏文本的自动排序
    • 支持人工校正的手动拉框识别,自主掌控识别精度
    • 支持本地离线断网部署,OCR源代码和模型全部部署在一体机上,离线断网保证珍贵文献的安全不外泄

·  Pro版用户界面1套(用户界面详见演示系统http://www.deepcivi.com/mgocr-demo.php

    • 支持1-N张图片或1-N个PDF文件批量上传
    • 支持自定义古籍幅面最长边自定义,支持普通幅面图书、期刊、超大幅面报纸、超小幅面的碎片古文字识别
    • 支持手动拉框识别,在自动OCR识别+手动拉框识别双重配合下,将复杂的图书、报纸、期刊场景一网打尽
    • 支持后处理,用户可以对报纸的卷次、章节、墨围、墨盖子、序跋等进行标注
    • 支持在线图文校对、文本编辑、在线效果预览
    • 支持图文混排的图表截取
    • 支持集外字原图截取
    • 支持导出word文本、导出图文校对的图片
    • 支持异体字-转繁体、转简体(需扩展定制)
    • 支持AI自动标点(需扩展定制)

·  搭载OCR AI模型+用户界面的本地私有化部署一体机1台(单机版,可离线断网)。软硬件配置:

    • 英伟达RTX4060 8GB GPU显卡1张,支持CUDA;
    • 酷睿14代i9-14900k CPU 1块;
    • 主板1块;32GB 内存;
    • 512GB固态+4TB STATA硬盘1块;
    • 1000W电源1个;
    • DELL 机箱;
    • 21吋 显示器1个;
    • 鼠标键盘1套;
    • CentOS7.9可视化操作系统
  • 可个性化定制扩展模块。用户可根据要处理文献的实际需求,购买扩展模块一并进行本地化部署。可扩展的模块(不单独销售):
    • 异体字-繁体字/简体字转换模块(准确率接近100%,购买后将直接集成到Pro版用户界面)
    • 模型扩展(OCR模型工作时会消耗算力,同时购买2个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4070 12GB;同时购买3个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4080 16GB;同时购买4个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4090 24GB
      • 古籍拓片OCR模型(准确率99.36%,购买后模型将直接集成到Pro版用户界面)
      • 手写文书档案OCR模型(即将推出,购买后模型将直接集成到Pro版用户界面)
      • 横排简繁体中英日文OCR模型(即将推出,购买后模型将直接集成到Pro版用户界面
    • AI自动标点
    • 智慧整理模块
      • 文献级(Plus版):在OCR模型的基础上,新增 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理 等功能
      • 文章级(Pro版):在OCR模型的基础上,新增 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理+单篇文章/片段提取 等功能,相当于在Plus版的基础上增加了“单篇文章/片段内容提取”模块。
      • 命名实体级(Max版):在OCR模型的基础上,新增 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理+单篇文章/片段提取+命名实体标引与关联,相当于在Pro版的基础上增加了“命名实体标引与关联”模块。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信