1. “古籍拓片智慧整理一体机”的软硬件配置及功能简介
· 内置古籍拓片OCR引擎1个。该引擎包含了“古籍拓片OCR一体机”的几乎所有功能:
-
- 古籍拓片OCR模型
- 支持Unicode13.0的9.9万汉字识别,轻松识别古籍中的繁体字、异体字、俗体字、避讳字、生僻字
- 支持多场景一站式识别,对高清原色、墨拓(黑底白字)、朱拓(红底白字)、朱印(白底红字)、影印(白底黑字)等复杂场景均能识别
- 独家排序算法,支持一页2栏、一页3栏、一页多栏文本的自动排序
- 支持人工校正的手动拉框识别,自主掌控识别精度
- Pro版用户界面
- 古籍拓片OCR模型
-
-
- 支持1-N张图片或1-N个PDF文件批量上传
- 支持自定义古籍幅面最长边自定义,支持普通幅面古籍、超大幅面字画、摩崖石刻拓片等、超小幅面的碎片古文字识别
- 支持手动拉框识别,在自动OCR识别+手动拉框识别双重配合下,将复杂的古籍场景一网打尽
- 支持后处理,用户可以对古籍的卷次、章节、墨围、墨盖子、序跋等进行标注
- 支持在线图文校对、文本编辑、在线效果预览
- 支持图文混排的图表截取
- 支持集外字原图截取
- 支持导出word文本、导出图文校对的图片
- 支持异体字-转繁体、转简体(需扩展定制)
- 支持AI自动标点(需扩展定制)
-
· 硬件与操作系统配置:
-
- 英伟达RTX4060 8GB GPU显卡1张,支持CUDA;
- 酷睿14代i9-14900k CPU 1块;
- 主板1块;32GB 内存;
- 512GB固态+4TB STATA硬盘1块;
- 1000W电源1个;
- DELL 机箱;
- 21吋 显示器1个;
- 鼠标键盘1套;
- CentOS7.9可视化操作系统
- AI辅助的智慧整理平台1套
- 用户前端
- 主页面
- 支持可视化拖拽自定义界面设计
- Ajax检索框。可根据输入的字符数缩小检索范围
- 主题分类。根据主题词将同主题词文献集中汇总
- 列表页
- 分面导航。根据文献分类和元数据进行分面导航
- 支持多个层级分类
- 支持“面(facet)”之间的 and、or逻辑组配检索
- 排序
- 图+文+摘要列表
- 分面导航。根据文献分类和元数据进行分面导航
- 详细页面
- 内容增强(缩略图图+摘要+三审三校OCR图文对照+三审三校标点整理本)
- 相关文献推荐
- 支持上传文件OCR
- 支持从远程URL拉取文件OCR
- 支持自动生成缩略图
- 支持自动拉取已OCR数据
- 主页面
- 管理员后端
- 支持元数据管理+PDF全文挂接+元数据著录
- 批量导入导出
- 单条记录元数据著录/修改/删除
- 批量删除
- 支持自定义元数据分类体系
- 支持多个层级分类
- 支持AI自动标点,准确率接近100%
- 支持异体字-繁体字-简体字转换,准确率接近100%
- 支持AI自动摘要,准确率接近100%
- 支持元数据管理+PDF全文挂接+元数据著录
- 用户前端
- 可个性化定制扩展模块。用户可根据要处理文献的实际需求,购买扩展模块一并进行本地化部署。可扩展的模块(不单独销售):
-
- 异体字-繁体字/简体字转换模块(准确率接近100%,购买后将直接集成到Pro版用户界面)
- 模型扩展(OCR模型工作时会消耗算力,同时购买2个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4070 12GB;同时购买3个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4080 16GB;同时购买4个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4090 24GB)
- 民国文献OCR模型(准确率99.36%,购买后模型将直接集成到Pro版用户界面)
- 手写文书档案OCR模型(即将推出,准确率90.73%,购买后模型将直接集成到Pro版用户界面)
- 横排OCR模型(即将推出,准确率99.22%,购买后模型将直接集成到Pro版用户界面)
- AI自动标点
- 智慧整理模块
- 文献级(Plus版):提供 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理 等功能
- 文章级(Pro版):提供 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理+单篇文章/片段提取 等功能,相当于在Plus版的基础上增加了“单篇文章/片段内容提取”模块。
- 命名实体级(Max版):提供 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理+单篇文章/片段提取+命名实体标引与关联,相当于在Pro版的基础上增加了“命名实体标引与关联”模块。