在售产品

在售产品

目录
< 所有主题

1. “古籍拓片智慧整理一体机”的软硬件配置及功能简介

古籍拓片智慧整理OCR一体机的包括:

· 内置古籍拓片OCR引擎1个。该引擎包含了“古籍拓片OCR一体机”的几乎所有功能:

    • 古籍拓片OCR模型
      • 支持Unicode13.0的9.9万汉字识别,轻松识别古籍中的繁体字、异体字、俗体字、避讳字、生僻字
      • 支持多场景一站式识别,对高清原色、墨拓(黑底白字)、朱拓(红底白字)、朱印(白底红字)、影印(白底黑字)等复杂场景均能识别
      • 独家排序算法,支持一页2栏、一页3栏、一页多栏文本的自动排序
      • 支持人工校正的手动拉框识别,自主掌控识别精度
    • Pro版用户界面
      • 支持1-N张图片或1-N个PDF文件批量上传
      • 支持自定义古籍幅面最长边自定义,支持普通幅面古籍、超大幅面字画、摩崖石刻拓片等、超小幅面的碎片古文字识别
      • 支持手动拉框识别,在自动OCR识别+手动拉框识别双重配合下,将复杂的古籍场景一网打尽
      • 支持后处理,用户可以对古籍的卷次、章节、墨围、墨盖子、序跋等进行标注
      • 支持在线图文校对、文本编辑、在线效果预览
      • 支持图文混排的图表截取
      • 支持集外字原图截取
      • 支持导出word文本、导出图文校对的图片
      • 支持异体字-转繁体、转简体(需扩展定制)
      • 支持AI自动标点(需扩展定制)

·  硬件与操作系统配置:

    • 英伟达RTX4060 8GB GPU显卡1张,支持CUDA;
    • 酷睿14代i9-14900k CPU 1块;
    • 主板1块;32GB 内存;
    • 512GB固态+4TB STATA硬盘1块;
    • 1000W电源1个;
    • DELL 机箱;
    • 21吋 显示器1个;
    • 鼠标键盘1套;
    • CentOS7.9可视化操作系统
  • AI辅助的智慧整理平台1套
    • 用户前端
      • 主页面
        • 支持可视化拖拽自定义界面设计
        • Ajax检索框。可根据输入的字符数缩小检索范围
        • 主题分类。根据主题词将同主题词文献集中汇总
      • 列表页
        •  分面导航。根据文献分类和元数据进行分面导航
          • 支持多个层级分类
          • 支持“面(facet)”之间的 and、or逻辑组配检索
        • 排序
        • 图+文+摘要列表
      • 详细页面
        • 内容增强(缩略图图+摘要+三审三校OCR图文对照+三审三校标点整理本)
        • 相关文献推荐
        • 支持上传文件OCR
        • 支持从远程URL拉取文件OCR
        • 支持自动生成缩略图
        • 支持自动拉取已OCR数据
    • 管理员后端
      • 支持元数据管理+PDF全文挂接+元数据著录
        • 批量导入导出
        • 单条记录元数据著录/修改/删除
        • 批量删除
      • 支持自定义元数据分类体系
        • 支持多个层级分类
      • 支持AI自动标点,准确率接近100%
      • 支持异体字-繁体字-简体字转换,准确率接近100%
      • 支持AI自动摘要,准确率接近100%
  • 可个性化定制扩展模块。用户可根据要处理文献的实际需求,购买扩展模块一并进行本地化部署。可扩展的模块(不单独销售):
    • 异体字-繁体字/简体字转换模块(准确率接近100%,购买后将直接集成到Pro版用户界面)
    • 模型扩展(OCR模型工作时会消耗算力,同时购买2个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4070 12GB;同时购买3个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4080 16GB;同时购买4个模型,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4090 24GB
      • 民国文献OCR模型(准确率99.36%,购买后模型将直接集成到Pro版用户界面)
      • 手写文书档案OCR模型(即将推出,准确率90.73%,购买后模型将直接集成到Pro版用户界面)
      • 横排OCR模型(即将推出,准确率99.22%,购买后模型将直接集成到Pro版用户界面
    • AI自动标点
    • 智慧整理模块
      • 文献级(Plus版):提供 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理 等功能
      • 文章级(Pro版):提供 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理+单篇文章/片段提取 等功能,相当于在Plus版的基础上增加了“单篇文章/片段内容提取”模块。
      • 命名实体级(Max版):提供 元数据管理+PDF挂接+OCR文本校对+AI辅助深度整理+单篇文章/片段提取+命名实体标引与关联,相当于在Pro版的基础上增加了“命名实体标引与关联”模块。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信