皕宋楼OCR一体机、智慧古籍整理

在售产品

在售产品

皕宋楼®古籍拓片OCR一体机

搭载自主知识产权的OCR AI识别系统,经过超过1.2亿古籍拓片字符训练,可精准识别墨印(原色黑字)、朱印(白底红字)、朱拓(红底白字)、墨拓(黑底白字)、影印(白底黑字)5个场景下楷、行、宋、仿宋、隶等书体书写的古籍拓片,对虫蛀、水渍、字迹漫漶等复杂情况具备图像自修复检测识别能力,文字(含繁体字、简体字、异体字、俗体字、生僻字、避讳字)识别准确率达99.36%。

价格:29.8万 10.8万 (目前享受“6·18钜惠”[活动时间:2025年6月3日-6月20日]的价格)
还可根据需要选购其他模块(将随一体机部署在本地),详见“物料清单”。
   
√ 半年AI模型+用户界面售后服务支持     √ 一次购买永久拥有

包含:

  • 古籍拓片OCR模型1个+Pro版用户界面1套(界面及OCR模型识别效果详见演示系统
    • 支持竖排版式9.9万超大字符集(涵盖Unicode扩展集)文字识别,异体字还原度高,准确率达99.36%
    • 支持原色古籍(黄底黑字)、朱印(白底红字)、朱拓(红底白字)、墨拓(黑底白字)、黑白影印(白底黑字)五个场景自动识别
    • 支持密集文字检测识别、经注混排自动分离识别
    • 支持一页多栏、犬牙交错文本排序与顺序还原
    • 支持1-N个PDF或图片批量并发处理,平均速率1-3页/秒
    • 支持自定义最长边,适配大幅面(卷轴、摩崖拓、碑拓等)、常规幅面(半页/双半页/筒子页线装书)、残片(最小5cmx5cm)
    • 支持超复杂场景下良好用户体验的实时增、删、改(手动拉列框OCR识别、手动拉矩形区块批量识别、手动拉多边形区块批量识别)
    • 支持PDF或IMG的远程URL地址拉取识别
    • 支持对已OCR文本的拉取读取
    • 支持集外字截图建档
    • 支持书内插图截取建档
    • 支持多格式文本输出(TXT、DOCX)
    • 支持图文对校(线上“校对模式”对校、线下生成_compare.jpg对校图片)
    • 支持本地离线断网部署,确保文献安全
    • 支持模型扩展与模块化升级
      • OCR模型:可增加民国报刊OCR模型、手写文书档案OCR模型
      • 功能扩展:可扩展“本地版异体字-正体繁体/简体模块”、“本地版自动标点模块”
      • 平台升级:可扩展“文献智慧整理模块”,将OCR平台升级为“古籍拓片智慧整理平台”,实现元数据+PDF挂接+OCR识别
    • 一次购买,永久拥有,生命周期内无需年服务费、无页码限制
  • 硬件服务器1台(单机版,可离线断网。软硬件配置:DELL 机箱;英伟达RTX4060 8GB显卡1张;酷睿14代i9-14900k CPU 1块;主板1块;32GB 内存;512GB固态+4TB STATA硬盘1块;1000W电源1个;21吋 显示器1个;鼠标键盘1套;CentOS7.9操作系统)[如需个性化升级,请联系客服]
  • 180天远程售后服务,自一体机签收之日起,180日内免费提供:
    • 技术支持:工作日5×8小时快速响应;
    • 远程服务:免费远程诊断修复服务;
    • 硬件维修:免费寄送维修服务(含往返物流);
    • 使用方面的咨询,得到咨询响应;
    • 提供一体机硬件、软件、模型、操作系统等方面的迭代改进意见或建议,分享使用经验,并得到反馈

付费可扩展模块(下列模块不单卖,只有选购一体机后才能扩展;选购的扩展模块将随一体机一起进行本地化部署)

  • 本地版异体字-繁体字/简体字转换模块,价格咨询客服(购买后将直接集成到Pro版用户界面)
    • 支持异体字→正体繁体[指的是可用于大陆出版物出版的]
    • 支持异体字→简体字
    • 支持简体字←→正体繁体
  • OCR模型扩展:
    • 民国文献OCR模型,价格咨询客服(购买后模型将直接集成到Pro版用户界面,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4070 16GB
      • 支持民国图书、报纸、期刊中竖排+繁简体+中英文混排文字识别
      • 支持新旧式标点符号识别
      • 支持模糊、污渍、部分缺损文字识别
    • 手写文书档案OCR模型,价格咨询客服(购买后模型将直接集成到Pro版用户界面,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4070 16GB
      • 支持手写文书档案中竖排+潦草行草+繁简体+中英文混排文字识别
      • 支持手写新旧式标点符号识别
  • 本地版自动标点AI模型,价格咨询客服(购买后将直接集成到Pro版用户界面)
    • 支持文言文自动标点,准确率94%以上
  • 文献智慧整理模块(Plus版[文献级]、Pro版[文章级]),价格咨询客服(购买后将直接集成,系统升级为“古籍拓片智慧整理平台”,效果详见演示系统
    • 支持元数据+PDF全文URL批量导入与挂接,批量导入与挂接速率:1万条+/30分钟
    • 支持批量挂接PDF URL后的全自动OCR,无需人工干预
    • 支持手动单条新增+PDF挂接,极简处理速度3~10秒钟/条
    • 支持AI自动摘要(非本地版API接口调用),准确率接近100%
    • 支持AI经注分开单独自动标点(本地版,准确率94%以上;非本地版API接口调用,准确率90%以上),(本地版需要购买相应模块,非本地版免费)
    • 支持异体字-繁简转换(本地版,准确率接近100%;非本地版API接口调用,准确率90%以上),(本地版需要购买相应模块,非本地版免费)
    • 支持管理员三审三校形成图文对照的定本OCR文字
    • 支持管理员三审三校形成定本标点整理本(可自动生成并回溯原典影页)
    • 支持自动卷次章节目录生成
    • 支持匿名用户拉框识别
    • 支持自定义文献分类体系及分面导航(facet navigation)
    • 支持用户体验良好的Ajax检索
    • 支持古籍拓片半自动编目(利用OCR的文字,不用人工敲字)
    • 支持知识片段抽取与汇总,及对片段的三审三校深度整理(Pro版[文章/知识级])
      • 示例:抽取方志中的物产、灾祥异、诗文,形成可溯源的专题知识库
    • 支持图表抽取与汇总(Pro版[文章级/知识])
      • 示例:抽取古籍印章
    • 支持命名实体自动标注(非本地版API接口调用,Pro版[文章级/知识]
      • 示例:对内容中的地名、人名、时间进行自动标注
    • 支持命名实体自动关联与超链接跳转(非本地版API接口调用,Pro版[文章级/知识]
      • 示例:通过超链接跳转到地名、人名等

采购流程:

  • 扫码加入用户群,进入用户专享优惠群

  • 联系销售人员/技术工程师,确定方案

  • 下单支付,对公转账

收      款     方:北京文明象限文化科技有限公司

收款方开户行:华夏银行股份有限公司北京万柳支行

收 款 方 账 号:10272000001059005

备               注:机构或个人姓名

  • 等待发货(一般4-7个工作日)

客户案例

beijingdax
xianggangkejidx

皕宋楼®民国报刊OCR一体机

搭载自主知识产权的OCR识别系统,经过超过2.1亿民国报纸期刊字符训练,可精准识别民国图书报纸期刊排印本中的楷、行、宋、仿宋、隶等书体,对模糊、水渍、油晕、字迹漫漶等复杂情况具备图像自修复能力,文字(含繁体字、简体字、俗体字、生僻字)识别准确率达99.15%。

价格:29.8万10.8万(目前享受“6·18钜惠”活动[活动时间:2025年6月3日-6月20日]的价格)
还可根据需要选购其他模块(将随一体机部署在本地),详见“物料清单”。
   
√ 半年AI模型+用户界面售后服务支持     √ 一次购买永久拥有

包含:

  • 民国报刊OCR AI模型1个+Pro版用户界面1套(识别效果详见演示系统
    • 支持民国图书、报纸、期刊中竖排版式+2.6万大字符集繁简体文字识别,准确率达99.16%
    • 支持竖排中、英文混排文字识别
    • 支持新旧式标点符号识别
    • 支持模糊、污渍、部分缺损文字识别
    • 支持密集文字检测识别、经注混排自动分离识别
    • 支持一页多栏、犬牙交错文本排序与顺序还原
    • 支持1-N个PDF或图片批量并发处理,平均速率1-3页/秒
    • 支持自定义最长边,适配大幅面(报纸等)、常规幅面(图书、期刊)、残片(最小5cmx5cm)
    • 支持超复杂场景下良好用户体验的实时增、删、改(手动拉列框OCR识别、手动拉矩形区块批量识别、手动拉多边形区块批量识别)
    • 支持PDF或IMG的远程URL地址拉取识别
    • 支持对已OCR文本的拉取读取
    • 支持集外字截图建档
    • 支持书内插图截取建档
    • 支持多格式文本输出(TXT、DOCX)
    • 支持图文对校(线上“校对模式”对校、线下生成_compare.jpg对校图片)
    • 支持本地离线断网部署,确保文献安全
    • 支持模型扩展与模块化升级
      • OCR模型:可增加古籍拓片OCR模型、手写文书档案OCR模型
      • 功能扩展:可扩展“本地版异体字-正体繁体/简体模块”、“本地版自动标点模块”
      • 平台升级:可扩展“文献智慧整理模块”,将OCR平台升级为“民国报刊智慧整理平台”,实现元数据+PDF挂接+OCR识别
    • 一次购买,永久拥有,生命周期内无需年服务费、无页码限制
  • 一体机硬件服务器1台(单机版,可离线断网。软硬件配置:DELL 机箱;英伟达RTX4060 8GB显卡1张;酷睿14代i9-14900k CPU 1块;主板1块;32GB 内存;512GB固态+4TB STATA硬盘1块;1000W电源1个;21吋 显示器1个;鼠标键盘1套;CentOS7.9操作系统)[如需个性化升级,请联系客服]
  • 180天远程售后服务,自一体机签收之日起,180日内免费提供:
    • 技术支持:工作日5×8小时快速响应;
    • 远程服务:免费远程诊断修复服务;
    • 硬件维修:免费寄送维修服务(含往返物流);
    • 使用方面的咨询,得到咨询响应;
    • 提供一体机硬件、软件、模型、操作系统等方面的迭代改进意见或建议,分享使用经验,并得到反馈

付费可扩展模块(下列模块不单卖,只有选购一体机后才能扩展;选购的扩展模块将随一体机一起进行本地化部署)

  • 本地版异体字-繁体字/简体字转换模块,价格咨询客服(购买后将直接集成到Pro版用户界面)
    • 支持异体字→正体繁体[指的是可用于大陆正式出版物直接出版的繁体字]
    • 支持异体字→简体字
    • 支持简体字←→正体繁体
  • OCR模型扩展:
    • 古籍拓片OCR模型,价格咨询客服(购买后模型将直接集成到Pro版用户界面,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4070 16GB
      • 支持古籍拓片中竖排版式+9.9万超大字符集/繁/简体文字识别
    • 手写文书档案OCR模型,价格咨询客服(购买后模型将直接集成到Pro版用户界面,GPU显卡从英伟达RTX4060 8GB升级至英伟达RTX4070 16GB
      • 支持手写文书档案中竖排+潦草行草+繁简体+中英文混排文字识别
      • 支持手写新旧式标点符号识别
  • 本地版自动标点AI模型,价格咨询客服(购买后将直接集成到Pro版用户界面)
    • 支持文言文自动标点,准确率94%以上
  • 文献智慧整理模块(Plus版[文献级]、Pro版[文章级]),价格咨询客服(购买后将直接集成,系统升级为“民国报刊智慧整理平台”,效果详见演示系统
    • 支持元数据+PDF全文URL批量导入与挂接,批量导入与挂接速率:1万条+/30分钟
    • 支持批量挂接PDF URL后的全自动OCR,无需人工干预
    • 支持手动单条新增+PDF挂接,极简处理速度3~10秒钟/条
    • 支持AI自动摘要(非本地版API接口调用),准确率接近100%
    • 支持AI经注分开单独自动标点(本地版,准确率94%以上;非本地版API接口调用,准确率90%以上),(本地版需要购买相应模块,非本地版免费)
    • 支持异体字-繁简转换(本地版,准确率接近100%;非本地版API接口调用,准确率90%以上),(本地版需要购买相应模块,非本地版免费)
    • 支持管理员三审三校形成图文对照的定本OCR文字
    • 支持管理员三审三校形成定本标点整理本(可自动生成并回溯原典影页)
    • 支持自动卷次章节目录生成
    • 支持匿名用户拉框识别
    • 支持自定义文献分类体系及分面导航(facet navigation)
    • 支持用户体验良好的Ajax检索
    • 支持民国书、刊、报半自动编目(利用OCR的文字,不用人工敲字)
    • 支持知识片段抽取与汇总,及对片段的三审三校深度整理(Pro版[文章/知识级])
      • 示例:抽取民国报纸、民国期刊中的豆腐块文章,形成文章级全文库
    • 支持图表抽取与汇总(Pro版[文章级/知识])
      • 示例:抽取民国报纸广告图、期刊插图,形成专题图片数据库
    • 支持命名实体自动标注(非本地版API接口调用,Pro版[文章级/知识]
      • 示例:对内容中的地名、人名、时间、事件进行自动标注
    • 支持命名实体自动关联与超链接跳转(非本地版API接口调用,Pro版[文章级/知识]
      • 示例:通过超链接跳转到地名、人名等

采购流程:

  • 扫码加入用户群,进入用户专享优惠群

  • 联系销售人员/技术工程师,确定方案

  • 下单支付,对公转账

收      款     方:北京文明象限文化科技有限公司

收款方开户行:华夏银行股份有限公司北京万柳支行

收 款 方 账 号:10272000001059005

备               注:机构或个人姓名

  • 等待发货(一般4-7个工作日)
关注微信