AI+档案
智慧整理编研一体机
针对各级档案馆,实现民国竖排手写档案、简体横排档案的图文对照OCR文字识别、全宗档案RAG向量问答、自动涉密审查、自动开放审查、双层PDF生成、卷宗PDF切割与卷内目录自动生成、自动档案标题拟定、自动档案摘要、档案智慧编研,将传统编研效率提升8倍以上。
核心功能
覆盖文献整理全流程,从识别到编研一站完成
手写档案高精度识别
支持民国至建国初期各类手写档案的智能OCR识别,覆盖竖排、横排、行书、草书、批注等多形态文字场景,对褪色、模糊、透印等老旧档案具备强鲁棒性。
元数据自动提取与智能编目
自动抽取案卷标题、日期、责任者等核心元数据,支持用户自定义著录规则与分类方案,实现批量档案“秒级著录”,大幅降低人工编目工作量。
RAG检索增强生成与编研辅助
采用检索增强生成技术,支持自然语言提问,准确还原档案原文依据,自动生成可追溯、可编辑的大事记、专题综述、人物年表等初稿,辅助编研人员高效成稿。
涉密信息自动审查
批量识别档案中的涉密内容,自动标识“涉密/非涉密”状态。基于本地涉密知识库与本地部署大语言模型,实现智能初筛,支持人工终审交互修正,确保审查结果安全可控。
开放利用智能审查
自动检测档案中涉及个人隐私、敏感事件等内容,依规标识“开放/不开放”。结合本地开放审查关键词库与大模型语义理解能力,提供开放利用建议,支持人工复核调整。
双层PDF一键生成
支持数万份档案批量生成双层PDF——上层为原文扫描图像,下层为精准识别的文本层,兼顾原貌保真与全文检索,便于长期保存与利用。
卷宗PDF切割与卷内目录生成
自动将整卷扫描件按件、按页精准切割,同步生成标准卷内文件目录,减少人工拆卷、编页、立卷等繁琐操作,提升数字化整理效率。
自动标题与摘要生成
基于语义理解模型,自动为无标题或标题不规范的档案拟定精准标题,并生成简洁摘要,快速呈现档案核心内容,辅助快速浏览与检索。
档案智慧编研
支持“原文摘编类纂”、“原著标点整理”、“智能引证编述”、“书目与提要”等四种方式开展档案编研,一键生成WORD版初稿,为深度编研提供素材支撑,实现“以用促建”的档案利用新模式。
本地离线断网一体部署
硬件(GPU显卡+存储+CPU+电源+显示器+鼠键+网卡+水冷/风冷风扇)+OCR专用模型+档案专用大语言模型+智能整理平台封装成一体机,进行本地部署,无需联网也能工作,确保档案数据不出域,满足涉密网、政务内网等安全环境要求。
全栈国产信创适配
数据库采用国产OceanBase,支持主流国产CPU、操作系统及中间件,全面适配信创环境,保障关键技术自主可控。
技术亮点
多项自主研发的核心技术,确保行业领先的处理效果
多风格手写体识别引擎
基于百万级手写档案样本训练,覆盖行书、草书、楷书及各类变体,对民国手写档案识别准确率达95%以上。
复杂版面智能分析
自动识别档案页面中的正文、批注、签章、表格、信笺抬头等元素,精准还原原始版面结构。
档案专用垂直模型
针对档案文体训练的命名实体识别、档案专业术语模型,精准抽取人名、地名、机构名、职官、日期等关键实体。
全私有化部署
支持全离线环境运行,数据不出馆,满足档案安全保密要求。提供API接口与现有档案管理系统无缝对接。
GPU集群加速
支持多GPU并行处理,单台一体机日处理档案可达5000页以上,满足大规模数字化项目的时效要求。
持续模型迭代
支持基于机构自有数据对模型进行微调优化,持续提升识别与抽取效果,越用越精准。
演示视频
典型案例
浙江省某县档案馆
县级档案馆数字化升级标杆
为浙江省某县档案馆部署AI+民国档案智慧整理一体机,处理民国至建国初期手写档案1.3余万件。实现竖排手写档案OCR高精度识别、元数据自动提取与智能编目、涉密信息自动审查、开放利用智能审查、双层PDF一键生成、卷宗PDF切割与卷内目录生成、自动标题与摘要生成、本地离线断网一体部署。
🏆 全国档案系统优秀案例 | 效率提升8倍
服务流程
常见问题
了解AI+档案
如何助力您的工作
提交您的需求,我们将在24小时内与您联系,提供专属方案与报价。
获取方案与报价
我们将在24小时内与您联系