MonkeyOCR:基于结构 - 识别 - 关系三元组范式的文档解析模型
https://huggingface.co/echo840/MonkeyOCRMonkeyOCR 是一个通过「结构 – 识别 – 逻辑」三级解耦的高效文档解析框架,依托新数据集 MonkeyDoc 和轻量模型,在多语言、多类型文档任务上展现出了超越现有方法的性能与效率。一、核心贡献:SRR 三元组范式SRR = Structure (布局检测) + Recognition (内容识别) + Relation (关系预测)Structure detection:YOLO-based 检测文档中 blocks(text, table, formula, image)及其位置。Content...