模型:

microsoft/markuplm-large-finetuned-websrc

英文

MarkupLM,在WebSRC上进行微调

多模式(文本+标记语言)预训练用于 Document AI

介绍

MarkupLM是一种简单而有效的文本和标记语言的多模式预训练方法,用于视觉丰富的文档理解和信息提取任务,例如网页问答和网页信息提取。MarkupLM在多个数据集上实现了SOTA结果。更多详情,请参阅我们的论文:

MarkupLM: Pre-training of Text and Markup Language for Visually-rich Document Understanding Junlong Li,Yiheng Xu,Lei Cui,Furu Wei

用法

我们参考 docs demo notebooks