模型:

naver-clova-ocr/bros-base-uncased

英文

BROS

GitHub: https://github.com/clovaai/bros

介绍

BROS(基于空间性的BERT)是一个预训练语言模型,专注于从文档中提取关键信息的文本和布局。根据文档图像的OCR结果(文本和边界框对),它可以执行各种关键信息提取任务,例如从收据中提取有序的项目列表。详细信息请参阅我们的论文:

BROS:一种专注于文本和布局以实现更好的文档关键信息提取的预训练语言模型

Teakgyu Hong,Donghyun Kim,Mingi Ji,Wonseok Hwang,Daehyun Nam,Sungrae Park

AAAI 2022 - 主要技术轨道

[arXiv]

预训练模型

name # params Hugging Face - Models
bros-base-uncased ( this ) < 110M 1232321
bros-large-uncased < 340M 1233321