|
--- |
|
library_name: transformers |
|
tags: |
|
- legal |
|
license: apache-2.0 |
|
language: |
|
- ru |
|
- en |
|
metrics: |
|
- f1 |
|
pipeline_tag: token-classification |
|
--- |
|
|
|
# Описание модели |
|
|
|
Модель представляет собой дообученную версию [nielsr/lilt-xlm-roberta-base](https://huggingface.co/nielsr/lilt-xlm-roberta-base) для анализа документов, подтверждающих индивидуальные достижения, которая позволит автоматически извлекать важную информацию из отсканированных документов. |
|
|
|
Модель способна распознавать следующие классы: |
|
* **Дата получения (DATE)** |
|
* **ФИО владельца (FULL_NAME)** |
|
* **Тип документа (DOC_TYPE)** |
|
* **Причина получения (REASON_OBTAINING)** |
|
* **Место, которое занял владелец (PLACE)** |
|
|
|
# Датасет |
|
Датасет `PIAD` (Parsing Individual Ahievement Documents) включает в себя **215** отсканированных документов, подтверждающих индивидуальные достижения. |
|
> [!NOTE] |
|
> PIAD не выложен в открытый доступ, так как некоторые элементы содержат персональные данные. |
|
|
|
# Ссылки |
|
- **Разработчик:** [Agapitov Denis](https://github.com/koshkidadanet) |
|
- **Репозиторий GitHub:** [lilt-finetuning-piad-ya-ocr](https://github.com/koshkidadanet/lilt-finetuning-piad-ya-ocr) |
|
- **Дообученная версия модели:** [nielsr/lilt-xlm-roberta-base](https://huggingface.co/nielsr/lilt-xlm-roberta-base) |
|
|
|
|