koshkidadanet
/

lilt-xlm-roberta-base-finetuned-piad

Token Classification

Inference Endpoints

Model card Files Files and versions Community

lilt-xlm-roberta-base-finetuned-piad / README.md

koshkidadanet's picture

Update README.md

66f7411 verified 10 months ago

|

history blame contribute delete

1.78 kB

	---
	library_name: transformers
	tags:
	- legal
	license: apache-2.0
	language:
	- ru
	- en
	metrics:
	- f1
	pipeline_tag: token-classification
	---

	# Описание модели

	Модель представляет собой дообученную версию [nielsr/lilt-xlm-roberta-base](https://huggingface.co/nielsr/lilt-xlm-roberta-base) для анализа документов, подтверждающих индивидуальные достижения, которая позволит автоматически извлекать важную информацию из отсканированных документов.

	Модель способна распознавать следующие классы:
	* Дата получения (DATE)
	* ФИО владельца (FULL_NAME)
	* Тип документа (DOC_TYPE)
	* Причина получения (REASON_OBTAINING)
	* Место, которое занял владелец (PLACE)

	# Датасет
	Датасет `PIAD` (Parsing Individual Ahievement Documents) включает в себя 215 отсканированных документов, подтверждающих индивидуальные достижения.
	> [!NOTE]
	> PIAD не выложен в открытый доступ, так как некоторые элементы содержат персональные данные.

	# Ссылки
	- Разработчик: [Agapitov Denis](https://github.com/koshkidadanet)
	- Репозиторий GitHub: [lilt-finetuning-piad-ya-ocr](https://github.com/koshkidadanet/lilt-finetuning-piad-ya-ocr)
	- Дообученная версия модели: [nielsr/lilt-xlm-roberta-base](https://huggingface.co/nielsr/lilt-xlm-roberta-base)