Upload 8 files

Files changed (5) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "benjamin/roberta-base-wechsel-ukrainian",
   "architectures": [
     "FCorefModel"
   ],
@@ -21,14 +21,15 @@
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,
-  "model_type": "roberta",
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.21.0",
   "type_vocab_size": 1,
   "use_cache": true,
-  "vocab_size": 50265
 }

 {
+  "_name_or_path": "pre-co-0.72/model",
   "architectures": [
     "FCorefModel"
   ],
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
+  "output_past": true,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.27.2",
   "type_vocab_size": 1,
   "use_cache": true,
+  "vocab_size": 31274
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aadf2757abc337eb99f8c7de0ccf58377ae0e3d0b971fe6a083dafb35671b961
-size 532295477

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8853fbbbf897a2e1e884c5fef2105616229066121a9a8c864444080176c6ccb
+size 473955125

special_tokens_map.json CHANGED Viewed

@@ -5,7 +5,7 @@
   "mask_token": {
     "content": "<mask>",
     "lstrip": true,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },

   "mask_token": {
     "content": "<mask>",
     "lstrip": true,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -3,21 +3,20 @@
   "bos_token": "<s>",
   "cls_token": "<s>",
   "eos_token": "</s>",
-  "errors": "replace",
   "mask_token": {
     "__type": "AddedToken",
     "content": "<mask>",
     "lstrip": true,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
-  "model_max_length": 512,
-  "name_or_path": "benjamin/roberta-base-wechsel-ukrainian",
   "pad_token": "<pad>",
   "sep_token": "</s>",
-  "special_tokens_map_file": null,
-  "tokenizer_class": "RobertaTokenizer",
-  "trim_offsets": true,
   "unk_token": "<unk>"
 }

   "bos_token": "<s>",
   "cls_token": "<s>",
   "eos_token": "</s>",
+  "extra_ids": 0,
   "mask_token": {
     "__type": "AddedToken",
     "content": "<mask>",
     "lstrip": true,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
+  "model_max_length": 1000000000000000019884624838656,
   "pad_token": "<pad>",
   "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "special_tokens_map_file": "./xlm-roberta-base-uk/special_tokens_map.json",
+  "tokenizer_class": "XLMRobertaTokenizer",
   "unk_token": "<unk>"
 }