krasserm
/

perceiver-io-txt-clf-imdb

Text Classification

perceiver-io-text-classifier

Model card Files Files and versions Community

perceiver-io-txt-clf-imdb / config.json

krasserm's picture

Upload PerceiverTextClassifier

26c92a3 almost 2 years ago

history blame contribute delete

1.66 kB

	{
	"architectures": [
	"PerceiverTextClassifier"
	],
	"id2label": {
	"0": "NEGATIVE",
	"1": "POSITIVE"
	},
	"label2id": {
	"NEGATIVE": 0,
	"POSITIVE": 1
	},
	"model_config": {
	"activation_checkpointing": true,
	"activation_offloading": false,
	"decoder": {
	"cross_attention_residual": true,
	"cross_attention_widening_factor": 1,
	"dropout": 0.1,
	"freeze": false,
	"init_scale": 0.02,
	"num_classes": 2,
	"num_cross_attention_heads": 1,
	"num_cross_attention_qk_channels": null,
	"num_cross_attention_v_channels": null,
	"num_output_queries": 1,
	"num_output_query_channels": 768
	},
	"encoder": {
	"cross_attention_widening_factor": 1,
	"dropout": 0.1,
	"first_cross_attention_layer_shared": false,
	"first_self_attention_block_shared": true,
	"freeze": false,
	"init_scale": 0.02,
	"max_seq_len": 2048,
	"num_cross_attention_heads": 8,
	"num_cross_attention_layers": 1,
	"num_cross_attention_qk_channels": 256,
	"num_cross_attention_v_channels": 1280,
	"num_input_channels": 768,
	"num_self_attention_blocks": 1,
	"num_self_attention_heads": 8,
	"num_self_attention_layers_per_block": 26,
	"num_self_attention_qk_channels": 256,
	"num_self_attention_v_channels": 1280,
	"params": null,
	"self_attention_widening_factor": 1,
	"vocab_size": 262
	},
	"num_latent_channels": 1280,
	"num_latents": 256
	},
	"model_type": "perceiver-io-text-classifier",
	"tokenizer_class": "PerceiverTokenizer",
	"torch_dtype": "float32",
	"transformers_version": "4.28.0"
	}