natmarinn commited on
Commit
fbc7b26
verified
1 Parent(s): 9828d23

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +89 -0
README.md ADDED
@@ -0,0 +1,89 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - es
4
+ metrics:
5
+ - accuracy
6
+ - precision
7
+ - recall
8
+ - f1
9
+ base_model:
10
+ - cardiffnlp/twitter-xlm-roberta-base-sentiment
11
+ pipeline_tag: text-classification
12
+ library_name: transformers
13
+ tags:
14
+ - politics
15
+ - sentiment
16
+ - argentina
17
+ ---
18
+
19
+ # Modelo de Clasificaci贸n de Sentimientos - Debate Presidencial Argentina 2023
20
+
21
+ Este modelo ha sido desarrollado en el marco de la Tesina para obtener el t铆tulo de ***Licenciatura en Estad铆stica en la Universidad Nacional de Rosario (UNR)***.
22
+
23
+ **Autores:**
24
+ - Alumna: Natalia Mar铆n
25
+ - Director: Mag. Marcos Miguel Prunello
26
+
27
+ ## Descripci贸n
28
+
29
+ Este modelo est谩 dise帽ado para clasificar comentarios de diversas redes sociales obtenidos luego del primer debate presidencial en Argentina en el a帽o 2023. Ha sido espec铆ficamente ajustado para analizar los comentarios sobre la candidata **(especificar candidata)**.
30
+
31
+ Para m谩s informaci贸n, consulte el siguiente enlace: [link](#)
32
+
33
+ ## Detalles del Modelo
34
+
35
+ - **Modelo base preentrenado:** `cardiffnlp/twitter-xlm-roberta-base-sentiment`
36
+ - **Ajuste espec铆fico:** El modelo ha sido fine-tuneado para clasificar comentarios sobre la candidata en el contexto de las elecciones presidenciales en Argentina.
37
+
38
+ #### M茅tricas Generales
39
+ | M茅trica | Valor |
40
+ |-----------|----------|
41
+ | Accuracy | 0.837838 |
42
+ | F1 Score | 0.824761 |
43
+ | Precision | 0.812948 |
44
+ | Recall | 0.837838 |
45
+
46
+ #### M茅tricas por Clase
47
+ | Clase | Precision | Recall | F1 | Support |
48
+ |---------|-----------|---------|----------|---------|
49
+ | Clase 0 | 0.867925 | 0.92 | 0.893204 | 50 |
50
+ | Clase 1 | 0.0 | 0.0 | 0.0 | 2 |
51
+ | Clase 2 | 0.761905 | 0.727273| 0.744186 | 22 |
52
+
53
+ #### Matriz de Confusi贸n
54
+ | | Clase 0 | Clase 1 | Clase 2 |
55
+ |-------|---------|---------|---------|
56
+ | Clase 0 | 46 | 0 | 4 |
57
+ | Clase 1 | 1 | 0 | 1 |
58
+ | Clase 2 | 6 | 0 | 16 |
59
+
60
+ ## Cargar y Usar el Modelo en Python
61
+
62
+ A continuaci贸n, se muestra un ejemplo de c贸mo cargar el modelo y su tokenizador, y realizar una predicci贸n de sentimiento en un comentario:
63
+
64
+ ```python
65
+ from transformers import XLMRobertaForSequenceClassification, XLMRobertaTokenizer
66
+ import torch
67
+
68
+ # Cargar el modelo y el tokenizador
69
+ model_path = "cardiffnlp/twitter-xlm-roberta-base-sentiment"
70
+ model = XLMRobertaForSequenceClassification.from_pretrained(model_path)
71
+ tokenizer = XLMRobertaTokenizer.from_pretrained(model_path)
72
+
73
+ # Texto de ejemplo
74
+ texto = "Este es un ejemplo de comentario del debate presidencial."
75
+
76
+ # Tokenizaci贸n
77
+ inputs = tokenizer(texto, return_tensors="pt", truncation=True)
78
+
79
+ # Predicci贸n
80
+ with torch.no_grad():
81
+ outputs = model(**inputs)
82
+ logits = outputs.logits
83
+ pred_class = torch.argmax(logits, dim=1).item()
84
+
85
+ # Mostrar resultado
86
+ clases = ["Clase 0", "Clase 1", "Clase 2"]
87
+ print(f"El comentario es clasificado como: {clases[pred_class]}")
88
+
89
+