Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,89 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
language:
|
3 |
+
- es
|
4 |
+
metrics:
|
5 |
+
- accuracy
|
6 |
+
- precision
|
7 |
+
- recall
|
8 |
+
- f1
|
9 |
+
base_model:
|
10 |
+
- cardiffnlp/twitter-xlm-roberta-base-sentiment
|
11 |
+
pipeline_tag: text-classification
|
12 |
+
library_name: transformers
|
13 |
+
tags:
|
14 |
+
- politics
|
15 |
+
- sentiment
|
16 |
+
- argentina
|
17 |
+
---
|
18 |
+
|
19 |
+
# Modelo de Clasificaci贸n de Sentimientos - Debate Presidencial Argentina 2023
|
20 |
+
|
21 |
+
Este modelo ha sido desarrollado en el marco de la Tesina para obtener el t铆tulo de ***Licenciatura en Estad铆stica en la Universidad Nacional de Rosario (UNR)***.
|
22 |
+
|
23 |
+
**Autores:**
|
24 |
+
- Alumna: Natalia Mar铆n
|
25 |
+
- Director: Mag. Marcos Miguel Prunello
|
26 |
+
|
27 |
+
## Descripci贸n
|
28 |
+
|
29 |
+
Este modelo est谩 dise帽ado para clasificar comentarios de diversas redes sociales obtenidos luego del primer debate presidencial en Argentina en el a帽o 2023. Ha sido espec铆ficamente ajustado para analizar los comentarios sobre la candidata **(especificar candidata)**.
|
30 |
+
|
31 |
+
Para m谩s informaci贸n, consulte el siguiente enlace: [link](#)
|
32 |
+
|
33 |
+
## Detalles del Modelo
|
34 |
+
|
35 |
+
- **Modelo base preentrenado:** `cardiffnlp/twitter-xlm-roberta-base-sentiment`
|
36 |
+
- **Ajuste espec铆fico:** El modelo ha sido fine-tuneado para clasificar comentarios sobre la candidata en el contexto de las elecciones presidenciales en Argentina.
|
37 |
+
|
38 |
+
#### M茅tricas Generales
|
39 |
+
| M茅trica | Valor |
|
40 |
+
|-----------|----------|
|
41 |
+
| Accuracy | 0.837838 |
|
42 |
+
| F1 Score | 0.824761 |
|
43 |
+
| Precision | 0.812948 |
|
44 |
+
| Recall | 0.837838 |
|
45 |
+
|
46 |
+
#### M茅tricas por Clase
|
47 |
+
| Clase | Precision | Recall | F1 | Support |
|
48 |
+
|---------|-----------|---------|----------|---------|
|
49 |
+
| Clase 0 | 0.867925 | 0.92 | 0.893204 | 50 |
|
50 |
+
| Clase 1 | 0.0 | 0.0 | 0.0 | 2 |
|
51 |
+
| Clase 2 | 0.761905 | 0.727273| 0.744186 | 22 |
|
52 |
+
|
53 |
+
#### Matriz de Confusi贸n
|
54 |
+
| | Clase 0 | Clase 1 | Clase 2 |
|
55 |
+
|-------|---------|---------|---------|
|
56 |
+
| Clase 0 | 46 | 0 | 4 |
|
57 |
+
| Clase 1 | 1 | 0 | 1 |
|
58 |
+
| Clase 2 | 6 | 0 | 16 |
|
59 |
+
|
60 |
+
## Cargar y Usar el Modelo en Python
|
61 |
+
|
62 |
+
A continuaci贸n, se muestra un ejemplo de c贸mo cargar el modelo y su tokenizador, y realizar una predicci贸n de sentimiento en un comentario:
|
63 |
+
|
64 |
+
```python
|
65 |
+
from transformers import XLMRobertaForSequenceClassification, XLMRobertaTokenizer
|
66 |
+
import torch
|
67 |
+
|
68 |
+
# Cargar el modelo y el tokenizador
|
69 |
+
model_path = "cardiffnlp/twitter-xlm-roberta-base-sentiment"
|
70 |
+
model = XLMRobertaForSequenceClassification.from_pretrained(model_path)
|
71 |
+
tokenizer = XLMRobertaTokenizer.from_pretrained(model_path)
|
72 |
+
|
73 |
+
# Texto de ejemplo
|
74 |
+
texto = "Este es un ejemplo de comentario del debate presidencial."
|
75 |
+
|
76 |
+
# Tokenizaci贸n
|
77 |
+
inputs = tokenizer(texto, return_tensors="pt", truncation=True)
|
78 |
+
|
79 |
+
# Predicci贸n
|
80 |
+
with torch.no_grad():
|
81 |
+
outputs = model(**inputs)
|
82 |
+
logits = outputs.logits
|
83 |
+
pred_class = torch.argmax(logits, dim=1).item()
|
84 |
+
|
85 |
+
# Mostrar resultado
|
86 |
+
clases = ["Clase 0", "Clase 1", "Clase 2"]
|
87 |
+
print(f"El comentario es clasificado como: {clases[pred_class]}")
|
88 |
+
|
89 |
+
|