Spaces:
Running
Running
cambios en la parte escrita del notebook de train
Browse files
xepelin_challenge_answers/caso_2_train.ipynb
CHANGED
@@ -14,9 +14,9 @@
|
|
14 |
"id": "cf6f976f-03ca-4717-abdf-e31e01d37f36",
|
15 |
"metadata": {},
|
16 |
"source": [
|
17 |
-
"- Se entrena un modelo de clasificación lightGBM
|
18 |
-
"- El método prepare_data transforma la variable dependiente overdueDays en 0 / 1 dependiendo de si la mora será mayor a 30 días, de modo que 1, implica una alerta. También elimina los ids de business y payer ya que considero que tenemos información sobre estos en las otras variables (y porque los datos son muy pocos para usar los ids como variables categóricas. \n",
|
19 |
-
"- Se elimina el método impute_missing (sugerido en el template) porque este tipo de modelos no tiene problemas para gestionar nulos y porque no tengo una mejor heurística para rellenarlos. \n",
|
20 |
"- En el método fit entrena el modelo LGBM.\n",
|
21 |
"- El método model_summary incluye métricas de accuracy, precision, recall, F1 así como una matriz de confusión, todas relevantes para analizar la calidad de un modelo de clasificación\n",
|
22 |
"- El método predict realiza predicciones\n",
|
|
|
14 |
"id": "cf6f976f-03ca-4717-abdf-e31e01d37f36",
|
15 |
"metadata": {},
|
16 |
"source": [
|
17 |
+
"- Se entrena un modelo de clasificación lightGBM.\n",
|
18 |
+
"- El método prepare_data transforma la variable dependiente overdueDays en 0 / 1 dependiendo de si la mora será mayor a 30 días, de modo que 1, implica una alerta. También elimina los ids de business y payer ya que considero que tenemos información relevante sobre estos en las otras variables (y porque los datos son muy pocos para usar los ids como variables categóricas). \n",
|
19 |
+
"- Se elimina el método impute_missing (sugerido en el template) porque este tipo de modelos no tiene problemas para gestionar nulos y porque no tengo una mejor heurística para rellenarlos (además que los datos proporcionados no tienen nulos). \n",
|
20 |
"- En el método fit entrena el modelo LGBM.\n",
|
21 |
"- El método model_summary incluye métricas de accuracy, precision, recall, F1 así como una matriz de confusión, todas relevantes para analizar la calidad de un modelo de clasificación\n",
|
22 |
"- El método predict realiza predicciones\n",
|