sanbatte commited on
Commit
afa0e43
·
1 Parent(s): 7416739

cambios en la parte escrita del notebook de train

Browse files
xepelin_challenge_answers/caso_2_train.ipynb CHANGED
@@ -14,9 +14,9 @@
14
  "id": "cf6f976f-03ca-4717-abdf-e31e01d37f36",
15
  "metadata": {},
16
  "source": [
17
- "- Se entrena un modelo de clasificación lightGBM, por su calidad de rendimiento para este tipo de problema y su facilidad para ser puesto en producción. \n",
18
- "- El método prepare_data transforma la variable dependiente overdueDays en 0 / 1 dependiendo de si la mora será mayor a 30 días, de modo que 1, implica una alerta. También elimina los ids de business y payer ya que considero que tenemos información sobre estos en las otras variables (y porque los datos son muy pocos para usar los ids como variables categóricas. \n",
19
- "- Se elimina el método impute_missing (sugerido en el template) porque este tipo de modelos no tiene problemas para gestionar nulos y porque no tengo una mejor heurística para rellenarlos. \n",
20
  "- En el método fit entrena el modelo LGBM.\n",
21
  "- El método model_summary incluye métricas de accuracy, precision, recall, F1 así como una matriz de confusión, todas relevantes para analizar la calidad de un modelo de clasificación\n",
22
  "- El método predict realiza predicciones\n",
 
14
  "id": "cf6f976f-03ca-4717-abdf-e31e01d37f36",
15
  "metadata": {},
16
  "source": [
17
+ "- Se entrena un modelo de clasificación lightGBM.\n",
18
+ "- El método prepare_data transforma la variable dependiente overdueDays en 0 / 1 dependiendo de si la mora será mayor a 30 días, de modo que 1, implica una alerta. También elimina los ids de business y payer ya que considero que tenemos información relevante sobre estos en las otras variables (y porque los datos son muy pocos para usar los ids como variables categóricas). \n",
19
+ "- Se elimina el método impute_missing (sugerido en el template) porque este tipo de modelos no tiene problemas para gestionar nulos y porque no tengo una mejor heurística para rellenarlos (además que los datos proporcionados no tienen nulos). \n",
20
  "- En el método fit entrena el modelo LGBM.\n",
21
  "- El método model_summary incluye métricas de accuracy, precision, recall, F1 así como una matriz de confusión, todas relevantes para analizar la calidad de un modelo de clasificación\n",
22
  "- El método predict realiza predicciones\n",