NBA

CART

INTRODUCCION

Se necesita desarrollar un sistema que asista a los directores técnicos de equipos de basketball a tomar decisiones estratégicas durante el transcurso de un partido, basadas en datos estadísticos a veces difícil de detectar a ojo.

DATASET

NBA Box Score

Se trabajará con un dataset (NBA Enhanced Box Score and Standings (2012 - 2018) | Kaggle) con datos de todos los partidos de la NBA entre 2012 y 2018. Se cuenta con información detallada del resultado de cada partido, contando con 123 variables, de las cuales para este estudio se utilizarán:


- Nombre del equipo
- Intentos de tiros de campo, de libres, de 2, y de 3 puntos
- Aciertos de tiros de campo, de libres, de 2, y de 3 puntos
- Porcentaje de tiros de campo, de libres, de 2, y de 3 puntos
- Cantidad de rebotes defensivos
- Cantidad de rebotes ofensivos
- Ganador (Loss o Win)



El dataset resulta muy completo y no cuenta con datos faltantes.

MODELO

CART

Se utilizará un árbol de decisión para este trabajo, ya que por su naturaleza es necesario conocer qué variables hay que controlar para lograr la victoria. Además, un árbol de decisión permite en cualquier momento durante el partido ir contestando preguntas (las formuladas en los nodos), para detectar posibles debilidades durante un partido, e identificar qué aspectos debe cuidar el equipo “para llegar a la hoja deseada”.

Por el mismo motivo de necesitar un árbol legible, se limitará su altura a 5. Cabe destacar que este método genera un árbol distinto para cada equipo, donde los nodos (y por ende las preguntas) serán personalizadas para cada equipo. Para ello, es necesario filtrar los partidos antes de entrenar para que solo se tenga en cuenta los datos del equipo en estudio.

Se entrena con una división del dataset de 70% para entrenamiento y 30% para validación. Se generan árboles para varios equipos arbitrariamente, y en todos los casos el accuracy ronda por el 75%, con buenos valores de precision y recall.