En las categorías FEB, ¿Que roles de jugadores nos encontramos?

Es una realidad que en muchas ocasiones la NBA se adelanta a las demás ligas de baloncesto en el mundo, quizá unos pocos se adelantaron a ellos pero sus métodos no fueron tan resonados como ocurre en esta organización, la NBA está en la vanguardia y, las demás ligas, están siempre recogiendo esos conocimientos.

A nivel de análisis de datos están muy por encima del baloncesto europeo, pero, poco a poco Europa está comenzando a obtener fuerzas en este campo.

Uno de los problemas al que entrenadores se enfrentan constantemente, mayormente, al finalizar la temporada, es la confección de una plantilla que pueda llegar a ser eficiente de cara a la nueva temporada, para conseguir los objetivos propuestos. Suele ser una labor bastante compleja, ya que hay que ajustar puestos y roles de jugadores, así como el presupuesto del que disponga el club deportivo.

Tradicionalmente, incluso, actualmente, para una mejor comprensión del juego y de los jugadores, se separan a los jugadores en las posiciones tradicionales, enumeradas desde el 1 hasta el 5; sin embargo, todos los entrenadores actuales saben que hay diferentes tipos de roles por cada posición específica de juego. Unos ejemplos pueden ser los bases que son más agresivos y atacan el aro, mientras otros se dedican más a la distribución del juego; o jugadores interiores que están mayormente dedicados a la obtención de rebotes, mientras otros, son mejores en proporcionar asistencias a sus compañeros uno vez el balón pasa por sus manos.

De eso hablaremos en esta ocasión en las competiciones FEB, vamos al lío.

Se tienen los datos de los jugadores durante las temporadas 20/21 y 21/22, masculinas y femeninas. Estos datos se han dividido en las diferentes temporadas y en las diferentes competiciones, para crear una tabla de datos, con las medias de los jugadores en cada temporada, por cada competición en la que ha estado; ejemplo, si un jugador en una misma temporada, ha jugado en liga EBA y en leb Plata, estas estadísticas no se considerarán como las mismas, sino que se separarán y computarán la media de los datos de forma independiente.

Una vez realizada las operaciones que hemos descrito previamente, hemos realizado un estudio de las diferentes variables que componen la base de datos y su continuidad, se ha valorado un histograma, con líneas para observar valores de media, mediana y moda, además de sus valores exactos, skew y kurtosis, finalizando con una prueba paramétrica para conocer si esa variable se puede considerar como continua, diferenciando los datos masculinos y femeninos.

Debido a que muchas de las variables se encontraban sesgadas por jugadores y jugadoras que no tenían muchos minutos, lo que hicimos fue filtrar la base de datos, para contabilizar aquellos que al menos hubiesen jugado 5 minutos de partido.

El siguiente paso que realizamos fue escoger las variables que vamos a introducir en nuestra técnica de clustering para que nos separe los diferentes roles de los jugadores de la FEB. Necesitamos variables que nos puedan diferenciar roles de los diferentes jugadores, necesitamos medir el nivel de anotación de un jugador, el nivel de participación de ese jugador, su eficiencia en el lanzamiento, la capacidad de generar a los demás compañeros y la habilidad de obtener rebotes, su capacidad defensiva.

¿Qué variables vamos a utilizar?

¿Qué evaluamos? ¿Cómo lo evaluamos?
Nivel de anotación Porcentaje de anotación con respecto al equipo
Nivel de participación Porcentaje de uso
Eficacia del lanzamiento Floor %, Puntos por tiro
Zonas de lanzamiento Ratio tiro de 2 y tiro de 3
Generación al equipo Ratio de asistencias por tiros del equipo
Habilidad de obtener rebotes Probabilidad condicional de que obtenga el rebote ofensivo o defensivo, sabiendo que se ha obtenido ese rebote.
Capacidad defensiva Ratio de tapones y robos por parada realizada

Para el cálculo de estas variables, primero, vamos a obtener las estadísticas de equipo que necesitamos (anotación del equipo, tiros del equipo, % rebotes ofensivos y defensivos). Juntamos los datos que coinciden en ambas bases de datos, haciendo coincidir la temporada y el equipo de cada jugador.

Próximo paso que tomamos es el propio cálculo de las variables que vamos a evaluar para nuestro clúster.

Para la detección de posibles outliers, hemos creado gráficos de cajas y bigotes, que nos muestren donde se encuentran esos outliers.

En el ejemplo anterior, podemos observar, la distribución del porcentaje de asistencias por jugador, y un punto que parece estar muy destacado con respecto a los demás, casi en el 40%. Por cada variable hemos evaluado esos puntos que están un poco fuera de la distribución y decidido eliminarlos.

Finalmente, escalaremos los datos, ¿qué significa esto? Cómo muchos datos tienen diferentes dimensiones y los rangos entre ellos pueden ser altos, lo que haremos es escalarlos para que todas las métricas tengan valores de entre 0 a 1, así todas las variables tienen el mismo peso.

Una vez transformados los datos, utilizaremos una técnica para saber cuál es el número óptimo de clústeres que realizaremos para nuestro análisis

Esta técnica consiste en realizar un gráfico sobre diferentes parámetros, algo más avanzados, que mide el número óptimo de clústeres basados en nuestros datos. El número de clústeres que se deben obtener es un tanto subjetivo, ya que el punto óptimo de clústeres es donde la gráfica realiza un cambio brusco en la pendiente, formando un vértice, y creando una bajada menos pronunciada, casi plana.

Nosotros hemos creído conveniente que para esta gráfica en concreto, tratando el baloncesto masculino, utilizaremos 5 clústeres. En el caso de baloncesto femenino, también obtenemos un número de 5 clústeres.

Veamos los resultados que nos encontramos

Se pueden observar ambos gráficos de jugadores y jugadoras en competiciones FEB, finalmente, ha resultado que ambas competiciones existen 5 tipología de jugadores/as. Estos gráficos tratan de concentrar todas las variables que hemos utilizado para la realización del clúster y las combina en solo dos métricas, siendo mucho más sencillo la posibilidad de realizar un gráfico y que se observe la separación entre grupos.

Podéis ver que en la nube de puntos de diferentes colores, existe una estrella de un color azulado, ese es el centro teórico del clúster, “en cristiano”, el jugador y jugadora más pura de ese clúster en concreto.

Pensaréis, muy bien, muy bonito y muy colorido, pero qué aplicación puede tener todo esta complicación que estáis realizando, ¿para qué?

Una tabla para masculino

Segunda tabla, para baloncesto FEB femenino

A estas alturas, estaréis cansado de tantos colorines, pero os prometemos, que en esta tabla van a ser fundamentales para detectar patrones.

Esta es la representación del color que utilizamos, cuando más bajo es el valor de la variable, más azul es, cuanto mayor sea el valor, más rojo se representa, sin embargo, si es un valor intermedio, se plantea un color medio grisáceo.

Las tablas corresponden a los diferentes roles de jugadores agrupados con la media de las estadísticas que hemos evaluado en nuestro clúster, conclusiones que podemos sacar son:

  • Parece que la estructura de clústeres para baloncesto masculino y femenino en la feb, es muy similar.
  • Sólo las variables de puntos por tiro y robos por paradas se diferencian un poco por el sexo biológico de los competidores.
  • Más concretamente hablando de clústeres:
    • Grupo 0: Jugador con mayor probabilidad de asistencias en los lanzamientos que realiza el equipo, también gran aportación en la anotación y alto porcentaje de uso pero eficiencia media en el lanzamiento, jugador que también lanza más de tres, realizando 17 lanzamiento de dos cada 10 lanzamientos de 10. El mejor jugador de robos por paradas. Un jugador que genera para él y para el equipo.
    • Grupo 1: es el jugador/a todoterreno, la estrella del juego. Con el mayor porcentaje del uso de balones cuando se encuentra en pista y mayor porcentaje de anotación sobre el total del equipo. Rol en el que el porcentaje de anotación es el más elevado, además, de su eficiencia en los puntos por tiro. Sobre todo anotador desde dos puntos. Gran porcentaje de obtención de rebotes ofensivos y defensivos, y gran capacidad de boquear lanzamientos.
    • Grupo 2: jugador que tiene bastante calificaciones bajas con respecto a los otros clústeres de sus compañeros, más eficiente que clúster 3, porque acapara menos el balón, por tanto, obtiene mejor eficiencia.
    • Grupo 3: jugadores y jugadoras que a priori, su gran destreza es la defensa, ya que son los segundos mejores defensores en robos por paradas realizadas, no son grandes bloqueadores en este caso. En el ataque, son los que más lanzan de tres y su porcentaje de uso es bastante bajo, aun así el menos eficiente en puntos por tiro.
    • Grupo 4: jugador y jugadora medio, no es una estrella pero tampoco pasa desapercibida, roles con anotación y porcentaje de uso medio, de la misma forma, con variables defensivas.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

A %d blogueros les gusta esto: