En las categorías FEB, ¿Dónde, cómo y a quién se pasa el balón tras rebote ofensivo?

Semanas atrás quisimos asistir a todos los entrenadores FEB explicando un poco cuáles son las acciones que se daban tras un rebote ofensivo, además de conocer las posiciones en el campo de esos lanzamientos que se producen tras un rebote ofensivo. ¿No viste ese análisis? Pásate por este enlace (https://ballandstats.com/2022/08/11/en-las-categorias-feb-que-se-produce-tras-un-rebote-ofensivo) porque lo que viene es una continuación de lo que tratamos de analizar en este post, sólo te tomará 5 minutos.

Tras resolver dudas que entrenadores plantearon a nuestro equipo de Ball & Stats, se plantearon más preguntas, cada cuál de ellas más interesantes; nuestro trabajo es poder dar respuestas a estas cuestiones reales, tratando de solucionar problemas. Nuestro siguiente análisis se plantea en el siguiente tweet, escrito por Mikel Ereño Martín, entrenador asistente en Rumania.

Pongámonos en contexto.

Nuestro equipo ha obtenido un rebote ofensivo, ¿quién?

Nuestro equipo realiza un lanzamiento tras rebote ofensivo, ¿quién produce ese tiro?

¿Ese tiro ha sido asistido? Si ha sido asistido, ¿quién asistió a ese jugador?

Para seguir una coherencia en nuestro análisis, vamos a visualizar una tabla resumen de jugadores y sus acciones, cuántas veces obtienen rebote ofensivo, cuántas veces obtienen una asistencia tras rebote ofensivo y cuantos lanzamientos realizan tras rebote ofensivo.

La obtención de este conjunto de datos no es muy compleja, pero tiene bastantes pasos a seguir, para hacer una explicación sencilla, se dividen la secuencia de acciones en diferentes tablas, sobre cada tabla de secuencia en las acciones de juego se obtiene el número de veces que se produce determinadas acciones. Finalmente, se unen todas estas tablas dando lugar a una tabla definitiva como la que os presentamos, ordenada por el número de acciones tras rebote que los y las jugadoras acumulan.

Ya tenemos los datos, ahora nos toca darle un poco de sentido a que significan estos datos, ¿cómo los podemos comparar? Para ello vamos a obtener ciertas medidas que nos puedan ayudar a esto.

¿Cómo interpretar estos datos? Todos conocemos lo que es una media y una desviación típica, probablemente; sobre todo, la media. Son medidas que nos pueden indicar la centralización y dispersión de los datos; sin embargo, en este conjunto de datos existe una gran variación, y su interpretación nos podría llevar a una gran confusión. Por lo que pasaremos a los percentiles, esto es algo más complejo de entender, pero pongamos un ejemplo, debemos observar la primera columna de “Lanzamiento” y el siguiente gráfico:

Los percentiles son medidas que nos ayudan a entender donde se encuentra la población de nuestros datos con respecto a ciertos valores. Los percentiles pueden ir desde 0 a 100.

Observemos la columna, tiene valores, min, 25, 50, 75% y max; 0, 1, 3, 6 y 50 correspondientemente.

¿Qué nos quiere decir estos datos?

Si observamos la gráfica, tenemos un rectángulo azul (caja) y unas líneas negras (bigotes), a la derecha del gráfico se observan ciertos puntos (outliers).

Enfoquémonos en la caja azul, la parte izquierda corresponde al 25% de la población, la parte derecha de la caja corresponde al 75% de la población; dentro de nuestra caja existe otra línea, que corresponde al 50% (importante: estos valores son iguales a los previamente mencionados: 0, 1, 3, 6 y 50).

En nuestro caso, estamos evaluando el lanzamiento, por lo que si nos enfocamos, por ejemplo, en el 75% de la población, tiene un valor de 6 lanzamientos como acción tras rebote ofensivo; explicando que menos del 75% (alrededor de 1120 datos) están por debajo de los 6 lanzamientos; misma interpretación para el 25% (373 datos) están por debajo de un lanzamiento como acción tras rebote ofensivo.

¿En qué nos ayuda? En entender cuáles son los valores que más se dan en nuestra población de jugadores, pudiendo detectar también los jugadores que sobresalen en ciertas medidas que nos puedan interesar (outliers); si sabemos que el 75% de la población tiene menos de 6 lanzamientos, podemos filtrar para quedarnos con el otro 25% de la población que destaca y evaluar sus características.

Como estamos tratando de explicar lo que más ocurre en los partidos de baloncesto FEB, deliberadamente, vamos a analizar, los datos que más se suelen repetir, así hacemos más sencillo nuestro análisis. Hemos obtenido que el percentil 90% corresponde a un total de 29 acciones tras rebote ofensivo, esta será nuestra medida de corte.

Hemos realizado dos gráficos que cuentan la misma historia, pero que dan una información diferente de una forma sencilla. Los tres jugadores con mayor número de acciones (29), y como se distribuyen esas acciones que realizan en cada jugador, más una clara comparativa de ambos a la derecha. Predominando uno de esos jugadores en el lanzamiento más que en el primer rebote, como lo hacen los otros dos jugadores.

Una vez, analizadas un poco las posibilidades tras ese rebote ofensivo, vamos a tratar de responder concretamente la pregunta que se nos ha realizado: ¿Quién asiste tras ese rebote ofensivo? ¿Quién realiza el lanzamiento?

Para preparar el análisis concreto de estos datos, debemos filtrar las diferentes acciones, en su respectivo orden de consecución:

  1. Rebote Ofensivo
  2. Asistencia
  3. Lanzamiento

Tras la obtención de estos datos en concreto que queremos analizar, nos encontramos con 2144 ocasiones en las que se produce dicha secuencia de rebote ofensivo, asistencia y lanzamiento. La probabilidad que ocurra dicha secuencia es de 1.37% dentro de las temporadas 20/21 y 21/22.

¿Quiénes son los jugadores que acumulan más rebotes? ¿Asistencias? Y, ¿lanzamientos?

En las gráficas anteriores podemos observar en cada caso quiénes son los 5 jugadores con mayor número de rebotes ofensivos cuando el equipo mantiene el balón en las siguientes dos acciones (rebote+asistencia+lanzamiento), el top de 5 jugadores que asisten el lanzamiento tras un rebote ofensivo y, finalmente, el top de 5 jugadores que realizan un lanzamiento asistido.

Pero lo que más nos interesa conocer sobre estas acciones, es como interaccionan unas con otras, que será lo que analizaremos en los siguientes párrafos.

Con respecto al total de casos en los que se obtiene un rebote ofensivo y es seguido por una asistencia, casi el 35% de ellos corresponde al mismo jugador, ese jugador obtiene un rebote ofensivo y, provee, a otro jugador de un lanzamiento anotado. En el otro 65% de los casos, las interacciones de acciones se produce entre 3 jugadores diferentes.

¿Qué ocurre cuando los jugadores que obtienen el rebote ofensivo no son los que asisten el lanzamiento? Veamos el siguiente gráfico:

Los gráficos de los que disponemos ahora marca la relación entre reboteadores y los asistentes en un equipo concreto.

Cada círculo comprende a un jugador, la línea mide la cantidad (por el grosor) y la dirección de la relación (flecha).

Realizaremos el mismo procedimiento, con los jugadores que asisten y los que lanzan.

Estos gráficos corresponden a (marrón) Real Madrid A y (verde) Cajasiete canarias.

Es difícil sacar una conclusión concreta como se nos pidió; hemos tratado de mostrar un análisis que es posible realizarse a través de un procesamiento de datos concienzudo, previamente, obtención de datos y, sobre todo, manipulación de los datos para que queden de una forma específica para poder ser analizados de la siguiente forma.

En estos casos concretos:

  • En Cajasiete canarias, gráfico de puntos verdes: existe una dominancia clara de L. Babel en la obtención de rebotes ofensivos y a través de estos distribuir el balón a otros jugadores que producen asistencias.
  • En el caso de Real Madrid A, M. García López parece ser la piedra angular de las asistencias tras los rebotes ofensivos.

Estos análisis tan particulares, son una gran herramienta para la evaluación de tu equipo o el equipo rival al que te enfrentas, sacar una generalización de esto, nos llega a ser más compleja por la gran cantidad de jugadores, ligas, categorías que estamos tratando en los datos.

Queríamos mostrar con este post, que las preguntas que se formulan entrenadores, pueden ser respondidas, sí, incluso en ligas FEB. Nosotros estamos aquí para guiarte en este proceso hacia la gestión de un equipo deportivo, incluso, club a través del análisis de datos.

En las categorías FEB, ¿Que estilo de equipos nos encontramos?

Previamente, en análisis que fueron realizados, ya os mostramos ideas tan interesantes como la agrupación de jugadores dependiendo de cómo desarrollaban su juego dentro de la pista; esta técnica, también es posible utilizarse para la obtención de los estilos de juego de los equipos. Muchos entrenadores, soñamos con tener el santo grial para la obtención de mejores resultados en nuestro equipo. Sin lugar a dudas, existe tantas combinaciones y posibilidades, que es muy difícil de llevar a un nivel tan preciso de acierto; incluso, con las mejores tecnologías se llega a complicar un poco.

¿Nunca te llegó a la cabeza la pregunta sobre qué tipo de equipo acumula un mayor número de victorias? ¿Qué tipología de juego es el que debo perseguir si quiero tener un mejor rendimiento? Sigue leyendo, porque esto es lo que vamos a tratar hoy.

Se han obtenido los datos de los equipos de competiciones FEB en las temporadas 20/21 y 21/22. Crearemos un archivo de datos con la media de los datos estadísticos y desviaciones típicas de los equipos en cada temporada, finalmente, separaremos la liga masculina y femenina. Hemos decidido que también puede ser interesante obtener las diferencias de anotaciones en ese partido por cuarto, para conocer en qué momentos esos equipos obtienen una mayor diferencia positiva o negativa.

Existen un total de 14486 partidos, 14424 partidos finalizaron en el último cuarto, el resto, se finalizó tras una prórroga, 806 partidos finalizaron tras una sola prórroga, 84 partidos terminaron tras dos prórrogas o más. Sólo contaremos con los primeros cinco cuartos para el análisis de nuestro clúster.

¿Qué vamos a evaluar para nuestro clúster?

¿Qué evaluamos? ¿Cómo lo evaluamos?
Capacidad de anotación Puntos anotados por lanzamiento realizado y lanzamientos totales
Distribución de lanzamientos Tiros de 3 intentados/Tiros campo intentados
Eficiencia  Ofensiva Puntos por 100 posesiones
Eficiencia Defensiva Puntos recibidos por 100 posesiones
Ritmo de juego Pace
Juego en equipo Ratio asistencias
Agresividad al aro Ratio tiros libres por lanzamiento intentado
Dominación del tablero % Rebotes ofensivos y defensivos
Estabilidad del juego Media de las desviaciones expuestas previamente

 

En la imagen anterior se puede observar los datos que estamos utilizando para la obtención de los diferentes clústeres.

Se escalan los datos, para que no afecten los valores absolutos entre las diferentes variables, y se obtiene el gráfico para deducir el número de clústeres que se debería de realizar en base a los datos que tenemos.

Esta técnica consiste en realizar un gráfico sobre diferentes parámetros, algo más avanzados, que mide el número óptimo de clústeres basados en nuestros datos. El número de clústeres que se deben obtener es un tanto subjetivo, ya que el punto óptimo de clústeres es donde la gráfica realiza un cambio brusco en la pendiente, formando un vértice, y creando una bajada menos pronunciada, casi plana.

Nosotros hemos creído conveniente que para esta gráfica en concreto, tratando los equipos masculinos, utilizaremos 4 clústeres. En el caso de baloncesto femenino, también obtenemos un número de 4 clústeres.

Veamos los resultados que nos encontramos

ambos gráficos tenemos los diferentes clústeres de los equipos en ligas masculinas y en ligas femeninas.

¿Cuáles son las características de cada clúster?

  1. Nuestro clúster número 0 para la liga masculina se trata de los equipos con mayor variación durante la temporada. Equipos que no tienen una dominación clara en cuanto a los diferentes parámetros que evaluamos, estos son los equipos que acumulan un menor porcentaje de victorias.
  2. Nuestro segundo grupo, incluye a los equipos que dominan los tableros, los mejores porcentajes en rebotes ofensivos y en rebotes ofensivos, con un alto ritmo de juego, un mayor número en los lanzamientos de tres sobre los tiros de campo lanzados, incluso teniendo un elevado número de intentos. Los equipos con mayor porcentaje de victorias, aunque sorprendemente, no los más eficientes ofensivamente, sí defensivamente.
  3. En el tercer grupo, nuestro clúster 2, se encuentran los equipos que no se encuentran cómodos con los lanzamientos de tres, alto número de lanzamientos y poco ratio de tiros libres. Equipos que comienzan los partidos con un bajo rendimiento, ya que suelen perder los tres primeros cuartos, pero que posteriormente en el último cuarto, obtiene un mejor rendimiento. Son los equipos que acumulan un menor porcentaje de victorias en la temporada.
  4. Por úlitmo, los equipos que obtienen la mejor eficiencia, puntos por tiro, ratio ofensivo; sin embargo, su defensa brilla por ausencia, siendo el equipo que mayor puntos permite por 100 posesiones. Equipos que mueven bien el balón y son agresivos yendo a canasta.

En las ligas femeninas, los clústeres tienen mayores diferencias entre unos y otros.

  1. En nuestro primer clúster (0), tenemos a los equipos más rápidos, que producen un mayor número de lanzamientos en cada partido. Esto hace que probablemente su rendimiento ofensivo y defensivo sea un rendimiento bastante medio, con respecto a los demás grupos. Moviéndose en un 53% de victorias por temporada.
  2. Un segundo grupo, que pertenece a los equipos con una mayor eficiencia en el lanzamiento, mejor eficiencia ofensiva, ritmo también bastante alto, un ratio alto de asistencias por lanzamiento, generan sus mayores diferencias en las anotaciones en segundo y tercer cuarto. Acumulan alrededor de un 55% de victorias.
  3. El tercer grupo, se lo quedan los peores anotadores y defensores de la liga, eficiencia en el lanzamiento bastante baja, además de menor número de lanzamientos. Todos los demás grupos les saca gran ventaja en la lucha de los rebotes ofensivos y defensivos. Acumulan un 33% de victorias en la temporada.
  4. El último clúster, está habitado por los mayores lanzadores de tres, aunque su eficiencia ofensiva no es la mejor, son los mejores defensores; un ritmo más bajo de juego; pero dominando claramente los tableros y los contactos, con un 21% de lanzamientos yendo a la línea de tiros libres. Generan sus mayores diferencias en el primer y último cuarto. Acumulan un 77% de victorias por temporada.

 

Previamente os presentamos un análisis de la tipología de jugadores que existen en las ligas FEB, en este caso, lo realizamos con los equipos que componen estas competiciones.

Existen patrones más claros en baloncesto femenino, que en baloncesto masculino. La gran diferencia de porcentaje de victorias entre los grupos, nos genera más preguntas que soluciones.

¿Dominación de los tableros? Parece ser claramente fundamental para la consecución de la victoria. ¿Ser eficiente o ser rápido? En masculino, nos da la sensación, tras el análisis de los datos, que jugar más rápido y lanzar más, te ayudará a obtener más victorias, pero no te descuides de la eficiencia de tu equipo; claramente, sé el mejor equipo defensivo.

En el caso del femenino, no parece un factor tan importante la rapidez/efectividad, buena selección de tiro, junto con una buena defensa y dominación de los tableros.

Pregunta que nos surge…

¿Es significativa esa diferencia que se produce entre los diferentes grupos? ¿Qué tipología de jugadores se encuentran en esos equipos?

En las categorías FEB, ¿Que se produce tras un rebote ofensivo?

En las pasadas semanas uno de los nuestros, Diego de la Pinta, formó parte de un conjunto de entrenadores para la realización de un campus de baloncesto, con la idea de mejorar a todos los jugadores inscritos en este; no sólo fue como entrenador, sino que representó nuestra start-up y quiso acercar las estadísticas y nuestro trabajo a este conjunto de entrenadores. Muchos quedaron con más dudas que respuestas, ¿Cuál es el límite del uso de estos datos estadísticos? Sinceramente, creemos que un gran límite está en las personas que utilizan esos datos; por eso, nos planteamos la realización de este proyecto.

  1. Cada vez más los entrenadores tienen claro, que el uso de datos estadísticos te puede dar una ventaja con respecto a los rivales.
  2. Lo que poco se conoce y utiliza, son los datos para mejorar la decisión de los clubes deportivos. Cómo aumentar tus ganancias para así no deber dinero y que tu club siga manteniéndose, o tenga la posibilidad de ascender.
  3. ¿La verdad? Este trabajo lo realiza normalmente un entrenador asistente, no existe poder económico para tener contratada a una persona específicamente para el análisis de datos. Esto produce un gran estrés y alto nivel de trabajo y exigencia a los asistentes, ya que muchos no sabrán manejas estadísticas y, si saben, probablemente les demorará bastante tiempo.

Aquí es donde viene nuestro proyecto, siendo entrenadores, especializados en el análisis de datos, estamos creando una herramienta automática para obtener esos datos estadísticos y procesarlos, con el objetivo de que esos datos, estén disponibles lo antes posible, y un precio más que razonable, ya que se puede abarcar a todos los equipos FEB, abasteciendo a un gran número de equipos, posibilitando así un precio bastante más bajo que muchos servicios.

Hoy queremos mostrar el gran poder y la poca limitación de estos análisis, tratando de resolver una de esas dudas que los entrenadores propusieron en el campus de baloncesto; total, por preguntar, ¿qué podemos perder?

Aquí viene la pregunta:

“[…] y, ¿se podría obtener los porcentajes de las acciones que ocurren tras la obtención de un rebote ofensivo? […]”

¿Se puede? Acompáñanos en este nuevo viaje a las estadísticas de FEB.

Si clicáis en la siguiente página: https://baloncestoenvivo.feb.es/partido/2271024 podréis observar las estadísticas recogidas por la FEB, tendréis las pestañas: Directo, Rankings, Ficha, Gráfico de tiro, Estadísticas. Todos estos son los datos que se pueden recoger. Atendiendo a la naturaleza de la pregunta, ¿qué ocurre tras un rebote ofensivo? Los datos que debemos procesar son bastante claros, debemos de utilizar los datos del directo, que llamaremos “jugada a jugada”.

Aquí tenemos un ejemplo, para que podáis ver claro como los datos se organizan.

Desde Ball & Stats, hemos realizado un procesamiento de los datos, que tratamos de obtener la mayor información posible de estas cadenas de texto, sin mucha organización; y nos ha quedado algo así.

Por lo que ya podemos identificar, jugadores, acciones de juego, éxito en la finalización del lanzamiento, que tipo de lanzamiento se realiza, cómo se pierde el balón, etc.

Para este problema en concreto, debemos de identificar cuando se obtiene un rebote y si es el mismo equipo que lanzó, el equipo que tiene el rebote.

Esto nos llega a un gráfico, como el que previamente, habíamos subido a nuestras redes sociales.

Pero, personalmente, es un análisis bastante vago, y que no nos da mucha información; así que, indaguemos un poco más en qué ocurre tras estos rebotes ofensivos.

Y de hecho, realizando un análisis bastante más exhaustivo de cómo son las secuencias de las acciones, hemos previamente realizado una asunción, que no ha sido muy correcta; a la hora del procesamiento de los datos, no se contempló previamente como las acciones que ocurrían as mismo minuto de partido se ordenaban, ejemplo, lanzamientos y rebotes, asistencias y rebotes; en nuestro datos salía como acción posterior a un lanzamiento una asistencia, lo cual no puede ser. Finalmente, una vez solucionado, podemos llegar a la siguiente conclusión, en el siguiente gráfico que exponemos:

 

Este gráfico, si hace mayor justicia al problema que estamos intentando resolver, se han obtenido las acciones de rebote ofensivo, y se ha evaluado cuál es la acción siguiente que se realiza por parte de ese equipo.

En el gráfico, queda bastante visual cuáles son las acciones que más se producen tras un rebote ofensivo, con mayor proporción se producen lanzamientos, asistencias y pérdidas de balón. Con menores porcentajes se producen siguientes acciones que se pueden ver resumidas en la tabla con sus porcentajes de aparición en el juego.

Aquí por ejemplo, para seguir avanzando un poco en el análisis, podemos preguntarnos, dónde se producen esos lanzamientos y las probabilidades de acierto.

En el gráfico que hemos expuesto por último, podemos ver claramente las posiciones de los lanzamientos que se realizan tras la obtención de un rebote ofensivo. Queda bastante claro, que donde mayor porcentaje de lanzamientos tras rebote existe es en el interior de la zona.

Podríamos seguir profundizando algo más en el problema, pero esto es una clara demostración de hasta donde los datos de los que disponemos son bastante utilizables y nos puede dar una gran clara idea, de cómo nuestro club, equipo, jugador, está actuando en los partidos.

Seguiremos trabajando para ofreceros los mejores servicios.

En las categorías FEB, ¿Que roles de jugadores nos encontramos?

Es una realidad que en muchas ocasiones la NBA se adelanta a las demás ligas de baloncesto en el mundo, quizá unos pocos se adelantaron a ellos pero sus métodos no fueron tan resonados como ocurre en esta organización, la NBA está en la vanguardia y, las demás ligas, están siempre recogiendo esos conocimientos.

A nivel de análisis de datos están muy por encima del baloncesto europeo, pero, poco a poco Europa está comenzando a obtener fuerzas en este campo.

Uno de los problemas al que entrenadores se enfrentan constantemente, mayormente, al finalizar la temporada, es la confección de una plantilla que pueda llegar a ser eficiente de cara a la nueva temporada, para conseguir los objetivos propuestos. Suele ser una labor bastante compleja, ya que hay que ajustar puestos y roles de jugadores, así como el presupuesto del que disponga el club deportivo.

Tradicionalmente, incluso, actualmente, para una mejor comprensión del juego y de los jugadores, se separan a los jugadores en las posiciones tradicionales, enumeradas desde el 1 hasta el 5; sin embargo, todos los entrenadores actuales saben que hay diferentes tipos de roles por cada posición específica de juego. Unos ejemplos pueden ser los bases que son más agresivos y atacan el aro, mientras otros se dedican más a la distribución del juego; o jugadores interiores que están mayormente dedicados a la obtención de rebotes, mientras otros, son mejores en proporcionar asistencias a sus compañeros uno vez el balón pasa por sus manos.

De eso hablaremos en esta ocasión en las competiciones FEB, vamos al lío.

Se tienen los datos de los jugadores durante las temporadas 20/21 y 21/22, masculinas y femeninas. Estos datos se han dividido en las diferentes temporadas y en las diferentes competiciones, para crear una tabla de datos, con las medias de los jugadores en cada temporada, por cada competición en la que ha estado; ejemplo, si un jugador en una misma temporada, ha jugado en liga EBA y en leb Plata, estas estadísticas no se considerarán como las mismas, sino que se separarán y computarán la media de los datos de forma independiente.

Una vez realizada las operaciones que hemos descrito previamente, hemos realizado un estudio de las diferentes variables que componen la base de datos y su continuidad, se ha valorado un histograma, con líneas para observar valores de media, mediana y moda, además de sus valores exactos, skew y kurtosis, finalizando con una prueba paramétrica para conocer si esa variable se puede considerar como continua, diferenciando los datos masculinos y femeninos.

Debido a que muchas de las variables se encontraban sesgadas por jugadores y jugadoras que no tenían muchos minutos, lo que hicimos fue filtrar la base de datos, para contabilizar aquellos que al menos hubiesen jugado 5 minutos de partido.

El siguiente paso que realizamos fue escoger las variables que vamos a introducir en nuestra técnica de clustering para que nos separe los diferentes roles de los jugadores de la FEB. Necesitamos variables que nos puedan diferenciar roles de los diferentes jugadores, necesitamos medir el nivel de anotación de un jugador, el nivel de participación de ese jugador, su eficiencia en el lanzamiento, la capacidad de generar a los demás compañeros y la habilidad de obtener rebotes, su capacidad defensiva.

¿Qué variables vamos a utilizar?

¿Qué evaluamos? ¿Cómo lo evaluamos?
Nivel de anotación Porcentaje de anotación con respecto al equipo
Nivel de participación Porcentaje de uso
Eficacia del lanzamiento Floor %, Puntos por tiro
Zonas de lanzamiento Ratio tiro de 2 y tiro de 3
Generación al equipo Ratio de asistencias por tiros del equipo
Habilidad de obtener rebotes Probabilidad condicional de que obtenga el rebote ofensivo o defensivo, sabiendo que se ha obtenido ese rebote.
Capacidad defensiva Ratio de tapones y robos por parada realizada

Para el cálculo de estas variables, primero, vamos a obtener las estadísticas de equipo que necesitamos (anotación del equipo, tiros del equipo, % rebotes ofensivos y defensivos). Juntamos los datos que coinciden en ambas bases de datos, haciendo coincidir la temporada y el equipo de cada jugador.

Próximo paso que tomamos es el propio cálculo de las variables que vamos a evaluar para nuestro clúster.

Para la detección de posibles outliers, hemos creado gráficos de cajas y bigotes, que nos muestren donde se encuentran esos outliers.

En el ejemplo anterior, podemos observar, la distribución del porcentaje de asistencias por jugador, y un punto que parece estar muy destacado con respecto a los demás, casi en el 40%. Por cada variable hemos evaluado esos puntos que están un poco fuera de la distribución y decidido eliminarlos.

Finalmente, escalaremos los datos, ¿qué significa esto? Cómo muchos datos tienen diferentes dimensiones y los rangos entre ellos pueden ser altos, lo que haremos es escalarlos para que todas las métricas tengan valores de entre 0 a 1, así todas las variables tienen el mismo peso.

Una vez transformados los datos, utilizaremos una técnica para saber cuál es el número óptimo de clústeres que realizaremos para nuestro análisis

Esta técnica consiste en realizar un gráfico sobre diferentes parámetros, algo más avanzados, que mide el número óptimo de clústeres basados en nuestros datos. El número de clústeres que se deben obtener es un tanto subjetivo, ya que el punto óptimo de clústeres es donde la gráfica realiza un cambio brusco en la pendiente, formando un vértice, y creando una bajada menos pronunciada, casi plana.

Nosotros hemos creído conveniente que para esta gráfica en concreto, tratando el baloncesto masculino, utilizaremos 5 clústeres. En el caso de baloncesto femenino, también obtenemos un número de 5 clústeres.

Veamos los resultados que nos encontramos

Se pueden observar ambos gráficos de jugadores y jugadoras en competiciones FEB, finalmente, ha resultado que ambas competiciones existen 5 tipología de jugadores/as. Estos gráficos tratan de concentrar todas las variables que hemos utilizado para la realización del clúster y las combina en solo dos métricas, siendo mucho más sencillo la posibilidad de realizar un gráfico y que se observe la separación entre grupos.

Podéis ver que en la nube de puntos de diferentes colores, existe una estrella de un color azulado, ese es el centro teórico del clúster, “en cristiano”, el jugador y jugadora más pura de ese clúster en concreto.

Pensaréis, muy bien, muy bonito y muy colorido, pero qué aplicación puede tener todo esta complicación que estáis realizando, ¿para qué?

Una tabla para masculino

Segunda tabla, para baloncesto FEB femenino

A estas alturas, estaréis cansado de tantos colorines, pero os prometemos, que en esta tabla van a ser fundamentales para detectar patrones.

Esta es la representación del color que utilizamos, cuando más bajo es el valor de la variable, más azul es, cuanto mayor sea el valor, más rojo se representa, sin embargo, si es un valor intermedio, se plantea un color medio grisáceo.

Las tablas corresponden a los diferentes roles de jugadores agrupados con la media de las estadísticas que hemos evaluado en nuestro clúster, conclusiones que podemos sacar son:

  • Parece que la estructura de clústeres para baloncesto masculino y femenino en la feb, es muy similar.
  • Sólo las variables de puntos por tiro y robos por paradas se diferencian un poco por el sexo biológico de los competidores.
  • Más concretamente hablando de clústeres:
    • Grupo 0: Jugador con mayor probabilidad de asistencias en los lanzamientos que realiza el equipo, también gran aportación en la anotación y alto porcentaje de uso pero eficiencia media en el lanzamiento, jugador que también lanza más de tres, realizando 17 lanzamiento de dos cada 10 lanzamientos de 10. El mejor jugador de robos por paradas. Un jugador que genera para él y para el equipo.
    • Grupo 1: es el jugador/a todoterreno, la estrella del juego. Con el mayor porcentaje del uso de balones cuando se encuentra en pista y mayor porcentaje de anotación sobre el total del equipo. Rol en el que el porcentaje de anotación es el más elevado, además, de su eficiencia en los puntos por tiro. Sobre todo anotador desde dos puntos. Gran porcentaje de obtención de rebotes ofensivos y defensivos, y gran capacidad de boquear lanzamientos.
    • Grupo 2: jugador que tiene bastante calificaciones bajas con respecto a los otros clústeres de sus compañeros, más eficiente que clúster 3, porque acapara menos el balón, por tanto, obtiene mejor eficiencia.
    • Grupo 3: jugadores y jugadoras que a priori, su gran destreza es la defensa, ya que son los segundos mejores defensores en robos por paradas realizadas, no son grandes bloqueadores en este caso. En el ataque, son los que más lanzan de tres y su porcentaje de uso es bastante bajo, aun así el menos eficiente en puntos por tiro.
    • Grupo 4: jugador y jugadora medio, no es una estrella pero tampoco pasa desapercibida, roles con anotación y porcentaje de uso medio, de la misma forma, con variables defensivas.

COOPER FLAGG

Descubriendo a … Cooper Flagg

 

El pasado 10 de julio la selección sub-17 de Estados Unidos conseguía hacerse con el campeonato del mundo de la categoría al imponerse a España en el Martín Carpena de Málaga. En ese partido y a lo largo de todo el campeonato, dentro del combinado americano destacó un joven espigado con el dorsal número 9, su nombre, Cooper, su apellido, Flagg.

¿Quién es Cooper Flagg?

Nacido el 21 de diciembre de 2006 (15 años) en Newport, Maine, Cooper Flagg es un jugador de la clase de 2025 quien ha militado en Nokomi Regional High School, y que recientemente se proclamó campeón del mundo sub-17 con las selección de Estados Unidos, siendo a la par uno de los jugadores más jovenes de su equipo (solo superado por Koa Peat) y uno de los más destacados del torneo.

El baloncesto queda en familia.

Cooper no es el único de la familia Flagg en jugar al baloncesto, su hermano gemelo Ace le acompañará en su próxima aventura en Montverde Academy. Y aún hay más, Kelly (Bowman) Flagg, es decir, la madre de los Flagg, jugó durante cuatro temporadas (1995–1999) en la universidad de Maine, donde consiguió ganar 4 títulos de la American East de manera consecutiva. Una familia de baloncesto en toda regla.

¿Cómo juega Cooper Flagg?

Jugador muy completo tanto a nivel defensivo como ofensivo. Ha dominado el rebote en sus minutos en cancha (19,6 min. por partido) capturando una media de 10 rebotes por encuentro (5,4 en defensa y 4,6 en ataque). En defensa se ha mostrado como un jugador muy activo durante todo el torneo, muestra de ello son sus 2,4 robos y 2,9 tapones por partido, siendo el mejor ejemplo su actuación en la final ante España donde consiguió 17 rebotes, 8 robos de balón y 4 tapones.

Estadísticas en ataque y defensa.

En el aspecto ofensivo Cooper se ha mostrado más discreto promediando solo 0,83 puntos por cada tiro de 2 que ha hecho y 1,29 puntos por cada tiro de 3, si bien solo ha realizado 7 tiros en todo el campeonato de los cuales ha anotado 3. Por supuesto, es en este punto cuando es obligatorio recordar que hablamos de un chico de 15 años que está en pleno proceso de formación y que el margen de mejora en este y otros aspectos es enorme.

Estadística de tiro.

Si hay algo característico del juego de Cooper Flagg es que siempre que está en cancha produce. De media en el campeonato mundial ha disfrutado de algo más de 11 acciones ofensivas en ataque. Si elevamos a 100 estas posesiones obtenemos que el 14,3% de estas acaban en asistencias, el 10% en pérdidas de balón, resultando un ratio de 1,4 asistencias por cada pérdida. Mejores números presenta en el apartado de tapones, donde por cada 2,2 tapones realiza una falta.

Estadísticas avanzadas.

En definitiva estamos hablando de un jugador muy completo y que a su temprana edad posee una gran lectura del juego y domina apartados muy complejos del juego, tanto a nivel defensivo como ofensivo. Con gran capacidad para intimidar y buen timing tanto para el tapón como para el rebote. Muy buena lectura desde la defensa, siendo uno de los mejores de su selección en poner en liza la presión a toda cancha que realizaron en diferentes fases del campeonato, provocando continuas pérdidas de balón en el rival. Cooper Flagg a sus 15 años presenta una gran multitud de herramientas que lo pueden definir como un jugador total.

El futuro.

Para la próxima temporada Cooper jugará junto a su hermano gemelo, Ace, en la prestigiosa Montverde Academy, pero sus planes de futuro no terminan aquí. Para el 2025 ya cuenta con ofertas de diferentes Colleges destacando entre ellas West Virginia, Michiga y Duke. No cabe duda de que al bueno de Cooper Flagg le espera un futuro brillante.

En las categorías FEB, ¿El número de posesiones afecta a la posibilidad de victoria?

La analítica avanzada cada vez se va consolidando mucho más en el deporte, podríamos decir que todo comenzó con el béisbol, posiblemente con una clara revolución tras el famoso caso de Oakland Athletics, del cual se escribió libros y una película: Moneyball.

En ambos, nos cuentan la historia sobre cómo equipos deportivos de alto rendimiento utilizan los datos disponibles para obtener ventajas que puedan llevarlos a obtener un mayor número de victorias. La cultura del dato sigue creciendo y, la especialización y el conocimiento que existe, actualmente, sobre los diferentes campos multidisciplinarios en los deportes es abismal. Muchos pueden tener acceso a esos datos e, incluso, a profesionales que puedan ayudarle en el proceso de entendimiento de estos. Nosotros en este caso vamos a tratar de desvelar en este post, uno de los puntos que pueden llegar a ser importantes para la obtención de un mayor número de victorias, o derrotas.

¿Cómo afecta el número de posesiones sobre el resultado? Cuando expertos analistas comenzaron a preguntarse como evaluar baloncesto y su eficiencia, comenzaron a entender que sólo mirar los puntos anotados no era necesario; baloncesto es sencillo, si metes más que el rival, ganas, sino pierdes; pero, ¿cuántos balones has utilizado para ello? Aquí es donde viene el valor de ser eficiente, sencillamente, entendemos que el equipo que anota 70 puntos en un partido con 70 posesiones es más eficiente que un equipo que necesita de 80 posesiones para anotar ese mismo número de puntos; a partir de ahí, se comenzó a utilizar el ratio ofensivo y ratio defensivo, puntos anotados y permitidos por 100 posesiones.

 

¿Qué consideramos una posesión?

Contamos una posesión cuando un jugador del equipo:

  1. Anota un lanzamiento
  2. Falla el lanzamiento y no se obtiene el rebote ofensivo
  3. Pérdida
  4. Va a la línea de tiros libres y anota el último lanzamiento o no obtiene rebote ofensivo del último lanzamiento no anotado

La fórmula que utilizamos para calcular nuestras posesiones es:

Posesión =0.96 * [Tiros intentados + Pérdidas + 0.44 * Tiros libres intentados – Rebotes Ofensivos]

Dejémonos de tecnicismos y vayamos a nuestro análisis.

Para comenzar nuestro análisis, queremos un poco contextualizar como se distribuyen las posesiones en las competiciones de la FEB. Observamos que hay ciertos partidos que están fuera de lo “normal”, partidos con menos de 50 posesiones, que debemos de estudiar más detenidamente.

Al parecer estos partidos tienen indicios de ser mal recogidos, ya que en algunos casos sus porcentajes de tiros son del 100%, realizando 14 tiros; algo bastante difícil de obtener en un partido de baloncesto; por lo que desecharemos parte de esta muestra para nuestros análisis.

Vamos a seguir poniéndonos un poco en contexto sobre las posesiones en las diferentes ligas, en este caso, vamos a ser un poco más específicos y obtener los top cinco equipos en posesiones y su porcentajes de victoria.

Para un mismo partido, el número de posesiones es muy similar para un equipo u otro, salvo por alterne de posesiones, finalizaciones de posesiones, etc.  en las que puede generarse una pequeña desigualdad, sin embargo, en ese mismo partido, con una similitud de posesiones, siempre existe un equipo que haya sido derrotado y otro que haya sido el invicto, por lo tanto, la relación de victorias en cuanto a ese partido con respecto a las posesiones, no va a ser tan evidente; para ello vamos a trabajar con análisis de medias en la temporada, media de posesiones y ratio de victorias de cada equipo.

Para continuar el análisis hemos dividido los datos en las temporadas correspondientes, en este caso visualizamos primero la temporada 20/21:

Y la siguiente correspondiente a la temporada 21/22.

Como se puede observar a través de las tablas de los top 5 equipos de cada temporada y liga, no existe una clara relación entre el número medio de posesiones y el porcentaje de victorias en esa temporada, para poder visualizar esta relación de forma más clara, os presentamos el siguiente gráfico.

Con este último gráfico, queda un poco más evidente que no existe una relación clara entre el número de posesiones y la probabilidad de victoria, precisamente, 0.03 como coeficiente de correlación, que era un poco nuestra pregunta en cuestión; pero, nos sigue generando la duda de, ¿por qué ocurre esto? Un mayor número de posesiones se traduce en un mayor intento de lanzamientos, pero también en un mayor número de pérdidas. ¿Existirá una relación evidente entre estos parámetros y la posesión?

Valores de correlación son de 0.68 y 0.44, respectivamente. Por lo que el aumento de los lanzamientos está bastante mayor correlacionado con el aumento de las posesiones, con respecto al número de pérdidas. Sin embargo, la diferencia de valores absolutos entre ambas métricas es bastante alta, ¿qué ocurre si normalizamos las variables?

Una vez normalizada las variables utilizando la fórmula:

Hemos sacado los mismos gráficos y los parámetros de correlación para ambas métricas, los resultados son los mismos obtenidos previamente.

Finalmente, para no quedarnos tanto en la vaguedad del análisis sin dar una respuesta clara, queremos ver cuando realmente aumenta esos lanzamientos intentados y pérdidas por posesión que se aumenta y, si realmente es significativo.

Se ha realizado dos regresiones lineales utilizando el número de posesiones como la variable independiente, además, separadamente como variables dependientes las pérdidas y los lanzamientos intentados.

 

En las tablas anteriores podemos observar los resultados obtenidos, a la izquierda tenemos la regresión de los lanzamientos intentados sobre las posesiones y, a la derecha, sobre las pérdidas.

El número de lanzamientos intentados se puede explicar en un 45.5% al número de posesiones, mientras un 19.5% se otorga a las pérdidas de balón.

Ambas pruebas son significativas, y podríamos decir que por cada posesión que se aumenta, el número de lanzamientos aumenta en 0.67 de media, estando entre los rangos de [0.61, 0.74] y el número de pérdidas aumenta en 0.44 de media, comprendiéndose entre [0.36, 0.52]

En este análisis, hemos tratado de dar una pincelada, sobre como el número de posesiones afecta a la victoria, de hecho, no hay una diferencia clara entre equipos con mayor y menor posesiones, tener un mayor ritmo o un menor ritmo, no va generarte una ventaja sobre los equipos de la liga, sí que afirmamos, que hay una clara relación entre el aumento de lanzamientos y el número de pérdidas, lo cual tiene mucho sentido. Quizá el enfoque de la pregunta no nos lleva a la respuesta a lo que tratamos de buscar, a nosotros tras este análisis, se nos viene en mente una situación que normalmente los entrenadores tenemos muy clara:

Sacar fuera de la zona de confort al otro equipo. Si a mi próximo rival lo saco de su ritmo de juego, puedo obtener una ventaja sobre él. ¿Será esta afirmación cierta? Desde luego nosotros seguiremos dando más y mejores análisis, para poder otorgaros un conocimiento más fundamentado.

SERGIO DE LARREA

Descubriendo a … Sergio de Larrea

Llegaba al mundial como uno de los jugadores a seguir. Con tan solo 16 años ha comandado durante gran parte de la temporada al Valencia Basket de LEB Plata, llegando a disputar la fase final por el ascenso cayendo en semifinales, lideró al equipo junior en el Adidas Next Generation Tournament, consiguiendo formar parte del quinteto ideal en la fase disputada en Belgrado y el pasado 10 de julio consiguió junto a sus compañeros de selección la medalla de plata del mundial sub17. Hoy descubrimos a Sergio de Larrea.

¿Quién es Sergio de Larrea?

Natural de Valladolid (4/12/2005) Sergio de Larrea es un jugador del Valencia Basket, donde alterna el equipo junior y el de LEB Plata, procedente del Colegio San Agustín de su ciudad natal.

 

Su nombre es popular en el baloncesto vallisoletano desde hace bastante tiempo, sin embargo, fue en el campeonato de España cadete de 2021 cuando saltó a la fama al conseguir una histórica marca de 64 puntos de valoración que vinieron de la mano de un triple doble (31 puntos, 20 rebotes y 10 asistencias).

Del colegio San Agustín a L’Alqueria del Basket, de Valladolid a Valencia y con tan solo 16 años, disputando un total de 30 partidos de LEB Plata (Playoffs y final por el ascenso incluidos) un jugador capaz de subir el balón, organizar al equipo y ejecutar el ataque.

 

¿Cómo juega Sergio de Larrea?

Antes de nada hay que tener en cuenta, en todo momento, que hablamos de un chico de 16 años y que por lo tanto todavía está en proceso de formación. Los números que presenta durante esta temporada deben ser puestos en contexto, sobre todo los de LEB Plata donde puede llegar a jugar con jugadores que le doblan la edad. Sergio de Larrea es un adolescente jugando con adultos, y lo mejor de todo es que no desentona.

¿De dónde vienen los puntos de Sergio de Larrea? Estadística de LEB Plata y del ANGT.

Con su metro y 97 centímetros, Sergio de Larrea que posee un gran manejo de balón, puede jugar tanto de base como de escolta e incluso alero. Jugador con un gran IQ y muy buena lectura de juego, además de un talento descomunal para el pase y un desequilibrante primer paso.

Puntos producidos por cada tipo de tiro. Estadística de LEB Plata y del ANGT.

 

En cuanto al tiro, Sergio debe seguir desarrollando y trabajando el tiro de 3 y consolidar y mejorar los buenos datos conseguidos en LEB Plata durante esta última temporada (20 de 59 para un 33.9%). Muy peligroso en las penetraciones, encarando siempre el aro con mucha determinación y acierto, y siendo este apartado clave para conseguir invitaciones a la línea de tiros libres (70% en LEB Plata).

Medida de los 4 factores. Estadística de LEB Plata y del ANGT.

 

Y tras una gran temporada con el Valencia Basket, llegaba la gran cita para la generación del 2005, el mundial sub-17 celebrado en Málaga. Sergio de Larrea aparecía en todas las listas de jugadores a seguir en el campeonato y no sin razón.

 

Su participación en el campeonato a nivel individual se puede calificar de irregular, yendo de más a menos en cuanto a aportación y también en los minutos de los que ha disfrutado para estar en cancha, llamando mucho la atención los escasos 8 minutos que tuvo en la final del campeonato ante Estados Unidos. Bien es cierto que tanto en cuartos de final ante Australia y en semifinales ante Francia, el jugador de Valencia Basket estuvo muy lejos de su mejor versión. Pero nada de esto le ha impedido conseguir junto a sus compañeros, una extraordinaria y merecida medalla de plata, tras plantarle cara la gran selección de Estados Unidos.

El futuro.

De nuevo hacemos hincapié en que estamos hablando de un chico de primer año junior, un jugador en formación y el cual debe mejorar en muchos aspectos, pero también estamos hablando de uno de los mayores talentos del baloncesto base español en muchísimos años, un jugador al que hay que seguir muy de cerca durante la próxima temporada. Como suelen decir los americanos, para Sergio de Larrea “The sky is the limit”.

 

Os adjuntamos un video con acciones destacadas del jugador durante su temporada en LEB Plata

En las categorías FEB, ¿El tiro de 3P es más rentable?

El tiro de 3, aliado y enemigo a partes iguales. Muchas veces los entrenadores tenemos largos debates sobre este tipo de tiro, sobre si ha “matado” al baloncesto actual o lo hace más divertido y eficiente.

Lo único que no nos crea dudas es que es un tiro que lleva entre nosotros des del año 1945, cuando se probó en un partido universitario en los Estados Unidos. Entre idas y venidas, se instauró en la NBA el año 1979 haciéndolo cuatro años más tarde en el reglamento FIBA.

Pero dejando de lado nuestra faceta de historiadores y poniéndonos la careta de analistas nos preguntamos, ¿el tiro de 3 puntos es eficiente en categorías FEB? Para esto hemos analizado las competiciones; Leb Oro, Liga Endesa, Leb Plata, Liga Challenge y Liga Femenina 2.

 

Competición Punto por tiro de 2 Punto por tiro de 3
Leb Oro 1,045 1,039
Liga Endesa 0,931 0,968
Leb Plata 1,005 0,95
Liga Challenge 0,875 0,84
Liga Femenina 2 0,864 0,844

 

De un primer vistazo podemos ver que solo en la Liga Endesa los tiros de 3 puntos generan más que los tiros de 2 puntos. Así pues, en un inicio, podemos afirmar que en general los tiros de 3 son menos eficientes que los tiros de 2.

Si vamos avanzando y viendo más datos, teniendo claro que los triples no generan más puntos que los tiros de 2, ¿hay un sobreuso del triple?

Competición 2P intentados 3P intentados 3PAr
Leb Oro 36,66 23,71 39,27
Liga Endesa 42,05 17,98 29,95
Leb Plata 37,6 24,9 39,78
Liga Challenge 40,75 20,75 33,74
Liga Femenina 2 39,459 19,78 33,38

 

 

Con un simple vistazo podemos ver que en las ligas femeninas el uso del triple es notablemente inferior a las ligas masculinas. Si en ninguna de las primeras se supera el 34% en 3PAr, en las segundas casi llega al 40%. Por ponernos un poco en contexto en la NBA los equipos con mucho uso del triple (GSW, Houston, Wolves…) tienen un 3PAr del 45% aproximadamente, en cambio los equipos con menos uso (Memphis, Bulls, Spurs…) no llegan al 35%. En las siguientes temporadas vamos a poder ver si esta tendencia va al alza y se acerca a los guarismos NBA o se mantiene estable con los datos de estas dos últimas temporadas.

Y otro detalle muy importante, ¿Cómo puede ser que la única competición donde el tiro de 3 es más eficiente que el tiro de 2 sea la competición donde menos tiros se lancen? ¿Calidad antes que cantidad?

*el 3PAr es el % de tiros de 3 que se lanzan por cada tiro de campo (tiros de 2 + tiros de 3).

Nuestro análisis está hecho con datos de las dos últimas temporadas (en caso de Liga Challenge, una) y como dice uno del os mejores analistas de datos de España, Luis Clausín (@luisclausinmb) el tiro de 3 es el tiro con más variabilidad que existe así que los porcentajes cambian notablemente de una temporada a otra. No nos atrevemos a afirmar con un NO rotundo que el tiro de 3 es menos eficiente, pero tampoco que a día de hoy SÍ lo sea. En los próximos análisis vamos a tratar otros temas muy interesantes, siempre ponemos encuestas en el Twitter así que tú puedes decidir qué es lo que prefieres leer antes.

¡Muchas gracias!