Serviços Personalizados
Artigo
Indicadores
Links relacionados
- Citado por SciELO
- Similares em SciELO
Bookmark
Revista de Investigación Estudiantil Iluminate
versão impressa ISSN 2415-2323
Rev. Inv. Est. I. v.12 n.1 La Paz nov. 2020
ARTÍCULO ORIGINAL
Visualización y análisis de los jugadores del Fifa 2021 aplicando algoritmos de
Machine Learning
Visualization and analysis of Fifa 2021 teams applying Machine Learning algorithms
Albert Omar Araya Cory,* José Antonio Aguilar Fernández**
*Instituto de Investigaciones en Ciencia y Tecnología, Universidad La Salle- Bolivia albertaraya944@gmail.com
**Instituto de Investigaciones en Ciencia y Tecnología, Universidad La Salle- Bolivia jaaguilarfernandez@outlook.es
Artículo Recibido: 23-09-2020 Artículo Aceptado: 11-10-2020
Resumen
El objetivo de la presente investigación es el de realizar un análisis comparativo sobre las características de los jugadores de fútbol del FIFA entre los años 2020 - 2021 y la vida real. Para el desarrollo de esta investigación se utilizó dos Dataset del videojuego. Se aplicó métodos de visualización de datos con Python y se realizó un análisis para la detección de anomalías mediante algoritmos de aprendizaje no supervisado.
Palabras clave
Pandas, Numpy, Seaborn, Scikit-Learn, Matplotlib, Dataset, Video juego, Clustering, Fútbol, Python
Abstract
The objective of this research is to carry out a comparative analysis on the characteristics of FIFA soccer players between the years 2020 - 2021 and real life. For the development of this research, two videogame dataseis were used. Data visualization methods were applied with Python and an analysis was carried out for the detection of anomalies using unsupervised learning algorithms.
Key words
Pandas, Numpy, Seaborn, Scikit-Learn, Matplotlib, Dataset, Video Game, Clustering, Soccer, Python
Introducción
La Federación Internacional de Fútbol Asociación (FIFA) es la institución que gobierna a todas las federaciones de fútbol del planeta, esta institución cada año brinda un informe acerca del rendimiento de los jugadores registrados, estos Dataseis son de carácter público y ayudan al desarrollo del Big Data del fútbol. El aprendizaje no supervisado es un método de aprendizaje automático donde un modelo se ajusta a las observaciones.
El siguiente proyecto presenta un dataset que contiene datos relevantes y específicos acerca de los jugadores de fútbol registrados en la FIFA hasta el año 2021, también se visualizara el club al que pertenecen, de esta manera estaremos realizando análisis en profundidad y visualización de estos datos, además de aplicar aprendizaje supervisado para la regresión lineal y para la detección de anomalías mediante tareas de Clustering.
Problemática
Los equipos de hoy tienen jugadores excelentes que benefician a su equipo en cada partido que se juega y de esta manera muchas veces algunos de estos jugadores son infravalorados y algunos otros sobrevalorados. Por esta razón al momento de contratar a un nuevo integrante existe la probabilidad de que el jugador beneficie o no al club al que se está integrando.
Objetivo General
Analizar los Datasets completos, para determinar cuáles son los jugadores infravalorados y sobrevalorados en base a distintas características que se obtendrá a través de un análisis profundo utilizando herramientas de machine Learning.
Los objetivos específicos son: Mediante un análisis exploratorio realizar gráficos de visualización. Detectar anomalías. Analizar y explicar los distintos gráficos obtenidos.
Referentes conceptuales
FIFA ha sido un videojuego al que atrae muchas personas en todo el mundo y ha aparecido en muchas ediciones. Su último lanzamiento será en octubre de este año, es decir, FIFA 2021. Este conjunto de datos contiene las características de los jugadores en el juego.
El conjunto de datos contiene datos de la clasificación de los jugadores, su edad, su nacionalidad, la posición en la que juegan y su potencial de crecimiento en el juego. Es posible que los datos de algunos jugadores y sus clubes no sean muy precisos, ya que la ventana de transferencia aún está abierta y es posible que se realicen cambios en etapas posteriores. (Mishra, 2020).
DATASETS
Para este proyecto se utilizaron tres Dataset en los cuales se trabajó y se creó un dataset único ya normalizado listo para ser analizado y visualizado de una manera correcta aplicando los distintos algoritmos.
Dataset1
fifa-FUT-Data fue el primer dataset que se utilizó y se normalizó para las funciones necesarias al principio de las pruebas del proyecto. (Kafagy, 2019).
Dataset 2
players 21 fue el segundo dataset que se utilizós para poder realizar una actualización mas reciente respecto a las características de los jugadores. (Leone, 2020).
Dataset 3
AprendizajeAutomatico dataset combinado de los dos anteriores dataset el que fue normalizado e implementado en el proyecto. (AlbertAC, 2020).
Actualmente cada equipo fútbol tiene a un jugador estrella que según los entrenadores son considerados el mejor, entonces los espectadores comienzan a pensar el ¿por qué? estos jugadores se consideran los mejores.
Surgen varias preguntas al respecto, para analizar detalles de muchos de estos jugadores, se comienza a formar varios conceptos, analizando elementos como: si es el potencial, la edad o es el salario que sustentan, hace que estos jugadores sean considerados los mejores.
De esta manera se ha propuesto a analizar a varios jugadores junto a sus equipos y ver que tanto es el aporte de estos según la posición en la que juega, el potencial que tiene, el valor que tiene en el mercado y el pago actual que recibe por temporadas de juego.
Métodos.
Importación de las librerías
Para realizar el análisis y la parte visual gráfica se necesita de algunas librerías necesarias como numpy, pandas, matplotlib, seaborn y scikit-learn.
Figura 1. Importación de Librerías
Fuente: Elaboración propia
Importación del Datasetya normalizado
Después de importar las librerías es necesario importar el Dataset ya normalizado para que de esta manera se tenga una visualizacion en tablas, así como en filas y columnas.
Tabla 1. Dataset normalizado
Fuente: (Elaboración propia)
En la presente tabla se obsera algunas caracterisitcas que se encontró en el Dataset
Definiendo funciones para encontrar al peor y al mejor jugador
Figura 2. Funciones para encontrar al peor y al mejor jugador
Fuente: Elaboración propia
Visualizaciones del Dataset
Gráfico de comparación del potencial y el valor del mercado del jugador en Euros
Seleccionamos los jugadores que tengan un potencial arriba de 80 y vemos el valor que tienen según su potencial.
Figura 3. Gráfico de comparación del potencial y el valor del mercado del jugador en Euros.
Fuente: (Elaboración propia)
Observaciones
En el gráfico podemos observamos que existen jugadores que están evaluados de una manera errónea ya que algunos valen más, pero no tienen el mayor potencial.
Gráfico de comparación entre el potencial y el sueldo del jugador en Euros
Seleccionamos los jugadores que tengan un potencial arriba de 80 y vemos el valor que tienen según su potencial
Figura 4. Vemos el valor que tienen según su potencial.
Fuente: Elaboración propia
Figura 5. Gráfico de comparación entre el potencial y el salario del jugador en Euros.
Fuente: Elaboración propia
Observaciones
Se puede observar que existen algunas anomalías en la visualizacion de los datos, en primer lugar, existen jugadores que perciben un sueldo mayor teniendo un potencial menor que el de otros jugadores. Estos datos reflejan que existen jugadores sobrevalorados en el mercado.
Gráfico de comparación entre la posición el sueldo de los jugadores
Seleccionamos los jugadores que tengan un potencial arriba de 80 y vemos] el valor que tienen según su posición.
Figura 6. Vemos el valor que tienen según su posición.
Fuente: (Elaboración propia)
Figura 7. Gráfico de comparación entre la posición el salario de los jugadores
Fuente: Elaboración propia
Observaciones
Según el gráfico podemos ver que los delanteros son los mejores pagados en las plantillas seguidos de los volantes de creación.
Análisis de la composición de un equipo de fútbol
Figura 8. Análisis de la composición de un equipo de futbol
Fuente: Elaboración propia
Figura 9. Gráfico de comparación entre el potencial y la posición del jugador.
Fuente: Elaboración propia Observaciones
Según el gráfico se puede observar que existen jugadores que no aportan mucho en el equipo, caso en el que encontramos a un GK (Portero) que tiene un rendimiento demasiado bajo.
Analizando cual es jugador con el potencial bajo
Figura 10. Analizando cual es jugador con el potencial bajo
Fuente: Elaboración propia
Tabla 2. Extracción del peor jugador.
Fuente: Elaboración propia
Figura 11. A. Lonergan según el análisis de datos el peor jugador del dataset y esta muy infravalorado
Fuente: (BeSoccer, 2020)
Aplicación de la Regresión Lineal
Declaración de hipótesis
Figura 12. Función de la hipótesis.
Fuente: Elaboración propia
Declaración del costo
Figura 13. Función consto
Fuente: Elaboración propia
Declaración de la derivada de la función de costo
Figura 14. Derivada de la función
Fuente: Elaboración propia
Declaración de x como la columna que almacenara los valores de los jugadores y del potencial de los mismos
Figura 15. Almacenamiento de valores de los jugadores
Fuente: Elaboración propia
Declaración de Alpha y las iteraciones del modelo
Figura 16. Pruebas para determinar su almacenamiento. alpha = S.01 iterations = 480
Fuente: Elaboración propia
Declaración theta
Figura 17. Theta como random.
Fuente: (Elaboración propia)
Fuente: Elaboración propia Obtención del costo inicial
Figura 18. Obtención del costo inicial.
Costo inicial:2573.490966374446
Fuente: Elaboración propia
Obtención del costo final
Figura 19. Obtención del costo final
Fuente: Elaboración propia
Visualización de la curva
Figura 20. Impresión de la curva.
Fuente: Elaboración propia
Figura 21. Gráfica de una curva que haciende de 0 2000.
Fuente: Elaboración propia
Observaciones
Se puede observar que existe una constante entre el valor del jugador y el salario que persive.
Visualización de datos para una tarea de detección de anomalías
Gráfico del valor del mercado y el sueldo de los jugadores
Figura 22. Imprimimos las anomalías que existen
Figura 23. Valor del jugador según salario.
Fuente: Elaboración propia
Observaciones
Podemos observar que existen un jugadores que no cumplen con la constante, por lo cual realizaremos una tara de clustering para ver cual es la tendencia.
Aplicando Clustering al gráfico del valor del mercado y el sueldo de los jugadores
Figura 24. Imprimimos el clustering del gráfico.
Fuente: Elaboración propia
Observaciones
Después de realizar una tarea de Clustering vemos que la mayoría de jugadores valen menos de 20 millones y persiben sueldos menores de 100 mil euros. Se podria decir que esto es una constante y es el salario promedio de los jugadores de fútbol.
Aplicando al Clustering de 4 etapas sueldos y su valor de los jugadores
Figura 25. Código de implementación para graficar con Matplotlib.
Fuente: Elaboración propia
Figura 26. Imprimir los gráficos.
Fuente: Elaboración propia
Visualziación gráfica de las 4 etapas
Figura 27. gráfica de las 4 etapas.
Fuente: Elaboración propia
Observaciones
Se puede observar que exisisten 4 segmentos marcados, donde existen jugadores que ganan lo que valen, pero en la cuarta etapa existen jugadores que valen más pero no se les paga lo que corresponde, con excepción de algunos que valen menos en el mercado pero ganan mas que otros.
Visualización de jugadores fuera del rango de con los mejores sueldos y el valor del mercado
Figura 28. Utilizando las librerías de sckityleran para imprimir la gráfica.
Fuente: Elaboración propia
Figura 29. jugadores fuera del rango de con los mejores sueldos y el valor del mercado.
Fuente: Elaboración propia
Observaciones
Al igual que el gráfico de 4 etapas podemos observar que exisisten 4 secmentos marcados, en este gráfico vemos que solo existe un jugadopr que según la constante vale menos de lo que le pagan, este jugador es Lionel Messi que según los últimos tiempos vajo su valor en el mercado.
Como se ha podido observar a lo largo del documento se exite un pequeño circulo rojo interlineado en donde existe un jugador que ha sido considerado el mejor de la historia hasta esta fechas y es:
Figura 30. Lionel Messi el jugador mas sobrevalorado en los utlimos tiempos.
Fuente: (As, 2020)
El jugador está evaluado por los 100,00 euros y es el mejor ya que es conocido por su larga travesía de partidos jugados y ganados en su largo recorrido. Por el momento sigue manteniendo la mejor racha jugando en el Barcelona.
Conclusión
Después de realizar este análisis se detectaron varias anomalías. En primer lugar, existen jugadores que no deberían ser centrados para el club puesto que según estadísticas y características de los jugadores estos no aportaran en mucho al equipo.
En segundo lugar, existen jugadores que actualmente valen menos de lo que solían valer, esto puede deberse al rendimiento que ahora tienen en sus respectivos equipos, en vista de ello, estos jugadores reciben salarios exorbitantes, los cuales consiguen la constante de salario vs valor del jugador, de igual manera existen jugadores que según sus estadísticas valen más de lo que perciben salarialmente. En conclusión, si bien existen jugadores que se les paga lo que valen, existen jugadores que no perciben el sueldo que merecen, esto se pude dar por varios motivos que pueden ser ajenos a las
estadísticas del jugador. Estos datos fueron extraídos de las características que tienen los jugadores en un videojuego, si bien estos datos son realizados por la FIFA no son datos exactos porque cuando se habla de fútbol todo puede pasar.
Proyecto
Repositorio para ver el proyecto completo. https://github.com/AlbertAC/ProyectoFinal/blob/master/SystemFifa.ipynb
Referencias Bibliográficas
AlbertAC. (22 de 10 de 2020). GitHub. Obtenido de AprendizajeAutomatico: https://github.com/AlbertAC/ProyectoFinal/ blob/master/SystemFifa.ipynb [ Links ]
As. (2020). As. Obtenido de https://resultados.as.com/resultados/ ficha/deportista/messi/15167/ [ Links ]
BeSoccer. (2020). BeSoccer. Obtenido de https://www.besoccer.com/player/a-lonergan-12304 [ Links ]
Kafagy, A. (26 de 11 de 2019). GitHub. Obtenido de fifa-FUT-Data: https://github.com/kafagy/fifa-FUT-Data [ Links ]
Leone, S. (26 de 10 de 2020). Kaggle. Obtenido de FIFA 21 complete player dataset: https://www.kaggle.com/stefanoleone992/fifa-21-complete-player-dataset?select=players_21.csv [ Links ]
Mishra, A. (15 de 09 de 2020). Kaggle. Obtenido de Conjunto de datos de jugador completo de FIFA 2021: https://www.kaggle.com/aayushmishra1512/fifa-2021-complete-player-data [ Links ]