SciELO - Scientific Electronic Library Online

 
vol.12 número1El impacto del internet en la formación de profesionales en tecnología de talla mundialExploración de datos y sistema de recomendación de libros índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Articulo

Indicadores

    Links relacionados

    • No hay articulos citadosCitado por SciELO
    • No hay articulos similaresSimilares en SciELO

    Bookmark

    Revista de Investigación Estudiantil Iluminate

    versión impresa ISSN 2415-2323

    Rev. Inv. Est. I. v.12 n.1 La Paz nov. 2020

     

    ARTÍCULO ORIGINAL

     

    Visualización y análisis de los jugadores del Fifa 2021 aplicando algoritmos de
    Machine Learning

     

    Visualization and analysis of Fifa 2021 teams applying Machine Learning algorithms

     

     

    Albert Omar Araya Cory,* José Antonio Aguilar Fernández**
    *Instituto de Investigaciones en Ciencia y Tecnología,
    Universidad La Salle- Bolivia albertaraya944@gmail.com
    **Instituto de Investigaciones en Ciencia y Tecnología, Universidad La Salle- Bolivia jaaguilarfernandez@outlook.es
    Artículo Recibido: 23-09-2020 Artículo Aceptado: 11-10-2020

     

     


    Resumen

    El objetivo de la presente investigación es el de realizar un análisis comparativo sobre las características de los jugadores de fútbol del FIFA entre los años 2020 - 2021 y la vida real. Para el desarrollo de esta investigación se utilizó dos Dataset del videojuego. Se aplicó métodos de visualización de datos con Python y se realizó un análisis para la detección de anomalías mediante algoritmos de aprendizaje no supervisado.

    Palabras clave

    Pandas, Numpy, Seaborn, Scikit-Learn, Matplotlib, Dataset, Video juego, Clustering, Fútbol, Python


    Abstract

    The objective of this research is to carry out a comparative analysis on the characteristics of FIFA soccer players between the years 2020 - 2021 and real life. For the development of this research, two videogame dataseis were used. Data visualization methods were applied with Python and an analysis was carried out for the detection of anomalies using unsupervised learning algorithms.

    Key words

    Pandas, Numpy, Seaborn, Scikit-Learn, Matplotlib, Dataset, Video Game, Clustering, Soccer, Python


     

     

    Introducción

    La Federación Internacional de Fútbol Asociación (FIFA) es la institución que gobierna a todas las federaciones de fútbol del planeta, esta institución cada año brinda un informe acerca del rendimiento de los jugadores registrados, estos Dataseis son de carácter público y ayudan al desarrollo del Big Data del fútbol. El aprendizaje no supervisado es un método de aprendizaje automático donde un modelo se ajusta a las observaciones.

    El siguiente proyecto presenta un dataset que contiene datos relevantes y específicos acerca de los jugadores de fútbol registrados en la FIFA hasta el año 2021, también se visualizara el club al que pertenecen, de esta manera estaremos realizando análisis en profundidad y visualización de estos datos, además de aplicar aprendizaje supervisado para la regresión lineal y para la detección de anomalías mediante tareas de Clustering.

    Problemática

    Los equipos de hoy tienen jugadores excelentes que benefician a su equipo en cada partido que se juega y de esta manera muchas veces algunos de estos jugadores son infravalorados y algunos otros sobrevalorados. Por esta razón al momento de contratar a un nuevo integrante existe la probabilidad de que el jugador beneficie o no al club al que se está integrando.

    Objetivo General

    Analizar los Datasets completos, para determinar cuáles son los jugadores infravalorados y sobrevalorados en base a distintas características que se obtendrá a través de un análisis profundo utilizando herramientas de machine Learning.

    Los objetivos específicos son: Mediante un análisis exploratorio realizar gráficos de visualización. Detectar anomalías. Analizar y explicar los distintos gráficos obtenidos.

    Referentes conceptuales

    FIFA ha sido un videojuego al que atrae muchas personas en todo el mundo y ha aparecido en muchas ediciones. Su último lanzamiento será en octubre de este año, es decir, FIFA 2021. Este conjunto de datos contiene las características de los jugadores en el juego.

    El conjunto de datos contiene datos de la clasificación de los jugadores, su edad, su nacionalidad, la posición en la que juegan y su potencial de crecimiento en el juego. Es posible que los datos de algunos jugadores y sus clubes no sean muy precisos, ya que la ventana de transferencia aún está abierta y es posible que se realicen cambios en etapas posteriores. (Mishra, 2020).

    DATASETS

    Para este proyecto se utilizaron tres Dataset en los cuales se trabajó y se creó un dataset único ya normalizado listo para ser analizado y visualizado de una manera correcta aplicando los distintos algoritmos.

    Dataset1

    fifa-FUT-Data fue el primer dataset que se utilizó y se normalizó para las funciones necesarias al principio de las pruebas del proyecto. (Kafagy, 2019).

    Dataset 2

    players 21 fue el segundo dataset que se utilizós para poder realizar una actualización mas reciente respecto a las características de los jugadores. (Leone, 2020).

    Dataset 3

    AprendizajeAutomatico dataset combinado de los dos anteriores dataset el que fue normalizado e implementado en el proyecto. (AlbertAC, 2020).

    Actualmente cada equipo fútbol tiene a un jugador estrella que según los entrenadores son considerados el mejor, entonces los espectadores comienzan a pensar el ¿por qué? estos jugadores se consideran los mejores.

    Surgen varias preguntas al respecto, para analizar detalles de muchos de estos jugadores, se comienza a formar varios conceptos, analizando elementos como: si es el potencial, la edad o es el salario que sustentan, hace que estos jugadores sean considerados los mejores.

    De esta manera se ha propuesto a analizar a varios jugadores junto a sus equipos y ver que tanto es el aporte de estos según la posición en la que juega, el potencial que tiene, el valor que tiene en el mercado y el pago actual que recibe por temporadas de juego.

     

    Métodos.

    Importación de las librerías

    Para realizar el análisis y la parte visual gráfica se necesita de algunas librerías necesarias como numpy, pandas, matplotlib, seaborn y scikit-learn.

    Figura 1. Importación de Librerías

    Fuente: Elaboración propia

    Importación del Datasetya normalizado

    Después de importar las librerías es necesario importar el Dataset ya normalizado para que de esta manera se tenga una visualizacion en tablas, así como en filas y columnas.

    Tabla 1. Dataset normalizado

    Fuente: (Elaboración propia)

    En la presente tabla se obsera algunas caracterisitcas que se encontró en el Dataset

    Definiendo funciones para encontrar al peor y al mejor jugador

    Figura 2. Funciones para encontrar al peor y al mejor jugador

    Fuente: Elaboración propia

    Visualizaciones del Dataset

    Gráfico de comparación del potencial y el valor del mercado del jugador en Euros

    Seleccionamos los jugadores que tengan un potencial arriba de 80 y vemos el valor que tienen según su potencial.

    Figura 3. Gráfico de comparación del potencial y el valor del mercado del jugador en Euros.

    Fuente: (Elaboración propia)

    Observaciones

    En el gráfico podemos observamos que existen jugadores que están evaluados de una manera errónea ya que algunos valen más, pero no tienen el mayor potencial.

    Gráfico de comparación entre el potencial y el sueldo del jugador en Euros

    Seleccionamos los jugadores que tengan un potencial arriba de 80 y vemos el valor que tienen según su potencial

    Figura 4. Vemos el valor que tienen según su potencial.

    Fuente: Elaboración propia

    Figura 5. Gráfico de comparación entre el potencial y el salario del jugador en Euros.

    Fuente: Elaboración propia

    Observaciones

    Se puede observar que existen algunas anomalías en la visualizacion de los datos, en primer lugar, existen jugadores que perciben un sueldo mayor teniendo un potencial menor que el de otros jugadores. Estos datos reflejan que existen jugadores sobrevalorados en el mercado.

    Gráfico de comparación entre la posición el sueldo de los jugadores

    Seleccionamos los jugadores que tengan un potencial arriba de 80 y vemos] el valor que tienen según su posición.

    Figura 6. Vemos el valor que tienen según su posición.

    Fuente: (Elaboración propia)

    Figura 7. Gráfico de comparación entre la posición el salario de los jugadores

    Fuente: Elaboración propia

    Observaciones

    Según el gráfico podemos ver que los delanteros son los mejores pagados en las plantillas seguidos de los volantes de creación.

    Análisis de la composición de un equipo de fútbol

    Figura 8. Análisis de la composición de un equipo de futbol

    Fuente: Elaboración propia

    Figura 9. Gráfico de comparación entre el potencial y la posición del jugador.

    Fuente: Elaboración propia Observaciones

    Según el gráfico se puede observar que existen jugadores que no aportan mucho en el equipo, caso en el que encontramos a un GK (Portero) que tiene un rendimiento demasiado bajo.

    Analizando cual es jugador con el potencial bajo

    Figura 10. Analizando cual es jugador con el potencial bajo

    Fuente: Elaboración propia

    Tabla 2. Extracción del peor jugador.

    Fuente: Elaboración propia

    Figura 11. A. Lonergan según el análisis de datos el peor jugador del dataset y esta muy infravalorado

    Fuente: (BeSoccer, 2020)

    Aplicación de la Regresión Lineal

    Declaración de hipótesis

    Figura 12. Función de la hipótesis.

    Fuente: Elaboración propia

    Declaración del costo

    Figura 13. Función consto

    Fuente: Elaboración propia

    Declaración de la derivada de la función de costo

    Figura 14. Derivada de la función

    Fuente: Elaboración propia

    Declaración de x como la columna que almacenara los valores de los jugadores y del potencial de los mismos

    Figura 15. Almacenamiento de valores de los jugadores

    Fuente: Elaboración propia

    Declaración de Alpha y las iteraciones del modelo

    Figura 16. Pruebas para determinar su almacenamiento. alpha = S.01 iterations = 480

    Fuente: Elaboración propia

    Declaración theta

    Figura 17. Theta como random.

    Fuente: (Elaboración propia)

    Fuente: Elaboración propia Obtención del costo inicial

    Figura 18. Obtención del costo inicial.

    Costo inicial:2573.490966374446

    Fuente: Elaboración propia

    Obtención del costo final

    Figura 19. Obtención del costo final

    Fuente: Elaboración propia

    Visualización de la curva

    Figura 20. Impresión de la curva.

    Fuente: Elaboración propia

    Figura 21. Gráfica de una curva que haciende de 0 2000.

    Fuente: Elaboración propia

    Observaciones

    Se puede observar que existe una constante entre el valor del jugador y el salario que persive.

    Visualización de datos para una tarea de detección de anomalías

    Gráfico del valor del mercado y el sueldo de los jugadores

    Figura 22. Imprimimos las anomalías que existen

    Figura 23. Valor del jugador según salario.

    Fuente: Elaboración propia

    Observaciones

    Podemos observar que existen un jugadores que no cumplen con la constante, por lo cual realizaremos una tara de clustering para ver cual es la tendencia.

    Aplicando Clustering al gráfico del valor del mercado y el sueldo de los jugadores

    Figura 24. Imprimimos el clustering del gráfico.

    Fuente: Elaboración propia

    Observaciones

    Después de realizar una tarea de Clustering vemos que la mayoría de jugadores valen menos de 20 millones y persiben sueldos menores de 100 mil euros. Se podria decir que esto es una constante y es el salario promedio de los jugadores de fútbol.

    Aplicando al Clustering de 4 etapas sueldos y su valor de los jugadores

    Figura 25. Código de implementación para graficar con Matplotlib.

    Fuente: Elaboración propia

    Figura 26. Imprimir los gráficos.

    Fuente: Elaboración propia

    Visualziación gráfica de las 4 etapas

    Figura 27. gráfica de las 4 etapas.

    Fuente: Elaboración propia

    Observaciones

    Se puede observar que exisisten 4 segmentos marcados, donde existen jugadores que ganan lo que valen, pero en la cuarta etapa existen jugadores que valen más pero no se les paga lo que corresponde, con excepción de algunos que valen menos en el mercado pero ganan mas que otros.

    Visualización de jugadores fuera del rango de con los mejores sueldos y el valor del mercado

    Figura 28. Utilizando las librerías de sckityleran para imprimir la gráfica.

    Fuente: Elaboración propia

    Figura 29. jugadores fuera del rango de con los mejores sueldos y el valor del mercado.

    Fuente: Elaboración propia

    Observaciones

    Al igual que el gráfico de 4 etapas podemos observar que exisisten 4 secmentos marcados, en este gráfico vemos que solo existe un jugadopr que según la constante vale menos de lo que le pagan, este jugador es Lionel Messi que según los últimos tiempos vajo su valor en el mercado.

    Como se ha podido observar a lo largo del documento se exite un pequeño circulo rojo interlineado en donde existe un jugador que ha sido considerado el mejor de la historia hasta esta fechas y es:

    Figura 30. Lionel Messi el jugador mas sobrevalorado en los utlimos tiempos.

    Fuente: (As, 2020)

    El jugador está evaluado por los 100,00 euros y es el mejor ya que es conocido por su larga travesía de partidos jugados y ganados en su largo recorrido. Por el momento sigue manteniendo la mejor racha jugando en el Barcelona.

     

    Conclusión

    Después de realizar este análisis se detectaron varias anomalías. En primer lugar, existen jugadores que no deberían ser centrados para el club puesto que según estadísticas y características de los jugadores estos no aportaran en mucho al equipo.

    En segundo lugar, existen jugadores que actualmente valen menos de lo que solían valer, esto puede deberse al rendimiento que ahora tienen en sus respectivos equipos, en vista de ello, estos jugadores reciben salarios exorbitantes, los cuales consiguen la constante de salario vs valor del jugador, de igual manera existen jugadores que según sus estadísticas valen más de lo que perciben salarialmente. En conclusión, si bien existen jugadores que se les paga lo que valen, existen jugadores que no perciben el sueldo que merecen, esto se pude dar por varios motivos que pueden ser ajenos a las

    estadísticas del jugador. Estos datos fueron extraídos de las características que tienen los jugadores en un videojuego, si bien estos datos son realizados por la FIFA no son datos exactos porque cuando se habla de fútbol todo puede pasar.

    Proyecto

    Repositorio para ver el proyecto completo. https://github.com/AlbertAC/ProyectoFinal/blob/master/SystemFifa.ipynb

     

    Referencias Bibliográficas

    •    AlbertAC. (22 de 10 de 2020). GitHub. Obtenido de AprendizajeAutomatico: https://github.com/AlbertAC/ProyectoFinal/ blob/master/SystemFifa.ipynb        [ Links ]

    •    As. (2020). As. Obtenido de https://resultados.as.com/resultados/ ficha/deportista/messi/15167/        [ Links ]

    •    BeSoccer. (2020). BeSoccer. Obtenido de https://www.besoccer.com/player/a-lonergan-12304        [ Links ]

    •    Kafagy, A. (26 de 11 de 2019). GitHub. Obtenido de fifa-FUT-Data: https://github.com/kafagy/fifa-FUT-Data        [ Links ]

    •    Leone, S. (26 de 10 de 2020). Kaggle. Obtenido de FIFA 21 complete player dataset: https://www.kaggle.com/stefanoleone992/fifa-21-complete-player-dataset?select=players_21.csv        [ Links ]

    •    Mishra, A. (15 de 09 de 2020). Kaggle. Obtenido de Conjunto de datos de jugador completo de FIFA 2021: https://www.kaggle.com/aayushmishra1512/fifa-2021-complete-player-data        [ Links ]