SciELO - Scientific Electronic Library Online

 
 número20¿Es la educación o la situación económica la principal determinante social de la mortalidad infantil en Bolivia?Confiabilidad y tiempo óptimo de reemplazo de equipo índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Artigo

Indicadores

    Links relacionados

    • Não possue artigos citadosCitado por SciELO
    • Não possue artigos similaresSimilares em SciELO

    Bookmark

    Revista Varianza

    versão impressa ISSN 9876-6789

    Revista Varianza  n.20 La Paz out. 2022

     

    ARTÍCULOS DE INVESTIGACIÓN

     

    El teorema central del límite: Una visión ilustrativa

     

    The central limit theorem: An illustrative view

     

     

    Raúl León Delgado Álvarez 1,*
    * Carrera de Estadística, Universidad Mayor de San Andrés, La Paz-Bolivia rldelgado3@umsa.bo
    Artículo recibido: 17-08-2022     Artículo aceptado: 06-09-2022

     

     


    Resumen

    El Teorema Central del Límite es de gran importancia, en el estudio de la Estadística, para su compresión además de la variedad de problemas prácticos, está la certeza de su convergencia.

    Objetivo: Comprender el Teorema Central del Límite, y su convergencia.

    Método: Se utilizarán cuadros y gráficos de la distribución del promedio de variables aleatorias independientes cada una con distribución Uniforme en el intervalo (0,1) y comparándola con la distribución Normal standard.

    Datos: Para este fin se utilizará una partición del intervalo comprendido entre 0 y 1, en distancias de un décimo.

    Resultados: Se mostrará la rápida convergencia del promedio de las variables citadas con distribución Uniforme hacia una distribución Normal estándar; para esta comparación se consideran dos cuadros que mostrarán esta afinidad deforma numérica y posteriormente (para cuando n aumente su valor) se expondrá el gráfico de la distribución del promedio de variables que completará el panorama.

    Palabras clave: Convergencia, distribución Irwin Hall, ilustración, Teorema Central del Límite.


    Abstract

    The Central Limit Theorem is of great importance, in the study of Statistics, for its understanding, in addition to the variety of practical problems, there is the certainty of its convergence.

    Objective: To understand the Central Limit Theorem, and its convergence.

    Method: Tables and graphs of the distribution of the average of independent random variables will be used, each with a Uniform distribution in the interval (0.1) and comparing it with the standard Normal distribution.

    Data: For this purpose, a partition of the interval between 0 and 1, in distances of one tenth, will be used.

    Results: The rapid convergence of the average of the variables mentioned with Uniform distribution towards a standard Normal distribution will be shown; For this comparison, two tables are considered that will show this affinity numerically and later (for when n increases its valué) the graph of the distribution of the average of variables will be exposed that will complete the panorama.

    Key words: Convergence, Irwin Hall distribution, illustration, Central Limit Theorem.


     

     

    1.  INTRODUCCIÓN

    El proceso de enseñanza aprendizaje de la Estadística, amerita reflexionar sobre, cuan útiles son las segmentaciones de esta disciplina, traducidas en asignaturas que marcan contenidos secuenciales y cuáles son las mejores estrategias que deberían utilizar los docentes para conseguir un aprendizaje significativo en el colectivo estudiantil.

    Una parte sin duda importante, es la comprensión del enunciado teórico de un tema, que se realiza a la luz del método científico, utilizando axiomas, lemas, teoremas, y corolarios cuyas demostraciones se desarrollan en clase.

    Otra parte es el argumento ilustrativo en la enseñanza para fijar los conocimientos, cómo son los cuadros y gráficos que sin duda son elementos que ayudan a este cometido.

    El Teorema Central del límite, se desarrolla haciendo énfasis en una de sus principales características como es su convergencia, la que muestra a través del comportamiento de la distribución del promedio aritmético de variables aleatorias. El teorema es muy fuerte en sus aplicaciones dado que ni siquiera es necesario conocer la distribución de las variables. La distribución Uniforme es un ejemplo ideal de una distribución simple y se puede considerar genérica pues, cada una de las variables aleatorias con distribución de densidad de probabilidades se encuentra en el intervalo (0,1) a diferencia de la distribución Beta que cuya gráfica ya muestra una comparación con la Normal.

     

    2. PROBLEMA

    En estudios realizados por (Johnson, Kotz, & Balakrishnan, 1995, pág. 296), en el libro Continuous Univariate Distributions, los autores citan a la distribución de Irwin Hall, para explicar la suma de variables aleatorias independientes, cada una con distribución Uniforme en el intervalo (0,1), que se constituye en un aporte para la comprensión del Teorema Central del Límite. Otro aspecto didáctico, se puede observar en el texto denominado Estadística Informatizada, (Barrera Ojeda, 2019), que hace referencia al aprendizaje utilizando programas informáticos.

     

    3. OBJETIVO

    Comprender el Teorema Central del Límite, y su convergencia, a través de cuadros y gráficos de la distribución del promedio de variables aleatorias independientes cada una con distribución Uniforme en el intervalo (0,1) y comparándola con la distribución Normal standard.

     

    4. DESARROLLO

    A diferencia del concepto de convergencia en sucesiones de números reales, en las sucesiones de variables aleatorias se debe considerar que las imágenes son números reales, pero siendo las variables aleatorias funciones de un espacio muestral hacia un conjunto numérico, la diferencia de una variable genérica Xn de la sucesión menos una variable aleatoria X, tanto por exceso como por defecto que sea menor que un e, es un suceso que tendría cierta probabilidad de no ocurrir (Obregón Sanin, 1977, pág. 247).

    Se denomina convergencia en probabilidad si:

    Dado un

    Se denomina convergencia casi segura si:

    La convergencia casi segura, implica convergencia en probabilidad, pero el reciproco no es cierto. Es decir la convergencia casi segura es más fuerte que la convergencia en probabilidad. La Ley de los grandes números afirma que si X es una variable aleatoria cuya media existe, y si X1, X2,..., Xn son observaciones independientes de ella, entonces converge casi seguro a E(X), esta versión se conoce como la Ley fuerte de los grandes números, si la convergencia es en probabilidad se denomina Ley débil de los grandes números.

    El Teorema Central del Límite

    El Teorema Central del Límite se enunciará en su forma general sin la demostración, dado que se pretende buscar su comprensión.

    Sean X1, X2,..., Xn, variables aleatorias no necesariamente independientes en el supuesto que las varianzas de las Xi sean finitas y que un número finito de ellas no predomine sobre las demás.

    Definida por

    Donde E (.), es el valor esperado y D (.), la desviación estándar de la suma de variables aleatorias.

    Yn converge en probabilidad a una variable aleatoria con distribución Normal estándar.

    Expresiones más restringidas son aquellas en que la independencia de las variables aleatorias, y su distribución común con media y varianza nos permiten establecer que la sucesión:

    Y la más conocida, de aplicaciones más variadas es:

    Se interpreta que Yn converge en probabilidad a una variable Normal estándar, esta última afirmación podría interpretarse como sigue:

    Si Fn(z), es la función de distribución acumulada del término genérico de la sucesión de variables y Φ(z) es la función de distribución acumulada de la densidad Normal estándar, entonces:

    O equivalentemente:

    Es decir, que cuando n crezca más, las funciones acumuladas tenderán a ser iguales, este hecho puede observarse en el comportamiento del promedio de distribuciones uniformes, pero ya desde el promedio de dos variables, se observa esta convergencia y más aún con el promedio de tres o más variables.

    La manera de la aproximación para una n finita, depende de las características de las distribuciones originales, pero en general es sorprendente la aproximación para una n pequeña en esta distribución.

    Para mostrar este hecho, hacemos el análisis del promedio aritmético o media aritmética de variables aleatorias independientes con distribución común Uniforme en el intervalo (0,1).

    Si se consideran dos variables aleatorias X1, X2 con distribución Uniforme en el intervalo (0,1) e independientes, a través del método de transformación u otro método, se puede probar que su promedio sigue la densidad y su acumulada es F2(z)

    Con

    Los valores , se utilizarán en la estandarización de z.

    Se recordará que F2(z) es la función de distribución acumulada exacta del promedio de dos variables aleatorias independientes con distribución uniforme en el intervalo (0,1).

    Claramente el mayor error entre las distribuciones exacta y normal acumuladas, apenas excede el orden de los centesimos, este error es ínfimo sí se considerarán tres variables con distribución Uniforme en el intervalo (0,1) y siendo independientes, entre sí se puede hallar de forma equivalente la función de densidad del promedio y su distribución acumulada como:

    Considerando los valores de , se realiza:

    Del Cuadro No. 2 se obtiene que el máximo error cometido al tomar la función de distribución de Z3 como normal, es menor que 0,01, es decir, un error del 1%.

    El cálculo numérico del error de estimación máximo no es el objetivo de este artículo, pero es un trabajo que puede lograr para el lector que quiere profundizar en este tema.

    Lo observado anteriormente, conduce a la afirmación de que cuanto más tiende a crecer n, la aproximación a la distribución Normal de la distribución del promedio de variables aleatorias independientes con distribución Uniforme en el intervalo (0,1) es más visible, por la interpretación de los Cuadros No. 1 y 2, sin embargo, para interpretar que n crece grandemente, se hará uso de la distribución de Irwin Hall para el promedio de variables independientes con distribución Uniforme, entonces la distribución del promedio indicada, se obtiene como:

    Siendo: su función de densidad de probabilidad es:

    Donde

    En el entendido de proseguir con la visión ilustrativa, se ha desarrollado un programa en MATLAB que muestra la expresión de la distribución exacta y la gráfica de la misma, para su comparación..

     

    5. RESULTADOS.

    En las Cuadros No. 1 y 2 se puede observar una columna de errores, que muestran una diferencia muy pequeña entre las funciones acumuladas exactas y la distribución Normal, este análisis implica que el error absoluto, para n=2, es casi igual a 0,01, la convergencia se nota más cuando para n=3, hacemos la comparación y el error es menor que 0,01, para n mayor se realiza la descripción de la función de densidad del promedio de n variables aleatorias, a través de la fórmula de Irwin Hall y haciendo una transformación que permite mostrar, la cercanía entre la densidad del promedio con la distribución Normal estándar Gráficas No. 1, 2 y 3.

     

    6. DISCUSIÓN

    El proceso de enseñanza y aprendizaje en la universidad tiene una vivencia día a día en el aula que es función del contenido científico que el docente pretende que se apropie el estudiante, en esta tendencia la estrategia para este fin cambia con mucha frecuencia de clase en clase, es así que esta ilustración pretende afirmar el conocimiento que debe tener el estudiante acerca del Teorema Central del Límite.

    Seguramente hay otras estrategias para la enseñanza de este teorema y uso de nuevos recursos, la visión ilustrativa es una alternativa para la compresión de este teorema.

     

    7. CONCLUSIÓN

    Para la comprensión del Teorema Central del Límite, se mostró que la distribución exacta del promedio de variables aleatorias independientes con distribución Uniforme en el intervalo (0,1) tiende a la distribución Normal estándar, incluso con valores de n pequeños, como se vio en los Cuadros No. 1 y 2 y en las Gráficas No. 1, 2 y 3.

     

    NOTA

    1 Docente emérito, Carrera de Estadística Universidad Mayor de San Andrés, La Paz Bolivia Orcid: 0000-0001-7886-5264

     

    REFERENCIA BIBLIOGRÁFICA

    Barrera Ojeda, D. (2019). Estadística Informatizada. Stigma.        [ Links ]

    Bernard, F. (1997). A first course in Multivariate Statistic. Springer.        [ Links ]

    Billingsley, P. (1986). Probability and Measure. John Wiley and Sons.        [ Links ]

    Casella George y Berger Roger. (2002). Statistical Inference. Duxbury Thomson.        [ Links ]

    De la Cruz, R. (1981). Razonamiento Matemático Superior. Lima Perú.        [ Links ]

    Efimov A, Karakulin A., Pospelov P, Tereschenko A., Vukolov E., Zemskov V, Zolotarev Yu. (1986). Problemas de las Matemáticas Superiores. Mir Moscu.        [ Links ]

    Fernández Cuesta y Fuentes García, Felipe. (1995). Curso de Estadística Descriptiva Teoría y Práctica. Barcelona: Ariel.        [ Links ]

    Freund Jhon y Walpole, Ronald (1990). Estadística Matemática con Aplicaciones. Prentice Hall hispanoamericana.        [ Links ]

    García Ore, C. (1997). Distribuciones y Estadística Inferencial. Lima Peru.        [ Links ]

    Grimett, G. R., & Stirzaker, D. (1993). Probability and Random Processes Problems and Solutions. Oxford University.        [ Links ]

    Gutierrez, B. (2004). Respuestas a dudas típicas de Estadística. Diaz de Santos.        [ Links ]

    Hogg, R. (2005). Introducción to Mathematical Statistics. Pearson Prentice Hall.        [ Links ]

    Johnson, N., Kotz, S., & Balakrishnan, N. (1995). Continuous Univariate Distributions. Wiley an Sons.        [ Links ]

    Kendall Maurice y Buckland William. (1980). Diccionario de Estadística. Pirámide.        [ Links ]

    Kreyszig, E. (1973). Introducción a la Estadística Matemática. Limusa Wiley.        [ Links ]

    Lazaro, M. (2007). Inferencia Estadística. Moshera.        [ Links ]

    Lijoletov I.I.y Matzkevich I.P (1977). Problemas de Matemática Superior Teoría de Probabilidad y de Estadística Matemática. Paraninfo.        [ Links ]

    Meyer, P L. (1998). Probabilidad y Aplicaciones Estadísticas. Paraninfo.        [ Links ]

    Mitacc Meza, M. (1998). Tópicos de Estadística descriptiva y Probabilidad. Lima Peru.        [ Links ]

    Mitacc, M. (1998). Tópicos de Inferencia estadística. Lima Perú: Thales.        [ Links ]

    Mood Alexander y Graybill Franklin. (1978). Introducción a la teoría de la Estadística. Aguilar.        [ Links ]

    Obregón Sanin, I. (1977). Teoría de la Probabilidad, p. 247: Limusa.        [ Links ]

    Parzen, E. (1979). Teoría Moderna de Probabilidades y sus Aplicaciones. Limusa.        [ Links ]

    Rincon, L. (2007). Curso Intermedio de Probabilidad. UNAM.        [ Links ]

    Ruiz Maya , L., & Martin Pliego , J. (2002). Estadística II Inferencia. Thomson.        [ Links ]

    Ruiz Maya, L. (1992). Problemas de Estadística. AC Madrid.        [ Links ]

    Sevastianov, B., Chistiakov , V, & Zubkov. (1985). Problemas de Cálculo de Probabilidades. Mir Moscu.        [ Links ]

    Tucker, H. G. (1966). Introducción a la teoría matemática de las probabilidades y a la estadística. Vinces vives.        [ Links ]

    Velez Barrola, R. (2012). Principios de Inferencia Estadística. Madrid: Uned.        [ Links ]

    Wisniewski Piotr Marian y Velasco Sotomayor Gabriel, Blanco Castaneda Liliana , Arunachalam Viswanathan y Dharmaraja Selvamuthu. (2012). Introduction to Probability and Stochastic Processes. Wiley and Sons.        [ Links ]

    Yohai, V. (2008). Notas de Probabilidades y Estadística.        [ Links ]

    Zacks, S. (2014). Examples and Problems in Mathematical Statistics. Wiley.        [ Links ]