SciELO - Scientific Electronic Library Online

 
 número20Currícula Estadística en Bolivia, cambios en la última década¿Es la educación o la situación económica la principal determinante social de la mortalidad infantil en Bolivia? índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Artigo

Indicadores

    Links relacionados

    • Não possue artigos citadosCitado por SciELO
    • Não possue artigos similaresSimilares em SciELO

    Bookmark

    Revista Varianza

    versão impressa ISSN 9876-6789

    Revista Varianza  n.20 La Paz out. 2022

     

    ARTÍCULOS DE INVESTIGACIÓN

     

    Una introducción al modelo de regresión lineal normal-asimétrico. Parte 1: Teoría, parametrización directa

     

    An introduction to the normal-skew linear regression model. Part 1: Theory, direct parameterization

     

     

    Omar Chocotea Poca1, *
    * Carrera de Estadística, Universidad Mayor de San Andrés, Bolivia ochocoteap@fcpn.edu.bo
    Artículo recibido: 13-08-2022     Artículo aceptado: 22-09-2022

     

     


    Resumen

    En el espectro de las distribuciones elípticas-asimétricas se encuentra la distribución normal-asimétrica que tiene como caso particular a la distribución normal. El objetivo principal de este trabajo es presentar al modelo de regresión lineal con variable aleatoria de error con distribución normal-asimétrica. Este trabajo se divide en tres partes. En estaparte, se revisa los aspectos teóricos base asociados con la parametrización directa. En la Parte 2, se revisa los aspectos teóricos base asociados con la parametrización centrada. Y en la Parte 3, se efectúa la ilustración con un conjunto de datos reales.

    Palabras clave: Distribuciones elípticas-asimétricas; Distribución normal-asimétrica; Modelo de regresión lineal


    Abstract

    In the spectrum of elliptic-asymmetric distributions is the skew-normal distribution, which has the normal distribution as a particular case. The main objective ofthis work is to present the linear regression model with random error variable with skew-normal distribution. This work is divided into three parts. In this part, the basic theoretical aspects associated with direct parameterization are reviewed. In Part 2, the basic theoretical aspects associated with centeredparameterization are reviewed. And in Part 3, the illustration is done with a real data set.

    Key words: Elliptic-asymmetric distributions; Skew-normal distribution; Linear regression model


     

     

    1. INTRODUCCIÓN                     

    El modelo de regresión lineal (MRL) permite modelar la función de regresión como una combinación lineal de covariables. La teoría del MRL está bien establecida. Además, el MRL es la base de muchas herramientas de modelado modernas. Por ejemplo, Naseem et al. (2010) presentan un enfoque novedoso de identificación de rostros mediante la formulación del problema de reconocimiento de patrones en términos del MRL.

    Azzalini & Capitanio (1999), Sahu et al. (2003), Rubio & Genton (2016) y Ferreira et al. (2018) entre otros reportan que el supuesto clásico de normalidad de los errores resulta restrictivo en situaciones donde se evidencia asimetría para los datos

    Para superar este posible inconveniente, en este de trabajo dividido en tres partes, se presenta una introducción al MRL normalasimétrico bajo la distribución normalasimétrica de Azzalini (1985), siguiendo los trabajos de Azzalini (1985), Azzalini & Capitanio (1999), y Azzalini & Capitanio (2014). Este modelo anida al MRL habitual.

    Este artículo está organizado de la siguiente manera. La Sección 2, revisa los momentos de la distribución normal-asimétrica. La sección 3, define la formulación del modelo con la parametrización directa. Finalmente, la Sección 4, revisa la inferencia por el método de máxima verosimilitud hasta obtener la matriz de información.

     

    2. MOMENTOS

    El Lema 1 de Azzalini (1985) permite producir la función de densidad de la normal-asimétrica.

    Una v.a. z tiene una distribución normal-asimétrica estándar con parámetro de asimetría y representaremos por , si su función de densidad está dada por

    donde denotan la función de densidad y función de distribución de la distribución normal estándar, respectivamente. La apariencia gráfica de la función de densidad de la se muestra en la Figura 1 para algunos valores de .

    Para valores negativos de se tiene una distribución asimétrica a la izquierda, y para valores positivos de se tiene una distribución asimétrica a la derecha.

    Son varias las propiedades que se derivan inmediatamente de la definición anterior.

    Si , se cumplen las siguientes propiedades:

    a) para todo z;

    b)

    c) independientemente de .

    La función generatriz de cumulantes de es

    donde y

    El siguiente resultado se utilizará en la última sección.

    Si

    con r= 1,2,... Entonces

    y

    En consecuencia: la esperanza y la varianza están dadas por

    y

    respectivamente; y los coeficientes de asimetría y curtosis están dados por

    y

    respectivamente.

    El coeficiente de asimetría es una función impar, y el coeficiente de curtosis es una función par. Efectuando una evaluación de los valores mínimo y/o máximo de los coeficientes de asimetría y curtosis, se tiene que los coeficientes de asimetría y curtosis varían en los intervalos [-0.995;0.995] y [0;0.869], respectivamente.

    De acuerdo con la teoría de la familia de localizadón-escala (ver, por ejemplo, Lehmann & Casella, 1998, p. 17), la distribución normal-asimétrica con parámetro de localización parámetro de escala y parámetro de asimetría se genera con la transformación

    y representaremos por si su función de densidad es

    A continuación, con base en la anterior transformación se extiende las características de la de .

    Si , se cumplen las siguientes propiedades:

    La esperanza y la varianza de la son

    y

    respectivamente. Los coeficientes de asimetría y curtosis de la son iguales a los coeficientes de asimetría y curtosis de la , respectivamente.

    3. FORMULACIÓN

    La sección modifica el supuesto del MRL habitual, en formulación.

    Sea un vector de variables aleatorias independientes, un vector de covariables donde es igual a uno (corresponde a una intersección), un vector de coeficientes de regresión, un vector de errores aleatorios independientes tales que

    con i = 1,... ,n. Suponiendo . completamente observado, el i-ésimo predictor lineal es . El modelo de regresión lineal normal-asimétrico vía parametrización directa está dado por

    La función de densidad de yi es

    donde

     

    4. INFERENCIA

    La sección revisa la inferencia del modelo de regresión lineal normal-asimétrico vía parametrización directa con el método de máxima verosimilitud.

    Sea . El logaritmo natural de la verosimilitud del modelo de regresión lineal normal-asimétrico vía parametrización directa es

    donde

    En consecuencia: la primera derivada de es

    con

    donde ; y la matriz de información es

    con

     

    NOTAS

    1 ORCID: 0000-0002-6490-7491.

     

    REFERENCIA BIBLIOGRÁFICA

    Azzalini, A. (1985). A class of distributions which includes the normal ones. Scandinavian Journal of Statistics, 12(2), 171-178. http://www.jstor.org/stable/4615982.        [ Links ]

    Azzalini, A. and Capitanio, A. (1999). Statistical applications of the multivariate skew normal distribution. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 61(3), 579-602. https://doi.org/10.1111/1467-9868.00194        [ Links ]

    Azzalini, A. and Capitanio, A. (2014). The Skew-Normal and Related Families. New York: Cambridge University Press.        [ Links ]

    Ferreira, C, Vilca, R, and Bolfarine, H. (2018). Diagnostics analysis for skew-normal linear regression models: Applications to a quality of life dataset. Brazilian Journal of Probability and Statistics, 32(3). https://doi.org/10.1214/17-BJPS352        [ Links ]

    Lehmann, E. L. and Casella, G. (1998). Theory of Point Estimation. New York: Springer, 2nd edition.        [ Links ]

    Naseem, L, Togneri, R., and Bennamoun, M. (2010). Linear regression for face recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 32(11), 2106-2112. h t t p s : / / i e e e x p l o r e . i e e e . o r g /document/5506092        [ Links ]

    Rubio, R J. and Genton, M. G. (2016). Bayesian linear regression with skew-symmetric error distributions with applications to survival analysis. Statistics in Medicine, 35(14), 2441-2454. https://doi.org/10.1002/sim.6897        [ Links ]

    Sahu, S. K., Dey, D. K., and Branco, M. D. (2003). A new class of multivariate skew distributions with applications to bayesian regression models. Canadian Journal of Statistics, 31(2), 129-150. https://doi.org/10.2307/3316064        [ Links ]