Serviços Personalizados
Artigo
Indicadores
Links relacionados
- Citado por SciELO
- Similares em SciELO
Bookmark
Revista Varianza
versão impressa ISSN 9876-6789
Revista Varianza n.20 La Paz out. 2022
ARTÍCULOS DE INVESTIGACIÓN
Una introducción al modelo de regresión lineal normal-asimétrico. Parte 1: Teoría, parametrización directa
An introduction to the normal-skew linear regression model. Part 1: Theory, direct parameterization
Omar Chocotea Poca1, *
* Carrera de Estadística, Universidad Mayor de San Andrés, Bolivia ochocoteap@fcpn.edu.bo
Artículo recibido: 13-08-2022 Artículo aceptado: 22-09-2022
Resumen
En el espectro de las distribuciones elípticas-asimétricas se encuentra la distribución normal-asimétrica que tiene como caso particular a la distribución normal. El objetivo principal de este trabajo es presentar al modelo de regresión lineal con variable aleatoria de error con distribución normal-asimétrica. Este trabajo se divide en tres partes. En estaparte, se revisa los aspectos teóricos base asociados con la parametrización directa. En la Parte 2, se revisa los aspectos teóricos base asociados con la parametrización centrada. Y en la Parte 3, se efectúa la ilustración con un conjunto de datos reales.
Palabras clave: Distribuciones elípticas-asimétricas; Distribución normal-asimétrica; Modelo de regresión lineal
Abstract
In the spectrum of elliptic-asymmetric distributions is the skew-normal distribution, which has the normal distribution as a particular case. The main objective ofthis work is to present the linear regression model with random error variable with skew-normal distribution. This work is divided into three parts. In this part, the basic theoretical aspects associated with direct parameterization are reviewed. In Part 2, the basic theoretical aspects associated with centeredparameterization are reviewed. And in Part 3, the illustration is done with a real data set.
Key words: Elliptic-asymmetric distributions; Skew-normal distribution; Linear regression model
1. INTRODUCCIÓN
El modelo de regresión lineal (MRL) permite modelar la función de regresión como una combinación lineal de covariables. La teoría del MRL está bien establecida. Además, el MRL es la base de muchas herramientas de modelado modernas. Por ejemplo, Naseem et al. (2010) presentan un enfoque novedoso de identificación de rostros mediante la formulación del problema de reconocimiento de patrones en términos del MRL.
Azzalini & Capitanio (1999), Sahu et al. (2003), Rubio & Genton (2016) y Ferreira et al. (2018) entre otros reportan que el supuesto clásico de normalidad de los errores resulta restrictivo en situaciones donde se evidencia asimetría para los datos
Para superar este posible inconveniente, en este de trabajo dividido en tres partes, se presenta una introducción al MRL normalasimétrico bajo la distribución normalasimétrica de Azzalini (1985), siguiendo los trabajos de Azzalini (1985), Azzalini & Capitanio (1999), y Azzalini & Capitanio (2014). Este modelo anida al MRL habitual.
Este artículo está organizado de la siguiente manera. La Sección 2, revisa los momentos de la distribución normal-asimétrica. La sección 3, define la formulación del modelo con la parametrización directa. Finalmente, la Sección 4, revisa la inferencia por el método de máxima verosimilitud hasta obtener la matriz de información.
2. MOMENTOS
El Lema 1 de Azzalini (1985) permite producir la función de densidad de la normal-asimétrica.
Una v.a. z tiene una distribución normal-asimétrica estándar con parámetro de asimetría y representaremos por , si su función de densidad está dada por
donde denotan la función de densidad y función de distribución de la distribución normal estándar, respectivamente. La apariencia gráfica de la función de densidad de la se muestra en la Figura 1 para algunos valores de .
Para valores negativos de se tiene una distribución asimétrica a la izquierda, y para valores positivos de se tiene una distribución asimétrica a la derecha.
Son varias las propiedades que se derivan inmediatamente de la definición anterior.
Si , se cumplen las siguientes propiedades:
a) para todo z;
b)
c) independientemente de .
La función generatriz de cumulantes de es
donde y
El siguiente resultado se utilizará en la última sección.
Si
con r= 1,2,... Entonces
y
En consecuencia: la esperanza y la varianza están dadas por
y
respectivamente; y los coeficientes de asimetría y curtosis están dados por
y
respectivamente.
El coeficiente de asimetría es una función impar, y el coeficiente de curtosis es una función par. Efectuando una evaluación de los valores mínimo y/o máximo de los coeficientes de asimetría y curtosis, se tiene que los coeficientes de asimetría y curtosis varían en los intervalos [-0.995;0.995] y [0;0.869], respectivamente.
De acuerdo con la teoría de la familia de localizadón-escala (ver, por ejemplo, Lehmann & Casella, 1998, p. 17), la distribución normal-asimétrica con parámetro de localización parámetro de escala y parámetro de asimetría se genera con la transformación
y representaremos por si su función de densidad es
A continuación, con base en la anterior transformación se extiende las características de la de .
Si , se cumplen las siguientes propiedades:
La esperanza y la varianza de la son
y
respectivamente. Los coeficientes de asimetría y curtosis de la son iguales a los coeficientes de asimetría y curtosis de la , respectivamente.
3. FORMULACIÓN
La sección modifica el supuesto del MRL habitual, en formulación.
Sea un vector de variables aleatorias independientes, un vector de covariables donde es igual a uno (corresponde a una intersección), un vector de coeficientes de regresión, un vector de errores aleatorios independientes tales que
con i = 1,... ,n. Suponiendo . completamente observado, el i-ésimo predictor lineal es . El modelo de regresión lineal normal-asimétrico vía parametrización directa está dado por
La función de densidad de yi es
donde
4. INFERENCIA
La sección revisa la inferencia del modelo de regresión lineal normal-asimétrico vía parametrización directa con el método de máxima verosimilitud.
Sea . El logaritmo natural de la verosimilitud del modelo de regresión lineal normal-asimétrico vía parametrización directa es
donde
En consecuencia: la primera derivada de es
con
donde ; y la matriz de información es
con
NOTAS
1 ORCID: 0000-0002-6490-7491.
REFERENCIA BIBLIOGRÁFICA
Azzalini, A. (1985). A class of distributions which includes the normal ones. Scandinavian Journal of Statistics, 12(2), 171-178. http://www.jstor.org/stable/4615982. [ Links ]
Azzalini, A. and Capitanio, A. (1999). Statistical applications of the multivariate skew normal distribution. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 61(3), 579-602. https://doi.org/10.1111/1467-9868.00194 [ Links ]
Azzalini, A. and Capitanio, A. (2014). The Skew-Normal and Related Families. New York: Cambridge University Press. [ Links ]
Ferreira, C, Vilca, R, and Bolfarine, H. (2018). Diagnostics analysis for skew-normal linear regression models: Applications to a quality of life dataset. Brazilian Journal of Probability and Statistics, 32(3). https://doi.org/10.1214/17-BJPS352 [ Links ]
Lehmann, E. L. and Casella, G. (1998). Theory of Point Estimation. New York: Springer, 2nd edition. [ Links ]
Naseem, L, Togneri, R., and Bennamoun, M. (2010). Linear regression for face recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 32(11), 2106-2112. h t t p s : / / i e e e x p l o r e . i e e e . o r g /document/5506092 [ Links ]
Rubio, R J. and Genton, M. G. (2016). Bayesian linear regression with skew-symmetric error distributions with applications to survival analysis. Statistics in Medicine, 35(14), 2441-2454. https://doi.org/10.1002/sim.6897 [ Links ]
Sahu, S. K., Dey, D. K., and Branco, M. D. (2003). A new class of multivariate skew distributions with applications to bayesian regression models. Canadian Journal of Statistics, 31(2), 129-150. https://doi.org/10.2307/3316064 [ Links ]