Una introducción al modelo de regresión lineal normal-asimétrico. Parte 1: Teoría, parametrización directa

Serviços Personalizados

Artigo

Indicadores

Links relacionados

Citado por SciELO
Similares em SciELO

Bookmark

|Mais

Revista Varianza

versão impressa ISSN 9876-6789

Revista Varianza n.20 La Paz out. 2022

ARTÍCULOS DE INVESTIGACIÓN

Una introducción al modelo de regresión lineal normal-asimétrico. Parte 1: Teoría, parametrización directa

An introduction to the normal-skew linear regression model. Part 1: Theory, direct parameterization

Omar Chocotea Poca^{1, *}
^* Carrera de Estadística, Universidad Mayor de San Andrés, Bolivia ochocoteap@fcpn.edu.bo
Artículo recibido: 13-08-2022 Artículo aceptado: 22-09-2022

Resumen

En el espectro de las distribuciones elípticas-asimétricas se encuentra la distribución normal-asimétrica que tiene como caso particular a la distribución normal. El objetivo principal de este trabajo es presentar al modelo de regresión lineal con variable aleatoria de error con distribución normal-asimétrica. Este trabajo se divide en tres partes. En estaparte, se revisa los aspectos teóricos base asociados con la parametrización directa. En la Parte 2, se revisa los aspectos teóricos base asociados con la parametrización centrada. Y en la Parte 3, se efectúa la ilustración con un conjunto de datos reales.

Palabras clave: Distribuciones elípticas-asimétricas; Distribución normal-asimétrica; Modelo de regresión lineal

Abstract

In the spectrum of elliptic-asymmetric distributions is the skew-normal distribution, which has the normal distribution as a particular case. The main objective ofthis work is to present the linear regression model with random error variable with skew-normal distribution. This work is divided into three parts. In this part, the basic theoretical aspects associated with direct parameterization are reviewed. In Part 2, the basic theoretical aspects associated with centeredparameterization are reviewed. And in Part 3, the illustration is done with a real data set.

Key words: Elliptic-asymmetric distributions; Skew-normal distribution; Linear regression model

1. INTRODUCCIÓN

El modelo de regresión lineal (MRL) permite modelar la función de regresión como una combinación lineal de covariables. La teoría del MRL está bien establecida. Además, el MRL es la base de muchas herramientas de modelado modernas. Por ejemplo, Naseem et al. (2010) presentan un enfoque novedoso de identificación de rostros mediante la formulación del problema de reconocimiento de patrones en términos del MRL.

Azzalini & Capitanio (1999), Sahu et al. (2003), Rubio & Genton (2016) y Ferreira et al. (2018) entre otros reportan que el supuesto clásico de normalidad de los errores resulta restrictivo en situaciones donde se evidencia asimetría para los datos

Para superar este posible inconveniente, en este de trabajo dividido en tres partes, se presenta una introducción al MRL normalasimétrico bajo la distribución normalasimétrica de Azzalini (1985), siguiendo los trabajos de Azzalini (1985), Azzalini & Capitanio (1999), y Azzalini & Capitanio (2014). Este modelo anida al MRL habitual.

Este artículo está organizado de la siguiente manera. La Sección 2, revisa los momentos de la distribución normal-asimétrica. La sección 3, define la formulación del modelo con la parametrización directa. Finalmente, la Sección 4, revisa la inferencia por el método de máxima verosimilitud hasta obtener la matriz de información.

2. MOMENTOS

El Lema 1 de Azzalini (1985) permite producir la función de densidad de la normal-asimétrica.

Una v.a. z tiene una distribución normal-asimétrica estándar con parámetro de asimetría y representaremos por , si su función de densidad está dada por

donde denotan la función de densidad y función de distribución de la distribución normal estándar, respectivamente. La apariencia gráfica de la función de densidad de la se muestra en la Figura 1 para algunos valores de .

Para valores negativos de se tiene una distribución asimétrica a la izquierda, y para valores positivos de se tiene una distribución asimétrica a la derecha.

Son varias las propiedades que se derivan inmediatamente de la definición anterior.

Si , se cumplen las siguientes propiedades:

a) para todo z;

c) independientemente de .

La función generatriz de cumulantes de es

donde y

El siguiente resultado se utilizará en la última sección.

con r= 1,2,... Entonces

En consecuencia: la esperanza y la varianza están dadas por

respectivamente; y los coeficientes de asimetría y curtosis están dados por

respectivamente.

El coeficiente de asimetría es una función impar, y el coeficiente de curtosis es una función par. Efectuando una evaluación de los valores mínimo y/o máximo de los coeficientes de asimetría y curtosis, se tiene que los coeficientes de asimetría y curtosis varían en los intervalos [-0.995;0.995] y [0;0.869], respectivamente.

De acuerdo con la teoría de la familia de localizadón-escala (ver, por ejemplo, Lehmann & Casella, 1998, p. 17), la distribución normal-asimétrica con parámetro de localización parámetro de escala y parámetro de asimetría se genera con la transformación

y representaremos por si su función de densidad es

A continuación, con base en la anterior transformación se extiende las características de la de .

Si , se cumplen las siguientes propiedades:

La esperanza y la varianza de la son

respectivamente. Los coeficientes de asimetría y curtosis de la son iguales a los coeficientes de asimetría y curtosis de la , respectivamente.

3. FORMULACIÓN

La sección modifica el supuesto del MRL habitual, en formulación.

Sea un vector de variables aleatorias independientes, un vector de covariables donde es igual a uno (corresponde a una intersección), un vector de coeficientes de regresión, un vector de errores aleatorios independientes tales que

con i = 1,... ,n. Suponiendo . completamente observado, el i-ésimo predictor lineal es . El modelo de regresión lineal normal-asimétrico vía parametrización directa está dado por

La función de densidad de y_i es

donde

4. INFERENCIA

La sección revisa la inferencia del modelo de regresión lineal normal-asimétrico vía parametrización directa con el método de máxima verosimilitud.

Sea . El logaritmo natural de la verosimilitud del modelo de regresión lineal normal-asimétrico vía parametrización directa es

donde

En consecuencia: la primera derivada de es

con

donde ; y la matriz de información es

con

NOTAS

¹ ORCID: 0000-0002-6490-7491.

REFERENCIA BIBLIOGRÁFICA

Azzalini, A. (1985). A class of distributions which includes the normal ones. Scandinavian Journal of Statistics, 12(2), 171-178. http://www.jstor.org/stable/4615982. [ Links ]

Azzalini, A. and Capitanio, A. (1999). Statistical applications of the multivariate skew normal distribution. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 61(3), 579-602. https://doi.org/10.1111/1467-9868.00194 [ Links ]

Azzalini, A. and Capitanio, A. (2014). The Skew-Normal and Related Families. New York: Cambridge University Press. [ Links ]

Ferreira, C, Vilca, R, and Bolfarine, H. (2018). Diagnostics analysis for skew-normal linear regression models: Applications to a quality of life dataset. Brazilian Journal of Probability and Statistics, 32(3). https://doi.org/10.1214/17-BJPS352 [ Links ]

Lehmann, E. L. and Casella, G. (1998). Theory of Point Estimation. New York: Springer, 2nd edition. [ Links ]

Naseem, L, Togneri, R., and Bennamoun, M. (2010). Linear regression for face recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 32(11), 2106-2112. h t t p s : / / i e e e x p l o r e . i e e e . o r g /document/5506092 [ Links ]

Rubio, R J. and Genton, M. G. (2016). Bayesian linear regression with skew-symmetric error distributions with applications to survival analysis. Statistics in Medicine, 35(14), 2441-2454. https://doi.org/10.1002/sim.6897 [ Links ]

Sahu, S. K., Dey, D. K., and Branco, M. D. (2003). A new class of multivariate skew distributions with applications to bayesian regression models. Canadian Journal of Statistics, 31(2), 129-150. https://doi.org/10.2307/3316064 [ Links ]