Scielo RSS <![CDATA[Revista Varianza]]> http://revistasbolivianas.umsa.bo/rss.php?pid=9876-678920210001&lang=en vol. num. 18 lang. en <![CDATA[SciELO Logo]]> http://revistasbolivianas.umsa.bo/img/en/fbpelogp.gif http://revistasbolivianas.umsa.bo <link>http://revistasbolivianas.umsa.bo/scielo.php?script=sci_arttext&pid=S9876-67892021000100001&lng=en&nrm=iso&tlng=en</link> <description/> </item> <item> <title><![CDATA[<b>Marginal models application to panel data</b>]]> http://revistasbolivianas.umsa.bo/scielo.php?script=sci_arttext&pid=S9876-67892021000100002&lng=en&nrm=iso&tlng=en Resumen El objetivo de este artículo es aplicar el modelo marginal en el análisis de datos tipo panel sobre la situación nutricional de los recién nacidos. Luego de examinar sucintamente los aspectos centrales de los modelos marginales, se revisa brevemente el método de ecuaciones de estimación generalizada (EEG), un método apropiado para la estimación de este tipo de modelos. Con base en un modelo marginal logístico con patrón de correlación intercambiable, se concluye que fumar durante el embarazo y un servicio prenatal inadecuado incrementan significativamente la probabilidad de un nacimiento con bajo peso al nacer.<hr/>Abstract The aim of this article is to apply the marginal model in the analysis of panel data on the nutritional status of newborns. After a brief review of the central aspects of marginal models, the generalized estimating equations (GEE) method, an appropriate method for estimating this type of model, is briefly reviewed. Based on a logistic marginal model with exchangeable correlation pattern, it is concluded that smoking during pregnancy and inadequate prenatal care significantly increase the probability of a low birth weight <![CDATA[<b>Asymmetric stratification electoral polls</b>]]> http://revistasbolivianas.umsa.bo/scielo.php?script=sci_arttext&pid=S9876-67892021000100003&lng=en&nrm=iso&tlng=en Resumen La importancia de las encuestas electorales radica en su precisión sobre los resultados oficiales, en particular, el diseño de muestreo que define la selección y el proceso de estimación es un componente neurálgico en esta operación estadística. Estrategias como la estratificación, y el uso de dos o más etapas son habituales, sin embargo, las regiones bisagra o lo que aquí se denomina como estratificación electoral asimétrica es una alternativa para mejorar la precisión de las estimaciones de encuestas de opinión en Bolivia. Con el objetivo de mejorar la precisión de las estimaciones, se experimentó la inclusión de variables electorales para la estratificación y la incorporación de otras variables en la Post-estratificación, mediante técnicas multivariantes como el de componentes principales y análisis cluster no jerárquico, esto genera mejoras en la desviación media absoluta (DMA) de 6.9 a 4.8, y en otras medidas de precisión, comparadas con las estimaciones de resultados de la 2da Encuesta de la iniciativa TuVotocuenta para las Elecciones Generales de Bolivia en 2020.<hr/>Abstract The importance of electoral polis lies in their precision on the official results, in particular, the sampling design that defines the selection and the estimation process is a neuralgic component in this statistical operation. Strategies such as stratification and the use of two or more stages are common; however, hinge regions or what it here call asymmetric electoral stratification is an alternative to improve the precision of opinion poll estimates in Bolivia. In order to improve the precision of the estimates, the inclusion of electoral variables for stratification and the incorporation of other variables in Post-stratification were experimented with, using multivariate techniques such as principal components and non-hierarchical cluster analysis, this generates improvements in the absolute mean deviation (DMA) from 6.9 to 4.8, and in other precision measures, compared with the estimates of the results of the 2nd Survey of the TuVotocuenta initiative for the Bolivian General Elections in 2020 <![CDATA[<b>Machine Learning Application without supervision</b>]]> http://revistasbolivianas.umsa.bo/scielo.php?script=sci_arttext&pid=S9876-67892021000100004&lng=en&nrm=iso&tlng=en Resumen El presente artículo, tiene como objetivo principal el desarrollo de la aplicación de machine learning no supervisado. La aplicación de esta metodología se realiza considerando la Encuesta Sociodemográfica del Departamento de La Paz, realizada en el año 2015. La base de datos considerada tiene datos de migración, salud, educación, empleo, ingresos, agropecuaria, vivienda, etc. De esta se considera los 75 municipios del Departamento de La Paz y los indicadores educativos, empleo, demográficos y vivienda y dentro de esta se consideran: la tasa de alfabetismo, tasa de participación, distribución de hogares según disponibilidad de dormitorios y relación de masculinidad. Los resultados muestran que los municipios Santiago de Huata, y Tito Yupanqui, muestran similares características respecto a los indicadores: tasas de participación, relación de masculinidad y tasa de alfabetismo. Otro cluster definido por la customización son los municipios Humanata, Alcapata y Ayata y son parecidos en distribución de hogares según disponibilidad de dormitorios por persona y tasa de alfabetismo. Se concluye que la customización es la mejor forma de clasificación por la forma en que se presenta en forma mucho más clara que otras formas de clasificar consideradas en el estudio.<hr/>Abstract The main objective of this article is the development of the unsupervised machine learning application. The application of this methodology is carried out considering the Sociodemographic Survey of the Department of La Paz, carried out in 2015. The database considered has data on migration, health, education, employment, income, agriculture, housing, etc. Of this, the 75 municipalities of the Department of La Paz and the educational, employment, demographic and housing indicators are considered and within this are considered: the literacy rate, participation rate, distribution of households according to availability of bedrooms and masculinity ratio. The results show that the municipalities of Santiago de Huata and Tito Yupanqui show similar characteristics regarding the indicators: participation rates, masculinity ratio and literacy rate. Another cluster defined by the customization are the municipalities Humanata, Alcapata and Ayata and they are similar in distribution of households according to availability of bedrooms per person and literacy rate. It is concluded that customization is the best form of classification due to the way it is presented in a much clearer way than other forms of classification considered in the study. <![CDATA[<b>Generation Z. Health effects associated with the use of technology</b>]]> http://revistasbolivianas.umsa.bo/scielo.php?script=sci_arttext&pid=S9876-67892021000100005&lng=en&nrm=iso&tlng=en Resumen El uso de las tecnologías es un tema trascendental en los últimos años, cada vez más evidente en todas las generaciones. Hasta el momento se afirmaba que las nuevas generaciones, particularmente la generación Z, era el grupo poblacional con mayor consumo de la tecnología, redes sociales y todos los equipos y accesorios que satisfacen la necesidad de una comunicación continua y permanente. Debido a esto, se plantea la interrogante si existe algún efecto a la salud y el comportamiento por el uso de la tecnología en la generación Z en comparación con las generaciones X e Y. Por lo tanto, se hace una exploración para determinar las diferencias en cuanto al tiempo promedio de uso de la tecnología y sus posibles efectos en la salud entre los grupos generacionales: Z (los nacidos desde 1996) y, la X (1961-1980) y Y (1981-1995). La muestra no probabilística responde a un instrumento electrónico, en el que participaron 273 universitarios. El análisis realizado correspondió a los métodos estadísticos no paramétricos para determinar la asociación entre las variables de interés. Entre los grupos generacionales, el tiempo promedio de uso de las tecnologías, no mostró diferencias estadísticamente significativas; respecto a las afectaciones a la salud, la ansiedad se presentó con mayor frecuencia en la generación Z (40%) comparado con las generaciones X e Y (34%); un comportamiento muy similar al trastorno del sueño 41% y 36%, respectivamente. También se observó que alrededor del 50% de la generación Z presenta problemas oculares.<hr/>Abstract The use of technologies is a transcendental issue in recent years, increasingly evident in all generations. Until now, it was affirmed that the new generations, particularly generation Z, were the population group with the highest consumption of technology, social networks and all the equipment and accessories that satisfy the need for continuous and permanent communication. Because of this, the question arises whether there are any health and behavioral effects of the use of technology in Generation Z compared to Generations X and Y. Therefore, an exploration is made to determine the differences in terms of the average time of use of the technology and its possible effects on health between the generational groups: Z (those born since 1996) and, X (1961-1980) and Y (1981-1995). The non-probabilistic sample responds to an electronic instrument, in which 273 university students participated. The analysis carried out corresponded to non-parametric statistical methods to determine the association between the variables of interest. Among the generational groups, the average time of use of the technologies did not show statistically significant differences; regarding health effects, anxiety was presented more frequently in generation Z (40%) compared to generations X and Y (34%); behavior very similar to sleep disorder 41% and 36%, respectively. It was also observed that around 50% of generation Z have eye problems <![CDATA[<b>Multinomial logistic model socioeconomic conditions of people that inhabit in El Alto city</b>]]> http://revistasbolivianas.umsa.bo/scielo.php?script=sci_arttext&pid=S9876-67892021000100006&lng=en&nrm=iso&tlng=en Resumen El objetivo es investigar las condiciones de vida de las personas que habitan en la ciudad de El Alto de La Paz, a partir de la referencia de algunas variables demográficas y socioeconómicas como son: edad, nivel de educación, seguridad alimentaria, ingreso, gasto mensual y ocupación, con la aplicación del modelo logístico multinomial que clasifica a la población en nivel socioeconómico alto, medio y bajo. Además, el modelo permite la medición probabilística de pertenecer a dichas categorías con mayor o menor influencia.<hr/>Abstract The objective is to investígate the living conditions of people living in El Alto city, located in the department of La Paz, based on the reference of some demographic and socioeconomic variables such as: age, education level, food security, income, monthly expenditure and oceupation, implicating the multinomial logistic model that classifies the population into high, médium and low socioeconomic level. In addition, the model allows the probabilistic measurement of belonging to these categories with greater or lesser influence <![CDATA[<b>A quick look at Bayesian Inference</b>]]> http://revistasbolivianas.umsa.bo/scielo.php?script=sci_arttext&pid=S9876-67892021000100007&lng=en&nrm=iso&tlng=en Resumen El enfoque Bayesiano de la estadística debe considerarse como una alternativa adicional al enfoque clásico, siendo ambos enfoques complementarios más no excluyentes. La estadística Bayesiana ofrece una gran variedad de métodos estadísticos similares en número a los proporcionados por el enfoque clásico. La estadística Bayesiana debe su nombre al uso repetido del Teorema de Bayes: la distribución final o posterior es el resultado de aplicar el Teorema de Bayes a la información que proporcionan los datos (función de verosimilitud) y la información previa del parámetro de interés (distribución inicial). La distribución posterior es idónea para hacer cualquier tipo de inferencias sobre el parámetro de interés 1, ya sea estimación puntual o por intervalo, pues incluye toda la información disponible acerca de θ una vez observados los datos junto con la información inicial. El objetivo de este artículo es la ejemplificación de obtención el estimador puntual Bayesiano y la región creíble de la media (θ) de datos con distribución Cauchy (θ,1). Para este propósito se usarán los datos de precipitaciones anuales del estado mexicano de Tabasco. Adicionalmente, se utilizan técnicas de simulación de variables aleatorias e integración numérica. Los resultados obtenidos mediante inferencia Bayesiana permitirán tener una aproximación a la verdadera media de precipitación (θ) desde que el estimador clásico se vuelve inestable conforme incrementa el tamaño de muestra. Con este simple ejercicio se pretende dar a conocer algunas ventajas de aplicar los métodos Bayesianos.<hr/>Abstract The Bayesian approach to statistics should be considered as an additional alternative to the classical approach, both approaches being complementary but not exclusive. Bayesian statistics offers a great variety of statistical methods similar in number to those provided by the classical approach. The origin of the term 'Bayesian Statistics' is due to the repeated use of the Bayes Theorem: the final or posterior distribution is the result of applying the Bayes Theorem to the information provided by data (likelihood function) and initial information about the parameter of interest (distribution initial). Posterior distribution is ideal for making any kind of inferences about the parameter of interest, whether it can be a point estímate or by interval, since it includes all the information available about θ after data has been observed together with initial information. The objective of this article is to illustrate how to get a Bayesian point estimator and credible region for the mean (θ) of Cauchy data Cau(θ, 1). For this purpose, annual rainfall data of Tabasco (Mexican state) will be used. Additionally, random variable simulation techniques and numerical integration are employed. The results obtained through Bayesian inference provides us with an approximation to the trae mean of precipitation (θ) since the classical estimator becomes unstable as the sample size increases. This simple exercise is intended to show some advantages of applying Bayesian methods <![CDATA[<b>Benford's Law and Covid-19 data in Bolivia</b>]]> http://revistasbolivianas.umsa.bo/scielo.php?script=sci_arttext&pid=S9876-67892021000100008&lng=en&nrm=iso&tlng=en Resumen En la actualidad, con los datos de la pandemia COVID-19, existe la duda en creer que los estados o gobiernos estén informando datos confiables y precisos. En Bolivia, en particular, ocurre lo mismo, en vista que el sistema de salud es precario, se duda de la información reportada hasta el día de hoy, tanto en nuevos casos diarios, casos diarios recuperados y fallecidos, así como en los datos acumulados. Por lo tanto, el objetivo del trabajo de investigación radica en docimar si estos conjuntos de datos informados por el sistema de salud del país siguen la ley de Benford. La metodología del trabajo se basa en el procedimiento de un estudio de investigación de bondad de ajuste pues abarca el uso de dos pruebas de bondad de ajuste denominadas el test Chi cuadrado de Bondad de Ajuste y el test de bondad de ajuste de Kuiper. Los datos recopilados provienen de los reportes diarios del Ministerio de Salud del Estado Plurinacional de Bolivia entre el 1 de abril del 2020 y el 14 de julio del 2021. Para determinar si el primer dígito significativo del número diario de casos confirmados con COVID-19 en Bolivia se adecúa a la ley de probabilidad de Benford se realizan las pruebas de bondad de ajuste Chi cuadrado de Pearsony la prueba de Kuiper, en ambos casos se rechaza la hipótesis que los datos se ajustan a la ley de Benford, la diferencia significativa más grande es con el dígito 1, este hecho sugiere que existe una subestimación en los reportes diarios de casos confirmados.<hr/>Abstract At present, with the data from the COVID-19 pandemic, there is doubt in believing that states or governments are reporting reliable and accurate data. In Bolivia, in particular, the same happens, given that the health system is precarious, the information reported to date is doubted, both in new daily cases, daily cases recovered and deaths, as well as in accumulated data. Therefore, the objective of the research work is to document whether these data sets reported by the country 's health system follow Benford's law. The work methodology is based on the procedure of a goodness-of-fit research study, since it involves the use of two goodness-of-fit tests called the Chi-square Goodness-of-Fit test and the Kuiper goodness-of-fit test. The data collected comes from the daily reports of the Ministry of Health of the Plurinational State of Bolivia between April 1, 2020 and July 14, 2021. To determine if the first significant digit of the daily number of confirmed COVID-19 cases in Bolivia conforms to Benford's law of probability, Pearson's Chi-square goodness-of-fit tests and Kuiper's test are performed, in both cases the hypothesis that the data conform to Benford's law is rejected, the diíference being more significant large is with the digit 1, this fact suggests that there is an underestimation in the daily reports of confirmed cases