SciELO - Scientific Electronic Library Online

 
 número7Aplicación del Análisis de Escalamiento MultidimensionalRegresión por Mínimos Cuadrados Parciales índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Articulo

Indicadores

    Links relacionados

    • No hay articulos citadosCitado por SciELO
    • No hay articulos similaresSimilares en SciELO

    Bookmark

    Revista Varianza

    versión impresa ISSN 9876-6789

    Revista Varianza  n.7 La Paz nov. 2010

     

    INVESTIGACIÓN

     

    Marcos de Muestreo Imperfectos

     

     

    Autor: Lic. Fernando O. Rivero Suguiura

     

     


     

     

    1. Planteamiento de los problemas de Marcos Muéstrales

    En la teoría de poblaciones finitas se supone que el marco de lista de la que se selecciona la muestra, coincide con las unidades que son parte de la población objeto de estudio. En la práctica no siempre esto es cierto, ya que las listas presentan con cierta frecuencia algunos defectos que pueden dar lugar a la aparición de sesgos y a la alteración de las varianzas de los estimadores. Los problemas más frecuentes en los marcos muéstrales de lista, son:

    Las dos últimas limitaciones  de marco muestral no son tratados en esta investigación, pero vale la pena nombrarlos:

    La subcobertura se presenta cuando existen unidades que están en la población objetivo y no en el marco, luego el marco muestral se convierte en un subconjunto de la población. Los siguientes ejemplos describen esta situación:

    -    Suponer que existen nuevas viviendas ocupadas en zonas marginales de una ciudad que son parte de la población, pero por falta de actualización del marco muestral estas no están presentes en dicho marco, dándoles probabilidad igual a cero de ser seleccionadas en la muestra. En este caso se convierten en unidades faltantes.

    -    Se muestrea de una lista de establecimientos económicos manufactureros del censo 2000 sin considerar establecimientos de nueva creación que son parte de la población. También son unidades faltantes.

    La duplicación de unidades muéstrales es cuando el marco muestral contiene elementos repetidos.

    Siguiendo los dos ejemplos anteriores:

    Suponer que una vivienda se registra en el marco muestral como ocupada con tres personas, tal cual ocurre con la población objetivo en el periodo de tiempo 1. Suponer que las tres personas dejan dicha vivienda y son ocupadas por otras cinco personas distintas a las anteriores. Esta vivienda es nuevamente registrada en el marco como ocupada en el periodo de tiempo 2. Si no se elimina del marco la vivienda del periodo de tiempo 1, se presenta el problema de unidad duplicada.

    El establecimiento económico de nombre "El Buen Productor" está registrado en el marco como parte de la población objetivo. Suponer el fallecimiento del dueño del establecimiento económico y el cierre temporal. Después de un periodo de tiempo, se abre nuevamente con el nombre "Carlos Andrade" y éste es registrado en el marco muestral como nuevo establecimiento económico. Es un caso de duplicación.

    La existencia de 'unidades extrañas en el marco muestral es tema de esta investigación. Por unidad extraña se entiende una unidad de muestreo que, incluida en el marco, no pertenece a la población que se desea estudiar, o que no es una unidad del colectivo que se desea seleccionar para ser parte de la muestra.

    Como ejemplos consideremos los siguientes:

    Para una encuesta se desea seleccionar una muestra aleatoria de viviendas ocupadas del marco muestral disponible. Si muchas de las especificadas en el marco están como ocupadas y en la población objetivo son desocupadas, se pueden muestrear unidades extrañas.

    Si para estimar alguna característica de producción en empresas manufactureras del país, se muestrea de una lista de establecimientos económicos manufactureros que en la actualidad cerraron sus puertas por falta de utilidad. Se puede seleccionar unidades extrañas.

    Los ejemplos anteriores ponen de manifiesto que la presencia de unidades extrañas en el marco ocurre principalmente en dos tipos de situaciones prácticas:

    a)  Por no tener actualizado el marco muestral. La lista incluye unidades que han dejado de pertenecer a la población objetivo.

    b)  La población que se desea muestrear se convierte en una subpoblación del marco muestral generándose el problema de la sobrecobertura.

     

    2. El problema de las unidades extrañas en el marco

    Ante la situación de sobrecobertura de marcos muéstrales, pueden adoptarse diferentes reglas de solución, no todas igualmente adecuadas, cuya puesta en práctica depende de los recursos disponibles.

    a) Depuración del marco de muestreo

    Eliminar del marco las unidades extrañas sabiendo el número total de inclusión. Con este proceso queda solucionado el problema de sobrecobertura puesto que luego se procede a seleccionar la muestra del marco depurado. En muchos casos esto no será posible con los recursos dados, bien sea porque el marco disponible no contiene información acerca de cuáles unidades son extrañas (siendo necesario un trabajo de campo de carácter exhaustivo o la construcción de un nuevo marco muestral) o por limitaciones de tiempo, presupuesto, personal no disponible, etc.

    b) Reemplazo de las unidades extrañas en la muestra

    Otra solución consiste en seleccionar una muestra aleatoria del marco disponible no depurado y sustituir las unidades que resulten ser extrañas por otras aleatoriamente seleccionadas de entre las restantes del marco, hasta completar el tamaño de la muestra planificada con unidades todas no extrañas. Lamentablemente esta solución da lugar a estimaciones sesgadas, como se verá luego.

    De acuerdo a los dos puntos anteriores, se considera algunos procedimientos para la estimación del total.

     

    3. Relación de parámetros poblacionales en marcos depurados y no depurados

    Suponer que de las N unidades de muestreo incluidas en el marco, N* son unidades no extrañas, y por lo tanto N - N* son unidades extrañas. Entonces se puede enumerar de 1 a N' las unidades que no son extrañas y de N* +1 a N las unidades extrañas del marco. Es decir que el marco de muestreo disponible no depurado se constituye en el conjunto:

    Sea Y: el valor de una variable que se desea investigar de lase atribuye el valor deigual a cero cuandoes una unidad extraña. Por tratarse de una unidad extraña, el valor depuede ser realmente cero o no estar definido. Ya que la unidad muestral no pertenece a la población objeto de estudio cuyo total se desea estimar, su contribución a dicho total es nula, justificando así el valor deigual a cero.

    Los valores totales de ambos marcos son entonces coincidentes, es decir:

    La relación ( 7 ) entre varianzas en el marco no depurado y en el marco depurado se obtiene de la siguiente manera:

    4. Estimador del total f cuando se muestrea con el marco depurado
    Si se considera un muestreo aleatorio simple sin reemplazo con probabilidades iguales de selección, se tiene que el estimador del total , es:

    Estos dos resultados forman parte de la teoría elemental de muestreo de poblaciones finitas, por ello, se aceptan sin demostración.

    5. Estimador del total t cuando se muestrea con el marco no depurado

    Se señalan dos aspectos en la estimación, estos son:

    5.1. No se sustituyen las unidades extrañas que aparecen en la muestra

    En estas condiciones, si se considera un muestreo aleatorio simple sin reemplazo con probabilidades iguales de selección, se tiene que el estimador del total es:

    la expresión (12) es un estimador insesgado y su varianza está dada por:

    Luego, analizar diferencias entre cuasivarianzas de ambos marcos muéstrales, es decir:

    el primer factor de des positivo, se debe probar que también lo es el segundo factor. En efecto, por ser:

    5.2 Se sustituyen aleatoriamente las unidades extrañas que aparecen en la muestra

     

    6. Conclusiones y recomendaciones

    Si no se - conoce el número de unidades extrañas incluidas en el marco, que es lo más probable, los estimadores son insesgados pero con varianza mayor al de un marco muestral con unidades depuradas. Si se identifican unidades extrañas seleccionadas en la muestra y se sustituyen por otras unidades no extrañas de un marco no depurado, entonces los estimadores son sesgados con varianza mayor al de un marco muestral depurado.

    Lo ideal es realizar actualizaciones de marcos de muestreo en periodos cortos de tiempo (año) antes de levantar una encuesta eliminando unidades extrañas. El costo y los recursos, impiden dicha labor, especialmente en los países subdesarrollados, tal es el caso nuestro. Una alternativa de solución al problema, es estimar la proporción de unidades extrañas en el marco ( W ), mediante los listados de actualización de una muestra de unidades primarias de muestreo que arrojen un resultado estimativo y hagan que la varianza de los estimadores a obtenerse sea menor y así aumentar la precisión y disminuir el error de muestreo de los estimadores que se obtengan.

     

    7. Bibliografía

    [1] Pandurang V. Sukhatme, Teoría de Encuestas por Muestreo con Aplicaciones        [ Links ]

    [2] Sharon L. Lohr, Muestreo - Diseño y Análisis        [ Links ]

    [3] Cari - Erik Sarndal, Model Assisted Survey Sampling        [ Links ]

    [4] Azorin Poch, Curso de Muestreo y Aplicaciones        [ Links ]

    [5] Des Raj, La Estructura de las Encuestas por Muestreo        [ Links ]

    [6] Leslie Kish, Muestreo de Encuestas        [ Links ]