SciELO - Scientific Electronic Library Online

 
 número11Clasificación mediante Redes Neuronales y Conglomerados No Jerárquicos de las Condiciones de Vida de los Hogares de BoliviaTamaño de Muestra en Poblaciones Agropecuarias índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Articulo

Indicadores

    Links relacionados

    • No hay articulos citadosCitado por SciELO
    • No hay articulos similaresSimilares en SciELO

    Bookmark

    Revista Varianza

    versión impresa ISSN 9876-6789

    Revista Varianza  n.11 La Paz mayo 2015

     

    ARTICULOS

     

    Superficies de Respuesta mediante un Diseño Central Compuesto

     

     

    Lic. María Gilka Jiménez Careaga
    gilka.jimenez@gmail.com

     

     


     

     

    1.    Introducción

    La Metodología de Superficies de Respuesta (MSR) es una combinación de análisis de Regresión y Diseño Experimental que fue introducida por Box y Wilson en 1951. Es una estrategia de experimentación secuencial y modelación que conduce a la localización de los valores óptimos de las variables independientes que maximizan, minimizan o cumplen ciertas restricciones en la variable respuesta.

     

    2.    Construcción de una superficie de respuesta

    La investigación de una superficie de respuesta en primera instancia aborda la localización de la región en la cual se encuentra la respuesta óptima Y, en las siguientes etapas, luego de comprobar experimentalmente, va reduciendo la superficie de respuesta en estudio, en algunos casos hasta obtener la convergencia en un punto óptimo.

    El proceso se inicia con la planificación de un diseño experimental exploratorio que permite la aproximación a la superficie mediante la representación matemática de los modelos más simples, entre estos tenemos:

    Un modelo de primer orden (lineal) sin interacciones o productos cruzados:

    Modelo de primer orden (lineal) con interacciones o productos cruzados:

    donde representa el ruido o error observado en la respuesta Y, xi son factores cuantitativos observados.

    En esta primera fase, se utilizan experimentos factoriales completos 2k o fraccionarios 2k-p, con el fin de estimar las respuestas medias para un modelo lineal o de primer orden, como el de la ecuación (2). Se recomienda generalmente agregar dos o más observaciones en el nivel medio de cada uno de los factores para estimar el error experimental y tener un mecanismo de evaluación para saber si el modelo lineal es apropiado.

    En la siguiente etapa, una vez identificada la región de respuesta óptima, los diseños factoriales completos o fraccionarios a dos niveles no son suficientes, pues se requieren al menos tres niveles para cada factor y el diseño debe de tener 1 + 2k + k(k — 1 )/2 puntos distintos para estimar los parámetros de un modelo de regresión cuadrática.

    Modelo cuadrático o de segundo orden:

    Entre los diseños experimentales que pueden ser utilizados en estafase están los experimentos factoriales 3k, sin embargo son considerados poco prácticos por el elevado número de combinaciones de tratamientos que requiere. Existen otros diseños desarrollados para la aproximación a una superficie de segundo orden, que no requieren tantas combinaciones de tratamientos, entre estos están los diseños centrales compuestos propuestos por Box y Wilson, y los diseños Box-Behnken.

     

    3. Análisis de la superficie de respuesta

    La naturaleza secuencial e iterativa de la metodología de Superficie de Respuesta requiere que en cada fase se identifiquen los factores significativos, se realice un análisis de adecuación del modelo y se determine la dirección en la cual se encuentran las condiciones óptimas de experimentación.

    Para identificar los factores que tienen mayor influencia en la respuesta y examinar la bondad de ajuste del modelo se utiliza el análisis de varianza. Mediante el método de máxima pendiente se determina la dirección en la cual se encuentra la región óptima. El análisis de la superficie ajustada se realiza mediante el análisis canónico, el cual permite determinar la naturaleza del punto estacionario.

    En el caso de un modelo de segundo orden, la ecuación escrita en forma matricial es:

    El punto crítico, si es que existe, será un conjunto de condiciones en x tal que las derivadas parciales son simultáneamente cero, es decir:

    siendo el punto estacionario

    El punto estacionario puede ser un punto máximo, un punto mínimo o un punto de ensilladura (minimax), la forma canónica de la función permite establecer su condición.

    Reemplazando (5) en (4)

    Forma canónica:

    donde es la respuesta estimada en el punto x0, son las raíces características de la matriz B y (siendo M la matriz de los vectores propios asociados a ).

    Si todos los son negativos, x0 representa un punto de máxima respuesta; si los son todos positivos, x0 es un mínimo de la superficie observada. En el caso de que los difieran en signo, el punto estacionario es un punto de ensilladura. En general si algún es cero o un valor muy cercano a cero, el punto estacionario no es único, se encuentra en una loma estacionaria.

     

    4. Diseño central compuesto

    Para comprender los diseños centrales compuestos, que se utilizarán en el ejemplo que se abordará, es necesario mencionar que los factores generalmente se codifican, pues facilita los cálculos, estandariza las variables eliminando las unidades de medida de las variables originales y se incrementa la precisión al estimar los coeficientes del modelo.

    Los niveles codificados de los factores de un diseño factorial 2k se obtienen mediante la siguiente fórmula: xi= 2(Ai — )/Ri , donde Ai es el i-ésimo nivel del factor A, es el nivel promedio del factor A y Ri es el rango entre el valor más alto y el más bajo de del factor A. Con este procedimiento, se asigna valores ±1 a las variables asociadas al arreglo factorial 2k.

    Los diseños centrales compuestos son diseños de tratamientos factoriales 2k con 2k combinaciones adicionales llamadas puntos axiales y nc puntos centrales. Las coordenadas de los puntos axiales de los ejes del factor codificado son (±,0,0,...,0), (0,±,0,...,0),...,(0,0,0,...,±), y los puntos centrales son de la forma (0,0,0,...,0). Dependiendo de la elección de a en los puntos axiales, el diseño central compuesto puede tener diferentes propiedades como ortogonalidad, rotabilidad y uniformidad. Se considerará solamente una propiedad deseable en estos diseños consistente en que la varianza de los valores estimados sea constante en puntos equidistantes del centro del diseño. Esta propiedad llamada rotabilidad se logra estableciendo = (2k)1/4. Así, el valor de a para un diseño con dos factores es = 1,414 y para tres factores = 1,682. La fórmula para a cambiará si se realizan réplicas del diseño o si se utiliza un diseño factorial fraccionario.

     

    5. Ejemplo de aplicación

    Para ejemplificar el procedimiento de superficies de respuesta se utilizarán los datos del ejercicio propuesto 5.6 del libro Response Surfaces de André I. Khuri, John A. Cornell.

    Se aplicaron a parcelas experimentales de maní dos tipos de fertilizantes, uno estándar de la combinación de Nitrógeno-Fósforo-Potasio (Factor A) y el otro un suplemento nutricional (Factor B), se observará los efectos en el rendimiento del maní medido en libras por parcela. Los niveles de cantidad (libras/parcela) de cada fertilizante aplicado fueron determinados de acuerdo a lo requerido por el diseño central compuesto rotable.

    En el siguiente cuadro se presenta los datos utilizados, el procedimiento se realizó aplicando el software Statgraphics, en el cual se eligió el diseño compuesto 2k estrella y el modelo cuadrático para la estimación del rendimiento (Y).

    El Cuadro 2 muestra las estimaciones para cada uno de los efectos estimados y las interacciones. Igualmente se muestran los intervalos de confianza del 95,0 % para los estimados. Note también que el factor de inflación de varianza (V.I.F.) más grande, es igual a 1,225. Para un diseño perfectamente ortogonal, todos los factores serían igual a 1.

    El cuadro 3 (ANOVA) particiona la variabilidad de Y (rendimiento) en valores separados para cada uno de los efectos, prueba la significancia estadística de cada efecto comparando su cuadrado medio contra un estimado del error experimental. En este caso, 4 efectos tienen una valor-P menor que 0,05 indicando que son significativamente diferentes de cero con un nivel de confianza del 95,0 %.

    La prueba de falta de ajuste está diseñada para determinar si el modelo seleccionado es adecuado para describir los datos observados o si se debería usar un modelo más complicado. La prueba se realiza comparando la variabilidad de los residuos del modelo actual con la variabilidad entre observaciones obtenidas en condiciones repetidas de los factores. Dado que el valor-P para la falta de ajuste en la tabla ANOVA es mayor que 0,05, el modelo cuadrático parece ser adecuado para los datos observados al nivel de confianza del 95,0 %.

    El estadístico R-cuadrado indica que el modelo, así ajustado, explica 95,7325 % de la variabilidad en Y. El estadístico R-cuadrado ajustado, que es más adecuado para comparar modelos con diferente número de variables independientes, es 93,7629%. El error estándar del estimado muestra que la desviaciónestándar de los residuos es 0,451359. El error medio absoluto (MAE) de 0,606823 es el valor promedio de los residuos. El estadístico de Durbin-Watson (DW) prueba si en los residuos hay alguna correlación significativa basada en el orden en que se presentan los datos en el archivo. Puesto que el valor-P es mayor que 5,0%, no hay indicación de autocorrelación serial en los residuos con un nivel de significancia del 5,0%.

    La ecuación del modelo ajustado es:

     

    Para esta superficie el punto estacionario es:

    Se observa que el Rendimiento (Y) es mayor para este punto.

    Este es el trayecto, desde el centro de la región experimental actual, a través del cual la respuesta estimada (Y) cambia más rápidamente con un cambio menor en los factores experimentales. Indica buenas características para ejecutar experimentos adicionales si el objetivo es incrementar el Rendimiento. Se nota que la mayor respuesta (16,3325) se encuentra próxima al origen por tanto los nuevos puntos experimentales deberían estar en esa dirección.

     

    Referencias

    [1] Box, George E. P.; Draper, Norman R. Empirical Model - Building and Response Surfaces.        [ Links ]

    [2]  Cochran, William G.; Cox, Getrude M. Diseños Experimentales.        [ Links ]

    [3]   Draper, N. R. Center Points in Second Order Response Surface Design. Technometrics Vol.18.        [ Links ]

    [4]   Heiberger, Richard M. Computation for the Analysis of Designed.        [ Links ]

    [5]   Khuri, André I.; Cornell, John A. Response Surfaces Designs and Analyses.        [ Links ]