8.4 Modelos de media móvil En lugar de utilizar valores pasados de la variable de pronóstico en una regresión, un modelo de media móvil utiliza errores de pronóstico anteriores en un modelo similar a la regresión. Y c e teta teta e dots theta e, donde et es ruido blanco. Nos referimos a esto como un modelo MA (q). Por supuesto, no observamos los valores de et, por lo que no es realmente regresión en el sentido usual. Observe que cada valor de yt puede considerarse como una media móvil ponderada de los últimos errores de pronóstico. Sin embargo, los modelos de media móvil no deben confundirse con el suavizado promedio móvil que discutimos en el Capítulo 6. Un modelo de media móvil se utiliza para pronosticar valores futuros mientras que el suavizado medio móvil se utiliza para estimar el ciclo de tendencias de valores pasados. Figura 8.6: Dos ejemplos de datos de modelos de media móvil con diferentes parámetros. A la izquierda: MA (1) con y t 20e t 0.8e t-1. Derecha: MA (2) con y t e t - e t-1 0.8e t-2. En ambos casos, e t es el ruido blanco normalmente distribuido con media cero y varianza uno. La Figura 8.6 muestra algunos datos de un modelo MA (1) y un modelo MA (2). Al cambiar los parámetros theta1, dots, thetaq, se obtienen diferentes patrones de series temporales. Al igual que con los modelos autorregresivos, la varianza del término de error y sólo cambiará la escala de la serie, no los patrones. Es posible escribir cualquier modelo estacionario AR (p) como un modelo MA (infty). Por ejemplo, usando la sustitución repetida, podemos demostrar esto para un modelo de AR (1): begin yt amp phi1y et amp phi1 (phi1y e) ph php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php php 1, el valor de phi1k se hará más pequeño a medida que k sea mayor. Así que finalmente obtenemos yt et phi1 e phi12 e phi13 e cdots, un proceso MA (infty). El resultado inverso se cumple si imponemos algunas limitaciones a los parámetros de MA. Entonces el modelo MA se llama inversible. Es decir, que podemos escribir cualquier proceso de MA (q) invertible como un proceso de AR (infty). Los modelos Invertibles no son simplemente para permitirnos convertir de modelos MA a modelos AR. También tienen algunas propiedades matemáticas que los hacen más fáciles de usar en la práctica. Las restricciones de invertibilidad son similares a las limitaciones de estacionariedad. Para un modelo MA (1): -1lttheta1lt1. Para un modelo MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Condiciones más complicadas se mantienen para qge3. Una vez más, R se encargará de estas limitaciones al estimar los modelos. Modelos de media móvil y de suavización exponencial Como primer paso para superar los modelos de media, aleatoria y lineal, los patrones no estacionales y las tendencias pueden ser extrapolados usando un modelo de movimiento - Promedio o modelo de suavizado. La suposición básica detrás de los modelos de promedio y suavizado es que la serie temporal es localmente estacionaria con una media variable lentamente. Por lo tanto, tomamos un promedio móvil (local) para estimar el valor actual de la media y luego usarlo como pronóstico para el futuro cercano. Esto puede considerarse como un compromiso entre el modelo medio y el modelo aleatorio-paseo-sin-deriva. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Una media móvil se denomina a menudo una versión quotomoldeada de la serie original porque el promedio de corto plazo tiene el efecto de suavizar los golpes en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), podemos esperar encontrar algún tipo de equilibrio óptimo entre el rendimiento de la media y los modelos de caminata aleatoria. El tipo más simple de modelo de promediación es el. Promedio móvil simple (igualmente ponderado): El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual al promedio simple de las observaciones m más recientes: (Aquí y en otros lugares usaré el símbolo 8220Y-hat8221 para permanecer en pie Para un pronóstico de la serie de tiempo Y hecho a la fecha más temprana posible posible por un modelo dado). Este promedio se centra en el período t (m1) / 2, lo que implica que la estimación de la media local tiende a quedar rezagada detrás del Valor real de la media local de aproximadamente (m1) / 2 periodos. Por lo tanto, decimos que la edad media de los datos en el promedio móvil simple es (m1) / 2 en relación con el período para el cual se calcula el pronóstico: es la cantidad de tiempo que las previsiones tienden a rezagarse detrás de los puntos de inflexión en el datos. Por ejemplo, si está promediando los últimos 5 valores, las previsiones serán de aproximadamente 3 períodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de caminata aleatoria (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo SMA es equivalente al modelo medio. Como con cualquier parámetro de un modelo de pronóstico, es habitual ajustar el valor de k para obtener el mejor valor de los datos, es decir, los errores de predicción más pequeños en promedio. He aquí un ejemplo de una serie que parece presentar fluctuaciones aleatorias alrededor de una media de variación lenta. En primer lugar, vamos a tratar de encajar con un modelo de caminata al azar, que es equivalente a una media móvil simple de un término: El modelo de caminata aleatoria responde muy rápidamente a los cambios en la serie, pero al hacerlo, recoge gran parte del quotnoisequot en el Los datos (las fluctuaciones aleatorias), así como el quotsignalquot (la media local). Si en lugar de eso intentamos una media móvil simple de 5 términos, obtendremos un conjunto de previsiones más suaves: El promedio móvil simple a 5 terminos produce errores significativamente menores que el modelo de caminata aleatoria en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de modo que tiende a quedar a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, parece haber ocurrido una recesión en el período 21, pero las previsiones no giran hasta varios periodos más tarde). Obsérvese que los pronósticos a largo plazo del modelo SMA son una línea recta horizontal, al igual que en la caminata aleatoria modelo. Por lo tanto, el modelo SMA asume que no hay tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de caminata aleatoria son simplemente iguales al último valor observado, las previsiones del modelo SMA son iguales a un promedio ponderado de valores recientes. Los límites de confianza calculados por Statgraphics para los pronósticos a largo plazo de la media móvil simple no se amplían a medida que aumenta el horizonte de pronóstico. Esto obviamente no es correcto Desafortunadamente, no hay una teoría estadística subyacente que nos diga cómo los intervalos de confianza deberían ampliarse para este modelo. Sin embargo, no es demasiado difícil calcular estimaciones empíricas de los límites de confianza para las previsiones a más largo plazo. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo SMA se utilizaría para pronosticar dos pasos adelante, tres pasos adelante, etc. dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de los errores en cada horizonte de pronóstico y, a continuación, construir intervalos de confianza para pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar apropiada. Si intentamos una media móvil sencilla de 9 términos, obtendremos pronósticos aún más suaves y más de un efecto rezagado: La edad promedio es ahora de 5 períodos ((91) / 2). Si tomamos una media móvil de 19 términos, la edad promedio aumenta a 10: Obsérvese que, de hecho, las previsiones están ahora rezagadas detrás de los puntos de inflexión en aproximadamente 10 períodos. Qué cantidad de suavizado es la mejor para esta serie Aquí hay una tabla que compara sus estadísticas de error, incluyendo también un promedio de 3 términos: El modelo C, la media móvil de 5 términos, produce el valor más bajo de RMSE por un pequeño margen sobre los 3 A término y 9 promedios, y sus otras estadísticas son casi idénticas. Por lo tanto, entre los modelos con estadísticas de error muy similares, podemos elegir si preferiríamos un poco más de capacidad de respuesta o un poco más de suavidad en las previsiones. El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable de que trata las últimas k observaciones por igual e ignora por completo todas las observaciones precedentes. (Volver al principio de la página.) Browns Simple Exponential Smoothing Intuitivamente, los datos pasados deben ser descontados de una manera más gradual - por ejemplo, la observación más reciente debería tener un poco más de peso que la segunda más reciente, y la segunda más reciente debería tener un poco más de peso que la tercera más reciente, y pronto. El modelo de suavizado exponencial simple (SES) lo logra. Sea 945 una constante quotsmoothingquot (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que represente el nivel actual (es decir, el valor medio local) de la serie, tal como se estimó a partir de los datos hasta el presente. El valor de L en el tiempo t se calcula recursivamente a partir de su propio valor anterior como este: Así, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde 945 controla la proximidad del valor interpolado al valor más reciente observación. El pronóstico para el siguiente período es simplemente el valor suavizado actual: Equivalentemente, podemos expresar el próximo pronóstico directamente en términos de previsiones anteriores y observaciones previas, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre la previsión anterior y la observación anterior: En la segunda versión, la siguiente previsión se obtiene ajustando la previsión anterior en la dirección del error anterior por una cantidad fraccionada de 945. es el error hecho en Tiempo t En la tercera versión, el pronóstico es una media móvil exponencialmente ponderada (es decir, descontada) con el factor de descuento 1-945: La versión de interpolación de la fórmula de pronóstico es la más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en un Célula única y contiene referencias de celdas que apuntan a la previsión anterior, la observación anterior y la celda donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de caminata aleatoria (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo medio, asumiendo que el primer valor suavizado se establece igual a la media. La edad promedio de los datos en el pronóstico de suavización exponencial simple es de 1/945 en relación con el período para el cual se calcula la predicción. (Esto no se supone que sea obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el pronóstico promedio móvil simple tiende a quedar rezagado detrás de puntos de inflexión en aproximadamente 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es 2 períodos cuando 945 0.2 el retraso es 5 períodos cuando 945 0.1 el retraso es 10 períodos, y así sucesivamente. Para una edad promedio dada (es decir, la cantidad de retraso), el simple suavizado exponencial (SES) pronosticado es algo superior a la predicción del promedio móvil simple (SMA), ya que coloca relativamente más peso en la observación más reciente - ie. Es un poco más sensible a los cambios ocurridos en el pasado reciente. Por ejemplo, un modelo SMA con 9 términos y un modelo SES con 945 0.2 tienen una edad promedio de 5 para los datos de sus pronósticos, pero el modelo SES pone más peso en los 3 últimos valores que el modelo SMA y en el modelo SMA. Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es continuamente variable, por lo que se puede optimizar fácilmente Utilizando un algoritmo quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES de esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0.2961 3.4 períodos, que es similar a la de un movimiento simple de 6 términos promedio. Los pronósticos a largo plazo del modelo SES son una línea recta horizontal. Como en el modelo SMA y el modelo de caminata aleatoria sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de manera razonable y que son sustancialmente más estrechos que los intervalos de confianza para el modelo de caminata aleatoria. El modelo SES asume que la serie es algo más predecible que el modelo de caminata aleatoria. Un modelo SES es en realidad un caso especial de un modelo ARIMA. Por lo que la teoría estadística de los modelos ARIMA proporciona una base sólida para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un término MA (1) y ningún término constante. Conocido también como modelo quotARIMA (0,1,1) sin constantequot. El coeficiente MA (1) en el modelo ARIMA corresponde a la cantidad 1-945 en el modelo SES. Por ejemplo, si se ajusta un modelo ARIMA (0,1,1) sin constante a la serie analizada aquí, el coeficiente MA estimado (1) resulta ser 0.7029, que es casi exactamente uno menos 0.2961. Es posible añadir la suposición de una tendencia lineal constante no nula a un modelo SES. Para ello, basta con especificar un modelo ARIMA con una diferencia no estacional y un término MA (1) con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia media observada durante todo el período de estimación. No puede hacerlo junto con el ajuste estacional, ya que las opciones de ajuste estacional están deshabilitadas cuando el tipo de modelo se establece en ARIMA. Sin embargo, puede agregar una tendencia exponencial a largo plazo constante a un modelo de suavizado exponencial simple (con o sin ajuste estacional) utilizando la opción de ajuste de inflación en el procedimiento de Pronóstico. La tasa apropiada de inflación (crecimiento porcentual) por período puede estimarse como el coeficiente de pendiente en un modelo de tendencia lineal ajustado a los datos en conjunción con una transformación de logaritmo natural o puede basarse en otra información independiente sobre las perspectivas de crecimiento a largo plazo . (Regreso al inicio de la página.) Browns Linear (es decir, doble) Suavizado exponencial Los modelos SMA y SES suponen que no hay ninguna tendencia de ningún tipo en los datos (que normalmente está bien o al menos no es demasiado malo para 1- Avance anticipado cuando los datos son relativamente ruidosos), y se pueden modificar para incorporar una tendencia lineal constante como se muestra arriba. ¿Qué pasa con las tendencias a corto plazo? Si una serie muestra una tasa de crecimiento variable o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de un período por delante, la estimación de una tendencia local también podría ser un problema. El modelo de suavizado exponencial simple puede generalizarse para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de nivel y tendencia. El modelo de tendencia más simple que varía en función del tiempo es el modelo lineal de suavizado exponencial de Browns, el cual utiliza dos series suavizadas diferentes que están centradas en diferentes momentos del tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación). La forma algebraica del modelo de suavizado exponencial lineal de Brown8217s, como la del modelo de suavizado exponencial simple, puede expresarse en un número de formas diferentes pero equivalentes. La forma estándar de este modelo se expresa usualmente de la siguiente manera: Sea S la serie de suavizado simple obtenida aplicando el suavizado exponencial simple a la serie Y. Es decir, el valor de S en el periodo t está dado por: (Recuérdese que, Exponencial, esto sería la previsión para Y en el período t1). Entonces, vamos a Squot denotar la serie doblemente suavizada obtenida aplicando el suavizado exponencial simple (usando el mismo 945) a la serie S: Finalmente, la previsión para Y tk. Para cualquier kgt1, viene dado por: Esto produce e 1 0 (es decir, trucar un poco y dejar que el primer pronóstico sea igual a la primera observación real), y e 2 Y 2 8211 Y 1. Después de lo cual las previsiones se generan usando la ecuación anterior. Esto produce los mismos valores ajustados que la fórmula basada en S y S si estos últimos se iniciaron usando S 1 S 1 Y 1. Esta versión del modelo se utiliza en la página siguiente que ilustra una combinación de suavizado exponencial con ajuste estacional. Holt8217s Linear Exponential Smoothing Brown8217s El modelo LES calcula las estimaciones locales de nivel y tendencia al suavizar los datos recientes, pero el hecho de que lo haga con un solo parámetro de suavizado impone una restricción en los patrones de datos que puede encajar: el nivel y la tendencia No se les permite variar a tasas independientes. El modelo LES de Holt8217s aborda este problema incluyendo dos constantes de suavizado, una para el nivel y otra para la tendencia. En cualquier momento t, como en el modelo Brown8217s, existe una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se calculan recursivamente a partir del valor de Y observado en el instante t y de las estimaciones previas del nivel y de la tendencia por dos ecuaciones que les aplican el suavizado exponencial separadamente. Si el nivel estimado y la tendencia en el tiempo t-1 son L t82091 y T t-1. Respectivamente, entonces la previsión de Y tshy que habría sido hecha en el tiempo t-1 es igual a L t-1 T t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula recursivamente interpolando entre Y tshy y su pronóstico, L t-1 T t-1, utilizando pesos de 945 y 1-945. El cambio en el nivel estimado, Es decir L t 8209 L t82091. Puede interpretarse como una medida ruidosa de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula recursivamente mediante la interpolación entre L t 8209 L t82091 y la estimación anterior de la tendencia, T t-1. Utilizando los pesos de 946 y 1-946: La interpretación de la constante de suavizado de tendencia 946 es análoga a la de la constante de suavizado de nivel 945. Los modelos con valores pequeños de 946 asumen que la tendencia cambia muy lentamente con el tiempo, mientras que los modelos con 946 más grandes suponen que está cambiando más rápidamente. Un modelo con una gran 946 cree que el futuro lejano es muy incierto, porque los errores en la estimación de la tendencia son muy importantes cuando se pronostica más de un período por delante. Las constantes de suavizado 945 y 946 se pueden estimar de la manera habitual minimizando el error cuadrático medio de los pronósticos de 1 paso adelante. Cuando esto se hace en Statgraphics, las estimaciones resultan ser 945 0,3048 y 946 0,008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período al siguiente, por lo que básicamente este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de la edad media de los datos que se utilizan para estimar el nivel local de la serie, la edad media de los datos que se utilizan para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso, resulta ser 1 / 0.006 125. Esto no es un número muy preciso en la medida en que la precisión de la estimación de 946 es realmente de 3 decimales, pero es del mismo orden general de magnitud que el tamaño de la muestra de 100 , Por lo que este modelo está promediando bastante historia en la estimación de la tendencia. La gráfica de pronóstico siguiente muestra que el modelo LES calcula una tendencia local ligeramente mayor al final de la serie que la tendencia constante estimada en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntico al obtenido ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, ¿se ven como pronósticos razonables para un modelo que se supone que está estimando una tendencia local? Si observa esta gráfica, parece que la tendencia local se ha vuelto hacia abajo al final de la serie. Lo que ha ocurrido Los parámetros de este modelo Se han estimado minimizando el error al cuadrado de las previsiones de un paso adelante, y no las previsiones a largo plazo, en cuyo caso la tendencia no hace mucha diferencia. Si todo lo que usted está mirando son errores de un paso adelante, no está viendo la imagen más grande de las tendencias sobre (digamos) 10 o 20 períodos. Con el fin de obtener este modelo más en sintonía con la extrapolación de nuestro ojo de los datos, podemos ajustar manualmente la tendencia de suavizado constante de modo que utiliza una base más corta para la estimación de tendencia. Por ejemplo, si elegimos establecer 946 0.1, la edad promedio de los datos utilizados para estimar la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia en los últimos 20 períodos aproximadamente. Here8217s lo que el pronóstico gráfico parece si fijamos 946 0.1 mientras que mantener 945 0.3. Esto parece intuitivamente razonable para esta serie, aunque probablemente sea peligroso extrapolar esta tendencia en más de 10 periodos en el futuro. ¿Qué pasa con las estadísticas de errores? Aquí hay una comparación de modelos para los dos modelos mostrados arriba, así como tres modelos SES. El valor óptimo de 945 para el modelo SES es de aproximadamente 0,3, pero se obtienen resultados similares (con un poco más o menos de capacidad de respuesta, respectivamente) con 0,5 y 0,2. (A) Holts lineal exp. Alisamiento con alfa 0.3048 y beta 0.008 (B) Holts linear exp. Alisamiento con alfa 0.3 y beta 0.1 (C) Suavizado exponencial simple con alfa 0.5 (D) Alisamiento exponencial simple con alfa 0.3 (E) Suavizado exponencial simple con alfa 0.2 Sus estadísticas son casi idénticas, por lo que realmente no podemos hacer la elección sobre la base De errores de pronóstico de un paso adelante en la muestra de datos. Tenemos que recurrir a otras consideraciones. Si creemos firmemente que tiene sentido basar la estimación de tendencia actual en lo que ha ocurrido durante los últimos 20 períodos, podemos hacer un caso para el modelo LES con 945 0.3 y 946 0.1. Si queremos ser agnósticos acerca de si hay una tendencia local, entonces uno de los modelos SES podría ser más fácil de explicar y también daría más pronósticos intermedios para los próximos 5 o 10 períodos. (Volver al principio de la página.) Qué tipo de tendencia-extrapolación es la mejor: horizontal o lineal La evidencia empírica sugiere que, si los datos ya han sido ajustados (si es necesario) para la inflación, puede ser imprudente extrapolar lineal a corto plazo Tendencias en el futuro. Las tendencias evidentes hoy en día pueden desacelerarse en el futuro debido a causas variadas como la obsolescencia del producto, el aumento de la competencia y las caídas o repuntes cíclicos en una industria. Por esta razón, el suavizado exponencial simple a menudo realiza mejor fuera de la muestra de lo que de otra manera podría esperarse, a pesar de su extrapolación horizontal de tendencia horizontal. Las modificaciones de la tendencia amortiguada del modelo de suavizado exponencial lineal también se usan a menudo en la práctica para introducir una nota de conservadurismo en sus proyecciones de tendencia. El modelo LES con tendencia amortiguada se puede implementar como un caso especial de un modelo ARIMA, en particular, un modelo ARIMA (1,1,2). Es posible calcular intervalos de confianza en torno a los pronósticos a largo plazo producidos por modelos de suavizado exponencial, al considerarlos como casos especiales de modelos ARIMA. El ancho de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (S) de la (s) constante (s) de suavizado y (iv) el número de periodos por delante que está pronosticando. En general, los intervalos se extienden más rápidamente a medida que el 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se usa lineal en lugar de simple suavizado. Este tema se discute más adelante en la sección de modelos de ARIMA de las notas. Modelos ARMA y ARIMA (Box-Jenkins) Modelos ARMA y ARIMA (Box-Jenkins) En las secciones anteriores hemos visto cómo el valor de una serie temporal univariada en el tiempo t. X t Puede ser modelado usando una variedad de expresiones del promedio móvil. También hemos demostrado que componentes tales como tendencias y periodicidad en las series temporales pueden ser modelados y / o separados explícitamente, con los datos descompuestos en componentes de tendencia, estacionales y residuales. También mostramos, en las discusiones anteriores sobre la autocorrelación. Que los coeficientes de autocorrelación total y parcial son extremadamente útiles para identificar y modelar patrones en series de tiempo. Estos dos aspectos del análisis y modelado de series temporales pueden combinarse en un marco general de modelación general ya menudo muy efectivo. En su forma básica, este enfoque se conoce como modelado ARMA (media móvil autorregresiva), o cuando la diferenciación se incluye en el procedimiento, el modelo ARIMA o Box-Jenkins, después de los dos autores que fueron centrales para su desarrollo (véase Box amp Jenkins, 1968 BOX1 y Box, Jenkins amp Reinsel, 1994 BOX2). No hay una regla fija en cuanto al número de períodos de tiempo requeridos para un ejercicio de modelado exitoso, pero para modelos más complejos y para mayor confianza en los procedimientos de ajuste y validación, a menudo se recomiendan series con 50 pasos de tiempo. Los modelos ARMA combinan los métodos de autocorrelación (AR) y los promedios móviles (MA) en un modelo compuesto de la serie temporal. Antes de considerar cómo estos modelos se pueden combinar, examinamos cada uno por separado. Ya hemos visto que los modelos de media móvil (MA) pueden utilizarse para proporcionar un buen ajuste a algunos conjuntos de datos, y las variaciones en estos modelos que implican el suavizado exponencial doble o triple pueden manejar componentes tendenciales y periódicos en los datos. Además, estos modelos se pueden utilizar para crear pronósticos que imitan el comportamiento de períodos anteriores. Una forma simple de tales modelos, basada en datos previos, puede escribirse como: Donde los términos beta i son los pesos aplicados a valores previos en la serie temporal, y es usual definir beta i 1, sin pérdida de generalidad. Por lo tanto, para un proceso de primer orden, q 1 y tenemos el modelo: es decir, el valor medio móvil se estima como un promedio ponderado de los valores actuales e inmediatos anteriores. Este proceso de promediación es, en cierto sentido, un mecanismo de suavizado pragmático sin un vínculo directo con un modelo estadístico. Sin embargo, podemos especificar un modelo estadístico (o estocástico) que abarque los procedimientos de los promedios móviles en conjunción con procesos aleatorios. Si dejamos ser un conjunto de variables aleatorias independientes e idénticamente distribuidas (un proceso aleatorio) con media cero y variación fija conocida, entonces podemos escribir el proceso como un promedio móvil de orden q en términos de: Claramente el valor esperado de xt bajo Este modelo es 0, por lo que el modelo sólo es válido si el xt ya ha sido ajustado para tener una media cero o si se agrega una constante fija (la media del xt) a la suma. También es evidente que la varianza de xt es simplemente: El análisis anterior puede extenderse para evaluar la covarianza cov (x t. Xtk), que encontramos rendimientos: Nótese que ni el valor medio, ni la covarianza (o autocovariancia) Al retraso k es una función del tiempo, t. Por lo que el proceso es de segundo orden estacionario. La expresión anterior nos permite obtener una expresión para la función de autocorrelación (acf): Si k 0 rho k 1, y para k gt q rho k 0. Además, el acf es simétrico y rho k rho - k. El acf se puede calcular para un proceso MA de primer orden: El componente autorregresivo o AR de un modelo ARMA se puede escribir en la forma: donde los términos en son coeficientes de autocorrelación en lags 1,2. P y z t es un término de error residual. Tenga en cuenta que este término de error se refiere específicamente al período de tiempo actual, t. Así, para un proceso de primer orden, p 1 y tenemos el modelo: Estas expresiones indican que el valor estimado de x en el tiempo t está determinado por el valor inmediatamente anterior de x (es decir, en el tiempo t -1) multiplicado por una medida, alfa . De la medida en que se correlacionan los valores de todos los pares de valores en períodos de tiempo con un intervalo 1 (es decir, su autocorrelación), más un término de error residual, z. En el tiempo t. Pero esta es precisamente la definición de un proceso de Markov. Por lo que un proceso de Markov es un proceso autorregresivo de primer orden. Si alfa 1 el modelo indica que el siguiente valor de x es simplemente el valor anterior más un término de error aleatorio, y por lo tanto es una simple caminata aleatoria 1D. Si se incluyen más términos, el modelo estima el valor de x en el tiempo t por una suma ponderada de estos términos más un componente de error aleatorio. Si sustituimos la segunda expresión anterior en la primera, tenemos: y la aplicación repetida de esta sustitución produce: Ahora bien, si alfa lt1 yk es grande, esta expresión puede escribirse en orden inverso, con términos decrecientes y con aportación del término En x en el lado derecho de la expresión se vuelve cada vez más pequeño, por lo que tenemos: Dado que el lado derecho de esta expresión xt modelos como la suma de un conjunto ponderado de valores anteriores, en este caso los términos de error aleatorio, es claro que Este modelo AR es, de hecho, una forma de modelo MA. Y si asumimos que los términos de error tienen media cero y varianza constante, entonces como en el modelo MA tenemos el valor esperado del modelo como también 0, asumiendo que el xt se ha ajustado para proporcionar una media cero, con varianza: Ahora como Por lo que tenemos: Como con el modelo de MA anterior, este análisis se puede extender para evaluar la covariación, cov (x t. X tk) de a (Α-1), por lo que tenemos: Esto demuestra que para un modelo autorregresivo de primer orden la función de autocorrelación (acf) es Simplemente definida por potencias sucesivas de la autocorrelación de primer orden, con la condición alfa lt1. Para alfa gt0 esto es simplemente una potencia que disminuye rápidamente o una curva de tipo exponencial, tendiendo a cero, o para lt0 es una curva oscilatoria amortiguadora, tendiendo de nuevo a cero. Si se supone que la serie temporal es estacionaria, el análisis anterior puede extenderse a autocorrelaciones de segundo orden y de orden superior. Con el fin de ajustar un modelo de AR a un conjunto de datos observados, tratamos de minimizar la suma de errores cuadrados (ajuste de mínimos cuadrados) utilizando el menor número de términos que proporcionan un ajuste satisfactorio a los datos. Los modelos de este tipo se describen como autorregresivos. Y puede aplicarse tanto a series de tiempo como a conjuntos de datos espaciales (véase más adelante, modelos de autorregresión espacial). Aunque en teoría un modelo autorregresivo puede proporcionar un buen ajuste a un conjunto de datos observados, que generalmente requieren la eliminación previa de la tendencia y los componentes periódicos, e incluso entonces podría necesitar un gran número de términos con el fin de proporcionar un buen ajuste a los datos. Sin embargo, al combinar los modelos AR con los modelos MA, podemos producir una familia de modelos mixtos que se pueden aplicar en una amplia gama de situaciones. Estos modelos se conocen como modelos ARMA y ARIMA, y se describen en las subsecciones siguientes. En las dos subsecciones anteriores hemos introducido el modo MA de orden q: y el modelo AR de orden p: Podemos combinar estos dos modelos simplemente añadiéndolos juntos como un modelo de orden (p, q), donde tenemos p AR términos Y q términos MA: En general, esta forma de modelo ARMA combinado se puede utilizar para modelar una serie de tiempo con menos términos en general que un MA o un modelo AR por sí mismos. Expresa el valor estimado en el tiempo t como la suma de q términos que representan la variación media de la variación aleatoria sobre q períodos anteriores (el componente MA), más la suma de p AR términos que calculan el valor actual de x como la suma ponderada De los p valores más recientes. Sin embargo, esta forma de modelo supone que la serie temporal es estacionaria, lo que rara vez es el caso. En la práctica, existen tendencias y periodicidad en muchos conjuntos de datos, por lo que es necesario eliminar estos efectos antes de aplicar dichos modelos. La retirada se lleva a cabo típicamente incluyendo en el modelo una etapa de diferenciación inicial, típicamente una, dos o tres veces, hasta que la serie es al menos aproximadamente estacionaria, sin mostrar tendencias obvias ni periodicidades. Al igual que con los procesos MA y AR, el proceso de diferenciación se describe por el orden de diferenciación, por ejemplo 1, 2, 3. En conjunto, estos tres elementos forman un triple: q define el tipo de modelo aplicado. En esta forma, el modelo se describe como un modelo ARIMA. La letra I de ARIMA se refiere al hecho de que el conjunto de datos se ha diferenciado inicialmente (ver diferenciación) y cuando el modelado está completo, los resultados tienen que ser sumados o integrados para producir las estimaciones y pronósticos finales. El modelo ARIMA se discute a continuación. Como se señala en la subsección anterior, la combinación de la diferenciación de una serie temporal no estacionaria con el modelo ARMA proporciona una poderosa familia de modelos que pueden aplicarse en una amplia gama de situaciones. El desarrollo de esta forma extendida de modelo se debe en gran parte a G E P Box y G M Jenkins, y como resultado los modelos ARIMA también se conocen como modelos Box-Jenkins. El primer paso en el procedimiento de Box-Jenkins es diferenciar la serie temporal hasta que esté estacionaria, asegurando así que los componentes de tendencia y estacionales sean eliminados. En muchos casos, una o dos etapas de diferenciación son suficientes. La serie diferenciada será más corta que la serie de origen por c intervalos de tiempo, donde c es el rango de la diferenciación. Un modelo ARMA se ajusta a las series de tiempo resultantes. Debido a que los modelos ARIMA tienen tres parámetros hay muchas variaciones a los posibles modelos que podrían ser instalados. Sin embargo, la decisión sobre cuáles deben ser estos parámetros puede guiarse por una serie de principios básicos: (i) el modelo debe ser lo más simple posible, es decir, contener tan pocos términos como sea posible, lo que significa los valores de p y q (Ii) el ajuste a los datos históricos debe ser lo más eficaz posible, es decir, el tamaño de las diferencias cuadradas entre el valor estimado en cualquier período de tiempo pasado y el valor real debe ser minimizado (principio de mínimos cuadrados) - los residuos Del modelo seleccionado puede examinarse a continuación para ver si cualquier residuo restante es significativamente diferente de 0 (véase más abajo) (iii) la autocorrelación parcial medida en los retardos 1,2,3. Debe proporcionar una indicación del orden del componente AR, es decir, el valor elegido para q (iv) el diagrama de la forma de la función de autocorrelación (acf) puede sugerir el tipo de modelo ARIMA requerido - la tabla a continuación (del NIST) proporciona orientación sobre Interpretando la forma del acf en términos de selección del modelo. ARIMA Selección del tipo de modelo con forma acf La serie no es estacionaria. Los modelos ARIMA estándar se describen a menudo por el triple: (p. Estos definen la estructura del modelo en términos del orden de AR, diferenciación y modelos de MA que se utilizarán. También es posible incluir parámetros similares para la estacionalidad en los datos, aunque estos modelos son más complejos para adaptarse e interpretar - el tripa (P. D.Q) se utiliza generalmente para identificar dichos componentes del modelo. En la captura de pantalla de SPSS que se muestra a continuación, se muestra el cuadro de diálogo para seleccionar manualmente elementos estructurales no estacionales y estacionales (instalaciones similares están disponibles en otros paquetes integrados, como SAS / ETS). Como se puede ver, el diálogo también permite transformar los datos (típicamente para ayudar con la estabilización de la varianza) y permitir a los usuarios incluir una constante en el modelo (el valor predeterminado). Esta herramienta de software particular permite detectar los valores atípicos si es necesario, de acuerdo con una gama de procedimientos de detección, pero en muchos casos los valores atípicos se han investigado y ajustado o eliminado y se han estimado los valores antes de cualquier análisis. Modelador de series temporales SPSS Modelado ARIMA, modo experto Se pueden ajustar varios modelos ARIMA a los datos, manualmente oa través de un proceso automatizado (por ejemplo, un proceso escalonado), y una o más medidas usadas para juzgar cuál es la mejor en términos de Ajuste y parsimony. La comparación de modelos utiliza típicamente una o más de las medidas teóricas de información descritas anteriormente en este manual: AIC, BIC y / o MDL (la función R, arima (), proporciona la medida AIC, mientras que SPSS proporciona una gama de medidas de ajuste, Incluyeron una versión de la estadística BIC otras herramientas varían en las medidas proporcionadas - Minitab, que proporciona una gama de métodos TSA, no incluye AIC / BIC tipo de estadísticas). En la práctica, puede utilizarse una amplia gama de medidas (es decir, además de las medidas basadas en los mínimos cuadrados, para evaluar la calidad del modelo). Por ejemplo, el error absoluto medio y el error absoluto máximo pueden ser medidas útiles, ya que incluso un Un buen ajuste de mínimos cuadrados puede ser todavía pobre en algunos lugares. Una serie de paquetes de software también puede proporcionar una medida general de la autocorrelación que puede permanecer en los residuos después de la adaptación del modelo. Una estadística con frecuencia se debe a Ljung y Box (1978 LJU1) , Y es de la forma: donde n es el número de muestras (valores de los datos), ri es la autocorrelación de la muestra con el retraso iy k es el número total de retrasos sobre los cuales se realiza el cálculo. Q k está distribuido aproximadamente como Una distribución de chi-cuadrado con k-m grados de libertad, donde m es el número de parámetros utilizados en el ajuste del modelo, excluyendo cualquier variable de predicción o término constante (es decir, incluyendo los triples pd q) Si la medida es estadísticamente significativa, Indica que los residuos siguen conteniendo una autocorrelación significativa después de que el modelo ha sido instalado, lo que sugiere que se debe buscar un modelo mejorado. Ejemplo: Modelar el crecimiento del número de pasajeros de aerolíneas A continuación se muestra un ejemplo de ajuste automático, utilizando SPSS para los datos de prueba de Box-Jenkins-Reinsel de los números de pasajeros REI1 proporcionados anteriormente en este Manual. Inicialmente no se especificó ninguna especificación de las fechas siendo meses dentro de años. El modelo seleccionado por el proceso automatizado fue un modelo ARIMA (0,1,12), es decir, el proceso identificó correctamente que la serie requería un nivel de diferenciación y aplicó un modelo de media móvil con una periodicidad de 12 y ningún componente de autocorrelación para ajustarse a la datos. El ajuste del modelo produjo un valor R 2 de 0.966, que es muy alto, y un error máximo absoluto (MAE) de 75. El ajuste visual del modelo a los datos parece excelente, pero el gráfico de la autocorrelación residual después de la adaptación y Ljung La prueba de la caja demuestra que la autocorrelación significativa permanece, indicando que un modelo mejorado es posible. A continuación, se revisó un modelo revisado basado en la discusión de este conjunto de datos por Box y Jenkins (1968) y la edición actualizada de Chatfields (1975 CHA1) book in Que él utiliza Minitab para ilustrar su análisis (6ta edición, 2003). La serie temporal se definió como una periodicidad de 12 meses y un modelo ARIMA con componentes (0,1,1), (0,1,1). Gráficamente, los resultados parecen muy similares al gráfico anterior, pero con este modelo el R-cuadrado es 0,991, el MAE41 y el estadístico de Ljung-Box ya no son significativos (12,6, con 16 grados de libertad). El modelo es, por lo tanto, una mejora respecto a la versión original (generada automáticamente), que comprende una MA no estacional y un componente MA estacional, ningún componente autorregresivo y un nivel de diferenciación para las estructuras estacionales y no estacionales. Ya sea que el ajuste sea manual o automatizado, un modelo ARIMA puede proporcionar un buen marco para modelar una serie temporal, o puede ser que modelos o enfoques alternativos ofrezcan un resultado más satisfactorio. A menudo es difícil saber de antemano cuán bueno es probable que sea cualquier modelo de pronóstico dado, ya que es sólo a la luz de su capacidad de predecir valores futuros de las series de datos que puede ser verdaderamente juzgado. A menudo, este proceso se aproxima ajustando el modelo a datos pasados excluyendo períodos de tiempo recientes (también conocidos como muestras de retención), y luego usando el modelo para predecir estos eventos futuros conocidos, pero incluso esto sólo ofrece una confianza limitada en su validez futura. Los pronósticos a más largo plazo pueden ser extremadamente poco fiables usando tales métodos. Es evidente que el modelo de estadísticas de tráfico aéreo internacional descrito anteriormente no es capaz de predecir correctamente el número de pasajeros hasta la década de los noventa y más allá, ni la caída de 5 años en el número de pasajeros de las aerolíneas internacionales estadounidenses después del 9/11/2001. Del mismo modo, un modelo ARIMA puede ajustarse a los valores históricos de los precios de la bolsa o valores de índices (por ejemplo, los índices NYSE o FTSE) y normalmente proporcionará un ajuste excelente a los datos (obteniendo un valor R-cuadrado mejor que 0,99) pero son A menudo de poca utilidad para predecir los valores futuros de estos precios o índices. Por lo general, los modelos ARIMA se utilizan para la predicción, en particular en el campo de la modelización macro y microeconómica. Sin embargo, pueden aplicarse en una amplia gama de disciplinas, ya sea en la forma descrita aquí, o aumentada con variables predictoras adicionales que se cree que mejoran la fiabilidad de las previsiones realizadas. Estos últimos son importantes porque toda la estructura de los modelos ARMA discutidos anteriormente depende de los valores anteriores y eventos aleatorios independientes a lo largo del tiempo, no en cualquier factor explicativo o causativo. Por lo tanto, los modelos ARIMA solo reflejarán y extenderán patrones pasados, los cuales podrían necesitar ser modificados en pronósticos por factores como el ambiente macroeconómico, los cambios tecnológicos o los cambios a largo plazo en los recursos y / o el medio ambiente. BOX1 Caja G E P, Jenkins G M (1968). Algunos avances recientes en la predicción y el control. Estadística Aplicada, 17 (2), 91-109 BOX2 Box, G E P, Jenkins, G M, Reinsel G C (1994) Análisis, predicción y control de series temporales. 3ª ed. Prentice Hall, acantilados de Englewood, NJ CHA1 Chatfield C (1975) El análisis de la serie de los tiempos: Teoría y práctica. Chapman y Hall, Londres (véase también, sexta edición, 2003) LJU1 Ljung G M, Box G E P (1978) Sobre una medida de la falta de ajuste en modelos de series temporales. Biometrika, 65, 297303 NIST / SEMATECH Manual electrónico de métodos estadísticos, itl. nist. gov/div898/handbook/ Sección 6.4: Introducción a series temporales. 2010 SPSS / PASW 17 (2008) AnalyseForecasting (modelos de series temporales) REI1 Reinsel G C Conjuntos de datos para modelos de Box-Jenkins: stat. wisc. edu/
Las 10 mejores opciones de binary options brokers uk. Top 10 corredores de opciones binarias en todo el mundo Corredores de opción corredores y experiencias mejores opciones binarias corredores y. Mejor forex. Es el corredor de opciones binarias uk para su correo electrónico y seguro es donde. Corredor de opciones binarias completas antes. Que habrá sido una nueva york, leer las mejores opciones binarias demo, puede comenzar a operar. Parte de los comerciantes nuevos de monecor londres no tienen ninguna obligación de advertirle sobre el mejor corredor de opción binaria, Oriente Medio y. Dirección de servicios financieros chipre: zanardifonderie. Consejos que se actualizan regularmente, opciones binarias. Los . Leer nuestras críticas y conseguir. Negociación con corredores de opciones binarias. Ofrecemos evaluaciones imparciales. Las revisiones profesionales nos corredor de opciones binarias que las opciones binarias plataforma de negociación; binario Opción. La pregunta es correcta cor...
Comments
Post a Comment