Friday 25 May 2018

Média centrada média para números pares


Ao calcular uma média móvel em execução, colocar a média no período de tempo médio faz sentido No exemplo anterior, calculamos a média dos três primeiros períodos de tempo e colocá-lo próximo ao período 3. Poderíamos ter colocado a média no meio da Intervalo de tempo de três períodos, ou seja, próximo ao período 2. Isso funciona bem com períodos de tempo ímpar, mas não é tão bom para mesmo períodos de tempo. Então, onde colocamos a primeira média móvel quando M4 Tecnicamente, a Média Móvel cairá em t 2,5, 3,5. Para evitar esse problema, suavizamos as MAs usando M 2. Assim, suavizamos os valores suavizados Se usarmos um número médio de termos, precisamos suavizar os valores suavizados A tabela a seguir mostra os resultados usando M 4.Para calcular um l Para um número inteiro, temos que fazer o que é chamado de centrar a média móvel. Isto é feito da seguinte maneira: Primeiro, calcule a média móvel simples. Em seguida, obtenha a média móvel centrada calculando a média dos valores adjacentes dessas médias móveis simples: Quando l2. A média móvel centrada é chamada Hanning. Como exemplo, considere computar uma média móvel de 4 termos nos primeiros 10 valores de dados dos dados SASDATA. INTAIR (um conjunto de dados que consiste em números mensais, em milhares, de passageiros em vôos internacionais para o Anos 1949 até 1960). Os dados originais são 112,118,132,129,121,135,148,148,136,119. Para obter os três primeiros termos da média móvel de 4 termos, primeiro compute Então os três primeiros valores de média móvel centrados são Estes são os três primeiros valores da média móvel de 4 termos. Joseph D Petruccelli Ter 21 Fev 14:15:46 EST 1995Movendo Médias e Médias Mínimas Centradas Um par de pontos sobre sazonalidade em uma série de tempo se repetem, mesmo que pareçam óbvios. Um deles é que o termo 8220season8221 não se refere necessariamente às quatro estações do ano que resultam da inclinação do eixo Earth8217s. Na análise preditiva, 8220season8221 muitas vezes significa exatamente isso, porque muitos dos fenômenos que estudamos variam com a progressão da primavera até o inverno: vendas de engrenagens de inverno ou verão, incidência de certas doenças generalizadas, eventos climáticos causados ​​pela localização do Fluxo de jato e mudanças na temperatura da água no oceano Pacífico oriental, e assim por diante. Da mesma forma, os eventos que ocorrem regularmente podem agir como se fossem estações meteorológicas, embora tenham apenas uma ligação tênue com os solstícios e equinócios. Mudanças de oito horas em hospitais e fábricas muitas vezes se expressam na incidência de ingestões e gastos de energia lá, uma estação é de oito horas de duração e as estações ciclo todos os dias, e não todos os anos. As datas de vencimento dos impostos indicam o início de uma inundação de dólares nos tesouros municipais, estaduais e federais, a estação pode ter um ano de duração (impostos sobre o rendimento das pessoas físicas), seis meses (impostos sobre a propriedade em muitos estados), trimestral ), e assim por diante. É um pouco estranho que tenhamos a palavra 8220season8221 para referir-se geralmente ao período de tempo regularmente recorrente, mas não há um termo geral para o período de tempo durante o qual ocorre uma volta completa das estações. 8220Cycle8221 é possível, mas em analítica e previsão, esse termo geralmente é usado para significar um período de comprimento indeterminado, como um ciclo econômico. Na ausência de um termo melhor, usei o período que acompanha 8222 neste capítulo e nos subseqüentes. Isso não é apenas reflexão terminológica. As maneiras pelas quais identificamos as estações e o período de tempo durante o qual as estações se transformam têm implicações reais, embora muitas vezes menores, sobre como medimos seus efeitos. As seções a seguir discutem como alguns analistas variam a maneira como calculam as médias móveis de acordo com o número de temporadas é ímpar ou par. Usando médias móveis em vez de médias simples Suponha que uma grande cidade está considerando a realocação de sua polícia de trânsito para melhor lidar com a incidência de condução, enquanto deficientes, que a cidade acredita que tem vindo a aumentar. Quatro semanas atrás, nova legislação entrou em vigor, legalizando a posse e uso recreativo de maconha. Desde então, o número diário de detenções de tráfego para DWI parece estar tendendo para cima. A complicação é o fato de que o número de prisões parece aumentar nas sextas-feiras e nos sábados. Para ajudar a planejar as necessidades de mão-de-obra no futuro, você gostaria de prever qualquer tendência subjacente que esteja sendo estabelecida. Você também gosta de tempo a implantação de seus recursos para ter em conta qualquer sazonalidade relacionada com o fim de semana que acontece. A Figura 5.9 tem os dados relevantes com os quais você tem que trabalhar. Figura 5.9 Com este conjunto de dados, cada dia da semana constitui uma estação. Mesmo observando apenas o gráfico na Figura 5.9. Você pode dizer que a tendência do número de prisões diárias é para cima. You8217ll tem que planejar para expandir o número de agentes de trânsito, e espero que os níveis de tendência em breve. Além disso, os dados confirmam a noção de que mais detenções ocorrem rotineiramente às sextas-feiras e aos sábados, portanto, sua alocação de recursos precisa abordar esses picos. Mas você precisa para quantificar a tendência subjacente, para determinar quantos adicionais polícia você tem que trazer. Você também precisa quantificar o tamanho esperado dos picos do fim de semana, para determinar quantos policiais adicionais você precisa assistindo para drivers erráticos naqueles dias. O problema é que, como de ainda você don8217t saber quanto do aumento diário é devido à tendência e quanto é devido ao efeito fim de semana. Você pode começar por detrending a série de tempo. No início deste capítulo, em 8220Simple Seasonal Averages, 8221 você viu um exemplo de como desviar uma série de tempo para isolar os efeitos sazonais usando o método de médias simples. Nesta seção, você verá como fazê-lo usando médias móveis, provavelmente, a abordagem de médias móveis é usada com mais freqüência na análise preditiva do que a abordagem de médias simples. Existem várias razões para a maior popularidade das médias móveis, entre elas, que a abordagem das médias móveis não pede que você colapse seus dados no processo de quantificação de uma tendência. Lembre-se que o exemplo anterior tornou necessário colapsar médias trimestrais para médias anuais, calcular uma tendência anual e, em seguida, distribuir um quarto da tendência anual em cada trimestre no ano. Esse passo era necessário para eliminar a tendência dos efeitos sazonais. Em contraste, a abordagem de médias móveis permite que você detrend a série de tempo sem recorrer a esse tipo de maquinação. A Figura 5.10 mostra como a abordagem de médias móveis funciona no exemplo atual. Figura 5.10 A média móvel no segundo gráfico esclarece a tendência subjacente. A Figura 5.10 adiciona uma coluna de média móvel, e uma coluna para estações específicas. Para o conjunto de dados da Figura 5.9. Ambas as adições exigem alguma discussão. Os picos em prisões que ocorrem nos fins de semana dá-lhe razão para acreditar que você está trabalhando com as estações que repetem uma vez por semana. Portanto, comece por obter a média para o período abrangente, ou seja, as primeiras sete temporadas, de segunda a domingo. A fórmula para a média na célula D5, a primeira média móvel disponível, é a seguinte: Essa fórmula é copiada e colada para baixo através da célula D29, então você tem 25 médias móveis com base em 25 execuções de sete dias consecutivos. Observe que, para mostrar as primeiras e as últimas observações na série de tempo, eu tenho escondido linhas de 10 a 17. Você pode exibi-los, se você quiser, neste livro do capítulo 8217s, disponível no site do publisher8217s. Faça uma seleção múltipla de linhas visíveis 9 e 18, clique com o botão direito do mouse em um de seus cabeçalhos de linha e escolha Unhide no menu de atalho. Quando você oculta linhas de uma planilha de trabalho, como fez na Figura 5.10. Qualquer dados gráficos nas linhas ocultas também está oculto no gráfico. Os rótulos do eixo x identificam apenas os pontos de dados que aparecem no gráfico. Como cada média móvel na Figura 5.10 engloba sete dias, nenhuma média móvel é emparelhada com as três primeiras ou três últimas observações reais. Copiar e colar a fórmula na célula D5 até um dia para a célula D4 é executado fora de observações 8212não há observação registrada na célula C1. Da mesma forma, não há média móvel registrada abaixo da célula D29. Copiar e colar a fórmula em D29 em D30 exigiria uma observação na célula C33, e nenhuma observação está disponível para o dia que a célula representaria. Seria possível, naturalmente, encurtar o comprimento da média móvel para, digamos, cinco em vez de sete. Fazer assim significaria que as fórmulas de média móvel na Figura 5.10 poderiam começar na célula D4 em vez de D5. No entanto, nesse tipo de análise, você quer que a duração da média móvel seja igual ao número de estações: sete dias em uma semana para eventos que se repetem semanalmente implica uma média móvel de comprimento sete e quatro trimestres em um ano para eventos que Recur anualmente implica uma média móvel de comprimento quatro. Em linhas semelhantes, geralmente quantificamos os efeitos sazonais de tal forma que eles totalizam a zero dentro do período abrangente. Como você viu na primeira seção deste capítulo, em médias simples, isso é feito calculando a média de (digamos) os quatro trimestres em um ano, e subtraindo então a média para o ano de cada figura trimestral. Assim fazendo garante que o total dos efeitos sazonais é zero. Por sua vez, that8217s útil porque ele coloca os efeitos sazonais em um efeito footing8212a verão comum de 11 é tão longe da média como um efeito de inverno de 821111. Se você quiser média cinco temporadas em vez de sete para obter a sua média móvel, você8217re melhor Off encontrar um fenômeno que se repete a cada cinco temporadas em vez de cada sete. No entanto, quando você toma a média dos efeitos sazonais mais tarde no processo, essas médias são improváveis ​​de somar a zero. É necessário, nesse ponto, recalibrar ou normalizar. As médias para que sua soma seja zero. Quando isso é feito, as médias sazonais médias expressam o efeito em um período de tempo de pertencer a uma estação particular. Uma vez normalizadas, as médias sazonais são denominadas os índices sazonais que este capítulo já mencionou várias vezes. Compreendendo Sazonais Específicos A Figura 5.10 também mostra o que são chamados de sazonais específicos na coluna E. Eles são o que restou depois de subtrair a média móvel da observação real. Para ter uma noção do que os sais específicos representam, considere a média móvel na célula D5. É a média das observações em C2: C8. Os desvios de cada observação da média móvel (por exemplo, C2 8211 D5) são garantidos para somar a zero 8212 que é uma característica de uma média. Portanto, cada desvio expressa o efeito de estar associado com aquele dia particular naquela semana particular. É um período específico sazonal, então específico porque o desvio se aplica a essa segunda-feira ou terça-feira e assim por diante, e sazonal, porque neste exemplo nós tratamos cada dia como se fosse uma estação no período abrangente de uma semana. Como cada temporada específica mede o efeito de estar nessa estação em relação à média móvel para esse grupo de (aqui) sete temporadas, você pode, em seguida, calcular a média dos períodos sazonais específicos para uma determinada temporada (por exemplo, todas as sextas-feiras no seu Séries temporais) para estimar que o efeito geral, em vez de específico, da estação 8217s. Essa média não é confundida por uma tendência subjacente na série temporal, porque cada estação específica expressa um desvio de sua própria média móvel particular. Alinhando as Médias Móveis Há também a questão de alinhar as médias móveis com o conjunto de dados original. Na Figura 5.10. Alinhei cada média móvel com o ponto médio da gama de observações que inclui. Assim, por exemplo, a fórmula na célula D5 faz a média das observações em C2: C8 e alinhei-a com a quarta observação, o ponto médio da faixa média, colocando-a na linha 5. Esta disposição é denominada média móvel centrada . E muitos analistas preferem alinhar cada média móvel com o ponto médio das observações que médias. Tenha em mente que, neste contexto, 8220midpoint8221 refere-se ao meio de um período de tempo: quinta-feira é o ponto médio de segunda a domingo. Não se refere à mediana dos valores observados, embora, naturalmente, possa funcionar dessa forma na prática. Outra abordagem é a média móvel à direita. Nesse caso, cada média móvel está alinhada com a observação final de que ela média 8212 e, portanto, trilhas por trás de seus argumentos. Este é frequentemente o arranjo preferido se você quiser usar uma média móvel como uma previsão, como é feito com suavização exponencial, porque sua média móvel final ocorre coincidente com a observação disponível final. Centered Moving Averages with Even Numbers of Seasons Nós costumamos adotar um procedimento especial quando o número de estações é mesmo em vez de estranho. Esse é o típico estado de coisas: tendem a haver números pares de estações no período abrangente para épocas típicas, como meses, trimestres e períodos quadrienais (para as eleições). A dificuldade com um número par de estações é que não há ponto médio. Dois não é o ponto médio de um intervalo começando em 1 e terminando em 4, e nenhum é 3 se pode ser dito ter um, seu ponto médio é 2.5. Seis não é o ponto médio de 1 a 12, e nem é 7 seu ponto médio puramente teórico é 6,5. Para agir como se houvesse um ponto médio, você precisará adicionar uma camada de média sobre as médias móveis. Consulte a Figura 5.11. Figura 5.11 O Excel oferece várias maneiras de calcular uma média móvel centrada. A idéia por trás dessa abordagem para obter uma média móvel centrada em um ponto médio existente, quando há um número par de estações, é puxar esse ponto médio para a frente por meia temporada. Você calcula uma média móvel que seria centrada em, digamos, o terceiro ponto no tempo se cinco estações em vez de quatro constituíam uma volta completa do calendário. That8217s feito, tendo duas médias consecutivas móveis e em média deles. Assim, na Figura 5.11. Existe uma média móvel na célula E6 que calcula a média dos valores em D3: D9. Como existem quatro valores sazonais em D3: D9, a média móvel em E6 é pensada como centrada na estação imaginária 2,5, meio ponto aquém da primeira temporada candidata disponível, 3. (As estações 1 e 2 não estão disponíveis como pontos médios para Falta de dados para a média antes da primeira temporada). Note-se, no entanto, que a média móvel na célula E8 média os valores em D5: D11, o segundo através do quinto na série temporal. Essa média é centrada no (imaginário) ponto 3.5, um período completo à frente da média centrada em 2,5. Ao calcular a média das duas médias móveis, então o pensamento vai, você pode puxar o ponto central da primeira média móvel para a frente por meio ponto, de 2,5 para 3. That8217s o que as médias na coluna F da Figura 5.11 fazer. A célula F7 fornece a média das médias móveis em E6 e E8. E a média em F7 é alinhada com o terceiro ponto de dados na série de tempo original, na célula D7, para enfatizar que a média é centrada naquela temporada. Se você expandir a fórmula na célula F7, bem como as médias móveis nas células E6 e E8, você verá que ele se torna uma média ponderada dos cinco primeiros valores na série de tempo, com o primeiro eo quinto valor dado um peso De 1 e o segundo a quarto valores dado um peso de 2. Isso nos leva a uma maneira mais rápida e simples de calcular uma média móvel centrada com um número par de estações. Ainda na Figura 5.11. Os pesos são armazenados na gama H3: H11. Esta fórmula retorna a primeira média móvel centrada, na célula I7: Essa fórmula retorna 13.75. Que é idêntico ao valor calculado pela fórmula de média dupla na célula F7. Fazendo a referência aos pesos absolutos, por meio dos sinais de dólar em H3: H11. Você pode copiar a fórmula e colá-lo para baixo, na medida do necessário para obter o resto das médias móveis centradas. Detrender a série com médias móveis Quando você subtraiu as médias móveis das observações originais para obter os valores sazonais específicos, você removeu a tendência subjacente da série. O que é deixado nos sazonais específicos é normalmente uma série estacionária, horizontal, com dois efeitos que fazem com que os sazonais específicos partam de uma linha absolutamente reta: os efeitos sazonais e erro aleatório nas observações originais. A Figura 5.12 mostra os resultados para este exemplo. Figura 5.12 Os efeitos sazonais específicos para sexta-feira e sábado permanecem claros na série detrended. O gráfico superior na Figura 5.12 mostra as observações diárias originais. Tanto a tendência ascendente geral como os picos sazonais de fim de semana são claros. O gráfico inferior mostra os dados sazonais específicos: o resultado da desvirtuação da série original com um filtro de média móvel, conforme descrito anteriormente em 8220. Compreendendo Sazonais Específicos.8221 Você pode ver que a série detrended é agora virtualmente horizontal (uma linha de tendência linear para os sazonais específicos Tem uma ligeira deriva para baixo), mas os picos sazonais de sexta e sábado ainda estão no lugar. O próximo passo é ir além dos sazonais específicos para os índices sazonais. Consulte a Figura 5.13. Figura 5.13 Os efeitos sazonais específicos são primeiro calculados pela média e depois normalizados para atingir os índices sazonais. Na Figura 5.13. Os sais sazonais específicos na coluna E são rearranjados na forma tabular ilustrada na gama H4: N7. O objetivo é simplesmente tornar mais fácil o cálculo das médias sazonais. Essas médias são mostradas em H11: N11. No entanto, os números em H11: N11 são médias, não desvios de uma média, e, portanto, não podemos esperar que eles somem a zero. Nós ainda precisamos ajustá-los para que eles expressam desvios de um grande meio. Essa grande média aparece na célula N13, e é a média das médias sazonais. Podemos chegar aos índices sazonais subtraindo a grande média em N13 de cada uma das médias sazonais. O resultado está na gama H17: N17. Esses índices sazonais não são mais específicos para uma determinada média móvel, como é o caso das espécies na coluna E. Como elas são baseadas em uma média de cada instância de uma determinada estação, elas expressam o efeito médio de uma determinada estação na Quatro semanas na série de tempo. Além disso, são medidas de uma estação, um dia em que as detenções de trânsito são visíveis à média durante um período de sete dias. Podemos agora usar esses índices sazonais para dessazonalizar a série. Utilizaremos a série dessazonalizada para obter previsões por meio de regressão linear ou método Holt8217s de suavização de séries tendenciosas (discutidas no Capítulo 4). Então nós simplesmente somamos os índices sazonais de volta às previsões para reseasonalize eles. Tudo isso aparece na Figura 5.14. Figura 5.14 Depois de ter os índices sazonais, os toques finais aplicados aqui são os mesmos que no método de médias simples. As etapas ilustradas na Figura 5.14 são em grande parte as mesmas que as das Figuras 5.6 e 5.7. Discutido nas seções a seguir. Desestacionando as Observações Subtraia os índices sazonais das observações originais para dessazonalizar os dados. Você pode fazer isso como mostrado na Figura 5.14. Em que as observações originais e os índices sazonais são organizados como duas listas começando na mesma linha, colunas C e F. Este arranjo torna um pouco mais fácil de estruturar os cálculos. Você também pode fazer a subtração como mostrado na Figura 5.6. No qual as observações trimestrais originais (C12: F16), os índices trimestrais (C8: F8) e os resultados dessazonalizados (C20: F24) são mostrados em formato tabular. Esse arranjo torna um pouco mais fácil se concentrar nos índices sazonais e nos trimestrais dessazonalizados. Previsão das Observações desestacionalizadas Na Figura 5.14. As observações dessazonalizadas estão na coluna H e na Figura 5.7 estão na coluna C. Independentemente de você querer usar uma abordagem de regressão ou uma abordagem de suavização da previsão, é melhor organizar as observações dessazonalizadas em uma lista de uma única coluna. Na Figura 5.14. As previsões estão na coluna J. A seguinte fórmula de matriz é inserida no intervalo J2: J32. Anteriormente neste capítulo, eu indiquei que se você omitir o argumento x-values ​​dos argumentos de função TREND () function8217s, o Excel fornece os valores padrão 1. 2. N. Onde n é o número de valores y. Na fórmula dada, H2: H32 contém 31 valores y. Como o argumento normalmente contendo os valores x está faltando, o Excel fornece os valores padrão 1. 2. 31. Esses são os valores que nós gostaríamos de usar de qualquer maneira, na coluna B, então a fórmula como dado é equivalente a TREND (H2: H32, B2: B32). E isso é a estrutura usada em D5: D24 da Figura 5.7: Fazendo a Previsão de Um Passo Ahead Até agora, você arranjou previsões das séries temporais dessazonalizadas de t 1 a t 31 na Figura 5.14. E de t 1 a t 20 na Figura 5.7. Estas previsões constituem informações úteis para vários fins, incluindo a avaliação da exactidão das previsões através de uma análise RMSE. Mas seu objetivo principal é prever, pelo menos, o próximo, ainda não observado período de tempo. Para conseguir isso, você poderia primeiro prever a função TREND () ou PROJ. LIN () se você estiver usando a regressão, ou a partir da fórmula de suavização exponencial se você usar o método Holt8217s. Depois, você pode adicionar o índice sazonal associado à projeção de regressão ou suavização, para obter uma previsão que inclua tanto a tendência quanto o efeito sazonal. Na Figura 5.14. Você obtém a previsão de regressão na célula J33 com esta fórmula: Nesta fórmula, os valores de y em H2: H32 são os mesmos que nas outras fórmulas de TREND () na coluna J. Assim são os valores de x (padrão) de 1 Até 32. Agora, porém, você fornece um novo valor x como terceiro argumento da função8217, que você diz para TREND () procurar na célula B33. It8217s 32. O próximo valor de t. E Excel retorna o valor 156.3 na célula J33. A função TREND () na célula J33 está dizendo ao Excel, na verdade, 8220Calcule a equação de regressão para os valores em H2: H32 regrediu nos valores t de 1 a 31. Aplicar essa equação de regressão para o novo valor x de 32 e retornar o resultado.8221 Você encontrará a mesma abordagem na célula D25 da Figura 5.7. Onde a fórmula para obter a previsão um passo adiante é esta: Adicionando os índices sazonais Voltar Na etapa final é reseasonalize as previsões, adicionando os índices sazonais para as previsões de tendência, reverter o que você fez quatro passos para trás quando você subtraiu o Índices das observações originais. Isso é feito na coluna F na Figura 5.7 e na coluna K na Figura 5.14. Não esqueça de adicionar o índice sazonal apropriado para a previsão de um passo à frente, com os resultados mostrados na célula F25 na Figura 5.7 e na célula K33 na Figura 5.14. Você pode encontrar gráficos de três representações dos dados de detenção de trânsito na Figura 5.15. A série dessazonalizada, a previsão linear a partir dos dados dessazonalizados, e as previsões reseasonalized. Observe que as previsões incorporam tanto a tendência geral dos dados originais quanto os seus picos de sexta-feira. Figura 5.15 Representação gráfica das previsões.5.2 Suavização de séries temporais A suavização é normalmente feita para nos ajudar a ver melhor padrões, tendências, por exemplo, em séries temporais. Geralmente suavizar a irregularidade irregular para ver um sinal mais claro. Para os dados sazonais, podemos suavizar a sazonalidade para que possamos identificar a tendência. Suavização não nos fornece um modelo, mas pode ser um bom primeiro passo para descrever vários componentes da série. O termo filtro às vezes é usado para descrever um procedimento de suavização. Por exemplo, se o valor suavizado para um determinado tempo é calculado como uma combinação linear de observações para tempos circundantes, pode-se dizer que weve aplicado um filtro linear para os dados (não o mesmo que dizer o resultado é uma linha reta, por o caminho). O uso tradicional do termo média móvel é que em cada ponto no tempo determinamos médias (possivelmente ponderadas) dos valores observados que circundam um determinado tempo. Por exemplo, no instante t. Uma média móvel centrada do comprimento 3 com pesos iguais seria a média dos valores às vezes t -1. T. E t1. Para tirar a sazonalidade de uma série, para que possamos ver melhor a tendência, usaríamos uma média móvel com um período sazonal span. Assim, na série suavizada, cada valor suavizado foi calculado em média em todas as estações. Isso pode ser feito olhando para uma média móvel unilateral em que você média todos os valores para os anos anteriores de dados ou uma média móvel centrada na qual você usa valores antes e depois da hora atual. Para dados trimestrais, por exemplo, poderíamos definir um valor suavizado para o tempo t como (x t x t-1 x t-2 x t-3) 4, a média deste tempo e os 3 trimestres anteriores. No código R, este será um filtro unilateral. Uma média móvel centrada cria um pouco de uma dificuldade quando temos um número par de períodos de tempo no período sazonal (como costumamos fazer). Para suavizar a sazonalidade nos dados trimestrais. A fim de identificar a tendência, a convenção usual é usar a média móvel alisada no tempo t é Para suavizar a sazonalidade em dados mensais. Para identificar a tendência, a convenção usual é usar a média móvel alisada no instante t. Isto é, aplicamos o peso 124 a valores às vezes t6 e t6 e peso 112 a todos os valores em todos os momentos entre t5 e t5. No comando R filtro, bem especificar um filtro de dois lados quando queremos usar valores que vêm antes e depois do tempo para o qual foram suavização. Observe que na página 71 de nosso livro, os autores aplicam pesos iguais em uma média móvel sazonal centrada. Thats ok também. Por exemplo, um trimestral mais suave pode ser alisado no momento t é fraco x frac x frac x frac x frac x Um mensal mais suave pode aplicar um peso de 113 a todos os valores de tempos t-6 a t6. O código que os autores usam na página 72 tira vantagem de um comando rep que repete um valor um certo número de vezes. Eles não usam o parâmetro filter dentro do comando filter. Exemplo 1 Produção Trimestral de Cerveja na Austrália Tanto na Lição 1 quanto na Lição 4, analisamos uma série de produção trimestral de cerveja na Austrália. O código R seguinte cria uma série suavizada que nos permite ver o padrão de tendência e traça esse padrão de tendência no mesmo gráfico da série de tempo. O segundo comando cria e armazena a série suavizada no objeto chamado trendpattern. Note que dentro do comando filter, o parâmetro named filter dá os coeficientes para o nosso alisamento e sides 2 faz com que um centrado suave seja calculado. Beerprod (beerprod. dat) trendpattern filtro (beerprod, filtro c (18, 14, 14, 14, 18), sides2) gráfico (beerprod, tipo b, tendência principal média móvel) linhas (trendpattern) Pode subtrair o padrão de tendência dos valores dos dados para obter uma melhor visão da sazonalidade. O resultado segue: Outra possibilidade para a série de alisamento para ver a tendência é o filtro one-sided trendpattern2 (beerprod, filter c (14, 14, 14, 14), sides1) Com isso, o valor suavizado é a média do ano passado. Exemplo 2. Desemprego mensal nos Estados Unidos Na lição de casa da semana 4, você analisou uma série mensal de desemprego nos Estados Unidos para 1948-1978. Heres um alisamento feito para olhar para a tendência. (Trendunemploy, mainTrend no Desemprego dos Estados Unidos, 1948-1978, xlab Year) Apenas a tendência alisada é plotada. (Trendunemployfilter) (trendunemployfilter) (desemprego, filtroc (124,112,112,112,112,112,112,112,112,112,112,112,112,112,112,112,112,112,124), sides2) trendunemploy ts (trendunemploy, start c (1948,1) O segundo comando identifica as características de tempo do calendário da série. Isso faz com que a trama tenha um eixo mais significativo. A trama segue. Para séries não-sazonais, você arent obrigado a suavizar qualquer intervalo particular. Para alisar você deve experimentar com médias móveis de diferentes vãos. Esses períodos de tempo podem ser relativamente curtos. O objetivo é derrubar as bordas ásperas para ver que tendência ou teste padrão pôde estar lá. Outros Métodos de Suavização (Seção 2.4) A Seção 2.4 descreve várias alternativas sofisticadas e úteis para a suavização média móvel. Os detalhes podem parecer esboçado, mas isso é bom porque não queremos ficar atolados em muitos detalhes para esses métodos. Dos métodos alternativos descritos na Seção 2.4, o lowess (regressão localmente ponderada) pode ser o mais amplamente utilizado. Exemplo 2 Continua O gráfico seguinte é uma linha de tendência suavizada para a série de Desemprego dos EUA, encontrada utilizando um lowess mais suave, no qual uma quantidade substancial (23) contribuiu para cada estimativa suavizada. Note que isso suavizou a série mais agressivamente do que a média móvel. Os comandos utilizados foram os desempregados (desemprego, início c (1948,1), freq12) lote (lowess (desempregado, f 23), suavização principal Lowess da tendência de desemprego dos EUA) Suavização Exponencial Única A equação básica de previsão para suavização exponencial única é frequentemente Dado como hat alfa xt (1-alfa) hat t texto Nós prognosticamos que o valor de x no tempo t1 seja uma combinação ponderada do valor observado no tempo t eo valor previsto no instante t. Embora o método seja chamado um método de suavização, seu usado principalmente para previsão de curto prazo. O valor de é chamado de constante de suavização. Por qualquer razão, 0.2 é uma escolha padrão popular de programas. Isso coloca um peso de 0,2 na observação mais recente e um peso de 1,2,8 na previsão mais recente. Com um valor relativamente pequeno de, o alisamento será relativamente mais extenso. Com um valor relativamente grande de, o alisamento é relativamente menos extenso à medida que mais peso será colocado no valor observado. Este é um método simples de previsão em uma etapa que, à primeira vista, parece não exigir um modelo para os dados. De fato, este método é equivalente ao uso de um modelo ARIMA (0,1,1) sem constante. O procedimento ideal é ajustar um modelo ARIMA (0,1,1) ao conjunto de dados observado e usar os resultados para determinar o valor de. Isso é ótimo no sentido de criar o melhor para os dados já observados. Embora o objetivo seja suavizar e um passo à frente previsões, a equivalência ao modelo ARIMA (0,1,1) traz um bom ponto. Não devemos cegamente aplicar alisamento exponencial porque o processo subjacente pode não ser bem modelado por um ARIMA (0,1,1). Considere um ARIMA (0,1,1) com média 0 para as primeiras diferenças, xt - x t-1: começa hat amp amp xt theta1 wt amp amp xt theta1 (xt - que t) amp amp (1 theta1) xt - theta1hat tendem. Se deixarmos (1 1) e assim - (1) 1, vemos a equivalência à equação (1) acima. Por que o Método é Chamado Suavização Exponencial Isso produz o seguinte: começo chapéu amplificador amp alfa xt (1-alfa) alfa x (1-alfa) chapéu amp amp alfa xt alfa (1-alfa) x (1-alfa) 2hat fim Continuar Desta forma substituindo sucessivamente o valor previsto no lado direito da equação. Isto leva a: hat alpha xt alfa (1-alfa) x alfa (1-alfa) 2 x dots alfa (1-alfa) jx pontos alfa (1-alfa) x1 texto A equação 2 mostra que o valor previsto é uma média ponderada De todos os valores passados ​​da série, com pesos exponencialmente mudando como nos movemos para trás na série. Suavização Exponencial Óptima em R Basicamente, basta ajustar um ARIMA (0,1,1) aos dados e determinar o coeficiente. Podemos examinar o ajuste do bom, comparando os valores previstos com a série real. O alisamento exponencial tende a ser usado mais como uma ferramenta de previsão do que um verdadeiro mais suave, por isso estávamos olhando para ver se temos um bom ajuste. Exemplo 3. N 100 observações mensais do logaritmo de um índice de preços do petróleo nos Estados Unidos. A série de dados é: Um ajuste ARIMA (0,1,1) em R deu um coeficiente MA (1) 0,3877. Assim, (1 1) 1,3877 e 1- -0,3877. A equação exponencial de suavização de previsão é 1.3877xt - 0.3877hat t No tempo 100, o valor observado da série é x 100 0,86601. O valor previsto para a série nesse momento é Assim, a previsão para o tempo 101 é 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 O seguinte é o quão bem o mais suave se encaixa a série. É um bom ajuste. Isso é um bom sinal para a previsão, o principal objectivo para este mais suave. Aqui estão os comandos usados ​​para gerar a saída para este exemplo: oilindex scan (oildata. dat) gráfico (oilindex, tipo b, registro principal de índice de óleo série) expsmoothfit arima (oilindex, ordem c (0,1,1)) expsmoothfit Para ver o arima resultados preditos oilindex - expsmoothfitresiduals previu valores gráfico (oilindex, typeb, principal Exponencial Suavização de Log of Oil Index) linhas (preditos) 1.3877oilindex100-0.3877predicteds100 previsão de tempo 101 Double Exponential Smoothing Dupla exponencial alisamento pode ser usado quando theres Tendência (longo ou curto prazo), mas sem sazonalidade. Essencialmente, o método cria uma previsão combinando estimativas exponencialmente suavizadas da tendência (inclinação de uma linha reta) eo nível (basicamente, a intercepção de uma linha reta). Dois pesos diferentes, ou parâmetros de suavização, são usados ​​para atualizar esses dois componentes a cada vez. O nível suavizado é mais ou menos equivalente a uma suavização exponencial simples dos valores de dados ea tendência alisada é mais ou menos equivalente a uma simples suavização exponencial das primeiras diferenças. O procedimento é equivalente à montagem de um modelo ARIMA (0,2,2), sem constante, pode ser realizado com um ajuste ARIMA (0,2,2). (1-B) 2 xt (1theta1B theta2B2) p. Navegação

No comments:

Post a Comment