Thursday, 24 August 2017

Moving Average Examples Time Series


Moving Average Este exemplo ensina como calcular a média móvel de uma série de tempo no Excel. Um avanço em movimento é usado para suavizar irregularidades (picos e vales) para reconhecer facilmente as tendências. 1. Primeiro, vamos dar uma olhada em nossa série de tempo. 2. No separador Dados, clique em Análise de dados. Observação: não é possível encontrar o botão Análise de dados Clique aqui para carregar o suplemento do Analysis ToolPak. 3. Selecione Média móvel e clique em OK. 4. Clique na caixa Input Range e selecione o intervalo B2: M2. 5. Clique na caixa Intervalo e escreva 6. 6. Clique na caixa Output Range e seleccione a célula B3. 8. Faça um gráfico destes valores. Explicação: porque definimos o intervalo como 6, a média móvel é a média dos 5 pontos de dados anteriores eo ponto de dados atual. Como resultado, os picos e vales são suavizados. O gráfico mostra uma tendência crescente. O Excel não consegue calcular a média móvel para os primeiros 5 pontos de dados porque não existem pontos de dados anteriores suficientes. 9. Repita os passos 2 a 8 para intervalo 2 e intervalo 4. Conclusão: Quanto maior o intervalo, mais os picos e vales são suavizados. Quanto menor o intervalo, mais próximas as médias móveis são para os pontos de dados reais. Você gosta deste site gratuito Por favor, compartilhe esta página no Googlemoving média Média de dados de séries temporais (observações igualmente espaçadas no tempo) de vários períodos consecutivos. Chamado de movimento porque é continuamente recalculado à medida que novos dados se tornam disponíveis, ele progride caindo o valor mais antigo e adicionando o valor mais recente. Por exemplo, a média móvel das vendas de seis meses pode ser calculada tomando a média das vendas de janeiro a junho, depois a média das vendas de fevereiro a julho, depois de março a agosto, e assim por diante. As médias móveis (1) reduzem o efeito de variações temporárias nos dados, (2) melhoram o ajuste dos dados para uma linha (um processo chamado suavização) para mostrar a tendência dos dados mais claramente e (3) realçam qualquer valor acima ou abaixo do valor tendência. Se você está calculando algo com variação muito alta o melhor que você pode ser capaz de fazer é descobrir a média móvel. Eu queria saber qual era a média móvel dos dados, então eu teria uma melhor compreensão de como estávamos fazendo. Quando você está tentando descobrir alguns números que mudam muitas vezes o melhor que você pode fazer é calcular a média móvel. O melhor do BusinessDictionary, entregue dailySmoothing dados remove variação aleatória e mostra tendências e componentes cíclicos Inerente na coleta de dados levados ao longo do tempo é alguma forma de variação aleatória. Existem métodos para reduzir o cancelamento do efeito devido a variação aleatória. Uma técnica freqüentemente usada na indústria é suavizar. Essa técnica, quando corretamente aplicada, revela mais claramente a tendência subjacente, os componentes sazonais e cíclicos. Existem dois grupos distintos de métodos de alisamento Métodos de média Métodos de suavização exponencial Tomar médias é a maneira mais simples de suavizar os dados Vamos primeiro investigar alguns métodos de média, como a média simples de todos os dados passados. Um gerente de um armazém quer saber o quanto um fornecedor típico oferece em unidades de 1000 dólares. Ele / ela toma uma amostra de 12 fornecedores, aleatoriamente, obtendo os seguintes resultados: A média computada ou média dos dados 10. O gerente decide usar isto como a estimativa para despesa de um fornecedor típico. Esta é uma boa ou má estimativa O erro quadrático médio é uma maneira de julgar o quão bom é um modelo Vamos calcular o erro quadrático médio. O valor verdadeiro do erro gasto menos o valor estimado. O erro ao quadrado é o erro acima, ao quadrado. O SSE é a soma dos erros quadrados. O MSE é a média dos erros quadrados. Resultados do MSE por exemplo Os resultados são: Erro e esquadrado Erros A estimativa 10 A questão surge: podemos usar a média para prever a renda se suspeitarmos de uma tendência? Um olhar para o gráfico abaixo mostra claramente que não devemos fazer isso. A média pondera todas as observações passadas igualmente Em resumo, afirmamos que A média simples ou média de todas as observações passadas é apenas uma estimativa útil para previsão quando não há tendências. Se houver tendências, use estimativas diferentes que levem em conta a tendência. A média pesa todas as observações passadas igualmente. Por exemplo, a média dos valores 3, 4, 5 é 4. Sabemos, é claro, que uma média é calculada adicionando todos os valores e dividindo a soma pelo número de valores. Outra forma de calcular a média é adicionando cada valor dividido pelo número de valores, ou 3/3 4/3 5/3 1 1.3333 1.6667 4. O multiplicador 1/3 é chamado de peso. Em geral: barra fração soma esquerda (fratura direita) x1 esquerda (fratura direita) x2,. ,, Esquerda (frac direito) xn. O (esquerdo (direito de fracto)) são os pesos e, naturalmente, somam a 1.Quando computa uma média movente running, colocando a média no período de tempo médio faz o sentido No exemplo precedente nós calculamos a média dos 3 primeiros Os períodos de tempo e colocá-lo próximo ao período 3. Poderíamos ter colocado a média no meio do intervalo de tempo de três períodos, ou seja, próximo ao período 2. Isso funciona bem com períodos de tempo ímpar, mas não tão bom para o tempo mesmo Períodos. Então, onde colocamos a primeira média móvel quando M 4 Tecnicamente, a Média Móvel cairá em t 2,5, 3,5. Para evitar esse problema, suavizamos as MAs usando M 2. Assim, suavizamos os valores suavizados Se usamos um número médio de termos, precisamos suavizar os valores suavizados A tabela a seguir mostra os resultados usando M 4.Time Series Exemplo Os exemplos a seguir Ilustram como XLMiner pode ser usado para explorar os dados para descobrir tendências e sazonalidades. Na faixa XLMiner, na guia Aplicando seu modelo, selecione Ajuda - Exemplos. Então Exemplos de Previsão / Mineração de Dados e abra o conjunto de dados de exemplo, Income. xlsx. Este conjunto de dados contém a renda média dos contribuintes por estado. Normalmente, as seguintes etapas são realizadas em uma análise de séries temporais. 1. Os dados são divididos em dois conjuntos com 60 dos dados atribuídos ao conjunto de treino e 40 atribuídos ao conjunto de validação. 2. Técnicas exploratórias são aplicadas aos Conjuntos de Treinamento e Validação. Se os resultados estiverem em sincronia, o modelo pode ser ajustado. Se os gráficos ACF e PACF forem os mesmos, então o mesmo modelo pode ser usado para ambos os conjuntos. 3. O modelo é ajustado usando o método ARIMA (Autoregressive Integrated Moving Average). 4. Quando um modelo é ajustado usando o método ARIMA, o XLMiner exibe os gráficos ACF e PACF para os resíduos. Se estas parcelas estão na banda de UCL e LCL, então os resíduos são aleatórios eo modelo é adequado. 5. Se os resíduos não estão dentro das bandas, então existem algumas correlações eo modelo deve ser melhorado. Primeiro, execute uma partição nos dados. Selecione uma célula dentro do conjunto de dados e, em seguida, no ribboon XLMiner, na guia Série temporal, selecione Partição para abrir a caixa de diálogo Data de partição de séries temporais. Na lista Variáveis, selecione Ano e clique em gt para mover para Variável de hora. Selecione as variáveis ​​restantes na lista Variáveis ​​e clique em gt para incluí-las na lista Variáveis ​​na partição. Em Especificar opções de particionamento, selecione Especificar registros para especificar o número de registros atribuídos aos conjuntos de treinamento e validação. Em Especificar registros para particionamento, selecione Especificar registros e digite 50 para o número de registros de conjuntos de treinamento e 21 para o número de registros de conjuntos de validação. Se Especificar percentagens estiver selecionado em Especificar Opções de Particionamento, o XLMiner atribuirá uma porcentagem de registros a cada conjunto de acordo com os valores inseridos pelo usuário ou inseridos automaticamente pelo XLMiner em Especificar porcentagens para particionamento. Clique em OK. A folha de cálculo DataPartitionTS é inserida à direita da folha de cálculo Rendimento. Na saída acima, o método de particionamento é seqüencial (versus aleatório). As primeiras 50 observações foram atribuídas ao Conjunto de Treino e as restantes 21 observações foram atribuídas ao Conjunto de Validação. Selecione uma célula na planilha DataPartitionTS e, em seguida, na faixa XLMiner, na guia Time Series, selecione ARIMA - Autocorrelações para exibir a caixa de diálogo ACF. Selecione CA como variável Selecionada, insira 10 para os parâmetros ACF para dados de treinamento e dados de validação. O traçar um gráfico ACF é selecionado por padrão. Clique em OK. A folha de cálculo ACFOutput é inserida após a folha de dados DataPartitionTS. Observe em cada gráfico que a autocorrelação diminui à medida que o número de atrasos aumenta. Isso sugere que existe um padrão definido em cada partição. No entanto, uma vez que o padrão não se repete, pode-se supor que nenhuma sazonalidade está incluída nos dados. Além disso, uma vez que ambos os gráficos exibem um padrão semelhante, podemos encaixar o mesmo modelo para os conjuntos de validação e treinamento. Clique em voltar para a planilha DataPartitionTS e na fita XLMiner, a partir da guia Time Series, selecione ARIMA - autocorrelações parciais para abrir o diálogo PACF. Selecione CA na lista Variáveis ​​em dados de entrada e, em seguida, clique em gt para mover a variável para a variável Selecionada. Digite 40 para Lag máximo nos parâmetros PACF para dados de treinamento e 15 para parâmetros PACF para dados de validação. O gráfico PACF do gráfico é selecionado por padrão. Clique em OK. A folha de cálculo ACFOutput é inserida directamente à direita da folha de cálculo DataPartitionTS. Ambas as parcelas PACF mostram padrões semelhantes em ambos os conjuntos de validação e formação. Como resultado, podemos usar o mesmo modelo para ambos os conjuntos. Saída PACF para dados de treinamento Saída PACF para dados de validação A função PACF mostra um padrão definido, o que significa que há uma tendência nos dados. No entanto, como o padrão não se repete, podemos concluir que os dados não mostram qualquer sazonalidade. Tanto o ACF quanto o PACF sugerem que existe um padrão definido, mas sem qualquer sazonalidade. Ambos os conjuntos de dados exibem o mesmo comportamento nos Conjuntos de Treinamento e Validação, o que sugere que o mesmo modelo é apropriado para cada um. Agora estamos prontos para ajustar o modelo. O modelo ARIMA aceita três parâmetros: p - o número de termos auto-regressivos d - o número de diferença não sazonal, e q - o número de erros defasados ​​(médias móveis). Lembre-se que a trama ACF não mostrou sazonalidade nos dados, o que significa que autocorrelação é quase estático, diminuindo com o número de defasagens crescentes. Isto sugere que se ponha q 0 uma vez que parece não haver erros defasados. O gráfico PACF exibiu um grande valor para o primeiro atraso, mas gráficos mínimos para sucessivos atrasos. Isto sugere a definição p 1. Com a maioria dos conjuntos de dados, a definição d 1 é suficiente ou pode pelo menos ser um ponto de partida. Clique em voltar para a planilha DataPartitionTS e na fita XLMiner, a partir da guia Time Series, selecione ARIMA - modelo ARIMA para abrir o Time Series - diálogo ARIMA. Selecione CA na lista Variáveis ​​em Dados de Entrada e, em seguida, clique em gt para mover a variável para o campo Variável Selecionada. Em Parâmetros não sazonal set Autoregressive (p) a 1, Diferença (d) a 1, e Média Móvel (q) para 0. Clique em Avançado para abrir o ARIMA - diálogo Opções avançadas. Selecione Valores e resíduos adequados, Produzir previsões e Relatórios de intervalos de confiança de previsão. O ajuste de Nível de Confiança padrão de 95 é inserido automaticamente. A matriz de variância-covariância é selecionada por padrão. Clique em OK na caixa de diálogo ARIMA-Advanced Options e novamente na caixa de diálogo Time Series - ARIMA. XLMiner calcula e exibe vários parâmetros e gráficos em duas folhas de saída, ARIMAOutput e ARIMAResiduals. A planilha ARIMAOutput contém o modelo ARIMA, mostrado abaixo. Nesta mesma planilha, XLMiner calculou o termo constante eo termo AR1 para o nosso modelo. Estes são os termos constantes e f1 da equação de previsão. Veja a seguinte saída do teste Qui-quadrado. O pequeno p-valor para o termo constante (0,9704) e prazo de AR1 (0) sugere que o modelo é um bom ajuste aos nossos dados. Abra a folha de cálculo ARIMAResiduals. Esta tabela apresenta os valores reais e ajustados e os resíduos resultantes. Conforme mostrado no gráfico abaixo, os valores reais e previstos correspondem bastante bem. A utilidade do modelo na previsão dependerá da proximidade dos valores reais e previstos no gráfico de tempo do conjunto de validação. Em seguida, vamos ver as parcelas ACF e PACF para erros encontrados na parte inferior da planilha ARIMAOutput. Todos os atrasos, com exceção do intervalo 1, estão claramente dentro das bandas UCL e LCL. Isso indica que os resíduos são aleatórios e não estão correlacionados, que é a primeira indicação de que os parâmetros do modelo são adequados para esses dados. Consulte a tabela Previsão na planilha ARIMAOutput. A tabela mostra o valor real e previsto. Os valores inferior e superior representam os limites inferior e superior do intervalo de confiança. Existe uma chance de 95 que o valor previsto caia dentro desta faixa. O gráfico de tempo para a direita indica como o modelo, que montou usando o Conjunto de Treinamento e executado no Conjunto de Validação. Os valores reais e previstos são bastante próximos, o que confirma que o nosso modelo deve ser bom para a previsão. Para traçar os valores na coluna inferior e superior no mesmo gráfico, selecione o gráfico e, em seguida, na faixa Excel, selecione Design - Selecionar dados para abrir a caixa de diálogo Selecionar origem de dados. Para o intervalo de dados do gráfico, insira ARIMAOutputB56: G77. Em seguida, desmarque Erro em Entradas de Legenda. Clique em OK. Esse gráfico mostra que os valores real e previsto estão dentro das bandas de nível de confiança 95 inferior e superior. Embora os valores reais flutuem um pouco, esses valores estão dentro do centro do intervalo. Podemos concluir a partir da saída ARIMA, que o nosso modelo usando parâmetros (1, 1, 0) foi mostrado para adequadamente ajustar os dados.

No comments:

Post a Comment