Possuo informações de um local na cidade, com diversas medidas diárias no ano, onde observo que o fluxo de ciclistas diários tem distribuição normal e o seu coeficiente de variação é de 12%. (ou seja, média e desvio padrão conhecidos)
Já em outros 5 locais dessa mesma cidade, tenho somente um registro diário por ano e nenhuma outra informação Por exemplo:
Local1: 2016 = 276 ciclistas;
2017 = 255 ciclistas;
2018 = 295 ciclistas;
2019 = 350 ciclistas.
Pois bem, minha questão é saber se para esse local1, onde tenho somente uma observação feita por ano, é possível por inferência estatística eu tentar estabelecer um intervalo de confiança para a faixa de valores em que é provável que ocorra a aferição de ciclistas no ano seguinte, caso não tenha tido alterações nos hábitos das pessoas.
Portanto, não busco a distribuição das médias amostrais, mas saber se essa única observação mais elevada de 2019 pode ter sido aleatória ou se é um indicativo de mudança temporal no hábito da mobilidade.
Para isso eu pensei em dois caminhos.
a) Considerar todos os locais como distribuição normal e com o mesmo coeficiente de variação do local que já tenho informação e estabelecer um intervalo de confiança a partir de então (12% * 1,96);
b) Realizar a distribuição t de Student para as 4 observações (ou as 3 anteriores?);
Basicamente, com as informações acima, pensei em considerar a média das observações dos 3 anos anteriores e em torno dela estabelecer um intervalo de confiança de por exemplo 24%( 1,96 * 12%) se considerar distribuição normal e coeficiente de variação de 12%. Com isso, valores 24% acima ou abaixo dessa média seria indicativo de possível mudança nos hábitos...
Bom, no final das contas, acabei ficando na dúvida:
1) É possível trabalhar com tão poucas informações? Os caminhos que pensei estão corretos? Existem outras formas de trabalhar com essas informações?
2) Para estabelecer um intervalo de confiança em torno da média, eu devo considerar como média as 4 observações ou deixo de fora aquele em que suspeito ter ocorrido variação maior (o ano de 2019)?
Envie sua primeira dúvida gratuitamente aqui no Tira-dúvidas Profes. Nossos professores particulares estão aqui para te ajudar.
a variável fluxo de ciclistas diários tem uma variação de 12%, o coeficiente de variação é uma medida padronizada que permite comparar variáveis com diferentes unidades de medidas, pois transforma a variabilidade das variáveis em percentagens. Quanto menor o coeficiente de variação de uma variável, mais constate é a medida.
como a sua medida é anual, esse coeficiente de varição é refente a série temporal inteira inclusa na amostra.
Pois bem, minha questão é saber se para esse local1, onde tenho somente uma observação feita por ano, é possível por inferência estatística eu tentar estabelecer um intervalo de confiança para a faixa de valores em que é provável que ocorra a aferição de ciclistas no ano seguinte, caso não tenha tido alterações nos hábitos das pessoas.
você poderá criar um intervalo de confiança, mas esse será referente ao período temporal inteiro na amostra.
prever os valores para o proximo ano seria um processo de predição de medida que deveria ser feito por meio de uma regressão linear (mas o seu n é muito baixo para a plicação desta técnica).
caso considere que não haverá variação de um ano para o outro, o calculo da amostra já indicará um intervalo de valores em que a nova observação pode se encaixar de acordo com um determinado níveld e confiança.
caminhos
b) Realizar a distribuição t de Student para as 4 observações (ou as 3 anteriores?);
se você modelar a distribuição de Student para as variáveis, você poderá chegar a probabilidades para a sequência da série, mas apenas reponderá qual a probabilidade da ocorrencia de cada valor.
1) É possível trabalhar com tão poucas informações? Os caminhos que pensei estão corretos? Existem outras formas de trabalhar com essas informações?
a aplicação da distribuição T sim, pois ela é para amostras pequenas
2) Para estabelecer um intervalo de confiança em torno da média, eu devo considerar como média as 4 observações ou deixo de fora aquele em que suspeito ter ocorrido variação maior (o ano de 2019)?
você incluí as 4 observações, pois essa variabilidade será compreendida dentro do IC, ampliando as medidas mínimas e máximas.
Espero ter ajuda. Estou a disposição.
Envie sua primeira dúvida gratuitamente aqui no Tira-dúvidas Profes. Nossos professores particulares estão aqui para te ajudar.
Envie sua primeira dúvida gratuitamente aqui no Tira-dúvidas Profes. Nossos professores particulares estão aqui para te ajudar.