Desenvolvimento


              Este trabalho está restrito aos dias de verão (21/06 - 21/09) do ano de 1970 nas estações Belmullet (BEL) e Dublin (DUB), de forma que os dados não-pertencentes a esse intervalo foram descartados através da criação de uma nova tabela gerada no Microsoft Excel com base nos dados do DATASET wind. Além disso, a unidade de medida da velocidade dos ventos "knots" foi convertida para m/s (metros por segundo).
              A tabela foi nomeada como "TABELA" e foi salva no formato .csv no Desktop do usuário Pedro. Para utilizá-la no ambiente R foi preciso utilizar o comando:

TABELA<-read.csv("C:/Users/Pedro/Desktop/TABELA.csv", sep=",", dec=".", header=TRUE)


              Aplicando-se o comando edit(TABELA) obtém-se a tabela:




              Através desta tabela o trabalho foi desenvolvido. O comando g<-TABELA foi utilizado para direcionar os posteriores comandos ao objeto TABELA.

Estatísticas Básicas:

              Para obter-se as estatísticas básicas, os comandos aplicados foram:
baisco<-TABELA
summary(basico)
              Gerando-se esta tabela:


              Através destas estatísticas básicas, nota-se que a velocidade dos ventos é maior em Belmullet do que em Dublin.
              OBS: Min. - Valor mínimo
                      1st Qu. - Primeiro Quartil
                      Median - Mediana
                      Mean - Média Aritmética
                      3rd Qu. - Terceiro Quartil
                      Máx. - Valor Máximo

Histogramas:

              Para a obtenção dos histogramas das velocidades dos ventos das estações, utilizaram-se os seguintes comandos:

Estação Belmullet:

x.norm<- g$BEL

h<-hist(x.norm,breaks=10)

xhist<-c(min(h$breaks),h$breaks)

yhist<-c(0,h$density,0)

xfit<-seq(0, 40, by=1.0)

yfit<-dnorm(xfit,mean=mean(x.norm),sd=sd(x.norm))

plot(xhist,yhist,type="s",ylim=c(0,max(yhist,yfit)),xlab="Velocidade dos Ventos (m/s)",ylab="Frequência Relativa",main="Histograma da Velocidade dos Ventos da Estação Belmullet ", sub="Verão 1970")

lines(xfit,yfit,col="red")

Estação Dublin:

x.norm<- g$DUB

h<-hist(x.norm,breaks=10)

xhist<-c(min(h$breaks),h$breaks)

yhist<-c(0,h$density,0)

xfit<-seq(0, 40, by=1.0)

yfit<-dnorm(xfit,mean=mean(x.norm),sd=sd(x.norm))

plot(xhist,yhist,type="s",ylim=c(0,max(yhist,yfit)),xlab="Velocidade dos Ventos (m/s)",ylab="Frequência Relativa",main="Histograma da Velocidade dos Ventos da Estação Dublin", sub="Verão 1970")

lines(xfit,yfit,col="red")


              Aplicando-se esses comandos, os dois histogramas a seguir foram gerados:




              Comparando os histogramas obtidos conclui-se que as velocidades dos ventos mais freqüentes na estação Dublin variam entre 2 e 6 m/s, dando um aspecto assimétrico ao histograma com a cauda direita mais longa. Já as datadas pela estação Belmullet, concentram-se entre 5 e 9m/s, dando, assim, um aspecto simétrico ao gráfico.
              Os histogramas confirmam que a velocidade dos ventos é maior na estação Belmullet.

Dispersograma e Coeficiente de Correlação:

              Para gerar o dispersograma, o comando aplicado foi:

plot(DUB~BEL, data=g, main="Dispersograma")


              Observando-se o dispersograma, percebe-se certa dependência entre as variáveis. Para verificar o quão dependente elas são, calculou-se, por meio de três métodos diferentes, o coeficiente de correlação (r).

Método Pearson:
Comando: cor(g$BEL,g$DUB, method="pearson")
Resultado: r = 0.746947

Método Kendall:
Comando: cor(g$BEL,g$DUB, method="kendall")
Resultado: r = 0.5328493

Método Spearman:
Comando: cor(g$BEL,g$DUB, method="spearman")
Resultado: r = 0.723561

              Os coeficientes de correlação indicam que as variáveis estão em associação direta (r>0). Segundo Santos (2007), quando 0,5<r<0,8, as variáveis apresentam correlação moderada positiva. Portanto, existe dependência entre as variáveis.
           

Modelo de Regressão Linear

              A reta de regressão é um modelo para estudar a dependência linear entre duas variáveis. Para ajustar este modelo no dispersograma, foram aplicados os seguintes comandos:

g.m1 <- lm(BEL~DUB, data=g)
lm(formula = BEL ~ DUB, data = g)

              Achando-se os coeficientes angular e linear da reta: 
Coefficients:
(Intercept)          DUB  
     3.4268       0.7411 

              Em seguida foi gerado o mesmo dispersograma do item anterior (apenas com o título alterado):

plot(BEL~DUB, data=g, main="Modelo de Regressão Linear")

             Para aplicar o modelo calculado anteriormente ao dispersograma, utiliza-se o comando:

abline(g.m1, col="red")

             Gerando-se, enfim, o Modelo de Regressão Linear:



              Para verificar a dependência linear das variáveis, aplicou-se o comando:
summary(regress)#avaliação do modelo


              A mediana dos resíduos é próximo de 0 e o r² é razoavelmente próximo de 1, o que indica que esse modelo é admissível para essas variáveis.
             



              

Nenhum comentário:

Postar um comentário