Atualizado em 05/04/2025

Sobre este material
Esta é uma plataforma dinâmica de ensino e aprendizagem estatística que visa atender alunos de graduação, pós-graduação e todos os interessados no assunto. Ela foi criada com o objetivo de contribuir para uma melhor fixação dos conteúdos de estatística experimental. A construção da plataforma é baseada no software R, usando os pacotes shiny, bs4Dash e shinyWidgets.
Conjunto de dados
Estatísticas Descritivas
Dispersão dos dados
Dados
Média
Dado um conjunto \(x\), com \(n\) elementos, a média aritmética deste conjunto (\(\bar x\)) é dada por: $$\bar x = \frac{\sum_{i = 1}^n x_i}{n}$$ Assim, a média é calculada por:
Mediana
Moda
A moda é o valor em 'X' que mais se repete.
Valores plotados
Média (vermelho) e mediana (azul)
Dados
Amplitude
A amplitude é calculada pela diferença entre o valor máximo e mínimo do conjunto de dados
Desvio Médio Absoluto
Ao computar a média do módulo dos desvios, temos o desvio médio absoluto
Variância
Desvio Padrão
Coeficiente de Variação
Erro padrão da média
Tamanho da amostra, desvio padrão e erro padrão
E se mostrarmos em um gráfico ambos o desvio padrão e o erro padrão da média? Clique no botão abaixo para gerar o gráfico.
Conjunto 1
Conjunto 2
Dados
Parâmetros (.xlsx)
Parâmetros (.csv)
Escolha as variáveis
Escolha as variáveis
Características da amostragem
O número possíveis de amostras com \(n\) indivíduos de uma população com \(N\) elementos, é dado por: $$\mathop C\nolimits_N^n = \frac{N!}{n!(N-n)!}$$
Valores da população
Possíveis amostras da população
Configurações
Resultado do experimento
Alvo digital
Características da amostragem
Parâmetros (.xlsx)
Parâmetros (.csv)
Conjunto de dados
Médias amostrais
Erros, média populacional e amostral
Consideremos a variável aleatória discreta \(X\) como o sexo de um bezerro nascido. Denotando sucesso (1 = fêmea) e fracasso (2 = macho), a probabilidade de sucesso é \(p = 0,5\) e a de fracasso é \(q = 1 - q = 0,5\). Assim, considerando um parto de monta natural de uma vaca há 50% de chance de nascimento de uma terneira.
Número de partos
Movimente o slider para aumentar o número de partos e veja o que acontece com a árvore ao lado.
Árvore dos resultados
A probabilidade de \(P(X = x)\), sendo \(x\) o número de terneiras nascidas de uma monta natural (\(p = 0,5; q = 0,5\)) dado que é dada por:
Parâmetros
Se \(X\) é uma variável aleatória discreta com um comportamento Binomial, então a probabilidade de assumir um dos valores \(k\) (sucesso) do espaço amostral \(\Omega\) é calculada por: $$ P(X = k) = \left( \begin{array}{l}n\\k\end{array} \right) \times {p^k} \times {q^{n - k}} $$ Abaixo é possível definir o número de ensaios e probabilidade de sucesso de um determinado evento e verificar os resultados nas abas 'Probabilidade calculada' e 'Probabilidade pontual'.Dados
Distribuições contínuas de probabilidade são utilizadas quando a variável que está sendo medida é expressa em uma escala contínua. Dentre várias, a distribuição normal é uma distribuição contínua bastante útil na estatística, pois sua função densidade de probabilidade (FDP) está associada ao fato de que aproxima de forma bastante satisfatória as curvas de frequências observadas quando se mensura diversas variáveis biológicas (ex., altura, massa, comprimento, etc). A distribuição normal possui dois parâmetros: \(\mu\) (média) e \(\sigma \) (desvio padrão). Estes parâmetros definem a posição e a dispersão do conjunto de dados. Assim, se \(X\) se distribui de forma normal e contínua, a Função Densidade de Probabilidade de \(X\) é dada por:
$$ f(X) = \frac{1}{{\sqrt {2\pi {\sigma ^2}} }}{e^{ - \frac{{{{(x - \mu )}^2}}}{{2{\sigma ^2}}}}}-\infty< x < \infty $$
Diferentemente das distribuições discretas onde a probabilidade era calculada para cada evento, nas distribuições contínuas, a probabilidade estatística é calculada para um intervalo de valores. Por exemplo, assumindo que \(X\) é a altura de planta (m) em uma lavoura de milho e que \(X\sim N(\mu = 2, \sigma = 0,2) \), a probabilidade de, ao entrar aleatoriamente nesta lavoura ser encontrada uma planta que mede de 1,75 m a 2 m é dada pela integral abaixo, representando a área destacada no gráfico.
$$ P\left(1,75\le X \le 2,00\right)=\int_{1,75}^{2,00} \frac{1}{0,2 \sqrt{2 \pi}} e^{-\frac{(x - 2)^{2}}{2 \times 0,2^{2}}} d x $$
Aproximação da distribuição normal
O cálculo da integral da distribuição Normal pode ser aproximado pelo método geométrico por soma de retângulos (Ou Soma de Riemann). Este método possibilita calcular a integral definida em dois pontos, considerando uma variável com distribuição normal. Assim, a soma das áreas dos retângulos sob a curva da distribuição normal resultará na probabilidade estatística de um valor estar no intervaloDensidade de Probabilidade: Diferentes médias e desvios padrão
Probabilidade Acumulada: Diferentes médias e desvios padrão
<= X <=
<= X <=
<= X <=
Variável Z
Probabilidade
<= X <=
Variável Z
Normal e Normal Padrão
Probabilidade Acumulada: Diferentes graus liberdade
<= X <=
<= X <=
Probabilidade Acumulada: Diferentes graus liberdade
<= X <=
<= X <=
Características da amostra
Fórmula
$$ IC = \bar{X} \pm Z \times \frac{\sigma}{\sqrt{n}} $$Cálculo
Interpretação
Quantil da Normal Padrão
Intervalo de confiança
Parâmetros (.xlsx)
Parâmetros (.csv)
Escolha as variáveis
Escolha as variáveis
Intervalo de Confiança
Características da amostra
Fórmula
$$ IC = \bar{X} \pm t \times \frac{S}{\sqrt{n}} $$Cálculo
Interpretação
Quantil da distribuição t
Intervalo de confiança
Amostra 1
Cálculo
Interpretação
Amostra 2
Cálculo
Interpretação
Quantil das amostras 1 e 2
Impacto do Desvio Padrão no IC
Impacto do tamanho de amostra no IC
Parâmetros (.xlsx)
Parâmetros (.csv)
Escolha as variáveis
Escolha as variáveis
Intervalo de Confiança
População com distribuição normal
Configuração da amostragem
Configuração da simulação
Defina aqui o número de simulações a serem realizadas. Em cada simulação, uma amostragem com 'n' indivíduos (definido acima) será realziada na população. A média será calculada e armazenada. Ao final será possível visualizar os resultados da distribuição das médias amostrais.Teste t para uma média populacional com variância desconhecida
Hipótese Nula
Parâmetros do teste
Fórmula
$$ t=\frac{\bar{x} - \mu}{\frac{S}{\sqrt{n}}} $$Cálculo
Interpretação
Teste t para duas médias populacionais com variância desconhecida e assumidamente iguais
Hipótese Nula
Parâmetros do teste
Fórmula
$$ t = \frac{\bar x_1 - \bar x_2}{S_c\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} ~~~~~ S_c = \sqrt{\frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1+n_2-2}} $$Cálculo
Interpretação
Teste t para duas médias populacionais com variância desconhecida e assumidamente desiguais
Hipótese Nula
Parâmetros do teste
Estatística do teste e interpretação
Neste caso, o Graus de liberdade é corrigido pelo método de Welch-Satterthwaite (v): $$ t = \frac{\bar x_1 - \bar x_2}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} ~~~~~ v = \frac{(\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2})^2}{\frac{(S_1^2/n_1)^2}{n_1-1} + \frac{(S_2^2/n_2)^2}{n_2-1}} $$Cálculo
Teste t para duas amostras dependentes (pareado)
Hipótese Nula
Parâmetros do teste
Estatística do teste e interpretação
$$ t = \frac{|\bar{d}|}{\frac{S_d}{\sqrt{n}}} $$Cálculo
Teste F para comparar a variância de duas amostras de uma população normal
Hipótese Nula
Parâmetros do teste
Estatística do teste e interpretação
$$ F = \frac{\sigma_1^2}{\sigma_2^2} ~~~~~~~~ GL_1 = n_1 - 1 ~~~~~~~~ GL_2 = n_2 - 1 $$Cálculo
Parâmetros (.xlsx)
Parâmetros (.csv)
Escolha dos fatores
Escolha dos fatores
Parâmetros da simulação
Fator de Correção (C)
Graus de liberdade (GL)
Somas de Quadrados
Quadrados Médios
F calculado
As hipóteses testadas neste experimento são:
$$ \begin{aligned}
& H_0: \tau_i=0 \\
& H_1: \tau_i \neq 0 \quad \text { para pelo menos um } \quad i
\end{aligned}
$$
Ou seja, testa-se se o efeito de tratamentos igual a zero. Neste caso, compara-se o F calculado com o F crítico.
$$ \Delta = q \times \sqrt{\frac{QM_{res}}{R}} $$
Parâmetros (.xlsx)
Parâmetros (.csv)
Escolha dos fatores
Escolha dos fatores
Fator de Correção (C)
Graus de liberdade (GL)
Somas de Quadrados
Quadrados Médios
F calculado
As hipóteses testadas neste experimento são:
$$ \begin{aligned}
& H_0: \tau_i=0 \\
& H_1: \tau_i \neq 0 \quad \text { para pelo menos um } \quad i
\end{aligned}
$$
Ou seja, testa-se se o efeito de tratamentos igual a zero. Neste caso, compara-se o F calculado com o F crítico.
$$ \Delta = q \times \sqrt{\frac{QM_{res}}{R}} $$
ANOVA - DIC
ANOVA - DBC
Comparação de médias (Tukey) considerando os delineamentos DIC e DBC. As setas mostram a diferença mínima significativa.
Parâmetros da simulação
Resultados da Simulação
Delineamento de Blocos Casualizados
Delineamento Inteiramente Casualizado
Delineamento de Blocos Casualizados
Delineamento Inteiramente Casualizado
Delineamento de Blocos Casualizados
Delineamento Inteiramente Casualizado
Parâmetros (.xlsx)
Parâmetros (.csv)
Escolha dos fatores
Escolha dos fatores
Selecione o número de níveis de cada fator.
Soma dos fatores
Soma dos blocos
Fator de Correção (C)
Graus de liberdade (GL)
Somas de Quadrados
Quadrados Médios
\( - \)
F calculado
As hipóteses testadas neste experimento são:
$$ \begin{aligned}
& H_0: \tau_i=0 \\
& H_1: \tau_i \neq 0 \quad \text { para pelo menos um } \quad i
\end{aligned}
$$
Ou seja, testa-se se o efeito de tratamentos igual a zero. Neste caso, compara-se o F calculado com o F crítico.
$$ \Delta = q \times \sqrt{\frac{QM_{res}}{JK}} $$
Comparação dos níveis do fator A, considerando a média de todos os níveis do fator B
$$ \Delta = q \times \sqrt{\frac{QM_{res}}{IK}} $$
Comparação dos níveis do fator B, considerando a média de todos os níveis do fator A
$$ \Delta = q \times \sqrt{\frac{QM_{res}}{K}} $$
Comparação dos níveis do fator B, dentro de cada nível do fator A
$$ \Delta = q \times \sqrt{\frac{QM_{res}}{K}} $$
Comparação dos níveis do fator A, dentro de cada nível do fator B
O modelo de regressão linear simples (primeiro grau) é dado abaixo. Com este modelo é possível predizer a resposta de uma variável dependente (y) em função de uma variável explicativa (x), desde que estas tenham uma relação linear.
$$ y = \beta_0 + \beta_1 \times x + \epsilon $$
Utilize os sliders abaixo para ajustar os valores do intercept (\(\beta_0\)) e coeficiente angular (\(\beta_1\)), demodo a minimizar a soma dos quadrados dos desvios, representados pelas linhas pontilhadas no gráfico
A linha azul representa a linha de predição do modelo ajustado utilizando os mínimos quadrados ordinários.
Parâmetros (.xlsx)
Parâmetros (.csv)
Escolha as variáveis
Escolha as variáveis
Soma de produtos e quadrados
SPxy
SQx
SQy
Cálculo dos coeficientes
Coeficiente angular
Intercept
Equação ajustada
Análise de Variância
SQ total
SQ regressão
SQ resíduo
Qualidade de ajuste
Coeficiente de determinação (R2)
$$ R^2 = \frac{SQ_{regressao}}{SQ_{total}}$$Erro quadrático médio
$$ MSE=\frac{1}{n} \sum_{i=1}^n\left(y_i-\hat{y}_i\right)^2$$Resumo da regressão
Análise de variância da regressão
Parâmetros (.xlsx)
Parâmetros (.csv)
Escolha as variáveis
Escolha as variáveis
Selecione a correlação entre as variáveis x e y