Atualizado em 05/04/2025

Sobre este material

Esta é uma plataforma dinâmica de ensino e aprendizagem estatística que visa atender alunos de graduação, pós-graduação e todos os interessados no assunto. Ela foi criada com o objetivo de contribuir para uma melhor fixação dos conteúdos de estatística experimental. A construção da plataforma é baseada no software R, usando os pacotes shiny, bs4Dash e shinyWidgets.

User Avatar

Tiago Olivoto

Desenvolvedor
Departamento de Fitotecnia
Centro de Ciências Agrárias
Universidade Federal de Santa Catarina

Conjunto de dados

Estatísticas Descritivas

Dispersão dos dados

Dados

Média

Dado um conjunto \(x\), com \(n\) elementos, a média aritmética deste conjunto (\(\bar x\)) é dada por: $$\bar x = \frac{\sum_{i = 1}^n x_i}{n}$$ Assim, a média é calculada por:

Mediana

Moda

A moda é o valor em 'X' que mais se repete.

Valores plotados

Média (vermelho) e mediana (azul)

Dados

Amplitude

A amplitude é calculada pela diferença entre o valor máximo e mínimo do conjunto de dados

Desvio Médio Absoluto

Ao computar a média do módulo dos desvios, temos o desvio médio absoluto

Variância

Desvio Padrão

Coeficiente de Variação

Erro padrão da média

Tamanho da amostra, desvio padrão e erro padrão

E se mostrarmos em um gráfico ambos o desvio padrão e o erro padrão da média? Clique no botão abaixo para gerar o gráfico.

Conjunto 1

Conjunto 2

Dados

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha as variáveis

Escolha as variáveis



Características da amostragem

O número possíveis de amostras com \(n\) indivíduos de uma população com \(N\) elementos, é dado por: $$\mathop C\nolimits_N^n = \frac{N!}{n!(N-n)!}$$

Valores da população

Possíveis amostras da população

Configurações

Resultado do experimento

Alvo digital

Características da amostragem

Parâmetros (.xlsx)

Parâmetros (.csv)

Conjunto de dados

Médias amostrais

Erros, média populacional e amostral

Consideremos a variável aleatória discreta \(X\) como o sexo de um bezerro nascido. Denotando sucesso (1 = fêmea) e fracasso (2 = macho), a probabilidade de sucesso é \(p = 0,5\) e a de fracasso é \(q = 1 - q = 0,5\). Assim, considerando um parto de monta natural de uma vaca há 50% de chance de nascimento de uma terneira.

Número de partos

Movimente o slider para aumentar o número de partos e veja o que acontece com a árvore ao lado.

Árvore dos resultados

A probabilidade de \(P(X = x)\), sendo \(x\) o número de terneiras nascidas de uma monta natural (\(p = 0,5; q = 0,5\)) dado que é dada por:

Parâmetros

Se \(X\) é uma variável aleatória discreta com um comportamento Binomial, então a probabilidade de assumir um dos valores \(k\) (sucesso) do espaço amostral \(\Omega\) é calculada por: $$ P(X = k) = \left( \begin{array}{l}n\\k\end{array} \right) \times {p^k} \times {q^{n - k}} $$ Abaixo é possível definir o número de ensaios e probabilidade de sucesso de um determinado evento e verificar os resultados nas abas 'Probabilidade calculada' e 'Probabilidade pontual'.
Distribuições contínuas de probabilidade são utilizadas quando a variável que está sendo medida é expressa em uma escala contínua. Dentre várias, a distribuição normal é uma distribuição contínua bastante útil na estatística, pois sua função densidade de probabilidade (FDP) está associada ao fato de que aproxima de forma bastante satisfatória as curvas de frequências observadas quando se mensura diversas variáveis biológicas (ex., altura, massa, comprimento, etc). A distribuição normal possui dois parâmetros: \(\mu\) (média) e \(\sigma \) (desvio padrão). Estes parâmetros definem a posição e a dispersão do conjunto de dados. Assim, se \(X\) se distribui de forma normal e contínua, a Função Densidade de Probabilidade de \(X\) é dada por: $$ f(X) = \frac{1}{{\sqrt {2\pi {\sigma ^2}} }}{e^{ - \frac{{{{(x - \mu )}^2}}}{{2{\sigma ^2}}}}}-\infty< x < \infty $$ Diferentemente das distribuições discretas onde a probabilidade era calculada para cada evento, nas distribuições contínuas, a probabilidade estatística é calculada para um intervalo de valores. Por exemplo, assumindo que \(X\) é a altura de planta (m) em uma lavoura de milho e que \(X\sim N(\mu = 2, \sigma = 0,2) \), a probabilidade de, ao entrar aleatoriamente nesta lavoura ser encontrada uma planta que mede de 1,75 m a 2 m é dada pela integral abaixo, representando a área destacada no gráfico. $$ P\left(1,75\le X \le 2,00\right)=\int_{1,75}^{2,00} \frac{1}{0,2 \sqrt{2 \pi}} e^{-\frac{(x - 2)^{2}}{2 \times 0,2^{2}}} d x $$

Aproximação da distribuição normal

O cálculo da integral da distribuição Normal pode ser aproximado pelo método geométrico por soma de retângulos (Ou Soma de Riemann). Este método possibilita calcular a integral definida em dois pontos, considerando uma variável com distribuição normal. Assim, a soma das áreas dos retângulos sob a curva da distribuição normal resultará na probabilidade estatística de um valor estar no intervalo

Densidade de Probabilidade: Diferentes médias e desvios padrão

Probabilidade Acumulada: Diferentes médias e desvios padrão



<= X <=

<= X <=


<= X <=

Variável Z

Probabilidade


<= X <=

Variável Z

Normal e Normal Padrão

Probabilidade Acumulada: Diferentes graus liberdade



<= X <=

<= X <=

Probabilidade Acumulada: Diferentes graus liberdade



<= X <=

<= X <=

Características da amostra

Fórmula

$$ IC = \bar{X} \pm Z \times \frac{\sigma}{\sqrt{n}} $$

Cálculo

Interpretação

Quantil da Normal Padrão

Intervalo de confiança

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha as variáveis

Escolha as variáveis

$$ IC = \bar{X} \pm Z \times \frac{\sigma}{\sqrt{n}} $$

Intervalo de Confiança

Características da amostra

Fórmula

$$ IC = \bar{X} \pm t \times \frac{S}{\sqrt{n}} $$

Cálculo

Interpretação

Quantil da distribuição t

Intervalo de confiança

Amostra 1

Cálculo

Interpretação

Amostra 2

Cálculo

Interpretação

Quantil das amostras 1 e 2

Impacto do Desvio Padrão no IC

Impacto do tamanho de amostra no IC

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha as variáveis

Escolha as variáveis

$$ IC = \bar{X} \pm t \times \frac{S}{\sqrt{n}} $$

Intervalo de Confiança

População com distribuição normal


Configuração da amostragem


Configuração da simulação

Defina aqui o número de simulações a serem realizadas. Em cada simulação, uma amostragem com 'n' indivíduos (definido acima) será realziada na população. A média será calculada e armazenada. Ao final será possível visualizar os resultados da distribuição das médias amostrais.

Teste t para uma média populacional com variância desconhecida

Hipótese Nula

Parâmetros do teste

Fórmula

$$ t=\frac{\bar{x} - \mu}{\frac{S}{\sqrt{n}}} $$

Cálculo

Interpretação

Teste t para duas médias populacionais com variância desconhecida e assumidamente iguais

Hipótese Nula

Parâmetros do teste

$$ H_0: \mu_1 = \mu_2 $$

Fórmula

$$ t = \frac{\bar x_1 - \bar x_2}{S_c\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} ~~~~~ S_c = \sqrt{\frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1+n_2-2}} $$

Cálculo

Interpretação

Teste t para duas médias populacionais com variância desconhecida e assumidamente desiguais

Hipótese Nula

Parâmetros do teste

$$ H_0: \mu_1 = \mu_2 $$

Estatística do teste e interpretação

Neste caso, o Graus de liberdade é corrigido pelo método de Welch-Satterthwaite (v): $$ t = \frac{\bar x_1 - \bar x_2}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} ~~~~~ v = \frac{(\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2})^2}{\frac{(S_1^2/n_1)^2}{n_1-1} + \frac{(S_2^2/n_2)^2}{n_2-1}} $$

Cálculo

Teste t para duas amostras dependentes (pareado)

Hipótese Nula

Parâmetros do teste

$$ H_0: |\bar{d}| = 0 $$
O teste t pareado é utilziado para testar se as diferenças nas medições antes e depois de um tratamento são significativas. A lógica é a mesma de um teste t para uma amostra, onde a média populacional (referência) é zero. Assim, testa-se a hipótese nula de que a média das diferenças é estatisticamente igual a zero.

Estatística do teste e interpretação

$$ t = \frac{|\bar{d}|}{\frac{S_d}{\sqrt{n}}} $$

Cálculo

Teste F para comparar a variância de duas amostras de uma população normal

Hipótese Nula

Parâmetros do teste

$$ H_0: \sigma_1^2 = \sigma_2^2 $$

Estatística do teste e interpretação

$$ F = \frac{\sigma_1^2}{\sigma_2^2} ~~~~~~~~ GL_1 = n_1 - 1 ~~~~~~~~ GL_2 = n_2 - 1 $$

Cálculo

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha dos fatores

Escolha dos fatores

Parâmetros da simulação

Fator de Correção (C)

Graus de liberdade (GL)

Somas de Quadrados

Quadrados Médios

F calculado

As hipóteses testadas neste experimento são: $$ \begin{aligned} & H_0: \tau_i=0 \\ & H_1: \tau_i \neq 0 \quad \text { para pelo menos um } \quad i \end{aligned} $$ Ou seja, testa-se se o efeito de tratamentos igual a zero. Neste caso, compara-se o F calculado com o F crítico.
$$ \Delta = q \times \sqrt{\frac{QM_{res}}{R}} $$

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha dos fatores

Escolha dos fatores

Fator de Correção (C)

Graus de liberdade (GL)

Somas de Quadrados

Quadrados Médios

F calculado

As hipóteses testadas neste experimento são: $$ \begin{aligned} & H_0: \tau_i=0 \\ & H_1: \tau_i \neq 0 \quad \text { para pelo menos um } \quad i \end{aligned} $$ Ou seja, testa-se se o efeito de tratamentos igual a zero. Neste caso, compara-se o F calculado com o F crítico.
$$ \Delta = q \times \sqrt{\frac{QM_{res}}{R}} $$

ANOVA - DIC

ANOVA - DBC

Comparação de médias (Tukey) considerando os delineamentos DIC e DBC. As setas mostram a diferença mínima significativa.

Parâmetros da simulação

Resultados da Simulação

Delineamento de Blocos Casualizados


                              

Delineamento Inteiramente Casualizado


                            

Delineamento de Blocos Casualizados


                              

Delineamento Inteiramente Casualizado


                            

Delineamento de Blocos Casualizados

Delineamento Inteiramente Casualizado

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha dos fatores

Escolha dos fatores

Selecione o número de níveis de cada fator.


                              

                            
Soma dos fatores

                              
Soma dos blocos

                              

Fator de Correção (C)

Graus de liberdade (GL)

Somas de Quadrados

Quadrados Médios

\( - \)

F calculado

As hipóteses testadas neste experimento são: $$ \begin{aligned} & H_0: \tau_i=0 \\ & H_1: \tau_i \neq 0 \quad \text { para pelo menos um } \quad i \end{aligned} $$ Ou seja, testa-se se o efeito de tratamentos igual a zero. Neste caso, compara-se o F calculado com o F crítico.
$$ \Delta = q \times \sqrt{\frac{QM_{res}}{JK}} $$

Comparação dos níveis do fator A, considerando a média de todos os níveis do fator B


$$ \Delta = q \times \sqrt{\frac{QM_{res}}{IK}} $$

Comparação dos níveis do fator B, considerando a média de todos os níveis do fator A


$$ \Delta = q \times \sqrt{\frac{QM_{res}}{K}} $$

Comparação dos níveis do fator B, dentro de cada nível do fator A


$$ \Delta = q \times \sqrt{\frac{QM_{res}}{K}} $$

Comparação dos níveis do fator A, dentro de cada nível do fator B


O modelo de regressão linear simples (primeiro grau) é dado abaixo. Com este modelo é possível predizer a resposta de uma variável dependente (y) em função de uma variável explicativa (x), desde que estas tenham uma relação linear. $$ y = \beta_0 + \beta_1 \times x + \epsilon $$ Utilize os sliders abaixo para ajustar os valores do intercept (\(\beta_0\)) e coeficiente angular (\(\beta_1\)), demodo a minimizar a soma dos quadrados dos desvios, representados pelas linhas pontilhadas no gráfico


                              

                              A linha azul representa a linha de predição do modelo ajustado utilizando os mínimos quadrados ordinários.
                            

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha as variáveis

Escolha as variáveis

Soma de produtos e quadrados

SPxy

SQx

SQy

Cálculo dos coeficientes

Coeficiente angular

Intercept

Equação ajustada

Análise de Variância

SQ total

SQ regressão

SQ resíduo

Qualidade de ajuste

Coeficiente de determinação (R2)

$$ R^2 = \frac{SQ_{regressao}}{SQ_{total}}$$

Erro quadrático médio

$$ MSE=\frac{1}{n} \sum_{i=1}^n\left(y_i-\hat{y}_i\right)^2$$

Resumo da regressão


                                        

Análise de variância da regressão


                                      

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha as variáveis

Escolha as variáveis


                                      

                                
Selecione a correlação entre as variáveis x e y

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha as variáveis

Escolha as variáveis

Somas de produtos e quadrados

SPxy

SQx

SQy

Cálculo do r e teste de hipótese

Correlação de Pearson

Teste t para a correlação

Interpretação

Parâmetros (.xlsx)

Parâmetros (.csv)

Escolha as variáveis

Escolha as variáveis

Tipo de apresentação e configurações


                                

Dígitos

Texto

Tabela Normal Padrão

Primeira decimal de Z nas linhas e segunda decimal de Z nas colunas

Tabela t de Student (bicaudal)

Valores críticos de t tais que a probabilidade da variável aleatória t estar entre \(-t\) e \(+t\) vale 1 - \(\alpha\)

Tabela F de Fischer-Snedecor

Coluna representa o grau de liberdade do numerador e linha representa grau de liberdade do denominador

Valores da amplitude estudentizada (q) para uso no teste Tukey

Coluna representa o número de tratamentos e linha representa grau de liberdade do erro

Quantil

Quantil da distribuição

Probabilidade

Probabilidade

Números aleatórios

Quantil

Quantil da distribuição Normal

Probabilidade

Probabilidade

Números aleatórios

Quantil

Probabilidade

Números aleatórios

Quantil

Probabilidade