Inferência Estatística
O objetivo de uma investigação científica é descobrir, entender e estudar alguma característica de certa população e a estatística é uma ferramenta que auxilia esse tipo de pesquisa. Já vimos a estatística descritiva, que serve para resumir, simplificar e observar um conjunto de dados, agora veremos a inferência estatística.
A inferência estatística tem como objetivo fazer afirmações sobre uma população a partir de um conjunto dados representativos (amostra) dessa mesma população, nesse contexto, é o conjunto de técnicas utilizadas para identificar relações entre variáveis que representem ou não relações de causa e efeito.
A população é muito maior do que a amostra observada, assim sendo, cada afirmação deve sempre vir acompanhadas de uma medida de precisão sobre sua veracidade.
A inferência estatística é necessária para tirar conclusões e realizar tomadas de decisões em relação uma população. Por exemplo:
- Prever a duração média da vida útil de um maquinário, com base no desempenho de muitos maquinários;
- Comparar a eficiência de duas dietas para aumentar o ganho médio diário de peso, com base no ganho de peso de indivíduos submetidos às dietas;
- Determinar a dosagem ideal de um novo medicamento, com base em testes feitos em pacientes voluntários de hospitais selecionados aleatoriamente.
Dentro da inferência estudamos probabilidades e os testes de hipóteses.
As probabilidades serve para identificar a chance de ocorrência de um determinado resultado de interesse, são exemplos de probabilidades:
- Proporção de votos que o candidato “A” terá na próxima eleição;
- Probabilidade de nascer “fêmea” de um parto;
- Proporção de indivíduos infectados com uma doença após a estação chuvosa.
As hipóteses são afirmações ou conjecturas sobre um parâmetro, ou mais parâmetros, da distribuição de probabilidades de uma característica da população ou de uma amostra, são exemplos de hipóteses:
- O candidato “A” vencerá a próxima eleição;
- A probabilidade de nascer “fêmea” de um parto é de 50%;
- A proporção de indivíduo infectados com uma doença após a estação chuvosa é maior que 5%.
Em estatística levamos em consideração a Teoria Popperiana:
- Não se pode provar nada, apenas “desaprovar”;
- Só aprendemos quando erramos;
- É mais fácil refutar do que provar alguma assertiva;
- Os estatísticos não perguntam qual é a probabilidade de estarem certos, mas a probabilidade de estarem errados, para fazerem isso estabelecem um hipótese nula.
Teste de Hipóteses:
É um procedimento, baseado nas informações contidas na amostra, uma regra de decisão que nos possibilita decidir em rejeitar ou não as: Hipótese nula (H0) e Hipótese alternativa (H1).
Exemplo 01: Queremos avaliar se uma moeda é honesta.
- Hipótese nula H0: a moeda é honesta
- Hipótese alternativa H1: a moeda não é honesta
Em linguagem estatística:
- H0: p = 0,05
- H1: p ≠ 0,05
Exemplo 02: Estudo de uma nova droga
- Hipótese 1: nova droga apresenta maior eficácia que a droga em uso.
H0: Dn = Da
H1: Dn > Da
- Hipótese 2: nova droga se propõe a reduzir os efeitos colaterais.
H0: Dn = Da
H1: Dn < Da
- Hipótese 3: nova droga tem efeito sobre o apetite dos indivíduos.
H0: Dn = Da
H1: Dn ≠ Da
A Hipótese nula (H0) expressa uma igualdade e a Hipótese alternativa (H1) expressa uma desigualdade.
Valor de P (p-valor)
Também chamado de nível descritivo ou probabilidade de significância, é a probabilidade de se obter uma estatística de teste igual ou mais extrema que aquela observada em uma amostra, sob a hipótese nula
Exemplo: p-valor = 0,05
A probabilidade de 5% de que a hipótese nula é verdadeira na amostra que estamos a testar.
Hipótese Estatística — Tipos de Erros
Ao realizarmos uma tomada de decisão por meio de uma amostra e não a população inteira podemos cometer dois tipos de erro:
- Erro tipo I quando rejeitamos H0 e H0 é verdadeira
- Erro tipo II quando não rejeitamos H0 e H0 é falsa
A probabilidade α do erro tipo I é denominada nível de significância do teste.
O erro tipo I é chamada de nível de significância — α, esse erro é geralmente determinado pelo pesquisador antes da coleta dos dados. Em muitas aplicações da estatística, o nível de significância é tradicionalmente fixado em 0,05.
Nos experimentos:
- Atribuem-se baixos valores para α = 1–10%;
- Normalmente formula-se H0 com a pretensão de rejeitá-la, daí o nome de hipótese nula;
- Se o teste indicar a rejeição de H0, tem-se um indicador mais seguro da decisão;
- Se o teste indicar a não rejeição de H0, diz-se que, com o nível de significância α não se pode rejeitar H0.
Vamos praticar: procure um artigo científico da sua área que compare tratamentos por meio de uma variável resposta, determine as hipóteses nula e alternativa, verifique o p-valor e a conclusão do pesquisador em relação aos tratamentos e a variável resposta escolhida.