Distribuição hipergeométrica
De Wikipedia, a enciclopédia encyclopedia
Em teoria das probabilidades e estatística, a distribuição hipergeométrica é uma distribuição de probabilidade discreta que descreve a probabilidade de sucessos em retiradas, sem reposição, de uma população de tamanho que contém exatamente sucessos, sendo cada retirada um sucesso ou um fracasso. Em contraste, a distribuição binomial descreve a probabilidade de sucessos em retiradas com reposição.
Distribuição hipergeométrica | |
---|---|
Parâmetros | |
Suporte | |
f.d.p. | |
f.d.a. | em que é a função hipergeométrica generalizada |
Média | |
Moda | |
Variância | |
Obliquidade | |
Curtose |
|
Função Geradora de Momentos | |
Função Característica |
Em estatística, o teste hipergeométrico usa a distribuição hipergeométrica para calcular a significância estatística de obtenção de um número específico de sucessos (a partir de um total de retiradas) a partir da população acima mencionada. O teste é frequentemente usado para identificar quais subpopulações estão super-representadas ou sub-representadas em um amostra. Por exemplo, um grupo de marketing poderia usar o teste para compreender sua base de consumidores ao testar um conjunto de consumidores desconhecidos para avaliar a super-representação de vários subgrupos demográficos (como mulheres ou pessoas abaixo de 30).
As seguintes condições caracterizam a distribuição hipergeométrica:
- O resultado de cada retirada (os elementos da população que compõem a amostra) pode ser classificado em uma de duas categorias mutuamente excludentes (por exemplo, aprovação ou reprovação, empregado ou desempregado);
- A probabilidade de um sucesso muda a cada retirada, conforme cada retirada diminui a população (amostragem sem reposição a partir de uma população finita).
Uma variável aleatória segue a distribuição hipergeométrica se a função massa de probabilidade for dada por[1]
em que
- é o tamanho da população,
- é o número de estados de sucessos na população,
- é o número de retiradas,
- é o número de sucessos observados,
- é um coeficiente binomial.
A função massa de probabilidade é positiva quando .
A função massa de probabilidade satisfaz a relação de recorrência
com
- .
Como é de se esperar, a soma das probabilidades resulta em 1:
Esta é essencialmente a identidade de Vandermonde da combinatória.
A seguinte identidade também se aplica:
Isto segue da simetria do problema, mas isto também pode ser mostrado expressando os coeficientes binomiais em termos de fatoriais e rearranjando os últimos.[2]