Sexam X os anos de experiência em vendas e Y as unidades diárias vendidas
X/Y | 1 | 2 | 3 |
2 | 0,14 | 0,04 | 0,02 |
4 | 0,04 | 0,18 | 0,08 |
6 | 0,02 | 0,26 | 0,12 |
8 | 0 | 0,02 | 0,08 |
Dada a tabela da distribuição conjunta de X e Y, calcular:
A) cov(X,Y)
B)ρ
A) A covariância para duas variáveis aleatórias e
é formalmente definida como
onde é o valor esperado (média) de
. Então, para obter a covariância, basta obter a esperança conjunta (
) de
e
, e subtrair o produto das esperanças marginais (as médias) de
e
. A esperança conjunta é obtida de maneira simples somando todos os produtos de combinações de valores observados para
e
com sua respectiva probabilidade. Por exemplo, o valor de 2 para
e o de 1 para
são observados juntamente com uma probabilidade de 0,14. Logo, o primeiro termo da nossa soma é 2 * 1 * 0,14. A nossa soma será
= (2 * 1 * 0,14) + (2 * 2 * 0,04) + (2 * 3 * 0,02) + (4 * 1 * 0,04) + ... + (8 * 2 * 0,02) + (8 * 3 * 0,08) = 10,76
Para obter as esperanças marginais e
, precisamos obter as probabilidades marginais de
e
. Isto é feito somando as probabilidades na mesma linha (para
) ou coluna (para
) na tabela. Por exemplo, a probabilidade marginal para
igual a 2 é 0,14 + 0,04 + 0,02 = 0,2. Já a probabilidade marginal para
igual a 1 é 0,14 + 0,04 + 0,02 + 0 = 0,2. É sempre uma boa ideia conferir se as probabilidades marginais calculadas estão corretas, e isto pode ser feito somando as probabilidades obtidas para
ou para
e vendo se a soma de ambas é igual a 1, condição que deve sempre ser verificada. A esperança marginal tanto de
como de
é obtida somando todos os produtos do valor observado com sua respectiva probabilidade marginal. A soma para
será
= (2 * 0,2) + (4 * 0,3) + (6 * 0,4) + (8 * 0,1) = 4,8
e a soma para será
= (1 * 0,2) + (2 * 0,5) + (3 * 0,3) = 2,1
Logo, voltando para a fórmula da covariância e substituindo os termos, temos que é igual a 10,76 - (4,8 * 2,1) = 0,68
B) o coeficiente de correlação entre
e
é definido como
,
onde e
são os desvios padrões para
e
. O desvio padrão é obtido como a raiz quadrada da variância, que é definida como
.
Para o primeiro termo, calculamos a soma de todos os produtos dos quadrados dos valores de (ou
) com sua respectiva probabilidade marginal. O primeiro termo, por exemplo, é igual a (2^2 * 0,2) = (4 * 0,2). As soma inteira para
e
são iguais a
= (4 * 0,2) + (16 * 0,3) + (36 * 0,4) + (64 * 0,1) = 26,4
= (1 * 0,2) + (4 * 0,5) + (9 * 0,3) = 4,9
Os valores para e
são simplesmente os quadrados dos termos
e
no exercício anterior. São respectivamente iguais a 23,04 e 4,41. Logo, as variâncias de
e
são iguais a
= 26,4 - 23,04 = 3,36
= 4,9 - 4,41 = 0,49
Tirando a raiz quadrada de ambos, verificamos que os desvios padrões de e
são respectivamente iguais a 1,83 e 0,7. Com isto, temos tudo o que precisamos para calcular o coeficiente de correlação, que é igual a
= 0,68 / (1,83 * 0,7) = 0,53