Variáveis Qualitativas e Quantitativas
em 28 de Outubro de 2021
Tabelas de frequência
Uma tabela de frequência é uma tabela utilizada para condensar as informações do conjunto de dados, que por sua vez pode ser muito extenso, facilitando a análise dos mesmos.
Exemplo.
Considere a seguinte tabela com dados de uma pesquisa feita numa certa faculdade:
Sexo | Tamanho da Camisa | Cor Preferida |
Prática de Esportes (Hrs/Semana) |
Satisfeito com o curso escolhido? | Idade |
M | G | AZUL | 3 horas | SIM | 21 |
F | M | VIOLETA | 4 horas | SIM | 22 |
F | M | AZUL | 5 horas | NÃO | 23 |
M | G | VERDE | 7 horas | NÃO | 43 |
M | P | BRANCO | 4 horas | SIM | 46 |
F | PP | VERDE | 6 horas | NÃO | 25 |
M | P | AZUL | 0 horas | SIM | 24 |
F | M | ROSA | 2 horas | SIM | 32 |
M | M | AZUL | 4 horas | NÃO | 33 |
M | M | DOURADA | 15 horas | SIM | 20 |
M | M | VERDE | 10 horas | NÃO | 21 |
A partir dela, podemos criar novas "sub-tabelas" constituindo uma visão melhor dos dados com as seguintes definições:
A frequência absoluta é a quantidade total que cada item aparece. Por exemplo, foram 7 pessoas do sexo masculino, enquanto 4 do sexo masculino. Portanto, a frequência da variável sexo masculino é 7, enquanto a do feminino é 4.
A frequência relativa é a proporção (divisão) entre a frequência absoluta de cada variável e todos os resultados. Por exemplo, a frequência relativa do sexo masculino é igual a 7/11, pois de 11 (total) 7 são do sexo masculino (frequência absoluta do sexo masculino). Da mesma forma, a do sexo feminino é 4/11. A frequência relativa pode, ainda, ser olhada como uma porcentagem.
A tabela de frequência da classe sexo ficaria assim:
SEXO | Frequência absoluta | Frequência relativa |
Masculino | 7 | 7/11 |
Feminino | 4 | 4/11 |
Total | 11 | 1 |
Em situações que a variável é quantitativa contínua ou pode ser transformada em uma num contexto, ou quando for possível (até para discretas), utilizam-se classes de frequência que são intervalos da reta que contém as observações. Por exemplo, em relação à prática de esportes poderíamos dividir as classes em intervalos de duas horas: pessoas que praticam de 0-4 horas; 4-8; etc. E ficamos com o seguinte:
Prática de esportes | Frequência absoluta | Frequência relativa |
[0,4[ | 3 | 3/11 |
[4,8[ | 6 | 6/11 |
[8,12[ | 1 | 1/11 |
[12,16[ | 1 | 1/11 |
Total | 11 | 1 |
Além destas, podemos utilizar, ainda, a frequência acumulada, a qual é a soma das relativas anteriores à determinada variável juntamente com sua frequência relativa. Por exemplo, na tabela anterior, a frequência acumulada ao primeiro intervalo de horas seria exatamente sua frequência relativa, já que não possui um intervalo antecessor. No segundo intervalo, sua frequência acumulada seria a soma das frequências relativas anteriores com a sua, isto é, 3/11 + 6/11 = 9/11. Portanto, acrescentando esta coluna, a tabela de horas de exercício praticada ficaria assim:
Prática de esportes | Frequência absoluta | Frequência relativa | Frequência acumulada |
[0,4[ | 3 | 3/11 | 3/11 |
[4,8[ | 6 | 6/11 | 9/11 |
[8,12[ | 1 | 1/11 | 10/11 |
[12,16[ | 1 | 1/11 | 1 |
Total | 11 | 1 | -------------------------- |
A coluna de frequência acumulada é muito útil em determinados casos. Por exemplo: se eu quisesse saber quantos porcentos dos alunos entrevistados praticam menos de 8 horas de exercícios semanais? Eu observo a frequência acumulada até a segunda classe. Ela vai me fornecer a porcentagem das pessoas que praticam até (excetuando) 8 horas: 9/11=81,81%.
Poderíamos fazer o mesmo com as outras classes da primeira tabela. Uma sugestão é "converter" a variável idade (que aqui na tabela estamos considerando quantitativa discreta), podendo dividi-la em classes; por exemplo 20 a 30 anos, 30 a 40 anos e 40 a 50 anos:
Idade | Frequência absoluta | Frequência relativa | Frequência acumulada |
[20,30[ | 7 | 7/11 | 7/11 |
[30,40[ | 2 | 2/11 | 9/11 |
[40,50[ | 2 | 2/11 | 1 |
Total | 11 | 1 | -------------------------- |