Olá Jéssica.
Uma causa possível é que o script tenha incluído uma diversidade pequena de variáveis. Outra causa costumeira, é que a entrevista tenha sido feita de maneira não uniforme pelos entrevistadores. Se os respondentes tiveram entendimentos diferentes sobre o que estava sendo inquirido, a sua amostra foi contaminada.
Existem técnicas para avaliar a coerência da massa de dados das respostas e , eventualmente poderia ser possível até mesmo recuperar sua validade.
Recomendo ler a dissertação "Estratégias para Tratamento de Variáveis com Dados Faltantes durante o Desenvolvimento de Modelos Preditivos; 2012; Dissertação (Mestrado em Estatística) - Universidade de São Paulo,; Orientador: Lucia Pereira Barroso;".
Fique à vontade para me contatar.
Espero que tenha sido útil este comentário.
Se julgar adequado, por favor curta esta resposta no Profes.