Modelo Diferenças em Diferenças (Dif-in-Dif)
em 13 de Novembro de 2024
A regressão logística é uma técnica estatística poderosa usada para modelar a probabilidade de um evento ocorrer com base em uma ou mais variáveis independentes. Frequentemente aplicada em áreas como epidemiologia, marketing e pesquisa social, ela permite prever a presença ou ausência de uma característica ou resultado com base em valores de dados categóricos e contínuos.
Vamos considerar um estudo fictício que investiga o efeito do sexo e do tipo de tratamento na cura de uma doença. Os dados são coletados para três variáveis categóricas: cura (sim ou não), sexo (masculino ou feminino) e tratamento (A, B ou C).
Na regressão logística, a probabilidade de um evento (Y=1) é modelada pela seguinte fórmula:
Aqui, X1 representa o sexo (1 para masculino e 0 para feminino), X2 e X3 representam os tratamentos A e B, respectivamente, com o tratamento C como referência (X2 = X3 = 0).
Para este exemplo, temos as seguintes estimativas para os parâmetros:
A equação logística com essas estimativas é:
Vamos agora calcular a probabilidade de cura para um indivíduo do sexo masculino sob tratamento A e B.
Para um indivíduo do sexo masculino (X1 = 1) sob tratamento A (X2 = 1, X3 = 0):
A probabilidade de cura (PPP) pode ser calculada como:
Portanto, a probabilidade de cura para um indivíduo do sexo masculino que recebe o tratamento A é de aproximadamente 82.1%.
Agora, vamos comparar a chance de cura entre os tratamentos A e B para indivíduos do sexo masculino.
Para um indivíduo do sexo masculino sob tratamento B (X2 = 0, X3 = 1):
Portanto, a probabilidade de cura para um indivíduo do sexo masculino que recebe o tratamento B é de aproximadamente 86.6%.
Para comparar as chances de cura entre os tratamentos A e B, calculamos a razão das odds:
Isso significa que a chance de cura para um indivíduo do sexo masculino que recebe o tratamento B é aproximadamente 1.4 vezes maior do que para um indivíduo que recebe o tratamento A.
Este exemplo destaca como a regressão logística pode ser aplicada para entender e prever resultados binários com base em variáveis explicativas. No nosso estudo fictício, vimos que o tratamento A oferece uma alta chance de cura para indivíduos do sexo masculino (82.1%), mas o tratamento B aumenta ainda mais essa chance para 86.6%, sendo 1.4 vezes mais eficaz que o tratamento A.
Você está interessado em aplicar a regressão logística em seus projetos? Entre em contato para saber mais sobre como podemos ajudar você a transformar seus dados em análises!
Entre em contato através do link:
#estatistica #dados #cientistadedados #popstat #natxtat #mentoria #concurso