segunda-feira, 26 de junho de 2017

Regressão logística usando o spss

Autor: Pedro Henrique Figueiredo


No exemplo será realizada a análise da influência da fraqueza muscular inspiratória no comprometimento da capacidade funcional de uma amostra de pessoas com doença cardiovascular, por meio da regressão logística.


PASSO 1: DEFINIÇÃO E CODIFICAÇÃO DAS VARIÁVEIS
Variável dependente: Comprometimento da Capacidade Funcional (“Baixa_CF”)
Importante: observar se as variáveis dicotômicas estão coerentes com os rótulos de valores. Ex. Baixa capacidade funcional (0 = não / 1 = sim). 

Mudar (0 = não / 1 = sim)
PASSO 2: DETERMINAR A FREQUÊNCIA DO EVENTO DE INTERESSE (comprometimento da capacidade funcional)
- Analisar →Estatística descritiva →Frequências





- Selecionar a variável dependente → ok



PASSO 3: DETERMINAR A ASSOCIAÇÃO ENTRE A VARIÁVEL DEPENDENTE E AS INDEPENDENTES – TESTE QUI-QUADRADO

- Analisar →Estatísticas descritivas → Tabelas de referência cruzada → Estatísticas → Qui-quadrado




- Selecionar as variáveis das linhas e colunas. 
Exemplo: Linhas – Fraqueza inspiratória (variável secundária) 
    Colunas – Comprometimento da Capacidade Funcional (variável primária) 



- Em “Estatísticas” selecionar o quadro “Qui-quadrado” → Continuar → ok



- Repetir este procedimento para todas as variáveis independentes ou preditoras (categóricas).
- Se p < 0,20 → realizar a análise de regressão logística simples ou univariada.


PASSO 4: REGRESSÃO LOGÍSTICA SIMPLES OU UNIVARIADA

- Analisar → Regressão → Logística Binária
Logística multinominal (quando há mais de 2 categorias. Estratificação sarcopenia. Gold. Estratificação sócio-econômica).  





- Selecionar a variável dependente e a preditora (independente).





- Em “categórico” identificar as variáveis categóricas


Importante – categoria de referência adotar o valor “0” inserido na tabela (Valores).  
Mudar (0 = não / 1 = sim). Neste caso, clicar em “primeiro


- Selecionar o indicador da variável preditora que será avaliado na análise.
No Exemplo, o indicador a ser avaliado da variável “fraqueza muscular inspiratória” é o indicador “0” (“sim”), conforme definido e codificado no PASSO 1. Assim, o primeiro indicador (“0”) deve ser selecionado.

No quadro “Alterar contraste” → selecionar “primeiro” → Alterar → Continuar



- Em “Opções” selecionar os itens do quadro “estatísticas e gráficos” → Continuar → ok






- No quadro “Variáveis da equação” observar o Fator de Chances (odds ratio) representado por “Exp(B)” e a significância estatística.





- Se p < 0,10 → incluir a variável preditora na análise de regressão logística múltipla ou multivariada.
- Repetir este procedimento com todas as variáveis independentes.


PASSO 5: REGRESSÃO LOGÍSTICA MÚLTIPLA OU MULTIVARIADA
- Analisar → Regressão → Logística Binária
- Selecionar a variável dependente e as preditoras (independentes).



- Em “categórico” identificar as variáveis categóricas, conforme descrito no “PASSO 4”.



- Em “Opções” selecionar os itens do quadro “estatísticas e gráficos” → Continuar → ok, conforme descrito no “PASSO 4”.

- Determinar o critério de seleção das variáveis independentes no modelo.

“método” → selecionar “Forward: condicional” → ok
Sexo – como é variável categórica, a escolha deve ser pautada na maior frequência (ex. amostra com 60% de homens 1 e 40% de mulheres 40% 2. Clicar em primeiro para esta variável 




No quadro “Variáveis da equação” observar o Fator de Chances (odds ratio) representado por “Exp(B)” e a significância estatística.



B = inclinação da reta (- indica efeito protetor / + indica efeito preditor) 
Exp(B) = fator “razão” de chance entre as probablilidade 

Interpretação: considerando que Exp(B) = 0.893 (sendo B negativo). Necessário subtrair 1 – 0.893 = aproximadamente 12% . A chance da idade comprometer a capacidade funcional é de 12%. Toda vez que B for negativo a razão de chances será menor que 1. Isto representa redução da chance em 12%. 

A chance da fraqueza inspiratória influenciar a capacidade funcional é de 4,53 vezes (isto representa aumento da chance de 350%). B positivo / Exp(B) efeito preditor.

- Os preditores independentes são aqueles com p < 0,05.


PASSO 6: AVALIAR A QUALIDADE DO MODELO - teste de Hosmer e Lemeshow E/OU PSEUDO R2

●Teste de Hosmer e Lemeshow

- No quadro “Teste de Hosmer e Lemeshow” avaliar a significância estatística do teste. O valor de p deve ser ≥ 0,05. 


● Pseudo R2

- No quadro “Resumo do modelo” verificar o valor do “R quadrado de Nagelkerke”. Quanto mais próximo de 1, maior a qualidade do modelo.