Como Interpretar a Significância Estatística
Quase todos os dias nos deparamos com o conceito de “significância estatística” dos resultados de um estudo clínico, geralmente avaliada através da expressão “p<0,05” ou semelhantes. Mas, na realidade, o que significa isso em termos de verdade científica? O termo “nível de significância” não costuma ser adequadamente entendido pelos médicos na prática clínica.
Na linguagem coloquial, o termo “significante” quer dizer “algo importante” ao passo que, na linguagem estatística, esse termo tem o significado de “provavelmente verdadeiro” e, portanto, não resultante de uma situação aleatória. Um achado científico pode ser verdadeiro sem ser necessariamente importante. Quando os estaticistas dizem que um resultado é “altamente significante”, isto significa que a hipótese que está sendo testada é muito provavelmente verdadeira. Da mesma forma, em ciência, o fato de uma diferença entre tratamentos, por exemplo, ser estatisticamente significante, isso não significa necessariamente que esta diferença seja clinicamente importante ou interessante.
A definição do limite do valor de p deve ser feita antes do início do estudo. Em geral, o valor de p<0,05 ou menor significa que estamos assumindo uma probabilidade de apenas 5% de que a diferença encontrada no estudo clínico não seja verdadeira, apesar de, estatisticamente, ter sido assim demonstrada. Quanto menor o valor de p, menor será a probabilidade disso acontecer. De uma forma geral, os resultados de um estudo clínico podem variar de “não significante” até “extremamente significante”, como mostra a tabela a seguir.
Significância Estatística, conforme o valor de P
A definição do limite do valor de p deve ser feita antes do início do estudo. Em geral, o valor de p<0,05 ou menor significa que estamos assumindo uma probabilidade de apenas 5% de que a diferença encontrada no estudo clínico não seja verdadeira, apesar de, estatisticamente, ter sido assim demonstrada. Quanto menor o valor de p, menor será a probabilidade disso acontecer. De uma forma geral, os resultados de um estudo clínico podem variar de “não significante” até “extremamente significante”, como mostra a tabela a seguir.
Significância Estatística, conforme o valor de P
Valor de P
|
Significado
|
>0,05
|
Não significante
|
0,01 a 0,05
|
Significante
|
0,001 a 0,01
|
Muito significante
|
<0,001
|
Extremamente significante
|
Alguns cientistas discordam dessa qualificação da significância estatística, segundo a qual um p = 0,0001 seria mais significante do que um p = 0,04. Segundo esses especialistas, uma vez definido o limite do valor de p, cada resultado é estatisticamente significante ou não significante, independentemente do seu valor.
Num texto muito bem humorado, publicado na revista eletrônica Medscape Business of Medicine, em 02 de março de 2006, Andrew J. Vickers, Assistente de Metodologia de Pesquisa do Hospital Memorial Sloan-Kettering Cancer Center, de Nova Iorque, aborda o problema da significância estatística das diferenças detectadas em estudos clínicos através de um exemplo corriqueiro e interessante. Para ir de bicicleta de casa ao trabalho, Vickers tinha duas opções: seguir por uma avenida muito movimentada ou por um caminho alternativo muito agradável e arborizado. Para avaliar qual o caminho mais rápido, ele mediu o tempo de percurso das duas opções, com um número suficientemente elevado de determinações (n) e concluiu que o caminho pela avenida muito movimentada apresentava um tempo de percurso apenas 57,3 segundos menor do que o tempo de percurso da alternativa mais tranqüila.
Num texto muito bem humorado, publicado na revista eletrônica Medscape Business of Medicine, em 02 de março de 2006, Andrew J. Vickers, Assistente de Metodologia de Pesquisa do Hospital Memorial Sloan-Kettering Cancer Center, de Nova Iorque, aborda o problema da significância estatística das diferenças detectadas em estudos clínicos através de um exemplo corriqueiro e interessante. Para ir de bicicleta de casa ao trabalho, Vickers tinha duas opções: seguir por uma avenida muito movimentada ou por um caminho alternativo muito agradável e arborizado. Para avaliar qual o caminho mais rápido, ele mediu o tempo de percurso das duas opções, com um número suficientemente elevado de determinações (n) e concluiu que o caminho pela avenida muito movimentada apresentava um tempo de percurso apenas 57,3 segundos menor do que o tempo de percurso da alternativa mais tranqüila.
A significância estatística dessa diferença foi de p = 0,0001, portanto, altamente significante. Mas, na prática, chegou à conclusão de que, apesar da alta significância encontrada, ele decidiu pela alternativa do caminho mais tranqüilo que lhe proporcionava prazer pessoal e qualidade de vida, embora durasse quase um minuto a mais. Usando este exemplo, ele afirma que, em ciência, o que parece importar é o teste de hipóteses e a significância estatística. Na verdade, os achados estatísticos devem necessariamente ser interpretados sob a perspectiva de outras variáveis não quantificadas no estudo, como por exemplo, a qualidade de vida, a freqüência de eventos adversos, o custo relativo do tratamento, entre outros. Em outras palavras, os dados estatísticos devem ser interpretados como uma bússola e não como uma rota terapêutica obrigatória que não considere outras variáveis psicológicas, sociais e econômicas.
Referências Bibliográficas
- Interpreting Statistical Significance. The Prism Guide to Interpreting Statistical Results. Acesso em 20 de março de 2007.
- Interpreting P Values. The Prism Guide to Interpreting Statistical Results. Acesso em 20 de março de 2007.
- To P or Not to P: Why Use a P Value, Anyway? Vickers, AJ. Medscape Business of Medicine. 2006;7(1). Acesso em 20 de março de 2007.
- Statistical Significance. The Survey System. Acesso em 20 de março de 2007.
Sem comentários:
Enviar um comentário