Nova inovação preditiva apresenta resultados surpreendentemente próximos da realidade
Um grupo internacional de matemáticos liderado pelo estatístico da Universidade Lehigh, Taeho Kim, desenvolveu uma nova forma de gerar previsões que se alinham mais de perto com os resultados do mundo real. O método deles visa melhorar o prognóstico em diversas áreas da ciência, especialmente na pesquisa em saúde, biologia e ciências sociais. Os pesquisadores…
Um grupo internacional de matemáticos liderado pelo estatístico da Universidade Lehigh, Taeho Kim, desenvolveu uma nova forma de gerar previsões que se alinham mais de perto com os resultados do mundo real. O método deles visa melhorar o prognóstico em diversas áreas da ciência, especialmente na pesquisa em saúde, biologia e ciências sociais.
Os pesquisadores chamam sua técnica de Previsor Linear de Máxima Concordância, ou MALP. Seu objetivo central é aumentar a correspondência entre os valores previstos e os observados. O MALP faz isso maximizando o Coeficiente de Correlação de Concordância, ou CCC. Essa medida estatística avalia como os pares de números caem ao longo da linha de 45 graus em um gráfico de dispersão, refletindo tanto a precisão (quão perto os pontos estão uns dos outros) quanto a exatidão (quão próximos estão dessa linha). Métodos tradicionais, incluindo o amplamente utilizado método dos mínimos quadrados, geralmente tentam reduzir o erro médio. Embora eficazes em muitas situações, esses métodos podem falhar quando o objetivo principal é assegurar um forte alinhamento entre previsões e valores reais, diz Kim, professor assistente de matemática.
“Às vezes, não queremos apenas que nossas previsões estejam próximas – queremos que elas tenham a maior concordância possível com os valores reais”, explica Kim. “A questão é como podemos definir a concordância de dois objetos de uma maneira cientificamente significativa? Uma maneira de conceituar isso é quão próximos os pontos estão alinhados com uma linha de 45 graus em um gráfico de dispersão entre o valor previsto e os valores reais. Então, se o gráfico de dispersão mostrar um forte alinhamento com essa linha de 45 graus, poderíamos dizer que existe um bom nível de concordância entre os dois.”
Por Que a Concordância É Mais Importante do Que uma Simples Correlação
De acordo com Kim, as pessoas frequentemente pensam primeiro no coeficiente de correlação de Pearson quando ouvem a palavra concordância, uma vez que é apresentado no início da educação estatística e continua sendo uma ferramenta fundamental. O método de Pearson mede a força de uma relação linear entre duas variáveis, mas não verifica especificamente se a relação se alinha com a linha de 45 graus. Por exemplo, ele pode detectar correlações fortes para linhas que se inclinam em 50 graus ou 75 graus, contanto que os pontos de dados fiquem próximos a uma linha reta, diz Kim.
“No nosso caso, estamos especificamente interessados no alinhamento com uma linha de 45 graus. Para isso, usamos uma medida diferente: o coeficiente de correlação de concordância, introduzido por Lin em 1989. Essa métrica foca especificamente em quão bem os dados se alinham com uma linha de 45 graus. O que desenvolvemos é um previsor projetado para maximizar a correlação de concordância entre valores previstos e valores reais.”
Testando o MALP com Exames Oculares e Medidas Corporais
Para avaliar o desempenho do MALP, a equipe conduziu testes usando dados simulados e medições reais, incluindo exames oculares e avaliações de gordura corporal. Um estudo aplicou o MALP a dados de um projeto de oftalmologia comparando dois tipos de dispositivos de tomografia de coerência óptica (OCT): o antigo Stratus OCT e o mais recente Cirrus OCT. À medida que os centros médicos migram para o sistema Cirrus, os médicos precisam de uma maneira confiável de traduzir medições para que possam comparar resultados ao longo do tempo. Usando imagens de alta qualidade de 26 olhos esquerdos e 30 olhos direitos, os pesquisadores examinaram quão precisamente o MALP poderia prever leituras do Stratus OCT a partir de medições do Cirrus OCT e compararam seu desempenho com o método dos mínimos quadrados. O MALP produziu previsões que se alinharam mais de perto com os valores reais do Stratus, enquanto os mínimos quadrados ligeiramente superaram o MALP na redução do erro médio, destacando um trade-off entre concordância e minimização do erro.
A equipe também analisou um conjunto de dados de gordura corporal de 252 adultos que incluía peso, tamanho do abdômen e outras medidas corporais. Medidas diretas da porcentagem de gordura corporal, como a pesagem subaquática, são confiáveis, mas caras, portanto, medidas mais fáceis são frequentemente substituídas. O MALP foi usado para estimar a porcentagem de gordura corporal e foi avaliado em comparação com o método dos mínimos quadrados. Os resultados foram semelhantes ao estudo de exames oculares: o MALP ofereceu previsões que se alinharam mais de perto com os valores reais, enquanto os mínimos quadrados novamente apresentaram erros médios ligeiramente inferiores. Esse padrão repetido sublinhou o equilíbrio contínuo entre concordância e minimização do erro.
Escolhendo a Ferramenta Certa para Tarefa Certa
Kim e seus colegas observaram que o MALP frequentemente fornecia previsões que corresponderam mais efetivamente aos dados reais do que as técnicas padrão. Mesmo assim, eles notam que os pesquisadores devem escolher entre o MALP e métodos mais tradicionais com base em suas prioridades específicas. Quando a redução do erro geral é o objetivo principal, métodos estabelecidos ainda têm um bom desempenho. Quando a ênfase está em previsões que se alinham o mais próximo possível dos resultados reais, o MALP muitas vezes é a opção mais forte.
O impacto potencial deste trabalho se estende a muitas áreas científicas. Ferramentas de previsão aprimoradas poderiam beneficiar a medicina, a saúde pública, a economia e a engenharia. Para pesquisadores que dependem de previsões, o MALP oferece uma alternativa promissora, especialmente quando alcançar uma concordância próxima com os resultados do mundo real é mais importante do que simplesmente reduzir a média da diferença entre os valores previstos e observados.
“Precisamos investigar mais”, diz Kim. “Atualmente, nosso contexto está dentro da classe de preditores lineares. Esse conjunto é grande o suficiente para ser utilizado praticamente em várias áreas, mas ainda é restrito do ponto de vista matemático. Portanto, desejamos estender isso para a classe geral, de modo que nosso objetivo seja remover a parte linear e assim se tornar o Previsor de Máxima Concordância.”
