Pesquisadores criam uma "tabela periódica" para a inteligência artificial

Pesquisadores criam uma tabela periódica para a inteligência artificial

A inteligência artificial é agora rotineiramente usada para combinar e interpretar diferentes tipos de informações, incluindo texto, imagens, áudio e vídeo. No entanto, um grande obstáculo permanece. Os desenvolvedores devem decidir qual algoritmo é mais adequado para uma tarefa específica, e essa escolha muitas vezes é complicada e demorada no campo em crescimento rápido da…



A inteligência artificial é agora rotineiramente usada para combinar e interpretar diferentes tipos de informações, incluindo texto, imagens, áudio e vídeo. No entanto, um grande obstáculo permanece. Os desenvolvedores devem decidir qual algoritmo é mais adequado para uma tarefa específica, e essa escolha muitas vezes é complicada e demorada no campo em crescimento rápido da IA multimodal.

Físicos da Universidade Emory propuseram uma abordagem mais clara e sistemática. Escrevendo na The Journal of Machine Learning Research, eles descrevem uma nova estrutura matemática que organiza os métodos de IA e orienta o design de algoritmos para problemas específicos.

“Descobrimos que muitos dos métodos de IA mais bem-sucedidos de hoje se reduzem a uma única ideia simples – comprimir vários tipos de dados apenas o suficiente para manter as partes que realmente preveem o que você precisa”, diz Ilya Nemenman, professor de física da Emory e autor sênior do estudo. “Isso nos proporciona uma espécie de ‘tabela periódica’ dos métodos de IA. Diferentes métodos se enquadram em diferentes células, com base nas informações que a função de perda de um método retém ou descarta.”

Uma função de perda é a fórmula matemática que mede quão longe as previsões de um modelo de IA se desviam da resposta correta. Durante o treinamento, o sistema se ajusta continuamente para reduzir esse erro. Quanto menor a perda, melhor o desempenho do modelo.

“As pessoas elaboraram centenas de diferentes funções de perda para sistemas de IA multimodal e algumas podem ser melhores do que outras, dependendo do contexto”, diz Nemenman. “Nos perguntamos se havia uma maneira mais simples do que começar do zero cada vez que enfrentamos um problema em IA multimodal.”

O Framework de Gargalo de Informação Multivariada Variacional

Para abordar essa questão, a equipe criou uma estrutura matemática geral para construir funções de perda específicas para problemas. O método deles se concentra em decidir quais informações devem ser preservadas e quais podem ser descartadas. Eles chamam isso de Framework de Gargalo de Informação Multivariada Variacional.

“Nosso framework é essencialmente como um botão de controle”, diz o coautor Michael Martini, que trabalhou no projeto como pós-doutorando e cientista de pesquisa no grupo de Nemenman. “Você pode ‘ajustar o botão’ para determinar quais informações manter para resolver um problema específico.”

“Nossa abordagem é generalizada e fundamentada”, acrescenta Eslam Abdelaleem, primeiro autor do artigo. Abdelaleem começou o trabalho como candidato a PhD em física na Emory antes de se formar em maio e se mudar para o Georgia Tech como pós-doutorando.

“Nosso objetivo é ajudar as pessoas a projetarem modelos de IA que sejam adaptados ao problema que estão tentando resolver”, diz ele, “ao mesmo tempo que lhes permite entender como e por que cada parte do modelo está funcionando.”

Usando o framework, os desenvolvedores de IA podem propor novos algoritmos, prever quais são mais propensos ao sucesso, estimar quanta quantidade de dados de treinamento precisarão e antecipar possíveis pontos de falha.

“Igualmente importante”, diz Nemenman, “isso pode nos permitir projetar novos métodos de IA que sejam mais precisos, eficientes e confiáveis.”

Uma Perspectiva Baseada em Física sobre Aprendizado de Máquina

Os pesquisadores abordaram o design da IA de forma diferente de muitos na comunidade de aprendizado de máquina.

“A comunidade de aprendizado de máquina está focada em alcançar precisão em um sistema sem necessariamente entender por que um sistema está funcionando”, explica Abdelaleem. “Como físicos, no entanto, queremos entender como e por que algo funciona. Portanto, nos concentramos em encontrar princípios fundamentais e unificadores para conectar diferentes métodos de IA.”

Abdelaleem e Martini começaram a trabalhar em equações manualmente, buscando a ideia central por trás da complexidade das técnicas modernas de IA.

“Passamos muito tempo sentados no meu escritório, escrevendo em um quadro branco”, diz Martini. “Às vezes eu estava escrevendo em uma folha de papel enquanto Eslam olhava por cima do meu ombro.”

O esforço se estendeu por vários anos. Eles desenvolveram fundamentos matemáticos, os revisaram com Nemenman, testaram ideias em computadores e muitas vezes tiveram que voltar ao quadro de desenho após perseguirem abordagens que não funcionaram.

“Foi muita tentativa e erro e voltar ao quadro branco”, diz Martini.

Um Momento Eureka e uma Surpresa do Smartwatch

O grande avanço surgiu quando identificaram um único princípio que descrevia o equilíbrio entre comprimir dados e reconstruí-los. A ideia capturou a troca no coração de muitos métodos de IA.

“Testamos nosso modelo em dois conjuntos de dados e mostramos que ele estava automaticamente descobrindo características compartilhadas e importantes entre eles”, diz Martini. “Isso foi gratificante.”

Após o intenso esforço que levou a essa percepção, Abdelaleem verificou seu smartwatch Samsung Galaxy ao deixar o campus. O dispositivo usa IA para monitorar sinais de saúde, como frequência cardíaca. No entanto, naquele dia, ele leu erroneamente sua empolgação.

“Meu relógio disse que eu havia estado pedalando por três horas”, diz Abdelaleem. “Foi assim que ele interpretou o nível de empolgação que eu estava sentindo. Eu pensei: ‘Uau, isso realmente é algo! Aparentemente, a ciência pode ter esse efeito.’

Testando o Framework e Olhando para o Futuro

Para avaliar sua abordagem, a equipe aplicou o framework a dezenas de métodos de IA existentes.

“Realizamos demonstrações em computadores que mostram que nosso framework geral funciona bem com problemas de teste em conjuntos de dados de referência”, diz Nemenman. “Podemos derivar funções de perda com mais facilidade, o que pode resolver os problemas que nos importam com menores quantidades de dados de treinamento.”

Como o framework ajuda a eliminar características desnecessárias, ele também pode reduzir as demandas computacionais dos sistemas de IA.

“Ao ajudar a guiar a melhor abordagem de IA, o framework evita codificar características que não são importantes”, diz Nemenman. “Quanto menos dados forem necessários para um sistema, menos poder computacional será necessário para executá-lo, tornando-o menos prejudicial ao meio ambiente. Isso também pode abrir a porta para experimentos de fronteira para problemas que não conseguimos resolver agora porque não há dados existentes suficientes.”

Os pesquisadores esperam que outros apliquem o framework para projetar algoritmos adaptados a desafios científicos específicos.

Eles também estão continuando a expandir o trabalho por conta própria. Uma área de interesse é a biologia, incluindo esforços para identificar padrões relacionados à função cognitiva.

“Quero entender como seu cérebro comprime e processa simultaneamente várias fontes de informação”, diz Abdelaleem. “Podemos desenvolver um método que nos permita ver as semelhanças entre um modelo de aprendizado de máquina e o cérebro humano? Isso pode nos ajudar a entender melhor ambos os sistemas.”


Posts Similares

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *