A evidência mais surpreendente de que a inteligência artificial pode propiciar avanços científicos profundos veio com o lançamento de um programa cham
A evidência mais surpreendente de que a inteligência artificial pode propiciar avanços científicos profundos veio com o lançamento de um programa chamado AlphaFold pelo Google DeepMind. Em 2016, pesquisadores da empresa haviam alcançado um grande sucesso com o AlphaGo, um sistema de IA que, depois de ter aprendido praticamente sozinho as regras do Go, passou a vencer os jogadores humanos mais bem ranqueados do jogo, às vezes usando táticas que ninguém jamais havia imaginado. Isso encorajou a empresa a construir um sistema que viria a trabalhar com um conjunto de regras muito mais complexo: as leis por meio das quais a sequência de aminoácidos que define uma proteína específica leva ao formato com que essa sequência se dobra quando a proteína é produzida de fato. O AlphaFold compreendeu essas regras e as aplicou com um sucesso impressionante.
A conquista foi notável e também útil. Notável porque muitos humanos inteligentes tinham passado décadas se esforçando para criar modelos computacionais dos processos que transformam cadeias de aminoácidos em proteínas. O AlphaFold superou os melhores esforços deles de maneira quase tão acachapante quanto o sistema que o havia inspirado derrotara jogadores humanos de Go. Útil porque o formato de uma proteína é de imensa importância prática: define o que a proteína faz e o que outras moléculas podem fazer com ela. Todos os processos básicos da vida dependem do que certas proteínas específicas fazem.
Encontrar moléculas que façam coisas desejáveis com as proteínas (às vezes bloqueando sua ação, às vezes a estimulando) é o objetivo da grande maioria dos programas mundiais de desenvolvimento de fármacos.
Devido à importância da estrutura tridimensional das proteínas, existe toda uma subdisciplina dedicada a ela: a biologia estrutural.
Esse campo faz uso de todo tipo de tecnologia para observar proteínas, por meio de técnicas de ressonância magnética nuclear ou fazendo-as cristalizar (o que pode ser muito difícil) e depois as explodindo com raios X. Antes do AlphaFold, mais de meio século de biologia estrutural havia produzido algumas centenas de milhares de estruturas proteicas confiáveis a partir desses métodos. O AlphaFold e seus rivais (mais notavelmente, um programa feito pela Meta) já forneceram previsões detalhadas dos formatos de mais de 600 milhões.
É difícil pensar em algo que possa deixar os cientistas ainda mais boquiabertos. Mas, se os produtos do AlphaFold impressionaram o mundo, seus princípios básicos são bem típicos daquilo que a aprendizagem profunda e a IA generativa podem oferecer à biologia. Treinado em dois tipos de dados (sequências de aminoácidos e descrições tridimensionais das formas com que se dobram), o AlphaFold encontrou padrões que lhe permitiram usar o primeiro tipo para prever o segundo. Nem todas as previsões são perfeitas. Chris Gibson, chefe da Recursion Pharmaceuticals, startup de descoberta de medicamentos que faz uso intensivo de IA e tem sede em Utah, diz que sua empresa trata os resultados do AlphaFold como hipóteses a serem testadas e validadas experimentalmente. Nem todas dão certo. Mas o Dr. Gibson diz que o modelo está melhorando rápido.
Sonhos de cristal
É o que toda uma série de pesquisadores estão fazendo agora no mundo da biomedicina e, mais especificamente, na pesquisa de medicamentos: levantando hipóteses sobre o mundo que os cientistas não conseguiriam imaginar por si mesmos. Treinados para encontrar padrões que se estendem por imensos conjuntos de dados díspares, os sistemas de IA conseguem descobrir relações dentro desses dados que têm implicações para a biologia humana e as doenças. Apresentados a dados novos, eles usam esses padrões para produzir novas hipóteses que podem, então, ser testadas.
A capacidade da IA para gerar novas ideias proporcionam a seus usuários conhecimentos que podem ajudar a identificar alvos farmacológicos e a prever o comportamento de novos compostos – às vezes nunca antes imaginados – que podem atuar como medicamentos. A IA também vem sendo empregada para encontrar novas aplicações para drogas antigas, prever efeitos colaterais de fármacos novos e encontrar maneiras de distinguir os pacientes que um medicamento pode ajudar daqueles que ele pode prejudicar.
Essas ambições computacionais não são novas. A computação em grande escala, o aprendizado de máquina e o design de fármacos já estavam se conectando na década de 2000, diz Vijay Pande, que à época era pesquisador na Universidade de Stanford. Isso foi, em parte, uma resposta à onda de novas descobertas da biologia: agora mais de um milhão de artigos de pesquisa biomédica são publicados todos os anos.
Uma das primeiras contribuições da IA para esse cenário foram os “gráficos de conhecimento”, que permitiram que todas essas informações fossem lidas por máquinas e extraídas para obter insights sobre, por exemplo, quais proteínas no sangue poderiam ser usadas como biomarcadores da presença ou da gravidade de determinada doença. Em 2020, a Benevolentai, com sede em Londres, usou esse método para avaliar o potencial do Baricitinibe – vendido pela Eli Lilly para artrite reumatoide – no tratamento da covid-19.
Em janeiro deste ano, uma pesquisa publicada na Science descreveu como algoritmos de IA de um tipo diferente aceleraram os esforços para encontrar biomarcadores de covid longa no sangue. As abordagens estatísticas que podem levar à descoberta de tais biomarcadores muitas vezes são desafiadoras, dada a complexidade dos dados. As IAs proporcionam uma forma de eliminar esse ruído e avançar nesse processo no caso de doenças novas, como a covid longa, ou difíceis de diagnosticar, como as fases iniciais do Alzheimer.
A hora é agora
Mas, apesar desse progresso dos anos passados, o Dr. Pande, agora na Andreessen Horowitz, empresa de capital de risco que é forte em IA, pensa que os avanços mais recentes marcam uma mudança radical. A pesquisa biomédica, especialmente nas áreas da biotecnologia e da indústria farmacêutica, vinha aumentando sua dependência da automação e da engenharia até os novos modelos de base virarem realidade. Agora as duas coisas parecem se reforçar mutuamente. Os novos modelos de base não apenas fornecem um jeito de lidar com grandes volumes de dados: eles os exigem. Os montes de dados confiáveis que laboratórios altamente automatizados produzem em abundância são perfeitos para treinar modelos de base. E os pesquisadores biomédicos precisam de toda a ajuda possível para compreender as torrentes de dados que agora são capazes de gerar.
Ao encontrar padrões que os humanos nem imaginavam procurar – ou não tinham esperança de encontrar sem ajuda – a IA proporciona aos pesquisadores novas formas de explorar e compreender os mistérios da vida. Alguns falam na IA dominando a “linguagem da biologia”, aprendendo a compreender o que a evolução forjou diretamente a partir dos dados – da mesma forma que, treinada em linguagem verbal, consegue gerar frases fluentes e com sentido que jamais foram pronunciadas.
Demis Hassabis, chefe da DeepMind, diz que se pode pensar na própria biologia como “um sistema de processamento de informação, ainda que extraordinariamente complexo e dinâmico”. Em uma publicação no Medium, Serafim Batzoglou, diretor de dados da Seer Bio, empresa do Vale do Silício especializada em observar como as proteínas se comportam, prevê o surgimento de modelos de base abertos que irão integrar dados tão díspares quanto sequências de genoma e prontuários médicos. Esses modelos, argumenta ele, vão acelerar muito a inovação e promover o avanço da medicina de precisão.
Assim como muitos dos entusiastas da IA, o Dr. Pande fala de uma “revolução industrial mudando tudo”. Mas sua compreensão de todo o processo que foi necessário até aqui o obriga a alertar que as conquistas que justificariam esse entusiasmo a longo prazo não vão surgir da noite para o dia: “Estamos vivendo um período de transição, em que as pessoas podem ver a diferença, mas ainda há muito trabalho a se fazer”.
Todos os dados de todos os lugares ao mesmo tempo
Muitas empresas farmacêuticas fizeram investimentos significativos no desenvolvimento de modelos de base nos últimos anos. Paralelamente, houve um aumento de startups centradas em IA, como Recursion, Genesis Therapeutics, com sede no Vale do Silício, Insilico, com sede em Hong Kong e Nova York, e Relay Therapeutics, em Cambridge, Massachusetts. Daphne Koller, chefe da Insitro, empresa de biotecnologia em IA no sul de São Francisco, diz que um sinal dos tempos é que ela não precisa mais explicar o que são grandes modelos de linguagem e aprendizagem auto-supervisionada. E a Nvidia – que fabrica as unidades de processamento gráfico essenciais para alimentar os modelos de base – demonstrou grande interesse. No ano passado, a Nvidia investiu ou fez acordos de parceria com pelo menos seis empresas de biotecnologia focadas em IA, entre elas a Schrodinger, outra empresa sediada em Nova York, a Genesis, a Recursion e a Genentech, uma subsidiária independente da Roche, a gigante farmacêutica suíça.
Os modelos de descoberta de medicamentos com os quais muitas empresas estão trabalhando podem aprender com uma ampla variedade de dados biológicos, como sequências genéticas, imagens de células e tecidos, estruturas de proteínas relevantes, biomarcadores no sangue, proteínas produzidas em células específicas e dados clínicos sobre o curso da doença e o efeito dos tratamentos nos pacientes. Uma vez treinadas, as IAs podem ser ajustadas com dados rotulados para aprimorar suas capacidades.
O uso de dados de pacientes é particularmente interessante. Por razões óbvias, muitas vezes não é possível descobrir o funcionamento exato de uma doença em humanos por meio de experiências. Portanto, o desenvolvimento de fármacos geralmente depende muito de modelos animais, embora estes possam ser enganosos. As IAs que são treinadas e sintonizadas com a biologia humana podem ajudar a evitar alguns dos becos sem saída que atrapalham o desenvolvimento de remédios.
A Insitro, por exemplo, treina seus modelos em lâminas de patologia, sequências genéticas, dados de ressonância magnética e proteínas do sangue. Um de seus modelos consegue associar mudanças na aparência das células ao microscópio com mutações no genoma e com resultados clínicos em várias doenças diferentes. A empresa espera utilizar estas e outras técnicas semelhantes para encontrar maneiras de identificar subgrupos de pacientes de câncer que poderão ter resultados particularmente bons com tratamentos específicos.
Às vezes, descobrir a qual aspecto dos dados uma IA está respondendo é útil por si só. Em 2019, a Owkin, uma empresa de IA e biotecnologia sediada em Paris, publicou detalhes sobre uma rede neural profunda treinada para prever a sobrevida em pacientes com mesotelioma maligno – um câncer no tecido que envolve os pulmões – a partir de amostras de tecido em lâminas. A tecnologia descobriu que as células que mais tinham a ver com as previsões da IA não eram as células cancerosas em si, mas sim as células não cancerosas vizinhas. A equipe da Owkin trouxe outros dados celulares e moleculares para o cenário e descobriu um novo alvo farmacológico. Em agosto do ano passado, uma equipe de cientistas da Universidade de Indiana, em Bloomington, treinou um modelo com dados sobre como as células cancerígenas reagem a medicamentos (incluindo informações genéticas), o que lhes permite prever a eficácia de um fármaco no tratamento de determinado tipo de câncer.
Muitas das empresas que usam IA precisam de volumes tão grandes de dados de alta qualidade que, em vez de ficarem esperando que sejam publicados em algum outro lugar, estão gerando esses dados elas mesmas, como parte dos seus programas de desenvolvimento de fármacos. Uma variação desse tema vem de uma nova unidade de ciências computacionais da Genentech que usa uma abordagem de “laboratório em circuito” para treinar sua IA. As previsões do sistema são testadas em larga escala por meio de experimentos em sistemas de laboratório automatizados. Os resultados desses experimentos então são usados para treinar a IA mais uma vez e aumentar sua precisão. A Recursion, que se vale de uma estratégia semelhante, afirma que pode usar robótica laboratorial automatizada para conduzir 2,2 milhões de experimentos por semana.
A ideia é mudar
À medida que as empresas farmacêuticas se mostram cada vez mais ávidas por dados, as preocupações com a privacidade dos pacientes ficam mais relevantes. Uma forma de lidar com o problema, usada pela Owkin e outras, é a “aprendizagem federada”, na qual os dados de treinamento necessários para construir um atlas de tipos de células cancerígenas nunca saem do hospital que armazenam as amostras de tecido: o que os dados podem oferecer em termos de treinamento é levado para outro lugar. Os dados ficam.
As implicações da IA vão além da compreensão da doença e de como intervir. Modelos generativos, como o Proteinsgm da Universidade de Toronto, agora são ferramentas poderosas no desenho de proteínas, porque são capazes não apenas de imaginar proteínas existentes, mas também de projetar novas – com características desejadas – que ainda não existem na natureza. Outros sistemas possibilitam que os químicos projetem pequenas moléculas que podem ser úteis como medicamentos, pois interagem com o alvo da maneira certa.
As hipóteses da IA precisam ser verificadas a cada estágio. Mesmo assim, tal abordagem parece acelerar as descobertas. Uma análise recente sobre medicamentos de empresas intensivas em IA realizada pela consultoria BCG concluiu que dos oito medicamentos para os quais havia informação disponível, cinco tinham chegado aos ensaios clínicos em menos tempo do que o normal. Outro trabalho sugere que a IA poderia gerar economias de 25% a 50% em termos de tempo e gastos na fase pré-clínica do desenvolvimento de fármacos, a qual costuma levar de quatro a sete anos. Dado o custo em tempo e dinheiro de todo o processo, que pode chegar a vários bilhões de dólares para um único medicamento, as melhorias poderiam transformar a produtividade da indústria. Mas levará algum tempo para sabermos com certeza. As linhas de produção ainda são lentas; e nenhuma dessas novas drogas prometidas chegou ao mercado até agora.
A Insilico Medicine é uma das empresas interessadas nessa mudança. Ela usa uma variedade de modelos em seu processo de desenvolvimento de fármacos. Um deles identifica as proteínas que podem ser direcionadas para afetar uma doença. Outro consegue projetar novos compostos medicamentosos em potencial. Utilizando esta abordagem, a empresa identificou um candidato a medicamento que poderá ser útil contra a fibrose pulmonar, tudo em menos de 18 meses e a um custo de US$ 3 milhões – uma fração do custo normal. A droga iniciou os testes de fase 2 recentemente.
Muitas empresas farmacêuticas na China estão fazendo acordos com empresas dedicadas à IA, como a Insilico, na esperança de chegar a resultados semelhantes. Alguns esperam que tais acordos possam impulsionar os negócios de desenvolvimento de fármacos chineses, que crescem relativamente devagar. As organizações de pesquisa contratadas da China já estão sentindo os benefícios do interesse por novas moléculas no mundo todo. O investimento na descoberta de medicamentos por IA na China foi de mais de US$ 1,26 bilhão de dólares em 2021.
O mundo assistiu à ascensão de uma série de novos fármacos e tratamentos inovadores na última década: as drogas para GLP-1 que vêm transformando o tratamento da diabetes e da obesidade; as terapias CAR-T que mobilizam o sistema imunológico contra o câncer; as primeiras aplicações clínicas da edição de genoma. Mas o longo percurso do desenvolvimento de remédios – desde a compreensão dos processos biológicos que importam até a identificação de alvos farmacológicos, o desenvolvimento de moléculas candidatas e sua submissão a testes pré-clínicos e, depois, a ensaios clínicos – continua sendo um trabalho lento e frustrante. Aproximadamente 86% de todos os candidatos a medicamentos desenvolvidos entre 2000 e 2015 não conseguiram atingir seus objetivos primários em ensaios clínicos. Alguns argumentam que o desenvolvimento de fármacos já colheu a maior parte dos frutos mais fáceis da biologia, deixando só doenças que são intratáveis.
Os próximos anos vão demonstrar conclusivamente se a IA é capaz de mudar concretamente esse quadro. Se ela proporcionar melhorias apenas incrementais, ainda vai ser um verdadeiro benefício. Se possibilitar que a biologia seja decifrada de uma forma totalmente nova, como sugerem os mais entusiasmados, poderá tornar todo o processo muito mais eficiente e bem-sucedido – e tratar o intratável. Os analistas da BCG veem sinais de uma onda de novos medicamentos gerados por IA chegando rapidamente. O Dr. Pande adverte que os reguladores de fármacos precisam correr para acompanhar o ritmo. Seria um bom problema para o mundo ter. / TRADUÇÃO DE RENATO PRELORENTZOU