Inteligência artificial acelera a busca por marcadores de resistência da cana-de-açúcar ao amarelinho
Karina Ninni | Agência FAPESP – O amarelinho, uma das principais doenças a acometer cultivos de cana-de-açúcar no país, é causado por um vírus resistente a tratamentos térmicos transmitido pelo pulgão Melanaphis sacchari. Uma vez infectada, a planta só pode ser recuperada por meio de um processo de cultura de tecidos vegetais em laboratório, que exige tempo e infraestrutura. Segundo um grupo de cientistas que estuda o problema, a maneira mais eficaz de controlar a doença é encontrar variedades de cana-de-açúcar resistentes a ela. Esse é o objetivo de um projeto que vem sendo conduzido com apoio da FAPESP.
Em artigo publicado na revista Scientific Reports, a equipe composta por cientistas da Universidade Estadual de Campinas (Unicamp), do Instituto Agronômico (IAC), do Instituto Biológico de São Paulo (IB), da Universidade Estadual Paulista (Unesp) e da Escuela Superior Politécnica del Litoral (Espol, no Equador) utilizou análises genômicas, algoritmos de machine learning e métodos estatísticos para refinar e acelerar a busca por marcadores moleculares de resistência à doença.
O grupo descobriu que a maioria das variedades resistentes é representante da chamada cana-energia (mais rica em biomassa do que em açúcar e mais talhada para a produção de etanol de segunda geração), mas ao menos uma delas tem apelo comercial para a fabricação de açúcar ou etanol convencional – tanto que foi lançada comercialmente pelo IAC em outubro.
A amostragem experimental consistiu de um painel de 97 genótipos de cana-de-açúcar, incluindo representantes das espécies selvagens (que não passaram por processo de melhoramento) Saccharum officinarum, Saccharum spontaneum e Saccharum robustum, além de variedades de cana-de-açúcar tradicional e de cana-energia, abrangendo cultivares comerciais oriundos de programas brasileiros de melhoramento.
“Analisamos a resistência de cada uma das variedades ao amarelinho. Nosso objetivo foi associar a resistência à doença a características genéticas. Para isso, usamos vários tipos de marcadores moleculares diferentes, que são variações do DNA, lançando mão de sequenciamento de nova geração para acessar essas informações”, resume Ricardo Pimenta, do Centro de Biologia Molecular e Engenharia Genética (CBMEG) da Unicamp.
O conjunto de variedades foi escolhido pela equipe do programa de melhoramento de cana do Instituto Agronômico. A maioria faz parte do próprio programa de melhoramento do IAC, mas há também amostras da Rede Intrauniversitária para o Desenvolvimento do Setor Sucroenergético (Ridesa) e do Centro de Tecnologia Canavieira (CTC).
“Essa coleção representa uma variabilidade do que existe em cana no Brasil, tanto plantada quanto usada em cruzamentos para produzir outras variedades”, esclarece Anete Pereira de Souza, professora do Departamento de Biologia Vegetal do Instituto de Biologia da Unicamp e coordenadora de projetos no CBMEG.
A expressão dos sintomas do amarelinho é complexa e geralmente ocorre em fases tardias do desenvolvimento da planta, sendo caracterizada principalmente pelo amarelecimento da nervura central das folhas da cana. A doença altera o metabolismo e o transporte da sacarose, bem como a eficiência fotossintética, prejudicando o desenvolvimento da gramínea, o que acaba se refletindo em perda de produtividade.
Abordagem
De acordo com Pimenta, o artigo descreve um feito inédito da equipe do IAC. “Eles plantaram a cana e, ao mesmo tempo, criaram pulgões em plantas já infectadas com o vírus. Depois, espalharam o pulgão nas plantas não infectadas e monitoraram, em um processo controlado de inoculação e infecção. Estudos anteriores haviam tentado coisas parecidas. Neles, a cana era plantada no campo e deixada lá. E a infecção ocorria de forma, digamos, natural, em um processo menos controlado de inoculação.”
Como explica o pesquisador, a questão da resistência ao amarelinho nas plantas infectadas pelo pulgão foi abordada de duas maneiras pela equipe do IAC. Primeiro, por meio de RT-PCR quantitativa, metodologia similar à usada nos testes diagnósticos da COVID-19. “A PCR foi usada para quantificar o vírus nesse conjunto de variedades de cana-de-açúcar que analisamos.” E, segundo, do ponto de vista da severidade da doença, revelada pelo aparecimento de sintomas (como, por exemplo, quão amarela fica a planta), algo muitas vezes difícil de analisar.
No intuito de estabelecer associações entre resistência ao amarelinho e características genéticas, a equipe usou análises de associação genômica e ainda algoritmos de machine learning – uma técnica de inteligência artificial baseada no reconhecimento de padrões – juntamente com métodos de seleção de atributos.
“O que normalmente encontramos em estudos de associação genômica são marcadores que têm muito efeito no fenótipo [características observáveis]. E isso é um problema, porque os outros marcadores, que têm menor efeito fenotípico, não se consegue encontrar. A seleção de atributos teve o objetivo de capturar as marcas que têm influência no fenótipo, mas de maneira reduzida, para fazer uma triagem mais eficiente de marcadores moleculares”, esclarece Alexandre Hild Aono, também do CBMEG.
Já o machine learning foi usado para construir um modelo de predição que, com base nos marcadores genéticos fornecidos, conseguisse antever se uma variedade é resistente, tolerante ou suscetível ao vírus. “Para os algoritmos fazerem isso, eles vão ranquear alguns marcadores como ‘muito importantes’ para a predição e outros como ‘menos significativos’. E o que nos perguntamos foi o seguinte: se o sistema considera determinados marcadores como muito importantes, será que estes não têm também influência no fenótipo? E encontramos que, sim, eles têm influência no fenótipo. Assim, acoplando essas várias metodologias, conseguimos filtrar e selecionar os marcadores que têm maior potencial para exercer influência direta na configuração do amarelinho. Mesmo que não sejam os ‘que aparecem mais’ [os que têm mais efeito no fenótipo]”, explica Aono.
Souza lembra que um dos objetivos do trabalho foi comparar os resultados de cada técnica metodológica e ver se havia convergência entre elas. “Encontramos uma coleção mais ampla de marcadores com a metodologia que está sendo proposta, mas ela também é validada pela estatística tradicional. Ambas se conversam e, utilizando-as em associação, conseguimos obter um conjunto de dados muito mais amplo a ser estudado, fornecendo uma base mais rica para o melhoramento.”
De acordo com a pesquisadora, o nível de detalhamento do trabalho realizado pela equipe multidisciplinar é inédito. “Comparamos as metodologias, mostramos a eficiência e a necessidade de usar uma metodologia estatística mais refinada. Não existe na literatura quem tenha feito esse tipo de análise ou cultivado o pulgão, infectado as plantas e depois quantificado o vírus com PCR quantitativa. Trata-se de um trabalho para balizar pesquisas no futuro, no sentido de ajudar a compreender o mecanismo molecular envolvido na doença.”
O estudo teve apoio da FAPESP por meio de bolsas de mestrado e de doutorado direto concedidas a Pimenta; bolsa de doutorado direto concedida a Aono e bolsa de pós-doutorado concedida a Carla Cristina da Silva, uma das autoras do artigo.
Resistentes
Segundo Pimenta, as plantas realmente resistentes, que não exibem sintomas da doença e também não acumulam o vírus, perfazem uma porcentagem bem baixa da amostragem. “Poucas são realmente resistentes. A maioria não exibe sintomas, mas acumula o vírus, o que acaba sendo um problema, porque o patógeno está ali sem o agricultor perceber. Nossos resultados podem ajudar a eliminar variedades suscetíveis e também as tolerantes: que acumulam o vírus sem exibir os sintomas e podem virar um reservatório viral”, antevê, salientando que o grande dilema do melhoramento de plantas é selecionar as melhores variedades sem perder muita variabilidade.
Ele revela que muitas dessas variedades mais resistentes são representantes da chamada cana-energia. “Elas têm um ancestral ‘selvagem’ recente mais resistente a doenças, não é surpreendente esse resultado. Mas descobrimos também algumas variedades mais comerciais que se mostraram resistentes e essas são mais interessantes. Dentre elas, a IACSP04-6007 tem se mostrado promissora e acabou de ser lançada pelo programa de melhoramento do IAC”, conta Pimenta.
Além dela, as variedades de cana-de-açúcar que mostraram maior resistência ao amarelinho (ou seja, não apresentaram sintomas da doença e tiveram baixa quantificação viral) são as seguintes: IACBIO241, IACBIO257, IACBIO266, IACBIO270, IACBIO271, IACBIO273, IACBIO275, IACBIO279, IACCTC 05-3616, IACSP04-2510, IACSP98-5046, IJ76293, IN8482, IN8488 e Krakatau.
Pimenta chama a atenção ainda para os genes associados aos marcadores encontrados. “Alguns exemplos mais marcantes são o gene de uma peroxidase, que é uma enzima que já foi associada à resistência ao amarelinho anteriormente; o gene de uma Dicer – enzima muito importante em um mecanismo de resposta de plantas a vírus; e ainda vários genes que contêm repetições ricas em leucina amplamente implicadas em respostas imunes de plantas a patógenos.”
Assinado também por Roberto Carlos Villavicencio Burbano, Alisson Esdras Coutinho, Ivan Antônio dos Anjos, Dilermando Perecin, Marcos Guimarães de Andrade Landell, Marcos Cesar Gonçalves e Luciana Rossini Pinto, o artigo Genome-wide approaches for the identification of markers and genes associated with sugarcane yellow leaf virus resistance pode ser acessado em: www.nature.com/articles/s41598-021-95116-1.