Poderá o machine learning ajudar a acelerar os programas de melhoramento de plantas e a aumentar a produtividade agrícola?

Um artigo publicado recentemente pela equipa do InnovPlantProtect (InPP) revela o potencial dos métodos computacionais de machine learning para prever características fenotípicas, como é o caso do rendimento/produtividade do trigo, a partir de informações genéticas desta planta.

O machine learning (ML) é uma área da ciência de dados que tem ganho cada vez mais relevância na última década. O ML é um ramo da inteligência artificial que permite o desenvolvimento de modelos de previsão que podem ser aplicados nas mais variadas áreas. Apesar de não nos apercebermos, utilizamos ferramentas baseadas em ML no nosso dia-a-dia, como por exemplo, os resultados personalizados apresentados no feed do seu Facebook. Mas as aplicações futuras vão desde permitir a condução autonoma até à deteção de doenças através da análise de radiografias (em humanos) ou imagens de drone (em pomares).

A predição genómica (PG) é outra das áreas em que o ML tem estado a ser aplicado. Esta consiste em usar dados genómicos (que nos dão informação acerca do genótipo) para desenvolver modelos computacionais que prevêem características fenotípicas complexas dos organismos, tal como rendimento/produtividade do trigo (Ver representação esquemática).

Nesta investigação agora publicada na revista científica Agriculture, os investigadores Manisha Sirsat e Ricardo Ramiro, ambos do departamento de Gestão de Dados e Análise de Risco, em colaboração com a Paula Oblessuc do departamento de Proteção de Culturas Específicas, exploraram a utilização de vários modelos de PG baseados em diferentes métodos computacionais para além do ML, como é o caso dos métodos estatísticos ou de deep learning (DL), com o objetivo de comparar a robustez e a performance de cada um deles em prever a característica fenotípica rendimento/produtividade do trigo. A ideia foi perceber quais os métodos que permitem prever características fenotípicas com maior fiabilidade.

“Os métodos estatísticos têm sido os mais utilizados em predição genómica pelas equipas de investigação em todo o mundo. Contudo, os métodos de ML estão a revelar-se uma boa alternativa, sendo mais precisos e rápidos”, evidencia Manisha Sirsat, primeira autora do estudo.

“A PG baseada em ML pode ajudar a reduzir o tempo e o custo da avaliação extensiva do processo de fenotipagem (durante os programas de melhoramento) e a acelerar o ganho genético”, explica a investigadora. “Este estudo contribui assim para ajudar os investigadores a perceber os fatores chave no desenvolvimento de modelos que possam acelerar os programas de melhoramento do trigo, ou de outras culturas, e a aumentar a produtividade agrícola”, acrescenta.

Representação esquemática do processo de predição genómica

A equipa tem estado a trabalhar em predição genómica desde 2020, e espera que a genómica e a predição genética sejam fundamentais para permitir manter ou aumentar a produtividade das culturas, apesar das múltiplas ameaças que enfrentamos, e para responder ao aumento de 50% na procura por alimentos até 2050, quando a população mundial atingir 9,7 mil milhões.

O estudo foi cofinanciado por fundos europeus, através do Programa Alentejo2020, e pela Fundação para a Ciência e a Tecnologia.

Investigadores Manisha Sirsat, Ricardo Ramiro e Paula Oblessuc (da esquerda para a direita)

Artigo original

Revista Agriculture

Genomic Prediction of Wheat Grain Yield Using Machine Learning

Manisha Sirsat e Ricardo Ramiro

DOI: https://doi.org/10.3390/agriculture12091406

Siga o InnovPlantProtect no Facebook, Twitter, LinkedIn e Instagram