Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos.

O objetivo deste trabalho foi desenvolver uma metodologia baseada em técnicas de mineração de dados para selecionar os principais marcadores SNP (Single Nucleotide Polymorphism) para as raças de ovinos: Crioula, Morada Nova e Santa Inês. Os dados utilizados foram obtidos do Consórcio Internacional de Ovinos e são compostos por 72 animais das raças citadas, e cada animal possui 49.034 marcadores SNP. Considerando que o número de atributos (marcadores) é muito maior que o de observações (animais), foram aplicadas as técnicas de predição LASSO (Least Absolute Shrinkage and Selection Operator), Random Forest e Boosting para a geração de modelos preditivos que incorporam métodos de seleção de atributos. Os resultados revelaram que os modelos preditivos selecionaram os principais marcadores SNP para identificação das raças estudadas. O modelo LASSO selecionou um total de 29 marcadores relevantes. A partir dos modelos Random Forest e Boosting, foram obtidos 27 e 20 marcadores importantes, respectivamente. Por meio da intersecção dos modelos gerados, identificou-se um subconjunto de 18 marcadores com maior potencial de identificação das raças.

Saved in:
Bibliographic Details
Main Authors: VIEIRA, F. D., OLIVEIRA, S. R. de M., PAIVA, S. R.
Other Authors: FÁBIO DANILO VIEIRA, CNPTIA; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA; SAMUEL REZENDE PAIVA, SRI.
Format: Artigo de periódico biblioteca
Language:pt_BR
por
Published: 2016-02-04
Subjects:Polimorfismo de nucleotídeo único, Seleção de atributos, Modelos preditivos, Regressão penalizada, Feature selection, Predictive modeling, Penalized regression, Single nucleotide polymorphism, Models,
Online Access:http://www.alice.cnptia.embrapa.br/alice/handle/doc/1036157
http://dx.doi.org/10.1590/1809-4430-Eng.Agric.v35n6p1172-1186/2015
Tags: Add Tag
No Tags, Be the first to tag this record!