Predição de classes de solo por mineração de dados em área da bacia sedimentar do São Francisco

Resumo O objetivo deste trabalho foi avaliar diferentes estratégias para a predição da distribuição de classes de solo em mapas pedológicos digitais de áreas sem dados de referência, na bacia sedimentar do São Francisco, no Norte de Minas Gerais. As estratégias incluíram: o detalhamento da legenda, o treinamento por observações em campo, a ampliação do conjunto de treinamento e o uso de diferentes algoritmos de mineração de dados. Foram elaboradas quatro matrizes, diferenciadas pelo volume de dados, para o aprendizado dos algoritmos, e pelo nível taxonômico das classes de solo a serem preditas. Avaliou-se o desempenho dos algoritmos de aprendizado de máquina - Random Forest, J48 e MLP -, associados a procedimentos de discretização, balanceamento de classes, seleção de variáveis e expansão do conjunto de treinamento. O balanceamento de classes, a discretização de variáveis por frequências iguais e o algoritmo Random Forest apresentaram os melhores desempenhos. A extensão da representatividade das observações em campo, que presume uma área de treinamento mais ampla, não trouxe ganho preditivo. A generalização taxonômica para subordem diminui a fragmentação dos polígonos mapeados e aumenta a acurácia dos mapas pedológicos digitais. Quando são produzidos após treinamento por observações de solo in situ, na área de mapeamento, os mapas pedológicos digitais têm valores de acurácia equivalentes aos dos treinados em mapas preexistentes.

Saved in:
Bibliographic Details
Main Authors: Dias,Laura Milani da Silva, Coelho,Ricardo Marques, Valladares,Gustavo Souza, Assis,Ana Carolina Cunha de, Ferreira,Edilene Pereira, Silva,Rafael Cipriano da
Format: Digital revista
Language:Portuguese
Published: Embrapa Secretaria de Pesquisa e Desenvolvimento 2016
Online Access:http://old.scielo.br/scielo.php?script=sci_arttext&pid=S0100-204X2016000901396
Tags: Add Tag
No Tags, Be the first to tag this record!