Uma estratégia para a identificação de citações geográficas em textos técnico-científicos da área agrícola na língua portuguesa.

Resumo - A proposta deste trabalho é utilizar um reconhecedor de entidades nomeadas para a língua portuguesa, a fim de extrair metadados de citações a localizações geográficas brasileiras em publicações técnico-científicas do domínio agrícola. A estratégia adotada consistiu na identificação de padrões de citação a localidades de interesse, a partir da criação de uma coleção dourada, e a consequente personalização do reconhecedor de entidades nomeadas da biblioteca SpaCy. Os experimentos conduzidos, com os novos treinamentos da SpaCy, mostram uma revocação média de 0,92 e uma precisão média de 0,95, permitindo aceitar que a acurácia para a identificação das localidades nos textos seja bastante confiável.

Saved in:
Bibliographic Details
Main Authors: MOURA, M. F., MEDEIROS, C. M.
Other Authors: MARIA FERNANDA MOURA, CNPTIA; CLARA MATTOS MEDEIROS.
Format: Folhetos biblioteca
Language:Portugues
pt_BR
Published: 2022
Subjects:Mineração de texto, Reconhecimento de entidades nomeadas, SpaCy,
Online Access:http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/1150456
Tags: Add Tag
No Tags, Be the first to tag this record!