Reconhecimento de Entidades Nomeadas em resultados de licitações publicados em Diários Oficiais
Resumo
Resumo : O Processamento de Linguagem Natural é uma área dedicada a desenvolver a capacidade tecnológica de compreensão da linguagem do homem pela máquina. Entretanto, um dos principais desafios neste campo ainda é a dificuldade de automatizar o entendimento de contexto e semântica de determinadas informações para capturalas corretamente. Neste artigo buscou-se construir um modelo que fosse capaz de identificar empresas vencedoras de licitações em resultados divulgados em Diários Oficiais e para isso, foram utilizadas técnicas de Reconhecimento de Entidades Mencionadas, considerado um importante recurso para o processamento de textos em grande escala. Utilizando o spaCy, uma biblioteca de código aberto para Processamento de Linguagem Natural, foi treinado um algoritmo de redes neurais para reconhecer entidades nos textos de Diários Oficiais coletados. A partir disso, foi possível aplicar o modelo a uma base de resultados desconhecidos e encontrar novas oportunidades de negócios em 90% dos casos. Abstract : Natural Language Processing is dedicated to develop technology ability for the understanding of human language, by machines. However, the main challenge in this field is the need of meaning in context and semantics of certain information in order to capture it accurately. The purpose of this is article was to build a model able to identify bidding winners in published texts by Official Journals. Techniques of Named Entity Recognition, considered as an important resource for largescale text processing, were used. By means of using spaCy, an open source library for Natural Language Processing, a neural network algorithm was trained to recognize entities at texts collected from Official Journal. There after it became possible to apply the model to a database of unknown results and find new business opportunities in 90% of cases.
Collections
- Data Science & Big Data [124]