dc.contributor.advisor | Wojciechowski, Jaime, 1965- | pt_BR |
dc.contributor.author | Hasse, Mozart | pt_BR |
dc.contributor.other | Universidade Federal do Paraná | pt_BR |
dc.date.accessioned | 2022-06-14T19:24:37Z | |
dc.date.available | 2022-06-14T19:24:37Z | |
dc.date.issued | 2021 | pt_BR |
dc.identifier.uri | https://hdl.handle.net/1884/76441 | |
dc.description | Orientador: Prof. Dr. Jaime Wojciechowski | pt_BR |
dc.description | Monografia (especialização) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Curso de Especialização em Inteligência Artificial Aplicada. | pt_BR |
dc.description | Inclui referências: p. 24-25 | pt_BR |
dc.description.abstract | Resumo: O grande volume de documentos PDF gerados por aplicações comerciais exige o uso de algoritmos de classificação eficientes para organizar estes arquivos de maneira automática. Este trabalho apresenta uma solução para o caso específico em que seja necessário diferenciar modelos de documentos sujeitos a alterações constantes na organização dos dados a fim de viabilizar um tratamento posterior bastante específico para cada classe. O algoritmo escolhido é o KNN com similaridade de documentos usando o texto junto com os metadados e medida via shingling. Algumas opções de algoritmos são analisadas e comparadas com a implementação proposta. Os resultados são comparados numa base de referência e então conclui-se que a abordagem escolhida atende aos requisitos propostos e é satisfatória para esta aplicação. | pt_BR |
dc.format.extent | 1 recurso online : PDF. | pt_BR |
dc.format.mimetype | application/pdf | pt_BR |
dc.language | Português | pt_BR |
dc.subject | Inteligência artificial | pt_BR |
dc.subject | Algorítmos de computador | pt_BR |
dc.subject | Software - Desenvolvimento | pt_BR |
dc.title | Identificacão de modelos de arquivos PDF através de texto e metadados | pt_BR |
dc.type | Monografia Especialização Digital | pt_BR |