Mostrar registro simples

dc.contributor.advisorGrégio, André Ricardo Abed, 1983-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Datapt_BR
dc.creatorToledo, Matheus Allanpt_BR
dc.date.accessioned2023-12-27T17:42:03Z
dc.date.available2023-12-27T17:42:03Z
dc.date.issued2023pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/85884
dc.descriptionOrientador: Prof. André Ricardo Abed Grégiopt_BR
dc.descriptionArtigo apresentado como Trabalho de Conclusão de Cursopt_BR
dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Datapt_BR
dc.descriptionInclui referênciaspt_BR
dc.description.abstractResumo: A utilização de arquivos CSV (Comma-Separated Values) é uma prática comum em muitos campos da ciência devido à sua simplicidade e facilidade de manipulação. No entanto, a leitura de arquivos CSV pode ser um desafio significativo devido a uma série de problemas comuns que surgem durante o processo. Esta monografia analisa os desafios comuns enfrentados ao ler arquivos CSV e apresenta estratégias para solucioná-los. Os desafios incluem a diversidade de encodings utilizados nos arquivos, a leitura de arquivos grandes e a inconsistência de cabeçalhos e dados. Para resolver esses problemas, são discutidas técnicas como detecção e leitura correta com encodings, abordagens eficientes para a leitura de arquivos grandes emétodos para lidar com dados inconsistentes, como valores nulos, mudanças no nome de colunas e perda de colunas. O objetivo é fornecer aos leitores um conjunto de estratégias eficazes e eficientes para enfrentar esses desafios ao lidar com arquivos CSV.pt_BR
dc.description.abstractAbstract: The use of CSV (Comma-Separated Values) files is a common practice in many fields of science and industry, due to their simplicity and ease of manipulation. However, reading CSV files can be a significant challenge due to a series of common problems that arise during the process. This monograph examines the common challenges faced when reading CSV files and presents strategies to address them. These challenges include the diversity of encodings used in the files, reading very large files, and data inconsistency. To address these problems, techniques such as detecting and correctly converting encodings, efficient approaches for reading large files, and methods for handling inconsistent data such as null values, column name changes, and column loss are discussed. The aim is to provide readers with a set of effective and efficient strategies to tackle these challenges when dealing with CSV files.pt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.subjectMineração de dados (Computação)pt_BR
dc.titleAbordagens e estratégias para superar desafios na exploração de dados : um estudo de casopt_BR
dc.typeTCC Especialização Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples