• Entrar
    Ver item 
    •   Página inicial
    • BIBLIOTECA DIGITAL: Trabalhos de Especialização
    • Ciências Exatas e da Terra
    • Data Science & Big Data
    • Ver item
    •   Página inicial
    • BIBLIOTECA DIGITAL: Trabalhos de Especialização
    • Ciências Exatas e da Terra
    • Data Science & Big Data
    • Ver item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Abordagens e estratégias para superar desafios na exploração de dados : um estudo de caso

    Thumbnail
    Visualizar/Abrir
    R - E - MATHEUS ALLAN TOLEDO.pdf (344.1Kb)
    Data
    2023
    Autor
    Toledo, Matheus Allan
    Metadata
    Mostrar registro completo
    Resumo
    Resumo: A utilização de arquivos CSV (Comma-Separated Values) é uma prática comum em muitos campos da ciência devido à sua simplicidade e facilidade de manipulação. No entanto, a leitura de arquivos CSV pode ser um desafio significativo devido a uma série de problemas comuns que surgem durante o processo. Esta monografia analisa os desafios comuns enfrentados ao ler arquivos CSV e apresenta estratégias para solucioná-los. Os desafios incluem a diversidade de encodings utilizados nos arquivos, a leitura de arquivos grandes e a inconsistência de cabeçalhos e dados. Para resolver esses problemas, são discutidas técnicas como detecção e leitura correta com encodings, abordagens eficientes para a leitura de arquivos grandes emétodos para lidar com dados inconsistentes, como valores nulos, mudanças no nome de colunas e perda de colunas. O objetivo é fornecer aos leitores um conjunto de estratégias eficazes e eficientes para enfrentar esses desafios ao lidar com arquivos CSV.
     
    Abstract: The use of CSV (Comma-Separated Values) files is a common practice in many fields of science and industry, due to their simplicity and ease of manipulation. However, reading CSV files can be a significant challenge due to a series of common problems that arise during the process. This monograph examines the common challenges faced when reading CSV files and presents strategies to address them. These challenges include the diversity of encodings used in the files, reading very large files, and data inconsistency. To address these problems, techniques such as detecting and correctly converting encodings, efficient approaches for reading large files, and methods for handling inconsistent data such as null values, column name changes, and column loss are discussed. The aim is to provide readers with a set of effective and efficient strategies to tackle these challenges when dealing with CSV files.
     
    URI
    https://hdl.handle.net/1884/85884
    Collections
    • Data Science & Big Data [138]

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV
     

     

    Navegar

    Todo o repositórioComunidades e ColeçõesPor data do documentoAutoresTítulosAssuntosTipoEsta coleçãoPor data do documentoAutoresTítulosAssuntosTipo

    Minha conta

    EntrarCadastro

    Estatística

    Ver as estatísticas de uso

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV