Análise de dados no internet movie database
Resumo
Resumo : Este trabalho tem como objetivo realizar uma análise na base de dados do IMDB com os títulos de estreia de filmes e séries entre 2015 até 2019 a fim de se identificar padrões e tendencias. O levantamento feito sobre o tema mostrou a falta de artigos sobre esse tema, em aplicar o conhecimento de Gestão da Informação na área de entretenimento, e foi o motivador para a realização do presente estudo. O método utilizado nesta pesquisa foi o KDD (Descoberta de Conhecimento em Bases de Dados), por meio da seleção dos dados, pré processamento, transformação, mineração de dados e a avaliação das informações. Primeiramente, para realizar a análise da base de dados foi feita a delimitação do que seria utilizado e analisado na base de dados e assim selecionados quais arquivos do IMDB seriam utilizados. Depois de fazer a seleção foram unificados os dois arquivos, gerando uma base de dados única. Após gerar a base de dados foram realizadas limpezas de dados e normalizações com o intuito de poder analisar com estatísticas e mineração de dados. Para a realização das estatísticas, primeiramente foi identificado que a maior parte dos atributos são qualitativos e utilizou-se como ferramenta o Excel. Na mineração de dados foram selecionados os algoritmos de Árvore de Decisão e Naïve Bayes ambos executados no RStudio. A execução da Árvore de Decisão e do Naïve Bayes na base de dados mostrou que em ambos tiveram uma taxa de acerto de aproximadamente 70%. O trabalho encerra com os objetivos alcançados e com ideias de utilização de outras ferramentas, algoritmos com objetivo de comparar resultados.
Collections
- Gestão da Informação [582]