dc.contributor.advisor | Bona, Luis Carlos Erpen de | pt_BR |
dc.contributor.other | Universidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data | pt_BR |
dc.creator | Ribeiro, Gabriel Yuri Silva | pt_BR |
dc.date.accessioned | 2024-02-08T19:56:51Z | |
dc.date.available | 2024-02-08T19:56:51Z | |
dc.date.issued | 2022 | pt_BR |
dc.identifier.uri | https://hdl.handle.net/1884/79923 | |
dc.description | Orientador: Luis C. E. Bona | pt_BR |
dc.description | Monografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science & Big Data. | pt_BR |
dc.description | Inclui referências | pt_BR |
dc.description.abstract | Resumo: Este trabalho tem como enfoque apresentar uma solução de engenharia de dados para o problema de scraping de dados web de maneira sistêmica e orquestrada, utilizando de uma infraestrutura hospedada em nuvem e declarada como código, bem como um pipeline de integração contínua e deploy contínuo para operacionalizar a adição de novos recursos e funções. Desta forma, um website com informações de partidas competitivas do jogo Counter Strike: Global Offensive foi escolhido como fonte de dados, que forneceu arquivos de partidas que foram tratados até a criação de tabelas em um data warehouse. Por fim, uma breve proposta de utilização dos dados é apresentada | pt_BR |
dc.description.abstract | Abstract: This work focuses on presenting a data engineering solution to the problem of web data scraping in a systemic and orchestrated way, using a cloud-hosted infrastructure and declared as code, as well as a continuous integration pipeline and continuous deployment to smoothen the addition of new features and functions. In this way, a website with information from competitive matches of the game Counter Strike: Global Offensive was chosen as a source of data, which provided match-related files to be then processed to the creation of tables in a data warehouse. Finally, a brief proposal for the use of the data is presented | pt_BR |
dc.format.extent | 1 recurso online : PDF. | pt_BR |
dc.format.mimetype | application/pdf | pt_BR |
dc.language | Português | pt_BR |
dc.subject | Computação em nuvem | pt_BR |
dc.subject | Coleta de dados | pt_BR |
dc.title | Plataformas de web scraping em ambiente de computação em nuvem : uma perspectiva prática | pt_BR |
dc.type | TCC Especialização Digital | pt_BR |