Mostrar registro simples

dc.contributor.advisorOliveira, Lucas Ferrari de, 1976-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Datapt_BR
dc.creatorSantana, Tiago Vinícius Santos dept_BR
dc.date.accessioned2024-10-22T21:55:29Z
dc.date.available2024-10-22T21:55:29Z
dc.date.issued2024pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/90364
dc.descriptionOrientador: Prof. Lucas Ferrari de Oliveirapt_BR
dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Datapt_BR
dc.descriptionInclui referênciaspt_BR
dc.description.abstractResumo: Este trabalho teve como objetivo avaliar o desempenho de alguns modelos clássicos de regressão emum conjunto de dados simulados(altamente idealizados) de fotometria para umproblema de estimativa de redshift de galáxias. Os modelos de regressão linear, regressão polinomial, árvore de decisão, random forest, e support vector machine foram treinados e validados utilizando o método Stratified K-Fold, inicialmente em uma amostra de treinamento correspondente a 5% dos dados da base original. Em seguida, estes mesmos modelos foram avaliados na amostra de teste, correspondente aos 95% restantes da base, permitindo assim a avaliação da generalização dos modelos ajustados. Além disso, devido alto nível de correlação entre as variáveis, foi utilizado também a técnica da análise de componentes principais (PCA) para reduzir a dimensionalidade do sistema.pt_BR
dc.description.abstractAbstract: This study aimed to evaluate the performance of some classical regression models in a highly idealized photometry dataset for a galaxy redshift estimation problem. The linear regression, polynomial regression, decision tree, random forest, and support vector machine models were trained and validated using the Stratified K-Fold method, initially in a training sample corresponding to 5% of the original database. Then, these same models were evaluated in the test sample, corresponding to the remaining 95% of the database, thus allowing the generalization evaluation of the adjusted models. In addition, due to the high level of correlation between the variables, the principal component analysis (PCA) technique was also used to reduce the dimensionality of the system.pt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.subjectGaláxiaspt_BR
dc.subjectFotometria astronomicapt_BR
dc.subjectCosmologiapt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectAnálise de regressão (Matemática)pt_BR
dc.titleEstimativa do Redshift Fotométrico de Galáxias via modelos de machine learning: um estudo comparativopt_BR
dc.typeTCC Especialização Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples