Mostrar registro simples

dc.contributor.advisorZeviani, Walmes Marques, 1986-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Datapt_BR
dc.creatorUmeyama, Ricardo Iwagoro Piekarzpt_BR
dc.date.accessioned2024-02-08T18:44:44Z
dc.date.available2024-02-08T18:44:44Z
dc.date.issued2020pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/71472
dc.descriptionOrientador : Prof. Walmes Marques Zevianipt_BR
dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science & Big Data.pt_BR
dc.descriptionInclui referências: p. 10pt_BR
dc.description.abstractResumo : A realização de teste de estabilidade é uma etapa essencial no desenvolvimento e comercialização de produtos. É responsabilidade da empresa a seguridade do teste e cabe a Anvisa a fiscalização. Cada componente, variáveis extrínsecas ou intrínsecas podem afetar a estabilidade de um produto. Os testes seguem um protocolo e recomendações conforme o Guia de Estabilidade de Produtos Cosméticos - Anvisa [1] e devem seguir determinadas condições de armazenamento, parâmetros de avaliação e periodicidade. O objetivo deste trabalho é encontrar uma metodologia de aprendizado de máquina que possibilite predizer com um bom nível de acurácia se o estudo sofrerá alteração ou não ao final da avaliação t90. O presente estudo teve início com a criação de um banco de dados relacional, agrupando dados de duas tabelas. Foram aplicados os modelos de Naive Bayes, Regressão logística com regularização(GLM) e Support vector machine. Como métrica de avaliação foi utilizada a matriz de confusão, acurácia e especificidade. Foram gerados 5 dataframes conforme a FAMILIA que o estudo pertence e suas características. O modelo com melhor desempenho foi o GLM, utilizando kfold = 10 com uma acurácia média entre as FAMILIAS de 92%. Palavras-chave: ANVISA, CRISP-DM, classificação supervisionada,caret, GLM, Naive Bayes, SVM, matriz de confusão, acurácia, especificidade, varImp, linguagem R.pt_BR
dc.description.abstractAbstract : Performing a stability testing has been an essential phase in the development and selling of products. The company is responsible for the suitability of test, and the inspection belongs to Anvisa (Brazilian Health Regulatory Agency) [1]. On each component, extrinsic and intrinsic variables may be affecting the stability of a product. Product testing follows the guidance of "Guia de Estabilidade de Produtos Cosméticos - Anvisa"and must follow recommendations for storage conditions, test parameters and its frequency. This final paper intends to find a machine learning methodology, which may help predicting with a good accuracy level whether the study suffers modification or not at the end of t90 estimation. This study has begun on a relational database with grouped data of two tables. Naive Bayes Classifiers, Logistic regression with regularization(GLM) and Support vector machine had been applied to. Confusion matrix, accuracy and specificity had been used as evaluation metrics. This had generated five data frames for the clusters and characteristics which the study belongs to. GLM has had the best performance with kfold = 10 and 92% of average accuracy among clusters. Keywords: ANVISA, CRISP-DM, supervised classification, caret, GLM, Naive Bayes, SVM, confusion matrix, accuracy, specificity, varImp, R Language.pt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectControle de qualidade - Estabilidadept_BR
dc.subjectProdutos industrializadospt_BR
dc.titleAnálise preditiva em testes de estabilidade dentro do desenvolvimento de produtos no setor de cosméticospt_BR
dc.typeTCC Especialização Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples