Aplicaçao de Data Mining em banco de dados do serviço de transplante de medula óssea
Date
2003Author
Junglos, Aldemir
Metadata
Show full item recordSubject
TesesBanco de dados - Gerencia
Medula ossea - Transplante
Análise numérica
xmlui.dri2xhtml.METS-1.0.item-type
DissertaçãoAbstract
Resumo: Depois do surgimento da informática, grandes volumes de informações têm sido coletados e armazenados. Esta armazenagem por si só já trouxe grandes benefícios, antes não encontrados nos arquivos de papel. Porém, pode-se tirar muito mais proveito destes bancos de dados, propiciado pela Descoberta de Conhecimentos (KDD), como por exemplo, a Mineração de Dados ou Data Mining que permite investigar os dados à procura de padrões, muitas vezes não visíveis pela simples observância. A Descoberta de Conhecimento compreende os seguintes passos: ter conhecimento do domínio de aplicação; selecionar um conjunto de dados; remover os ruídos e estimar os dados faltantes; encontrar os algoritmos apropriados; classificação; interpretação dos conhecimentos descobertos e incorporação no processo. Neste trabalho utilizou-se o banco de dados do Serviço de Transplante de Medula Óssea para, além da análise estatística para encontrar relações entre atributos, classificar os pacientes em grupos de rejeição: primeiramente em dois grupos (rejeição ou não rejeição do transplante de medula óssea -TMO) e depois em três grupos (rejeição em menos de cem dias, de cem dias a dois anos e em mais de dois anos). Além da classificação estatística (Análise Discriminante de Fisher e Regressão Logística) outras metodologias foram utilizadas, como por exemplo, Redes Neuronais, C4.5, Decision Stump e Logit Boost. Os pacotes WEKA, STATGRAPHICS e MINITAB foram utilizados para executar estas tarefas. As regras aprendidas foram encaminhadas aos especialistas para possível incorporação no processo. Abstract: After the emergence of computer science, great volumes of information have been collected and stored. The quick access to these computerized files became a great advantage over paper files. However, much more advantage can be taken from these databases provided by Knowledge Discovery (KDD), such as Data Mining that allows investigation of data in search of standards, often invisible through simple observance. Knowledge Discovery consists of the following steps: understanding the application domain; selecting a data set; removing noise and estimating missing data; finding the appropriate algorithms; classifying; interpreting discovered knowledge and incorporating it into the process. This piece of work uses the database of the Bone Marrow Transplant Service in order to find the relation between attributes through statistical analysis and classify patients in rejection groups: first in two groups (rejection or non-rejection of bone marrow transplant) then in three groups (rejection in less than one hundred days, from one hundred days to two years and after two years). Besides statistical classification (Fisher Discriminant Analysis and Logistic Regression), other methodologies were used, such as Neuronal Networks, C4.5, Decision Stump and Logit Boost. WEKA, STATGRAPHICS and MINITAB packages were used in the execution of these tasks. The rules learned have been directed to the specialists for possible incorporation into the process.
Collections
- Teses & Dissertações [8564]