Descoberta de conhecimento sobre o processo seletivo da UFPR
Resumo
Resumo: A informação vem desempenhando um papel fundamental no desenvolvimento e sucesso das grandes organizações. Os sistemas de suporte à decisão, cada vez mais presentes na realidade dessas organizações, tornam mais confiáveis as tarefas de coletar, tratar, interpretar e utilizar informações, resultando em um processo eficaz. As empresas tendem, com o passar do tempo, a aumentar consideravelmente seu volume de dados. Entretanto, há uma relação inversa entre o volume de dados existentes e a necessidade de conhecimento estratégico, ou seja, apesar das informações resumidas e significativas para tomada de decisão serem de volume menor, geralmente elas não estão disponíveis e exigem que sejam extraídas a partir de grandes quantidades de dados. Descoberta de Conhecimento em Banco de Dados (KDD — Knowledge Discovery in Databases) refere-se ao processo de extração de conhecimento a partir de grandes bases de dados. Mineração de dados (ou Data Mining), refere-se a uma determinada etapa deste processo e consiste na aplicação de algoritmos e técnicas estatísticas e de aprendizagem de máquina em grandes bases de dados para encontrar tendências ou padrões em dados que possam dar suporte à tomada de decisões. Este trabalho apresenta uma aplicação prática do processo de KDD na base de dados sobre os candidatos ao processo seletivo do vestibular ocorrido em dezembro de 2003 da UFPR. Neste trabalho, utilizando-se de uma ferramenta chamada WEKA (Waikato Environment for Knowledge Analysis), foi aplicada a técnica de mineração de dados Árvore de Decisão, através dos algoritmos de classificação J48.J48 e J48.PART. Os resultados obtidos poderão ser usados para traçar perfis dos candidatos ao processo seletivo do vestibular da UFPR, a fim de levantar informações relevantes que tragam subsídios para as instituições de ensino em geral na tomada de decisões. Abstract: Information has been having a fundamental role on companies’ growth, development and success. The making-decision supporting systems, available at these companies, make the work of collecting, treating, analyzing and using information more efficient, improving the whole process. There is also a tendency in these companies to increase their data amount. However, there is an inverse relation between the data amount and the need of a strategic knowledge, that is, although the resumed and meaningful information to making-decision are fewer, generally they are not available and demand to be extracted from big data amounts. KDD - Knowledge Discovery in databases refers to the extraction of knowledge from a huge database amounts. Data Mining refers to a specific phase of this process and consists in the application of algorithms and statistical techniques and learning of machines in big databases to find tendencies or standardized patterns in data that can give support to making-decision process. This study demonstrates a practical application of KDD Process to the database of 2003 UFPR’s Entrance Examination or Selective Process. Coherently to WEKA research tool — Waikato Environment for Knowledge Analysis, the Decision Tree Data research technique was applied, through the algorithms classification J48.J48 and J48.PART. The results can be used to build up the candidates profile, in order to extract and point out important information that offer support to the educational institutions on the makingdecision process.
Collections
- Teses & Dissertações [10009]