Análise de agrupamentos para dados espaciais : estudo de simulação e aplicação a dados educacionais do Estado do Paraná
Date
2021Author
Souza, Daiane Chitko de, 1996-
Metadata
Show full item recordSubject
Análise matemáticaMétodos numéricos
Análise Numérica
xmlui.dri2xhtml.METS-1.0.item-type
Dissertação DigitalAbstract
Resumo: Este trabalho apresenta dois estudos sob a perspectiva da analise de agrupamentos envolvendo dados espaciais. O primeiro e um estudo de caso com dados educacionais do Estado do Paraná que tem como objetivo identificar padrões baseados em indicadores educacionais e também de constituir grupos de municípios homogêneos quantos aos padrões detectados. O segundo e um estudo por simulação com o objetivo de avaliar a reprodutibilidade de métodos de agrupamentos espaciais e não espaciais de uma partição de grupos predefinida. Foram considerados métodos de agrupamentos não espaciais (K-means, Complete linkage e Ward) e métodos de agrupamentos espaciais (ClustGeo e Skater) que foram comparados, no estudo de caso, por meio de três índices de validação interna (largura media da silhueta, índice de Dunn e índice de conectividade) e, no estudo por simulação, usando dois índices de validação externa (índice de Rand ajustado e variação da informação). Os dois estudos permitiram concluir em um favorecimento aos métodos espaciais como os mais adequados para analisar tanto os indicadores educacionais quanto os dados simulados, em termos da reprodutibilidade da partição predefinida (para o estudo por simulação) e do favorecimento em identificar os padrões educacionais (para o estudo de caso). Abstract: This work presents two studies from the perspective of cluster analysis involving spatial data. The first is a case study with educational data from the State of Parana that aims to identify clusters based on educational indicators and to constitute groups of homogeneous municipalities. The second is a simulation study to evaluate the reproducibility of spatial and non-spatial clustering methods of a predefined group partition. Non-spatial clustering methods (K-means, Complete linkage and Ward) and spatial clustering methods (ClustGeo and Skater) were considered, which were compared, in the case study, using three internal validation indexes (average silhouette width, Dunn index and Connectivity index) and, in the simulation study, using two external validation indexes (adjusted Rand index and variation of information). The two studies made it possible to conclude in favor of spatial methods as the most suitable for analyzing both educational indicators and simulated data, in terms of the reproducibility of the predefined partition (in the simulation study) and identifying educational clusterings (in the case study).
Collections
- Dissertações [221]