Identificação da redundância em dados hiperespectrais baseado em um método ensemble para redução de dimensionalidade
Resumo
Resumo: Embora o sensoriamento remoto hiperespectral capture uma ampla gama de comprimentos de onda para fornecer uma descrição detalhada da superfície do objeto, ele também envolve alta redundância causada pela forte correlação entre bandas espectrais estreitas e contínuas. Para identificar redundância em dados hiperespectrais, novos métodos baseados na seleção de atributos foramdesenvolvidos. Umdesses métodos que tem trazido excelentes contribuições em diversas áreas da pesquisa são os métodos ensemble com seus diferentes modelos.Os métodos ensemble através de modelos Stacking treinam vários modelos separadamente e combinam as previsões de cada um desses modelos utilizando outro modelo, denominado metamodelo, a fim de obter uma previsão única, mais precisa e confiável e assim melhorar o desempenho e a capacidade de generalização em relação a cada modelo indivídual. Nesse sentido, o objetivo deste trabalho é identificar a redundância em dados hiperespectrais com base no método ensemble Stacking utilizando os algoritmos Random Forest e LASSO. Os resultados obtidos com este método são promissores e robustos, podendo ser utilizado como uma alternativa para identificação de redundância para fins de redução de dimensionalidade. Abstract: Although hyperspectral remote sensing captures a wide range of wavelengths to provide a detailed description of the object’s surface, it also involves high redundancy caused by the strong correlation between narrow and continuous spectral bands. New methods based on feature selection have been developed to identify redundancy in hyperspectral data. One of the methods that has made significant contributions across various research fields is ensemble methods with their different models. Ensemble methods using Stacking models train several models separately and combine their predictions using another model known as a meta-model. This approach aims to produce a single, more accurate, and reliable prediction, thereby improving performance and generalization capabilities compared to each individual method. In this sense, this work aims to identify redundancy in hyperspectral data based on the ensemble stacking method using Random Forest and LASSO algorithms. The results obtained with this method are promising and robust so it can be used as an alternative for the identification of redundancy for dimensionality reduction purposes.
Collections
- Data Science & Big Data [124]