Correção dos dados do sensor PurpleAir PA-II-FLEX para monitoramento de material particulado ultrafino (PM1.0)
Resumo
Resumo : A crescente demanda por sensores acessiveis e precisos para o monitoramento ambiental impulsionou a avaliacao de instrumentos de baixo custo como alternativas viaveis para a quantificacao do material particulado ultrafino (PM1.0) em ambientes urbanos. Este trabalho avaliou o desempenho do sensor optico PurpleAir PA-II-FLEX (PMS6003) em comparacao ao metodo gravimetrico de referencia (Impactador Harvard MS&T), durante uma campanha de amostragem conduzida na cidade de Curitiba-PR. Os dados brutos do sensor evidenciaram tendencia a superestimacao das concentracoes de PM1.0, especialmente em cenarios de alta umidade relativa, reforcando a necessidade de calibracao local e ajustes metodologicos para garantir a confiabilidade das medicoes. A metodologia empregou a aplicacao de modelos de regressao linear multipla (MLR), algoritmos do tipo Random Forest (RF) e um metodo alternativo baseado em conversao de contagem de particulas. Para garantir robustez estatistica, foram adotados dois procedimentos de validacao: separacao holdout (80% treino e 20% teste) e validacao cruzada k-Fold (k = 5). As principais metricas de desempenho analisadas incluiram coeficiente de determinacao (R²), raiz do erro quadratico medio (RMSE), erro absoluto medio (MAE) e vies normalizado medio (MNB). Os resultados mostraram que ambos os modelos calibrados reduziram significativamente o erro e o vies em relacao aos dados brutos do sensor, elevando o desempenho preditivo para niveis compativeis com padroes internacionais. O modelo de Regressao Linear Simples (MLR-A) apresentou maior consistencia (R²=0.58 } 0.09, RMSE=1.74 } 0.06 ƒÊg/m³ e MAE= 1.31}0.10 ƒÊg/m³), especialmente na validacao cruzada, enquanto o Random Forest ofereceu ganhos pontuais em conjuntos especificos de teste, mas apresentou maior variabilidade para faixas de concentracao elevadas (R²=0.54 } 0.11, RMSE=1.81 } 0.07 ƒÊg/m³ e MAE= 1.37 } 0.10 ƒÊg/m³). A analise segmentada revelou que os modelos calibrados acompanham adequadamente o metodo de referencia em intermediarias de concentracoes, ainda que apresentem limitacoes para concentracoes mais altas. O estudo destaca a importancia de incorporar variaveis ambientais no processo de calibracao e validacao de sensores opticos. Entre as limitacoes, ressalta-se o tamanho amostral reduzido e a necessidade de avaliacoes multicentricas para ampliar a aplicabilidade dos resultados. Em sintese, a calibracao criteriosa dos sensores de baixo custo, associada a modelos estatisticos e validacao, representa um avanco para o monitoramento ambiental de PM1.0, contribuindo para a geracao de dados mais confiaveis e subsidiando politicas de gestao da qualidade do ar e saude publica Abstract : The growing demand for accessible and accurate sensors for environmental monitoring has driven the evaluation of low-cost instruments as viable alternatives for the quantification of ultrafine particulate matter (PM1.0) in urban environments. This study assessed the performance of the PurpleAir PA-II-FLEX optical sensor (PMS6003) in comparison to the gravimetric reference method (Harvard MS&T Impactor) during a sampling campaign conducted in Curitiba, Brazil. The raw sensor data revealed a tendency to overestimate PM1.0 concentrations, particularly under high relative humidity scenarios, reinforcing the need for local calibration and methodological adjustments to ensure measurement reliability. The methodology employed multiple linear regression (MLR) models, Random Forest (RF) algorithms, and an alternative method based on particle count conversion. To ensure statistical robustness, two validation approaches were adopted: holdout separation (80% training and 20% testing) and k-Fold cross-validation (k = 5). The main performance metrics analyzed included coefficient of determination (R²), root mean squared error (RMSE), mean absolute error (MAE), and mean normalized bias (MNB). Results showed that both calibrated models significantly reduced error and bias relative to the raw sensor data, raising predictive performance to levels consistent with international standards. The simple linear regression model (MLR-A) demonstrated greater consistency (R²=0.58 ± 0.09, RMSE=1.74 ± 0.06 ìg/m³, MAE= 1.31 ± 0.10 ìg/m³), especially in cross-validation, while the Random Forest model offered specific gains in selected test sets but showed greater variability for higher concentration ranges (R²=0.54 ± 0.11, RMSE=1.81 ± 0.07 ìg/m³, MAE= 1.37 ± 0.10 ìg/m³). Segmented analysis revealed that both calibrated models closely tracked the reference method at intermediate concentration ranges, although limitations were observed at higher concentrations. This study highlights the importance of incorporating environmental variables in the calibration and validation of optical sensors, particularly in regions with high climatic variability. Among the limitations, the relatively small sample size and the need for multicenter evaluations to expand the applicability of the results stand out. In summary, the careful calibration of low-cost sensors, combined with robust statistical modeling and rigorous validation, represents an advance for PM1.0 environmental monitoring, contributing to the generation of more reliable data and supporting air quality management and public health policies
Collections
- Engenharia Ambiental [197]