Abordagem de aprendizado profundo para classificação de batimentos cardíacos de forma automática
Abstract
Resumo: No ano de 2021 a Organização Mundial da Saúde (OMS) estimou que aproximadamente 17 milhões de pessoas morrem todos os anos devido a doenças cardiovasculares associadas ao coração humano dentre elas arritmias. A arritmia é a irregularidade e anormalidade do ritmo dos batimentos cardíacos e a principal forma de identificação destas anormalidades dos batimentos do coração pode ser realizada por meio do eletrocardiograma (do inglês eletrocardiogram, ECG), sendo uma das ferramentas de auxílio ao diagnóstico comumente usadas na medicina e na saúde para lidar com problemas relacionados ao coração. Entretanto as abordagens tradicionais de detecção de arritmia, incluindo a investigação manual dos registros de ECG, são geralmente demoradas e propensas a erros, além de serem, às vezes, subjetivas gerando uma dificuldade para os médicos e equipes médicas para distinguir os diferentes padrões de arritmias, demonstrando que existe a possibilidade de não se identificar qualquer doença cardíaca com 100% de precisão até o paciente ser submetido a outros exames. No entanto, para interpretar de forma apropriada os sinais de ECG, métodos de análise automatizada foram propostos na literatura na tentativa de alcançar a classificação automática dos tipos de arritmia. Na literatura, abordagens utilizando de aprendizado profundo, especialmente as Redes Neurais Convolucionais, tem sido usada com sucesso para a detecção e classificação de sinais de ECG de forma automática, com o fim de não dispor da necessidade de um pré-processamento antes do treinamento da rede, exceto para normalização do conjunto de dados. Para tanto, nessa dissertação de mestrado foi proposto um codificador automático (do inglês autoencoder, AE) com camadas de memória de curto e longo prazo (do inglês long short term memory, LSTM) para extração de características do sinal combinado a um classificador multi-classe, da qual esta estrutura pode cooperar com o processo de pré-processamento dos sinais para classificar de forma eficiente as arritmias. Um total de 97300 batimentos consistindo de 5 classes diferentes de arritmias foram extraídos, incluindo ritmo sinusal normal, batimento prematuro atrial, contração ventricular prematura, bloqueio do ramo esquerdo e bloqueio do ramo direito do banco de dados de arritmias e supraventricular, ambos da base de dados do Instituto de Tecnologia de Massachusetts e do Hospital Israelita de Boston (MIT-BIH). O modelo proposto nas tarefas de classificação alcançou uma taxa de acurácia de 98,57% na base de dados de arritmia e 97,59% na base de dados supraventricular do MIT-BIH, o que permite esperar resultados efetivos quando aplicados a paciente reais. Comparado com outras abordagens de aprendizado profundo de maior estrutura, como modelos baseados em Redes Neurais Convolucionais, foi possível identificar que a abordagem proposta descarta o problema do desaparecimento do gradiente em tarefas de classificação. Também foi possível constatar que a etapa de pré-processamento impactou significativamente os resultados demonstrando que os ruídos afetam na classificação do sinal. Abstract: In the year 2021, the World Health Organization (WHO) estimated that approximately 17 million people die every year due to cardiovascular diseases associated with the human heart, including arrhythmias. Arrhythmia is the irregularity and abnormality of the heartbeats' rhythm. The main way to identify these abnormalities of the heartbeats can be performed through an electrocardiogram (ECG), which is one of the commonly used diagnostic aids in medicine and healthcare to deal with heart-related problems. However, traditional approaches to arrhythmia detection, including manual investigation of ECG records, are generally time-consuming and prone to errors, and are sometimes subjective, making it difficult for doctors and medical teams to distinguish different patterns of arrhythmias, demonstrating that there is a possibility of not identifying any cardiac disease with 100% accuracy until the patient undergoes further tests. However, to properly interpret ECG signals, automated analysis methods have been proposed in the literature in an attempt to achieve the automatic classification of arrhythmia types. In the literature, approaches using deep learning, especially Convolutional Neural Networks, have been successfully used for the automatic detection and classification of ECG signals, to eliminate the need for pre-processing before network training, except for data normalization. Therefore, in this master's thesis, an autoencoder with long and short-term memory (LSTM) layers was proposed for feature extraction from the signal combined with a multi-class classifier, which can cooperate with the signal pre-processing process to efficiently classify arrhythmias. A total of 97,300 heartbeats consisting of 5 different classes of arrhythmias were extracted, including normal sinus rhythm, premature atrial beat, premature ventricular contraction, left bundle branch block, and right bundle branch block from the arrhythmia and supraventricular databases, both from the Massachusetts Institute of Technology and the Beth Israel Hospital (MIT-BIH) arrhythmia database. The proposed model achieved an accuracy rate of 98.57% in the arrhythmia database and 97.59% in the supraventricular database of the MIT-BIH, which allows for effective results when applied to real patients. Compared to other deep learning approaches with larger structures, such as models based on Convolutional Neural Networks, it was possible to identify that the proposed approach discards the problem of gradient disappearance in classification tasks. It was also possible to observe that the pre-processing step significantly impacted the results, demonstrating that noise affects signal classification.
Collections
- Dissertações [220]