• Login
    View Item 
    •   DSpace Home
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016034P5 Programa de Pós-Graduação em Informática
    • Dissertações
    • View Item
    •   DSpace Home
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016034P5 Programa de Pós-Graduação em Informática
    • Dissertações
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Exploring traffic matrix patterns to classify scale-free network applications

    Thumbnail
    View/Open
    R - D - RAFAEL GOMES DE CASTRO.pdf (2.758Mb)
    Date
    2021
    Author
    De Castro, Rafael, 1993-
    Metadata
    Show full item record
    Subject
    Redes de computadores
    Computação de alto desempenho
    Ciência da Computação
    xmlui.dri2xhtml.METS-1.0.item-type
    Dissertação Digital
    Abstract
    Resumo: A evolução da computação e das redes de computadores permitiu a interconexão de vários computadores, agregando seus poderes de processamento para formar arquiteturas de computação de alto desempenho (HPC). As aplicações executadas nesses ambientes computacionais processam e comunicam grandes quantidades de informações, levando várias horas ou até dias para concluir suas execuções. Portanto, entender suas demandas de computação e comunicação é essencial para fins de gerenciamento. Embora a maioria das aplicações HPC sejam implementadas com algoritmos conhecidos que tendem a seguir um determinado padrão em computação e comunicação, os métodos clássicos de análise de tráfego não são precisos para classificá-los. Nesse sentido, argumentamos que observar e entender os padrões visuais nas matrizes de tráfego (TMs) dessas aplicações pode fornecer um método de classificação preciso. Neste trabalho, propomos o SCTReco (Scale Free Traffic matrices Recognition), um framework que mantém um banco de dados com características visuais extraídos dessas TMs e aplica técnicas de aprendizado de máquina e aprendizado profundo para classificar as aplicações HPC que estão consumindo a rede, independentemente do número de nós computacionais que a executam. O modo de classificação do SCTReco usa algoritmos de pré-processamento, extratores de características e classificadores de Aprendizado de Máquina (ML). Equipamos o framework com os conhecidos classificadores Random Forest (RF) e Support Vector Machine (SVM); como extrator de características são usados o Padrão Binário Local Uniforme (ULBP), Padrão Binário Local Robusto (RLBP), Matriz de Coocorrência em Nível de Cinza (GLCM) e Análise de Componente Principal (PCA); e pré-processando as TMs com interpolação do vizinho mais próximo, desfoque gaussiano, recorte e dilatação. Com essa abordagem, SCTReco pôde ser treinado com TMs de 128 nós e reconheceu três aplicativos HPC reais executados em 256 nós de computação com 99,76% de precisão e 85,23% reconhecendo TMs de 512 nós de computação.
     
    Abstract: The evolution of computing and computer networking allowed multiple computers to be interconnected, aggregating their processing powers to form High-Performance Computing (HPC) architectures. Applications running in these computational environments process and communicate huge amounts of information, taking several hours or even days to complete their executions. So, understanding their computation and communication demands is essential for management purposes. Although most HPC applications are implemented with known algorithms that tend to follow a certain pattern in computing and communication, classical traffic analysis methods are not accurate to classify them. In this context, we argue that observing and understanding the visual patterns in the traffic matrices (TMs) of these applications can provide an accurate classification method. In this work, we propose SCTReco (Scale Free Traffic matrices Recognition), a framework that maintains a database with visual characteristics extracted from these TMs and applies machine learning techniques to classify the HPC applications that are consuming the network, regardless of the number of computational nodes that execute it. SCTReco's classification mode uses preprocessing algorithms, feature extractors, and Machine Learning (ML) classifiers. We equipped the framework with the well-known classifiers Random Forest (RF) and Support Vector Machine (SVM); using as feature extractor the Uniform Local Binary Pattern (ULBP), Robust Local Binary Pattern (RLBP), Gray-Level Co-occurrence Matrix (GLCM), and Principal Component Analysis (PCA); and preprocessing the TMs with nearest neighbor interpolation, Gaussian blur, crop and dilation. With this approach, SCTReco could be trained with TMs of 128 nodes and recognized three real HPC applications executed in 256 computing nodes with 99.76% of accuracy, and 85.23% recognizing TMs of 512 computing nodes.
     
    URI
    https://hdl.handle.net/1884/75104
    Collections
    • Dissertações [352]

    DSpace software copyright © 2002-2016  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    Atmire NV
     

     

    Browse

    All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsxmlui.ArtifactBrowser.Navigation.browse_typeThis CollectionBy Issue DateAuthorsTitlesSubjectsxmlui.ArtifactBrowser.Navigation.browse_type

    My Account

    LoginRegister

    Statistics

    View Usage Statistics

    DSpace software copyright © 2002-2016  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    Atmire NV