Análise da filogenia molecular global de eucariotos atráves da representação vetorial de proteomas mitocondriais
Resumo
Resumo: A construção de uma filogenia eucariótica global por meio de análises moleculares é um desafio de longa data. Apesar dos avanços na área genômica e em métodos filogenéticos, grupos taxonômicos controversos destacam a necessidade de modelos filogenéticos globais atualizados para acomodar o crescente volume de dados genômicos. Devido a diversas características vantajosas, o genoma mitocondrial é amplamente utilizado em estudos filogenéticos. O desenvolvimento de um modelo global otimizado para filogenia mitocondrial pode aprimorar nossa compreensão da biologia eucariótica. Neste estudo, utilizamos representações vetoriais de proteomas mitocondriais do NCBI RefSeq para construir uma árvore molecular global para eucariotos em uma abordagem de duas fases: primeiro, com um conjunto de dados menor contendo 8.426 organismos e, depois, com um conjunto de dados maior e atualizado contendo 16.977 organismos. Apresentamos o modelo mais completo atualmente para filogenia mitocondrial de eucariotos. Devido à escala abrangente do estudo, focamos a análise em espécies de metazoários. Nossa árvore resolveu com sucesso táxons em níveis mais baixos, como ordens e famílias de aves, destacando a precisão do modelo. No entanto, relações em níveis mais altos foram desafiadoras devido a imprecisões nos dados e fenômenos de atração de ramificações longas, principalmente nos filos Mollusca e Arthropoda. Além disso, conseguimos identificar os grupos taxonômicos que possuíram um crescimento significativo no intervalo entre os dois conjuntos de dados. O presente estudo auxilia na compreensão das relações evolutivas entre táxons diversos, fornecendo insights sobre grupos filogenéticos conflitantes. Além disso, destacamos a importância da filogenia molecular na resolução de debates taxonômicos e no avanço da compreensão da complexa evolução eucariótica. Abstract: The construction of a global eukaryotic phylogeny through molecular data is a challenging task. Despite advances in genomics and phylogenetic methods, ongoing taxonomic controversies highlight the need for updated global phylogenetic models to accommodate the growing volume of genomic data. Due to several advantageous characteristics, mitochondrial genome sequences are widely used in phylogenetic studies. An optimal global model for mitochondrial phylogeny could enhance our understanding of eukaryote biology. In this study, we used vector representations of mitochondrial proteomes from NCBI RefSeq to build a comprehensive molecular tree for eukaryotes in a twophase approach: firstly, with a smaller dataset containing 8,426 organisms and after with a larger updated dataset containing 16,977 organisms. We present the current most complete eukaryotic mitochondrial phylogeny model. Due to the large scale of the study, we focused the analysis on metazoan species here. Our tree successfully resolved lower-level taxa, such as bird orders and families, showcasing the model's accuracy. However, higher-level relationships were challenging to resolve due to data inaccuracies and long-branch attraction phenomena, mainly with the phyla Mollusca and Arthropoda. Moreover, we could identify the taxonomic groups that experienced noteworthy growth in the interval between the two datasets. This study helps to understand evolutionary relationships across diverse taxa, providing insights into conflicting phylogenetic groups. It underscores the importance of molecular phylogenetics in resolving taxonomic debates and advancing our understanding of the complex eukaryotic evolution.
Collections
- Dissertações [225]