Genomics methodologies to access autozygosity and inbreeding in dairy cattle
Abstract
Resumo: Para alcançar a demanda crescente de produtos de origem animal a cadeia de produção de leite tem mudado constantemente nos últimos 20 anos. Por exemplo, o melhoramento genético de bovinos de leite tem aumentado o ganho genético de inúmeras características de qualidade e produtividade. Porém, o intenso uso de um pequeno número de reprodutores e a inseminação artificial nos programas de melhoramento genético tem aumentado também o nível de endogamia dessas populações. Altos índices de endogamia têm sido relacionados com a redução no desempenho produtivo e reprodutivo. Atualmente, em bovinos da raça Holandesa, é praticamente impossível encontrar animais sem algum nível de endogamia. O interesse em estimar coeficientes de endogamia com informação genômica apareceu com o advento da tecnologia de genotipagem utilizando milhares de marcadores. Por exemplo, tem sido aplicada em bovinos de leite a estimativa de endogamia através das corridas de homozigose (ROH). Portanto, o objetivo deste estudo foi avaliar o efeito da seleção com o acasalamento preferencial positivo sobre a depressão endogâmica em diferentes populações simuladas de bovinos leiteiros, diferentes em desequilíbrio de ligação (LD). Além disso, esta tese avaliou o uso de dados genômicos simulados para investigar muitos aspectos e cenários de endogamia e autozigose em populações de bovinos de leite. Portanto, o objetivo também foi em avaliar a habilidade do método da janela de SNPs e do método de SNPs consecutivos para determinação de ROH e o seu acesso à autozigosidade e ao coeficiente de endogamia genômica em populações simuladas de bovinos taurinos e indianos. A avaliação foi aplicada em populações simuladas de bovinos leiteiros diferentes em níveis de desequilíbrio de ligação (LD). Utilizando o software QMSim, as populações foram simuladas pelo processo forward-in-time. Os parâmetros foram escolhidos para gerar populações com características similares às raças leiteiras taurinas e zebuínas. Foram simulados 93 QTLs relacionados à produção de leite, e aleatoriamente distribuídos em 29 autossomos de Bos taurus. Para criar alto e baixo desequilíbrio de ligação foi realizado um afunilamento na população histórica, 1.020 ou 2.020 gerações foram simuladas iniciando com um tamanho efetivo de 1.000 e terminando com 200 animais no final do ciclo. Para fundar 20 gerações em 5 cenários diferentes para cada nível de desequilíbrio de ligação, as populações foram simuladas com diferentes sistemas de acasalamento e critérios de seleção. A seleção foi feita baseada nos valores genéticos estimados pelo método BLUP ou pelo valor genético verdadeiro estimado com o efeito dos QTLs. A média de endogamia de cada geração foi estimada pelo próprio QMSim e associado com o nível de depressão endogâmica para produção de leite encontrado na literatura. Da última geração da população histórica, para gerar o genótipo para a seleção, foram aleatoriamente selecionados 50.000 marcadores da população (MAF ? 0,02), estes dados imitam os painéis utilizados comumente para genotipar bovinos. As corridas de homozigose foram obtidas por duas diferentes metodologias do pacote detecRUNS do programa R para 1.000 animais nas gerações 1, 5, 10, 15 e 20. O primeiro, o método das janelas consecutivas de SNPs, escaneia cada SNP ao longo do genótipo de cada animal para a detecção de segmentos em homozigose de acordo com um tamanho de corridas de homozigose e um número mínimo de SNPs em homozigose. O segundo, o método consecutivo, não utiliza as janelas para evitar a determinação de falsos ROH, menores que a janela. O coeficiente de endogamia baseado nas corridas de homozigose (FROH) é definido como a proporção de corridas de homozigose em relação ao genoma total do indivíduo. Os níveis mais altos de endogamia foram obtidos nos cenários com acasalamento preferencial positivo, e variaram de 0,2 a 0,36 na vigésima geração de seleção. O uso intenso de um pequeno número de touros em vinte gerações de seleção poderia causar perda entre 6,98 e 7,20% na produção de leite nos piores cenários. Em geral, para os cenários imitando o acasalamento dirigido, e minimizando a endogamia, o aumento no nível médio de endogamia de ~3% e ~8% diminui ~0,6 e ~1,8% a produção de leite aos 305 dias respectivamente. A seleção intensa para uma característica pode incrementar rapidamente os níveis do coeficiente de endogamia para valores críticos em populações com baixo e alto desequilíbrio de ligação inicial. Sistemas de acasalamento dirigido podem ser aplicados para a manutenção de baixos níveis de endogamia e consequentemente controlar a depressão endogâmica. Em geral, o maior número de corridas de homozigose nas gerações de 1 a 20 estão na classe com comprimento variando entre 1-2 Mb. A porcentagem de corridas de homozigose diminuíram com o passar das gerações para a classe 1-2 Mb de comprimento. No entanto, a porcentagem de corridas de homozigose aumentou da primeira para a vigésima geração na classe > 8 Mb nas diferentes populações e metodologias utilizadas para a detecção de ROH. A média do comprimento de ROH na classe 1-2 Mb é maior para populações taurinas comparadas às populações indianas. No entanto, para a classe > 8 Mb, a população indiana geralmente possui um média maior no comprimento da corrida de homozigose. O coeficiente de endogamia baseado no pedigree (FPED) aumentou ao longo das 20 gerações simuladas para as populações taurinas e indianas. Porém, os coeficientes de endogamia genômicos baseados nas corridas de homozigose (FROH), detectados pelas diferentes metodologias, são diferentes entre as populações taurinas e indianas. Estes resultados sugerem que FROH calculado a partir das corridas de homozigose, obtidas em ambas metodologias, é capaz de acessar a autozigosidade muito antiga. A detecção de corridas de homozigose, pelo método das janelas ou dos SNPs consecutivos, são metodologias importantes para acessar endogamia recente ou mais antiga. A estimativa de endogamia genômica baseada nas corridas de homozigose é capaz de demonstrar eventos evolutivos que diferenciam algumas raças de bovinos. Palavras-chave: Holandesa, Ligação, Desequilíbrio, QMSim, Simulação, Seleção, ROH, Homozigosidade, SNP. Abstract: To achieve the livestock products demand, the milk productive chain has been changed constantly over the last 20 years. For instance, dairy cattle's breeding has been improving many milk quality and productivity traits. But, the heavy use of a small number of sires and the artificial insemination practice on breeding programs has been increasing the dairy cattle inbreeding. Besides that, these high levels have been related to reduced fitness and reproductive performance. In Holstein dairy cattle it is almost impossible to find individuals without some level of inbreeding. The interest to estimate inbreeding coefficients with genomic information appears with the advent of high throughput genotyping technologies. For instance, was applied in dairy cattle the estimation of inbreeding coefficient with runs of homozygosity (ROH). Therefore, the aim of this study was to evaluate the effect of selection with assortative positive mating on inbreeding depression considering simulated dairy cattle populations distinguished by linkage disequilibrium (LD). In addition, this thesis evaluated the use of genomic simulated data to investigate many aspects and scenarios of inbreeding and autozygosity under dairy cattle populations. Thus, also the aim of was to evaluate the ability of sliding and consecutive ROH approach to detect and express autozygosity and genomic inbreeding coefficient (FROH) in taurine and indicine simulated populations with twenty generations of assortative positive mating. The evaluation was applied in dairy cattle populations distinguished by linkage disequilibrium (LD). Using the QMSim software, the populations were simulated based on forward-in-time process. The parameters were chosen to try and generate a population with similar characteristics of taurine and indicine dairy cattle. Were simulated 93 milk yield QTLs randomly distributed on 29 autosomal chromosomes of Bos taurus. To create a high and low level of initial linkage disequilibrium were made a bottleneck in the historical population, 1,020 or 2,020 generations were simulated starting from an effective population of 1,000 to 200 animals at the end of the cycle. To found 20 generations of five different scenarios for each level of LD, the populations were simulated with a different mating system and selection criteria. The selection was based on breeding values estimated with BLUP method or, the true breeding value estimated with the effect of QTLs. Each generation inbreeding mean was estimated by QMSim and associated with the level of inbreeding depression of milk yield found in the literature. From the last generation of the historical population, to generate genotypic data for the selection, the individuals were randomly selected with a total of 50,000 markers (MAF ? 0.02), these data mimicked the commonly SNP panel used to genotype cattle. The runs of homozygosity were obtained by two different methodologies in the detectRUNS package of R software for 1,000 individuals of generations 1, 5, 10, 15, and 20. At first, the sliding window method scans along everyone's genotype, at each SNP marker position, for detection of homozygous segments with a specified length or number of homozygous SNPs. At second, the consecutive method does not use the sliding windows to avoid the introduction of artificial ROH that are shorter than the window. Inbreeding coefficient based on ROH (FROH) is a genomic portion of individual autozygosity and defined it as the proportion of the autosomal genome lying in ROH of certain minimal length relative to the overall genome in interest. The highest inbreeding levels, varying from 0.2 to 0.36, in the twentieth generation were obtained for positive assortative mating systems. The intense use of a few numbers of sires in twenty generations of selection may cause a loss between 6.98 and 7.20% on milk yield in the worst scenarios. In general, for minimizing inbreeding scenarios, the average level inbreeding increasing of ~3 and ~8% in the twenty generations of selection decreases ~0.6 and ~1.8% the milk yield at 305 days respectively. The intensive selection for one trait could rapidly increase the average inbreeding coefficient on critical levels in populations with high and low initial LD. Non-random mating systems must be applied to control inbreeding levels and consequently inbreeding depression. In general, the class of 1-2 Mb length size has the highest number of ROH across all evaluations on generations 1, 5, 10 and 20. The percentage of ROH class 1-2 Mb decreases from generation 1 to 20. Nevertheless, the percentage of ROH class >8 increase across the twenty generations of selection in the distinguished populations and ROH detection methodologies. The mean ROH length in the class 1-2 Mb is higher for taurine than to indicine simulated population. Otherwise, for the class >8 Mb the indicine generally has higher mean ROH length. The inbreeding coefficient level based on pedigree (FPED) increases across the twenty simulated generations for taurine and indicine populations. But, genomic inbreeding coefficients based on ROH detected by sliding approach (FROHs) and ROH detected with the consecutive approach (FROHc) are different among these two populations. These results suggest that FROH from both methods to access ROH can detect ancient and recent autozygosity. Genomic inbreeding estimates based on ROH segments can represent and evolutionary events which distinguish some breeds. Key-words: Holstein, Linkage, Disequilibrium, QMSim, Simulation, Selection, ROH, homozygosity, SNP.
Collections
- Teses [49]