조상별로 다양한 연관 연구에서 연관 불균형에 대한 매우 희박한 모델
홈페이지홈페이지 > 블로그 > 조상별로 다양한 연관 연구에서 연관 불균형에 대한 매우 희박한 모델

조상별로 다양한 연관 연구에서 연관 불균형에 대한 매우 희박한 모델

Aug 24, 2023

Nature Genetics (2023)이 기사 인용

293 액세스

30 알트메트릭

측정항목 세부정보

연관 불균형(LD)은 근처의 유전적 변이체 간의 상관관계입니다. 유전적 연관성 연구에서 LD는 큰 상관 행렬을 사용하여 모델링되는 경우가 많지만 이 접근 방식은 특히 조상이 다양한 연구에서 비효율적입니다. 본 연구에서는 LD를 매우 희박하고 효율적으로 표현하는 LD 그래픽 모델(LDGM)을 소개합니다. LDGM은 게놈 차원의 계보에서 파생됩니다. LDGM의 대립유전자 간의 통계적 관계는 일배체형 간의 계보적 관계에 해당합니다. 우리는 5개 조상 그룹에서 1,800만 개의 공통 변이(소대립유전자 빈도 >1%)에 대한 LDGM 및 조상별 LDGM 정밀 행렬을 발표하고, 정확성을 검증했으며, 일반적으로 사용되는 LD 행렬 계산에 대해 런타임에서 크기 차수 개선을 시연했습니다. 우리는 참조 LD 상관 행렬을 기반으로 하는 유사한 방법보다 더 나은 성능을 발휘하는 매우 빠른 다중 조상 다유전자 예측 방법인 BLUPx-ldgm을 구현했습니다. LDGM은 수백만 개의 변종과 개체에 걸쳐 조상의 다양한 유전적 연관 데이터로 확장되는 정교한 방법을 가능하게 합니다.

구독 콘텐츠의 미리보기입니다. 기관을 통해 액세스하세요.

Nature 및 기타 54개 Nature 포트폴리오 저널에 액세스하세요.

최고의 가치를 지닌 온라인 액세스 구독인 Nature+를 받으세요

$29.99 / 30일

언제든지 취소하세요

이 저널을 구독하세요

12권의 인쇄본과 온라인 접속권을 받으세요

연간 $189.00

호당 단 $15.75

이 기사를 대여하거나 구매하세요

가격은 품목 유형에 따라 다릅니다.

부터$1.95

~$39.95

가격에는 결제 시 계산되는 지방세가 적용될 수 있습니다.

LDGM, LDGM 정밀 행렬 및 트리 시퀀스는 Zenodo(참조 84, https://doi.org/10.5281/zenodo.8157131)에서 구할 수 있습니다. 높은 적용 범위의 단계적 1000개 게놈 유전자형 데이터는 http://ftp.1000genomes.ebi.ac.uk/vol1/ftp/data_collections/1000G_2504_high_coverage/working/20201028_3202_phased에서 확인할 수 있습니다. LD 독립 블록은 https://github.com/jmacdon/LDblocks_GRCh38에서 사용할 수 있습니다. 영국 바이오뱅크 요약 통계 및 LD는 s3://broad-alkesgroup-ukbb-ld/UKBB_LD/에서 확인할 수 있습니다. 조상 상태는 Ensembl 릴리스 100을 통해 제공되며 ftp://ftp.ensembl.org/pub/release-100/fasta/ancestral_alleles(참조 83)에서 다운로드할 수 있습니다.

우리는 Python과 MATLAB으로 구현된 오픈 소스 소프트웨어 패키지인 ldgm v.0.1을 출시했습니다. ldgm을 사용하면 LDGM 및 LDGM 정밀 행렬을 추론할 수 있을 뿐만 아니라 LDGM을 사용하여 GWAS 요약 통계를 계산적으로 효율적으로 분석할 수 있습니다. https://github.com/awohns/ldgm에서 이용 가능하며 Zenodo85(https://doi.org/10.5281/zenodo.8161389)에 기탁되어 있습니다. BLUPx-ldgm을 포함하여 LDGM을 사용하여 GWAS 요약 통계를 분석하는 모든 기능은 현재 MATLAB에서 구현됩니다. Python 구현이 계획되어 있습니다. BLUPx-ldgm은 https://github.com/freeseek/score에서 사용할 수 있는 bcftools에서도 구현됩니다. tskit은 https://github.com/tskit-dev/tskit에서 사용할 수 있습니다. 이 원고의 결과를 재현하는 스크립트는 https://github.com/awohns/ldgm_paper에서 확인할 수 있습니다.

국제 HapMap 컨소시엄. 인간 게놈의 일배체형 지도. 자연 437, 1299-1320(2005).

기사 Google 학술검색

Reich, DEet al. 인간 게놈의 연관 불균형. 자연 411, 199–204 (2001).

기사 CAS PubMed Google 학술검색

Abecasis, GRet al. 세 가지 게놈 영역에서 연관 불균형의 정도와 분포. 오전. J. 흠. 그 가죽. 68, 191–197(2001).

기사 CAS PubMed Google 학술검색

Finucane, HK et al. 게놈 전체 연관 요약 통계를 사용하여 기능적 주석으로 유전성을 분할합니다. Nat. 그 가죽. 47, 1228-1235(2015).

0.01. c and f show the alternative mean-squared error, defined as m−2 Tr((I−PR)(I−RP)). This measures the difference between PR, the product of the LD correlation matrix and the LDGM precision matrix, and the identity matrix (see Supplementary Note, section 4). Compared with the MSE, the alternative MSE is less sensitive to large eigenvalues of R, probably explaining why it is not elevated for AMR. For the identity matrix, the alternative MSE and the MSE are identical. In all plots, the lower whisker, lower hinge, center, upper hinge and upper whisker correspond to (lower hinge − 1.5× interquartile range (IQR)) and the 25th percentile, median, 75th percentile, and (upper hinge + 1.5× IQR), respectively./p>