Chapter 8. 자폐 시퀀싱 컨소시엄과 국제 협력

개별 코호트가 각각의 장점을 가지고 있다 하더라도, 자폐스펙트럼장애의 유전적 구조를 본격적으로 해부하기 위해서는 이 코호트들의 데이터를 통합하여 분석하는 과정이 필요했다. 하나의 코호트에서 특정 유전자에 신생변이가 한두 명에게서 발견되었다고 해서 그것이 자폐 위험 유전자라고 확정할 수는 없다. 유전자가 충분히 크다면 우연에 의해서도 변이가 관찰될 수 있기 때문이다. 같은 유전자에 신생변이가 여러 명의 환자에게서 반복적으로 발견되어야, 그리고 그 빈도가 우연에 의한 기대치를 통계적으로 유의하게 초과해야 비로소 위험 유전자로 인정받을 수 있다. 이 반복 관찰을 확보하기 위해서는 수천, 수만 명 규모의 통합 분석이 필수적이었다.

자폐 시퀀싱 컨소시엄(Autism Sequencing Consortium, ASC)은 이 필요에 응답하여 만들어진 국제 협력체다. Buxbaum et al. (2012) 연구에 기술된 ASC는 마운트 시나이 의과대학, 브로드 연구소, 카네기 멜론 대학, 예일 대학, 피츠버그 대학 등 주요 연구 기관들이 참여하여 엑솜 시퀀싱 데이터를 공유하고 통합 분석하는 프레임워크를 구축했다. ASC의 핵심 전략은 여러 코호트의 데이터를 하나로 합쳐서 분석하는 것(데이터 풀링, data pooling)이었다. SSC, AGRE, 그리고 다수의 개별 코호트에서 수행된 엑솜 시퀀싱 결과를 하나의 분석 파이프라인 안에서 함께 분석함으로써, 개별 코호트에서는 불가능했던 통계적 검정력을 확보하는 것이었다.

ASC가 발전시킨 핵심 통계 도구가 TADA(Transmission and De novo Association) 프레임워크다. TADA는 신생변이, 유전된 변이, 사례-대조 비교의 증거를 하나의 모형 안에서 통합하여 유전자 수준의 연관 검정을 수행한다. 유전자의 크기(큰 유전자는 우연히 변이가 생길 확률이 높으므로 이를 보정해야 한다), 변이의 유형(기능 상실, 미스센스, 동의 변이), 그리고 유전자가 변이에 얼마나 민감한지(제약 정도, constraint)를 고려하여 각 유전자가 진정한 자폐 위험 유전자일 확률을 추정한다. 이 프레임워크를 통해 ASC는 단계적으로 자폐 위험 유전자 목록을 확장해왔다. Sanders et al. (2015) 연구에서 65개, Satterstrom et al. (2020) 연구에서 102개, Fu et al. (2022) 연구에서 185개의 유전자가 통계적으로 신뢰할 수 있는 자폐 위험 유전자로 확인되었고, 현재는 전체 자폐 위험 유전자 수가 약 1,000개에 달할 것으로 추정된다. 이 유전자 발견의 역사는 Part 3에서 자세히 다룬다.

정신과 유전학의 컨소시엄 모델

ASC의 컨소시엄 모델은 자폐 분야에서 독립적으로 발전한 것이 아니라, 정신과 유전학 전반에서 일어난 컨소시엄 과학의 흐름 안에 있었다. 정신질환 유전체학 컨소시엄(Psychiatric Genomics Consortium, PGC)은 조현병, 양극성 장애, 주요 우울장애, ADHD 등 주요 정신질환의 GWAS 데이터를 통합하는 메가 컨소시엄으로, 2009년에 설립되어 현재 40개국 800명 이상의 연구자가 참여하고 있다. PGC의 모델은 간단했다. 개별 연구실이 각자의 표본으로 GWAS를 수행하면 검정력이 부족하지만, 모든 표본을 하나로 합치면 의미 있는 발견이 가능하다는 것이었다. 이 전략은 조현병에서 108개의 유전적 좌위를 발견한 2014년의 연구에서 극적으로 입증되었고, 자폐 유전학에도 같은 논리가 적용되었다.

Sanders et al. (2017) 연구는 전장 유전체 시퀀싱을 정신과 유전학에 적용하기 위한 또 다른 컨소시엄, 전장 유전체 시퀀싱 정신과 유전체학 컨소시엄(Whole Genome Sequencing for Psychiatric Genomics, WGSPD)을 기술한다. 이 컨소시엄은 엑솜에서 전장 유전체로의 전환이 어떤 추가적인 발견을 가능하게 하는지를 탐구하기 위해 설립되었다. 엑솜 시퀀싱이 단백질 코딩 영역의 변이만 볼 수 있는 반면, 전장 유전체 시퀀싱은 비코딩 조절 요소, 구조 변이, 반복 서열 확장 등 유전체의 나머지 98.5%에 있는 변이도 포착할 수 있다. 이 확장된 시야가 자폐 유전학에 어떤 새로운 발견을 가져왔는지는 Part 3의 후반부에서 다루게 된다.

유럽을 넘어 — 조상 다양성의 문제

자폐 유전학의 대규모 코호트들이 가진 가장 심각한 한계 중 하나는 조상(ancestry) 다양성의 부족이었다. SSC, SPARK, MSSNG 모두 참여자의 대다수가 유럽계(European ancestry)였고, 아시아, 아프리카, 라틴아메리카 인구는 극히 소수에 불과했다. 이것은 단순한 대표성의 문제가 아니라 과학적 한계를 초래한다. 유전 변이의 빈도는 인구 집단에 따라 다르고, 특정 인구에서 흔한 변이가 다른 인구에서는 드물 수 있다. 유럽계 인구에서 발견된 위험 변이가 다른 인구에서도 같은 효과를 가지는지는 별도의 검증이 필요하며, 비유럽계 인구 고유의 위험 변이는 유럽계 중심의 코호트에서는 발견조차 되지 않을 수 있다.

이 문제를 해결하기 위한 노력이 최근에야 본격화되고 있다. GALA(Genetic Analysis of Latin American Autism) 컨소시엄은 브라질, 페루, 콜롬비아, 코스타리카, 멕시코, 미국 등 아메리카 대륙 10개 기관에서 모집한 6,977명(자폐 환자 4,717명 포함)을 분석하여, 라틴아메리카계 인구에서 수행된 가장 큰 규모의 자폐 시퀀싱 연구를 완성했다(GALA Consortium 2026). TADA 분석을 통해 35개의 유전체 수준 유의 유전자를 확인했는데, 그중 19개가 유럽계 인구 데이터에서도 유의하여 자폐의 핵심적인 유전적 기전이 조상 집단에 걸쳐 공유된다는 것을 보여주었다. 신생변이가 형제에 비해 자폐 환자에서 높은 비율로 나타나는 패턴도 라틴아메리카계에서 다른 조상 집단과 일관되게 확인되었다. 이 결과는 기존의 유전자 검사 접근이 다양한 인구에 적용 가능하다는 실질적 함의를 가진다. 한국의 K-ARC 코호트는 동아시아계 인구에서 가장 큰 자폐 유전체 자원을 제공하고 있으며, 중국에서도 대규모 자폐 코호트 구축이 진행되고 있다. 이러한 노력들은 자폐의 유전적 구조가 인구 집단에 걸쳐 보편적인 것인지, 아니면 인구 특이적 요소가 있는지를 검증하는 데 필수적이다. 다음 장에서는 이 조상 다양성 문제와 직접적으로 연결되는 한국의 자폐 코호트, K-ARC의 이야기를 다룬다.

References

Buxbaum, J. D., Daly, M. J., Devlin, B., Lehner, T., Roeder, K., & State, M. W. (2012). The Autism Sequencing Consortium: Large-scale, high-throughput sequencing in autism spectrum disorders. Neuron, 76(6), 1052-1056. doi:10.1016/j.neuron.2012.12.008

Fu, J. M., Satterstrom, F. K., Peng, M., Brand, H., Collins, R. L., Dong, S., … & Talkowski, M. E. (2022). Rare coding variation provides insight into the genetic architecture and phenotypic context of autism. Nature Genetics, 54(9), 1320-1331. doi:10.1038/s41588-022-01104-0

Sanders, S. J., He, X., Willsey, A. J., Ercan-Sencicek, A. G., Samocha, K. E., Cicek, A. E., … & State, M. W. (2015). Insights into autism spectrum disorder genomic architecture and biology from 71 risk loci. Neuron, 87(6), 1215-1233. doi:10.1016/j.neuron.2015.09.016

Sanders, S. J., Neale, B. M., Huang, H., Werling, D. M., An, J.-Y., Dong, S., … & Buxbaum, J. D. (2017). Whole genome sequencing in psychiatric disorders: The WGSPD consortium. Nature Neuroscience, 20(12), 1661-1668. doi:10.1038/nn.4602

GALA Consortium. (2026). Deleterious coding variation associated with autism is shared across ancestries. Nature Medicine. doi:10.1038/s41591-026-04228-6

Satterstrom, F. K., Kosmicki, J. A., Wang, J., Breen, M. S., De Rubeis, S., An, J.-Y., … & Buxbaum, J. D. (2020). Large-scale exome sequencing study implicates both developmental and functional changes in the neurobiology of autism. Cell, 180(3), 568-584. doi:10.1016/j.cell.2019.12.036