Chapter 7. 5만 가족의 시대 — SPARK와 대규모 코호트

SSC가 약 2,700개의 심플렉스 4인 가족 가족을 모집하는 데 수년이 걸렸다면, 그다음 단계의 질문은 분명했다. 더 많은 가족을 더 빠르게 모집할 수 있는 방법은 없는가? 유전학에서 표본 크기는 곧 통계적 검정력이고, 검정력은 곧 발견의 범위를 결정한다. 통계적 검정력이란, 실제로 존재하는 차이를 탐지할 수 있는 능력을 말한다. 표본이 적으면 큰 차이만 잡아낼 수 있고, 표본이 많으면 작은 차이까지 잡아낼 수 있다. SSC의 2,700가족에서 발견할 수 있었던 것은 효과 크기가 큰 신생변이들이었다. 하지만 자폐스펙트럼장애의 유전적 위험의 대부분이 개별 효과가 작은 일반 변이의 합산에 있다는 것이 밝혀지면서, 이런 작은 효과를 탐지하려면 수만 명 규모의 코호트가 필요하다는 것이 분명해졌다.

2015년, SFARI는 SPARK(Simons Foundation Powering Autism Research for Knowledge)를 발족했다. SPARK Consortium (2018) 연구에 기술된 이 프로젝트의 목표는 5만 가족, 즉 약 25만 명의 개인을 모집하는 것이었다. 이 규모는 SSC의 거의 20배에 달했다. 규모의 확대를 가능하게 한 핵심 혁신은 모집 방식의 변화였다. SSC가 12개 대학 의료 기관에서 직접 대면 평가를 통해 모집했다면, SPARK는 웹 기반 플랫폼을 통한 원격 모집을 도입했다. 참여를 원하는 가족은 온라인으로 등록하고, 표준화된 설문을 작성하며, 우편으로 타액 채취 키트(침을 담는 작은 용기)를 받아 DNA 시료를 보냈다. 침 속에 포함된 구강 세포에서 DNA를 추출할 수 있기 때문이다. 이 접근은 전통적인 대면 모집에 비해 비용이 획기적으로 낮았고, 지리적 장벽을 제거하여 대학 의료 기관에 접근하기 어려운 가족들도 참여할 수 있게 했다.

물론 웹 기반 모집에는 타협이 따랐다. SSC에서 모든 참여자가 ADOS와 ADI-R이라는 황금 표준 도구로 직접 평가받은 것과 달리, SPARK의 자폐스펙트럼장애 진단 확인은 주로 보호자의 자기 보고에 의존했다. 진단의 정확성이 떨어질 수 있다는 우려가 있었지만, SPARK는 이를 참여자 재접촉(recontact) 기능으로 보완하려 했다. 특정 유전적 소견이 발견된 참여자에게 다시 연락하여 추가 평가를 수행할 수 있는 구조를 설계한 것이다. 또한 SPARK는 심플렉스 가족에 한정하지 않고 멀티플렉스 가족, 단독 참여자(부모 없이 환자만), 그리고 유전적으로 진단된 증후군적 자폐 사례까지 포괄적으로 모집했다. SSC가 신생변이 발견에 최적화된 균질한 코호트였다면, SPARK는 다양한 연구 질문에 활용할 수 있는 넓은 표본이었다.

Autism Speaks와 MSSNG — 또 다른 가족의 이야기

SFARI 재단과 함께 자폐 연구의 인프라를 구축한 또 하나의 핵심 조직이 Autism Speaks다. 이 조직의 탄생에도 한 가족의 이야기가 있다. 밥 라이트(Bob Wright)는 제너럴 일렉트릭(GE)의 부회장이자 NBC의 CEO로 20년 이상 재직한 미디어 산업의 거물이었다. 그와 그의 아내 수잔 라이트(Suzanne Wright)의 손자가 자폐스펙트럼장애 진단을 받은 것이 계기가 되어, 2005년에 Autism Speaks를 설립했다. SFARI 재단이 기초과학 연구에 집중한 것과 비교하면, Autism Speaks는 연구와 함께 인식 개선, 입법 활동, 보험 개혁에도 적극적이었다. 미국 의회에서 2006년 자폐 대응법(Combating Autism Act)을 통과시켜 9억 2,100만 달러의 연구 예산을 확보한 것, 유엔에서 세계 자폐 인식의 날(World Autism Awareness Day)을 제정하게 한 것, 미국 32개 주에서 자폐 보험 개혁 법률을 이끌어낸 것이 대표적인 성과다. 밥 라이트는 NIH의 350억 달러 예산 중 자폐에 할당되는 금액이 약 1억 6,900만 달러에 불과하다는 점을 지적하면서, 정부 연구비가 자폐의 유병률에 비해 심각하게 부족하다고 주장했다. 이 부족분을 민간 자선이 메우고 있다는 것이 자폐 연구의 독특한 구조다.

Autism Speaks는 연구 측면에서도 중요한 기여를 했다. 특히 AGRE(Autism Genetic Resource Exchange)를 흡수하여 멀티플렉스 가족 중심의 유전체 자원을 확보했고, 이를 기반으로 MSSNG 프로젝트를 발족했다. SPARK가 규모를 추구했다면, MSSNG는 깊이를 추구했다. MSSNG는 AGRE에 등록된 가족들을 대상으로 전장 유전체 시퀀싱(whole-genome sequencing, WGS)을 수행하는 프로젝트였다. 엑솜 시퀀싱이 단백질을 만드는 유전자 영역(약 유전체의 1.5%)만을 읽는 것이라면, 전장 유전체 시퀀싱은 유전체 전체, 즉 코딩 영역과 비코딩 영역 모두를 읽는 것이다. 비코딩 영역에는 유전자의 발현을 조절하는 인핸서(enhancer), 프로모터(promoter), 절연체(insulator) 같은 조절 요소들이 포함되어 있고, 이 영역의 변이가 자폐에 기여할 수 있다는 가능성은 이미 여러 연구에서 제기되고 있었다.

Trost et al. (2022) 연구는 MSSNG의 11,312명(자폐 환자 5,100명 포함) 전장 유전체 시퀀싱 데이터를 분석하여, 자폐스펙트럼장애의 유전적 구조를 가장 포괄적으로 기술한 결과를 보고했다. 이 연구의 핵심 발견은 변이 유형별 기여도 추정이었다. 전체 진단적 변이 중 52%가 서열 수준의 변이(SNV, 작은 삽입결실)에서, 46%가 구조 변이(CNV, 역위, 전위)에서, 그리고 2%가 미토콘드리아 변이에서 발견되었다. 전체적인 진단 수율은 14.1%였다. 진단 수율(diagnostic yield)이란 유전체를 분석한 환자 중에서 자폐의 원인으로 지목할 수 있는 구체적인 유전 변이가 발견된 비율을 말한다. 14.1%라는 것은 전장 유전체 시퀀싱을 수행해도 약 86%의 사례에서는 명확한 단일 유전적 원인을 지목할 수 없다는 것을 의미했다. MSSNG의 또 다른 특징은 AGRE에서 유래한 멀티플렉스 가족이 상당수 포함되어 있다는 점이었다. SSC가 심플렉스 가족에서 신생변이를 찾는 데 최적화되었다면, MSSNG는 멀티플렉스 가족에서 유전되는 변이의 역할을 연구하는 데 더 적합한 코호트였다.

AGP(Autism Genome Project)도 이 시기의 중요한 다국적 협력체였다. AGP Consortium (2007) 연구는 자폐가 가족 안에서 어떤 유전체 영역과 함께 전달되는지를 추적하는 연관 분석이라는 방법을 사용하여 자폐 위험 영역을 찾으려 했다. 이 방법은 이후의 대규모 시퀀싱 기술에 의해 대체되었지만, AGP는 여러 나라의 연구자들이 표본과 데이터를 공유하는 국제 협력의 모델을 확립했다는 점에서 중요했다. 자폐 유전학이 단일 연구실의 작업이 아니라 컨소시엄 과학(consortium science)으로 전환되는 데 AGP가 기여한 바는 크다.

코호트 구축의 역사 — 다섯 번의 전환

자폐 유전학의 코호트 역사를 넓게 보면, 1997년 AGRE(Autism Genetic Resource Exchange)의 설립에서 시작하여 현재까지 다섯 번의 전략적 전환이 있었다. 첫 번째는 멀티플렉스에서 심플렉스로의 전환(2007)이다. AGRE가 멀티플렉스 가족에서 유전되는 변이를 찾는 데 집중했다면, SSC는 심플렉스 가족에서 신생변이를 찾는 쪽으로 전략을 바꾸었고, 이것이 자폐 유전자 발견의 돌파구가 되었다. 두 번째는 엑솜에서 전장 유전체로의 전환(2015~)이다. MSSNG와 WGSPD가 유전체의 나머지 98.5%를 읽기 시작했다. 세 번째는 병원 모집에서 인구 기반으로의 전환(2012~)이다. 덴마크의 iPSYCH 코호트는 국가 등록 체계를 통해 18,381명의 자폐 환자를 인구 기반으로 확인하여, 병원에 오는 사람만 연구하는 편향을 줄였다. 네 번째는 깊은 표현형에서 규모로의 전환(2018~)이다. SSC의 엄격한 ADOS/ADI-R 평가에서 SPARK의 웹 기반 설문으로 전환하면서, 규모를 20배 키웠지만 표현형의 깊이는 타협했다. 다섯 번째는 단일 조상에서 다중 조상으로의 전환(2020~)이다. K-ARC, GALA, 중국 코호트 등이 유럽계 중심의 편향을 극복하기 시작했다.

이 다섯 전환의 결과로 현재의 연구 규모가 만들어졌다. Satterstrom et al. (2020) 연구에서 35,584명, Fu et al. (2022) 연구에서 63,237명, Kim et al. (2025) 연구에서 78,685명의 통합 분석이 가능해진 것이다. 하지만 동시에 한 가지 역설도 드러났다. 유전체 데이터가 가장 풍부한 코호트(SSC, SPARK, MSSNG)에는 성인기 결과 데이터가 거의 없고, 성인기 결과를 장기 추적하는 코호트(UK Biobank, 덴마크 등록 체계)에는 심층 유전체 데이터가 부족하다. 유전적 원인을 아는 아이가 성인이 되었을 때 어떤 삶을 살게 되는지를 알기 위해서는, 이 두 종류의 데이터가 한 코호트 안에서 만나야 한다. 이것은 자폐 유전학의 다음 과제 중 하나다.

코호트의 설계가 발견을 결정한다

이 코호트들의 비교에서 드러나는 핵심 교훈은, 코호트의 설계가 발견할 수 있는 것의 범위를 결정한다는 것이다. SSC는 심플렉스 4인 가족 설계로 신생변이 발견에 탁월했고, 실제로 자폐 유전학의 초기 신생변이 발견 대부분이 이 코호트에서 나왔다. SPARK는 규모와 다양성으로 일반 변이의 효과를 연구하고 표현형 하위 집단을 정의하는 데 강점을 가졌다. MSSNG는 전장 유전체 시퀀싱과 멀티플렉스 가족 포함으로 비코딩 변이와 유전되는 변이의 기여를 탐구하는 데 적합했다. 어떤 코호트도 모든 질문에 답할 수 없었고, 각 코호트는 자폐의 유전적 구조라는 퍼즐의 서로 다른 조각을 제공했다.

Glahn et al. (2019) 연구는 가족 기반 연구의 가치를 재조명하면서, 대규모 사례-대조 연구만으로는 포착하기 어려운 유전적 현상들, 이를테면 불완전 침투도, 가변적 표현도(variable expressivity), 양적유전 전달 불균형(polygenic transmission disequilibrium)을 가족 설계가 더 잘 다룰 수 있다고 주장했다. 자폐 유전학이 점점 더 큰 사례-대조 코호트를 추구하는 와중에도, SSC처럼 엄밀하게 설계된 가족 코호트의 가치는 줄어들지 않았다. 다음 장에서는 이러한 개별 코호트들을 하나의 분석 프레임워크 안에서 통합하는 시도, 자폐 시퀀싱 컨소시엄의 이야기로 들어간다.

References

Autism Genome Project Consortium. (2007). Mapping autism risk loci using genetic linkage and chromosomal rearrangements. Nature Genetics, 39(3), 319-328. doi:10.1038/ng1985

Fu, J. M., Satterstrom, F. K., et al. (2022). Rare coding variation provides insight into the genetic architecture and phenotypic context of autism. Nature Genetics, 54(9), 1320-1331. doi:10.1038/s41588-022-01104-0

Glahn, D. C., Nimgaonkar, V. L., Raventós, H., Contreras, J., McIntosh, A. M., Thomson, P. A., … & Escamilla, M. A. (2019). Rediscovering the value of families for psychiatric genetics research. Molecular Psychiatry, 24(4), 523-535. doi:10.1038/s41380-018-0073-x

SPARK Consortium. (2018). SPARK: A US cohort of 50,000 families to accelerate autism research. Neuron, 97(3), 488-493. doi:10.1016/j.neuron.2018.01.015

Kim, S.-W., & An, J.-Y. (2025). Advancing precision diagnosis in autism: Insights from large-scale genomic studies. Molecules and Cells, 48(4), 100248. doi:10.1016/j.mocell.2025.100248

Satterstrom, F. K., Kosmicki, J. A., Wang, J., et al. (2020). Large-scale exome sequencing study implicates both developmental and functional changes in the neurobiology of autism. Cell, 180(3), 568-584. doi:10.1016/j.cell.2019.12.036

Trost, B., Thiruvahindrapuram, B., Chan, A. J. S., Engchuan, W., Higginbotham, E. J., Howe, J. L., … & Scherer, S. W. (2022). Genomic architecture of autism from comprehensive whole-genome sequence annotation. Cell, 185(23), 4409-4427. doi:10.1016/j.cell.2022.10.009