7장. 5만 가족의 시대 — SPARK와 대규모 코호트

SSC가 약 2,700개의 단발성 4인 가족을 모집하는 데 수년이 걸렸다면, 그다음 질문은 표본 크기로 옮겨갔다. 더 많은 가족을, 더 빠르게 모을 방법은 없는가. 유전학에서 표본 크기는 곧 통계적 검정력이고, 검정력은 발견의 범위를 정한다. 통계적 검정력이란 실제로 존재하는 차이를 탐지하는 능력을 말한다. 표본이 적으면 큰 차이만 잡히고, 표본이 많으면 작은 차이까지 잡힌다. SSC의 2,700가족에서 잡아낼 수 있던 것은 효과 크기가 큰 신생변이였다. 그러나 자폐스펙트럼장애의 유전적 위험 대부분이 개별 효과가 작은 일반 변이의 합산에 있다는 사실이 밝혀지면서, 이런 작은 효과까지 탐지하려면 수만 명 규모의 코호트가 필요하다는 점이 드러났다.

2015년, SFARI는 SPARK(Simons Foundation Powering Autism Research for Knowledge)를 발족했다. SPARK Consortium (2018) 연구에 기술된 이 프로젝트의 목표는 5만 가족, 약 25만 명의 개인을 모집하는 것이었다. 이 규모는 SSC의 거의 20배에 달했다. 규모를 이만큼 키울 수 있었던 핵심은 모집 방식의 변화였다. SSC가 12개 대학 의료 기관에서 직접 대면 평가로 모집했다면, SPARK는 웹 기반 플랫폼으로 원격 모집을 도입했다. 참여를 원하는 가족은 온라인으로 등록하고, 표준화된 설문을 작성한 뒤, 우편으로 받은 타액 채취 키트(침을 담는 작은 용기)에 시료를 담아 보냈다. 침에 섞여 나오는 구강 세포에서 DNA를 뽑아낼 수 있기 때문이다. 이 방식은 전통적인 대면 모집과 비교해 비용이 크게 낮았고, 지리적 장벽을 없애 대학 의료 기관에 접근하기 어려운 가족도 참여할 수 있게 했다.

물론 웹 기반 모집에는 타협이 따랐다. SSC에서는 모든 참여자가 ADOS와 ADI-R이라는 황금 표준 도구로 직접 평가를 받았다. SPARK의 자폐스펙트럼장애 진단 확인은 주로 보호자의 자기 보고에 의존했다. 진단의 정확성이 떨어질 수 있다는 우려가 있었지만, SPARK는 이를 참여자 재접촉(recontact) 기능으로 보완하려 했다. 특정 유전적 소견이 발견된 참여자에게 다시 연락해 추가 평가를 진행할 수 있는 구조를 설계한 것이다. SPARK는 또한 단발성 가족에 한정하지 않았다. 다발성 가족, 단독 참여자(부모 없이 진단을 받은 사람만), 그리고 유전적으로 진단된 증후군적 자폐 사례까지 폭넓게 모집했다. SSC가 신생변이 발견에 최적화된 균질한 코호트라면, SPARK는 다양한 연구 질문에 활용할 수 있도록 넓게 펼쳐진 표본이었다.

Autism Speaks와 MSSNG — 또 다른 가족의 이야기

SFARI 재단과 함께 자폐 연구의 인프라를 구축한 또 하나의 핵심 조직이 Autism Speaks다. 이 조직의 탄생에도 한 가족의 이야기가 있다. 밥 라이트(Bob Wright)는 제너럴 일렉트릭(GE)의 부회장이자 NBC의 CEO로 20년 넘게 재직한 미디어 산업의 거물이었다. 그와 그의 아내 수잔 라이트(Suzanne Wright)의 손자가 자폐스펙트럼장애 진단을 받은 일이 계기가 되어, 부부는 2005년 Autism Speaks를 설립했다. SFARI 재단이 기초과학 연구에 집중한 것과 달리, Autism Speaks는 연구와 함께 인식 개선, 입법 활동, 보험 개혁에도 적극적이었다. 미국 의회에서 2006년 자폐 대응법(Combating Autism Act)을 통과시켜 9억 2,100만 달러의 연구 예산을 확보한 일, 유엔에서 세계 자폐 인식의 날(World Autism Awareness Day)을 제정하게 한 일, 미국 32개 주에서 자폐 보험 개혁 법률을 이끌어낸 일이 대표적인 성과다. 밥 라이트는 NIH의 350억 달러 예산 중 자폐에 할당되는 금액이 약 1억 6,900만 달러에 그친다고 지적하면서, 정부 연구비가 자폐의 유병률에 비해 심각하게 부족하다고 주장했다. 이 부족분을 민간 자선이 메우고 있다는 것이 자폐 연구의 독특한 구조다.

Autism Speaks는 연구 측면에서도 중요한 기여를 했다. 특히 AGRE(Autism Genetic Resource Exchange)를 흡수해 다발성 가족 중심의 유전체 자원을 확보했고, 이를 바탕으로 MSSNG 프로젝트를 발족했다. SPARK가 규모를 추구했다면, MSSNG는 깊이를 추구했다. MSSNG는 AGRE에 등록된 가족들을 대상으로 전장 유전체 시퀀싱(whole-genome sequencing, WGS)을 수행하는 프로젝트였다. 엑솜 시퀀싱이 단백질을 만드는 유전자 영역(유전체의 약 1.5%)만을 읽는다면, 전장 유전체 시퀀싱은 유전체 전체, 곧 코딩 영역과 비코딩 영역 모두를 읽는다. 비코딩 영역에는 유전자의 발현을 조절하는 인핸서(enhancer), 프로모터(promoter), 절연체(insulator) 같은 조절 요소가 포함되어 있고, 이 영역의 변이가 자폐에 기여할 수 있다는 가능성은 여러 연구에서 이미 제기되고 있었다.

Trost et al. (2022) 연구는 MSSNG의 11,312명(자폐 진단군 5,100명 포함) 전장 유전체 시퀀싱 데이터를 분석해, 자폐스펙트럼장애의 유전적 구조를 가장 포괄적으로 기술한 결과를 보고했다. 이 연구의 핵심 발견은 변이 유형별 기여도 추정이었다. 전체 진단적 변이 중 52%가 서열 수준의 변이(SNV, 작은 삽입결실)에서, 46%가 구조 변이(CNV, 역위, 전위)에서, 2%가 미토콘드리아 변이에서 발견되었다. 전체적인 진단 수율은 14.1%였다. 진단 수율(diagnostic yield)이란 유전체 검사를 받은 사람 중에서 자폐의 원인으로 지목할 수 있는 구체적인 유전 변이가 발견된 비율을 말한다. 14.1%라는 숫자는, 전장 유전체 시퀀싱을 수행해도 약 86%의 사례에서는 해석 가능한 단일 유전적 원인을 짚어내지 못한다는 뜻이었다. MSSNG의 또 다른 특징은 AGRE에서 유래한 다발성 가족이 상당수 포함되어 있다는 점이었다. SSC가 단발성 가족에서 신생변이를 찾는 데 최적화된 코호트라면, MSSNG는 다발성 가족에서 유전되는 변이의 역할을 연구하는 데 더 적합한 코호트였다.

AGP(Autism Genome Project)도 이 시기의 중요한 다국적 협력체였다. AGP Consortium (2007) 연구는 자폐가 가족 안에서 어떤 유전체 영역과 함께 전달되는지를 추적하는 연관 분석이라는 방법으로 자폐 위험 영역을 찾으려 했다. 이 방법은 이후 대규모 시퀀싱 기술로 대체되었지만, AGP는 여러 나라의 연구자들이 표본과 데이터를 공유하는 국제 협력의 모델을 확립했다는 점에서 의미가 있다. 자폐 유전학이 단일 연구실의 작업에서 컨소시엄 과학(consortium science)으로 옮겨가는 데 AGP가 기여한 몫은 크다.

코호트 구축의 역사 — 다섯 번의 전환

자폐 유전학의 코호트 역사를 넓게 보면, 1997년 AGRE의 설립에서 시작해 현재까지 다섯 번의 전략적 전환이 있었다.

전환 시기 이전 이후 대표 코호트
가족 구조 2007 다발성 가족 (유전된 변이) 단발성 가족 (신생변이) SSC
시퀀싱 범위 2015~ 엑솜 (1.5%) 전장 유전체 (100%) MSSNG, WGSPD
모집 방식 2012~ 병원 기반 인구 기반 (국가 등록) iPSYCH
표현형 깊이 2018~ 엄격한 대면 평가 웹 기반 설문 (규모 20배) SPARK
유전적 조상 2020~ 유럽계 중심 다중 조상 한국(K-ARC), 라틴아메리카(GALA), 중국

다섯 번째 전환에서 사용한 ‘유전적 조상(ancestry)‘이라는 말은 한국어에 적절한 번역어가 없어 설명이 필요하다. 영어에서 race(인종)나 ethnicity(민족)와는 다른 개념이다. 유전적 조상이란 한 사람의 유전체에 새겨진 계통적 유래를 가리킨다. 유전 변이는 부모에게서 물려받으므로, 오랜 세대에 걸쳐 같은 지역에서 살아온 사람들은 유전 변이의 패턴이 서로 비슷해진다. 유럽에서 오래 살아온 사람들의 유전체와 동아시아에서 오래 살아온 사람들의 유전체에는 각각 특징적인 변이의 분포가 있고, 특정 변이가 한쪽에서는 흔한데 다른 쪽에서는 드문 경우가 많다. 그래서 유럽계 인구에서 발견된 위험 변이가 다른 유전적 조상을 가진 인구에서도 같은 효과를 갖는지는 별도의 검증이 필요하다. 한 가지 짚어둘 점은 이 구분이 절대적인 범주가 아니라 상대적이고 연속적이라는 사실이다. “한국인의 유전체”라는 고정된 실체가 따로 있는 것이 아니라, 유전 변이의 분포가 지리와 역사를 따라 점진적으로 달라질 뿐이다.

이 다섯 전환을 거치며 연구는 현재의 규모에 이르렀다. Satterstrom et al. (2020) 연구에서 35,584명, Fu et al. (2022) 연구에서 63,237명, Kim et al. (2025) 연구에서 78,685명의 통합 분석이 가능해졌다. 동시에 한 가지 역설도 드러났다. 유전체 데이터가 가장 풍부한 코호트(SSC, SPARK, MSSNG)에는 성인기 결과 데이터가 거의 없고, 성인기 결과를 장기 추적하는 코호트(UK Biobank, 덴마크 등록 체계)에는 심층 유전체 데이터가 부족하다. 유전적 원인을 아는 아이가 성인이 되었을 때 어떤 삶을 사는지를 알려면, 이 두 종류의 데이터가 한 코호트 안에서 만나야 한다. 자폐 유전학의 다음 과제 중 하나가 여기에 있다.

코호트의 설계가 발견을 결정한다

이 코호트들의 비교에서 드러나는 핵심 교훈은, 코호트의 설계가 발견할 수 있는 것의 범위를 결정한다는 점이다. SSC는 단발성 4인 가족 설계로 신생변이 발견에 강했고, 자폐 유전학의 초기 신생변이 발견 대부분이 실제로 이 코호트에서 나왔다. SPARK는 규모와 다양성을 발판으로 일반 변이의 효과를 연구하고 표현형 하위 집단을 정의하는 데 강점이 있었다. MSSNG는 전장 유전체 시퀀싱과 다발성 가족 포함이라는 두 축으로 비코딩 변이와 유전되는 변이의 기여를 탐구하는 데 적합했다. 어떤 코호트도 모든 질문에 답할 수는 없었다. 각 코호트는 자폐의 유전적 구조라는 퍼즐의 서로 다른 조각을 내놓았다.

가족 기반 연구의 가치를 다시 짚은 연구도 있다 (Glahn et al. 2019). 대규모 사례-대조 연구만으로는 포착하기 어려운 유전적 현상들이 있는데, 가족 설계가 이를 더 잘 다룰 수 있다는 것이다. 예컨대 불완전 침투도(같은 유전 변이를 가지고도 어떤 사람은 자폐가 나타나고 어떤 사람은 나타나지 않는 현상), 가변적 표현도(같은 변이를 가진 사람들 사이에서도 증상의 종류와 심각도가 다른 현상), 양적유전 전달 불균형(부모가 가진 수천 개의 일반 변이 중 자폐 위험을 높이는 쪽이 자녀에게 편향적으로 전달되는 현상) 같은 것들은, 진단군과 비교군을 단순히 비교하는 것만으로는 드러나지 않고 같은 가족 안에서 부모와 자녀, 진단을 받은 자녀와 형제자매를 비교해야 비로소 관찰된다. 자폐 유전학이 점점 더 큰 사례-대조 코호트를 추구하는 와중에도, SSC처럼 엄밀하게 설계된 가족 코호트의 가치는 줄어들지 않았다. 다만 개별 코호트마다 강점이 있다 해도, 충분한 검정력은 이 코호트들의 데이터를 하나로 모아 통합 분석할 때 비로소 확보된다.

이 장을 삶으로 옮길 때

SPARK와 MSSNG가 보여주는 대규모 연구의 장점은 더 많은 가족이 연구에 들어올 수 있게 했다는 점이다. 웹 기반 모집과 자기 보고는 엄밀한 직접 평가보다 거칠 수 있지만, 그 덕분에 지역, 시간, 비용의 장벽 때문에 연구에서 빠졌던 가족도 참여할 수 있었다. 부모 독자는 이 차이를 “어느 코호트가 더 낫다”가 아니라 “어떤 질문에 어떤 설계가 맞는가”로 읽으면 좋다. 당사자와 가족에게 중요한 것은 자신의 데이터가 어떤 범위에서 쓰이고, 다시 연락이 올 때 어떤 권리가 보장되는지다. 교사와 정책 담당자에게는 큰 표본이 평균을 더 잘 보여주지만, 평균이 개별 학생의 지원 계획을 대신하지 못한다는 점이 남는다. 대규모 코호트는 넓은 지도를 제공하지만, 실제 길은 각 사람의 생활 맥락에서 다시 찾아야 한다.

참고문헌

Autism Genome Project Consortium. (2007). Mapping autism risk loci using genetic linkage and chromosomal rearrangements. Nature Genetics, 39(3), 319-328. doi:10.1038/ng1985

Fu, J. M., Satterstrom, F. K., et al. (2022). Rare coding variation provides insight into the genetic architecture and phenotypic context of autism. Nature Genetics, 54(9), 1320-1331. doi:10.1038/s41588-022-01104-0

Glahn, D. C., Nimgaonkar, V. L., Raventós, H., Contreras, J., McIntosh, A. M., Thomson, P. A., … & Escamilla, M. A. (2019). Rediscovering the value of families for psychiatric genetics research. Molecular Psychiatry, 24(4), 523-535. doi:10.1038/s41380-018-0073-x

SPARK Consortium. (2018). SPARK: A US cohort of 50,000 families to accelerate autism research. Neuron, 97(3), 488-493. doi:10.1016/j.neuron.2018.01.015

Kim, S.-W., & An, J.-Y. (2025). Advancing precision diagnosis in autism: Insights from large-scale genomic studies. Molecules and Cells, 48(4), 100248. doi:10.1016/j.mocell.2025.100248

Satterstrom, F. K., Kosmicki, J. A., Wang, J., et al. (2020). Large-scale exome sequencing study implicates both developmental and functional changes in the neurobiology of autism. Cell, 180(3), 568-584. doi:10.1016/j.cell.2019.12.036

Trost, B., Thiruvahindrapuram, B., Chan, A. J. S., Engchuan, W., Higginbotham, E. J., Howe, J. L., … & Scherer, S. W. (2022). Genomic architecture of autism from comprehensive whole-genome sequence annotation. Cell, 185(23), 4409-4427. doi:10.1016/j.cell.2022.10.009