자폐스펙트럼장애의 유전적 구조를 밝히려면 대규모의 체계적인 표본이 필요하다. 소수의 가족만 깊이 분석해서는 전체 그림이 나오지 않고, 수천 가족의 유전체를 비교해야 반복적으로 변이가 일어나는 유전자를 통계적으로 짚어낼 수 있다. 그렇다고 자폐 진단군의 수만 많이 모은다고 되는 일도 아니다. 표본의 설계, 즉 어떤 가족 구조의 참여자를 어떻게 모집하느냐에 따라 발견할 수 있는 유전 변이의 종류가 달라진다. 이 장에서는 자폐 유전학의 가장 영향력 있는 코호트 가운데 하나인 사이먼즈 심플렉스 컬렉션(Simons Simplex Collection, SSC)이 어떤 설계 철학 위에서 만들어졌는지 살펴본다.
SSC를 이해하려면 먼저 단발성(simplex)과 다발성(multiplex)이라는 두 가족 유형의 구분을 알아야 한다. 단발성 가족은 한 가족 안에서 자폐스펙트럼장애 진단을 받은 사람이 한 명뿐인 경우다. 부모와 형제자매는 모두 자폐 진단을 받지 않았는데, 그 가족에서 한 아이만 자폐스펙트럼장애가 있다. 반면 다발성 가족은 두 명 이상의 가족 구성원이 자폐스펙트럼장애를 가진 가족이다. 이 구분이 유전학적으로 의미 있는 이유는, 두 유형에서 작동하는 유전적 기전이 서로 다를 수 있기 때문이다. 단발성 가족에서는 부모에게 없던 변이가 자녀에게서 새로 생긴 신생변이가 주된 원인일 가능성이 높다. 부모와 형제가 모두 자폐 진단을 받지 않았다는 사실은, 유전적 위험이 가족 안에서 공유되었다기보다 그 아이에게서 새로 생겨났을 가능성을 시사한다. 다발성 가족에서는 유전되는 변이(inherited variants)가 더 큰 역할을 한다. 여러 구성원이 자폐 진단을 받는다는 것은, 부모가 가진 유전적 위험 요인이 자녀에게 전달되고 있다는 뜻이다.
이때 단발성과 다발성이라는 말은 가족을 구분해 평가하려는 표현이 아니다. 연구자가 어떤 종류의 유전 변이를 더 잘 찾을 수 있는지 판단하기 위한 표본 설계의 언어다. 단발성 가족 자료는 부모에게는 없고 자녀에게 새로 생긴 변이를 찾는 데 유리하고, 다발성 가족 자료는 여러 세대를 거쳐 전달되는 변이와 양적유전 배경을 살피는 데 유리하다. 같은 학교에서 학생들의 키를 볼 때 개인의 성장 기록을 볼 수도 있고 가족의 키 분포를 함께 볼 수도 있듯, 질문에 따라 필요한 자료의 모양이 달라진다. 중요한 것은 어느 가족 유형이 더 단순하거나 더 복잡하다는 뜻이 아니라, 서로 다른 연구 질문에 답하게 해준다는 점이다.
자폐 유전학이 오늘날의 규모에 이르기까지, 정부 연구비만으로는 어려웠을 투자를 한 사람이 있다. 짐 사이먼즈(Jim Simons, 1938~2024)다. 사이먼즈는 MIT에서 수학 학사를, UC 버클리에서 23세에 수학 박사를 받은 수학자였다. 스토니브룩 대학의 수학과 학과장을 지내며, 중국의 수학자 천성선(Shiing-Shen Chern)과 함께 미분기하학의 핵심 업적인 천-사이먼즈 이론(Chern-Simons theory)을 발표했다. 1978년 학계를 떠나 르네상스 테크놀로지스(Renaissance Technologies)라는 헤지펀드를 설립했는데, 수학자와 물리학자를 고용해 금융 시장의 패턴을 양적으로 분석하는 전략을 개척했다. 이 펀드는 역사상 가장 수익률이 높은 투자 회사 중 하나가 되었다.
사이먼즈와 그의 아내 매릴린 사이먼즈(Marilyn Simons)는 1994년에 사이먼즈 재단(Simons Foundation)을 세워 기초과학 연구를 지원하기 시작했다. 짐과 매릴린은 학문적인 이유에서나 개인적인 이유에서나 신경과학에 관심이 많았다. 2003년, 사이먼즈 부부는 신경과학자와 자폐 전문가들을 모아 원탁회의를 열었고, 이 자리에서 자폐 연구에 대한 체계적 투자의 청사진을 그렸다. 이것이 SFARI 재단(Simons Foundation Autism Research Initiative, SFARI)의 시작이었다. 가족 연구에서 자폐에 유전적 기여가 있다는 초기 증거가 나오던 시기였고, SFARI는 유전학으로 자폐의 원인을 밝히는 쪽에 집중하기로 했다. 특히 부모에게는 없고 자녀에게서 새로 생겨난 신생변이를 찾는 것이 초기 전략이었다. 신생변이는 부모로부터 물려받은 것이 아니라 생식세포에서 우연히 발생한 것이라, 그 효과가 클 가능성이 높다는 논리였다.
2004년, SFARI 재단은 제럴드 피시바흐(Gerald Fischbach)를 SFARI의 초대 과학 책임자로 영입했다. 피시바흐는 컬럼비아 대학 의생명과학 학장을 지낸 신경과학자로, 사이먼즈와의 첫 만남에서 SFARI 리더십을 맡아달라는 제안을 받았다. 피시바흐가 2024년에 쓴 추모 글에 따르면, 사이먼즈의 경영 철학은 “최고의 인재를 찾아서, 그들에게 공을 넘기는 것”이었다. 사이먼즈는 연구의 세부 방향에는 간섭하지 않았지만, 데이터 관리와 공유에는 각별한 관심을 기울였다. SFARI Gene이라는 중앙 데이터베이스를 구축해 여러 출처의 정보를 통합했고, 연구자들에게 데이터를 활발하게 공개하는 문화가 자리잡았다. 유전체 시퀀싱 비용이 떨어지면서 더 많은 표본이 필요해지자, SFARI 재단은 개별 연구자에게 연구비를 지원하는 데서 나아가, 민관 협력으로 대규모 코호트를 직접 구축하고 검증된 사후 뇌 조직 컬렉션을 체계적으로 모으는 새로운 모델을 만들었다. SSC가 바로 이 모델의 첫 번째 산물이었다.
사이먼즈는 2024년 5월 10일, 86세의 나이로 뉴욕에서 세상을 떠났다. SFARI 재단의 현 대표 데이비드 스퍼겔(David Spergel)은 추모사에서 “짐은 수학, 기초과학, 그리고 자폐에 대한 우리의 이해에 이미 거대한 영향을 미친 조직을 만들었다”고 말했다. SFARI 재단은 영구적으로 운영되도록 설계되어 있어, 그가 떠난 뒤에도 그의 비전은 계속된다. SFARI, SSC, SPARK는 사이먼즈가 없었으면 존재하지 않았을 자원이며, 이 책에서 다루는 자폐 유전학의 발견 대부분이 이 자원에 기대고 있다. 수학자의 정밀성, 투자자의 규모, 그리고 과학을 향한 순수한 호기심이 결합된 독특한 자선 모델이었다.
Fischbach and Lord (2010) 연구는 SSC의 설계와 구축 과정을 기술한다. SSC는 2,000가족이 넘는 단발성 4인 가족(quad)을 모집했다. 4인 가족이란 자폐 진단을 받은 자녀(proband), 자폐 진단을 받지 않은 형제자매(sibling), 그리고 양쪽 부모로 구성된 네 명의 가족 단위를 가리킨다. 이 설계의 핵심은 같은 가족 안에서 자폐 진단을 받은 자녀와 자폐 진단을 받지 않은 형제자매의 유전체를 직접 비교할 수 있다는 점이다. 형제자매는 부모로부터 같은 유전적 배경을 물려받지만 자폐 진단을 받지 않았으므로, 자폐 진단을 받은 자녀에게만 있고 형제에게는 없는 유전 변이를 찾으면 그것이 자폐와 관련된 변이일 가능성이 높다. 외부의 비관련 대조군을 쓰는 것보다 교란이 적다는 점도 큰 장점이었다. 서로 다른 인종이나 지역 출신을 비교하면 자폐와 관련 없는 인구 집단 간 유전적 차이가 결과를 왜곡할 수 있는데(이것을 인구 구조에 의한 교란이라 한다), 같은 가족 안에서 비교하면 이 문제가 자동으로 풀린다.
SSC의 모집은 미국과 캐나다의 12개 대학 의료 기관에서 이루어졌고, 엄격한 표현형 검증 절차가 적용되었다. 모든 참여자는 ADOS와 ADI-R을 포함한 표준화된 진단 평가를 받았고, 인지 검사, 적응 행동 평가, 의료력 조사가 함께 수행되었다. 기관 간 신뢰도(cross-site reliability)를 확보하려고 임상가들이 정기적으로 교정 훈련을 받았고, SFARI Base라는 중앙 데이터베이스에 모든 표현형과 유전체 데이터가 통합 저장되어 연구자들에게 공개되었다. 출판 당시 1,887명의 참여자가 등록되어 있었고, 남녀 비율은 약 6:1이었다. 이 코호트에서 나온 유전체 데이터는 이후 자폐 유전학의 이정표가 되는 여러 발견을 가능하게 했고, 파트 3에서 다룰 신생 구조 변이, 신생 코딩 변이, 비코딩 변이 연구의 기반이 되었다.
SSC가 자폐 진단군에서 유전 변이를 찾는 “표현형 우선(phenotype-first)” 접근이었다면, SFARI 재단은 이와 짝을 이루는 접근도 시도했다. 사이먼즈 변이 개인 프로젝트(Simons Variation in Individuals Project, VIP)는 특정 유전 변이를 가진 사람들을 먼저 찾고, 이들의 표현형을 체계적으로 기술하는 “유전형 우선(genotype-first)” 접근을 택했다. Simons VIP Consortium (2012) 연구에 기술된 이 프로젝트의 첫 번째 대상은 16p11.2라는 영역에 변이를 가진 사람들이었다. 16p11.2는 염색체 16번의 짧은 팔에 있는 약 60만 글자(염기쌍) 크기의 영역이다. 이 영역이 통째로 빠져 있는 경우(결실, 즉 유전체 책에서 한 장이 찢겨 나간 것)는 자폐스펙트럼장애, 지적장애, 거대두증(macrocephaly, 머리둘레가 일반적 범위보다 큰 것)과 연관되고, 반대로 같은 영역이 한 벌 더 들어 있는 경우(중복, 즉 같은 장이 두 번 인쇄된 것)는 조현병, 소두증(microcephaly, 머리둘레가 일반적 범위보다 작은 것)과 연관되는 대표적인 구조 변이 좌위다.
VIP가 남긴 중요한 점은 같은 유전 변이를 가진 사람들 사이에서도 표현형이 얼마나 다양한지를 체계적으로 보여주었다는 데 있다. 16p11.2 영역이 빠져 있는 사람들 가운데 일부는 자폐스펙트럼장애로 진단받았지만, 다른 일부는 자폐 없이 지적장애만 보였고, 또 다른 일부는 평균 범위의 인지 기능을 가지고 있었다. 같은 유전 변이가 있어도 표현형 결과가 사람마다 다르다는 것, 즉 침투도(penetrance)가 불완전하다는 것은 유전적 배경(genetic background)이나 환경적 요인이 표현형을 조절한다는 뜻이었다. 이 관찰은 이후 자폐 유전학에서 반복적으로 확인되는 주제, 즉 유전적 이질성뿐 아니라 같은 유전 변이 안에서의 표현형 이질성이라는 문제를 처음으로 체계적으로 드러냈다.
SSC와 VIP라는 두 프로젝트는 자폐 유전학에서 표본 설계가 얼마나 중요한지 보여주는 사례다. 단발성 가족에 집중하는 것과 특정 유전 변이 보유자에 집중하는 것은 서로 다른 질문에 답하게 해준다. SSC는 “자폐의 유전적 원인으로 어떤 유전 변이들이 있는가?”라는 발견 지향적 질문에 최적화되어 있고, VIP는 “특정 유전 변이가 있을 때 어떤 표현형이 나타나는가?”라는 해석 지향적 질문에 맞춰져 있다.
여기서 한 가지 짚고 갈 것이 있다. 이런 코호트를 구축하는 데 필요한 것은 진단을 받은 참여자 표본만이 아니다. 정신과 전문의가 진단을 확인하고, 임상심리학자가 표현형을 평가하고, 유전학자가 시퀀싱을 수행하고, 통계학자가 분석 프레임워크를 설계하고, 신경과학자가 결과를 해석하는, 여러 분야의 전문가가 함께 일해야 한다. 또 이렇게 다양한 전문가들이 자발적으로 협업할 수 있는 제도적 장치, 데이터 공유 정책, 지속적인 연구비 지원 구조가 갖추어져야 한다. SSC가 12개 대학 기관에서 동일한 기준으로 표현형을 측정하고 중앙 데이터베이스에 통합할 수 있었던 것은 하루아침에 이루어진 일이 아니다. 수년에 걸친 기관 간 협의, 평가 도구의 교정, 데이터 형식의 표준화가 먼저 있어야 했다. 자폐 유전학의 발견은 유전체 기술의 발전만으로 가능했던 것이 아니라, 이런 학제간 협업의 인프라 위에서 가능했던 것이다. SSC가 약 2,700가족이라는 규모에 이르는 데 수년이 걸렸으니, 그다음 과제는 더 많은 가족을 더 빠르게 모집해, 작은 효과의 유전 변이까지 잡아낼 수 있는 통계적 검정력을 확보하는 일이었다.
SSC 같은 코호트는 숫자로 보이지만, 실제로는 가족의 시간과 신뢰가 쌓여 만들어진 연구 기반이다. 부모와 형제자매가 함께 참여했기 때문에 신생변이와 유전되는 변이를 더 정확히 구분할 수 있었고, 이 과정에서 형제자매도 연구의 조용한 참여자가 되었다. 다만 코호트 참여가 곧 개인에게 즉각적인 답을 돌려준다는 뜻은 아니다. 연구 결과는 통계적 발견으로 먼저 나타나고, 임상적 설명이나 지원으로 번역되기까지 시간이 걸린다. 그래서 가족이 기대해야 할 것은 “우리 집의 원인을 바로 찾아준다”는 약속이 아니라, 장기적으로 더 나은 진단과 상담의 근거를 만드는 과정이다. 연구자는 그 신뢰를 데이터 공유와 개인정보 보호, 쉬운 설명으로 되돌려주어야 한다.
Fischbach, G. D. (2024). Jim Simons (1938–2024). Nature Neuroscience, 27, 1636-1637. doi:10.1038/s41593-024-01723-2
Fischbach, G. D., & Lord, C. (2010). The Simons Simplex Collection: A resource for identification of autism genetic risk factors. Neuron, 68(2), 192-195. doi:10.1016/j.neuron.2010.10.006
Simons VIP Consortium. (2012). Simons Variation in Individuals Project (Simons VIP): A genetics-first approach to studying autism spectrum and related neurodevelopmental disorders. Neuron, 73(6), 1063-1067. doi:10.1016/j.neuron.2012.02.014