자폐스펙트럼장애의 유전적 구조를 밝히기 위해서는 대규모의 체계적인 표본이 필요하다. 한두 가족을 깊이 분석하는 것만으로는 전체 그림을 그릴 수 없고, 수천 가족의 유전체를 비교해야 반복적으로 변이가 발생하는 유전자를 통계적으로 확인할 수 있다. 그런데 단순히 많은 수의 자폐 환자를 모으는 것만으로는 충분하지 않다. 표본의 설계, 즉 어떤 가족 구조를 가진 참여자를 어떻게 모집하느냐가 발견할 수 있는 유전 변이의 종류를 결정한다. 이 장에서는 자폐 유전학의 가장 영향력 있는 코호트 중 하나인 사이먼즈 심플렉스 컬렉션(Simons Simplex Collection, SSC)이 어떤 설계 철학에 기반하여 만들어졌는지를 살펴본다.
SSC를 이해하려면 먼저 심플렉스(simplex)와 멀티플렉스(multiplex)라는 두 가지 가족 유형의 구분을 알아야 한다. 심플렉스 가족은 한 가족 안에서 자폐스펙트럼장애를 가진 사람이 한 명뿐인 가족을 말한다. 부모와 형제자매 모두 자폐가 아닌데, 그 가족에서 한 명의 아이만 자폐스펙트럼장애를 가지고 있는 경우다. 반면 멀티플렉스 가족은 두 명 이상의 가족 구성원이 자폐스펙트럼장애를 가진 가족이다. 이 구분이 유전학적으로 중요한 이유는, 두 유형의 가족에서 작동하는 유전적 기전이 다를 수 있기 때문이다. 심플렉스 가족에서는 부모에게 없던 유전 변이가 자녀에게서 새로 발생한 신생변이가 주된 원인일 가능성이 높다. 부모와 형제가 모두 영향을 받지 않는다는 것은, 유전적 위험이 가족 안에서 공유되기보다 해당 아이에게서 새로 생겨났을 가능성을 시사하기 때문이다. 멀티플렉스 가족에서는 유전되는 변이(inherited variants)가 더 중요한 역할을 할 수 있다. 여러 가족 구성원이 영향을 받는다는 것은, 부모가 가지고 있는 유전적 위험 요인이 자녀에게 전달되고 있을 가능성을 의미한다.
자폐 유전학이 오늘날의 규모에 도달하기까지, 정부 연구비만으로는 불가능했을 투자를 한 사람이 있다. 짐 사이먼즈(Jim Simons, 1938~2024)다. 사이먼즈는 MIT에서 수학 학사를, UC 버클리에서 23세에 수학 박사를 받은 수학자였다. 스토니브룩 대학의 수학과 학과장을 지내면서, 중국의 수학자 천성선(Shiing-Shen Chern)과 함께 미분기하학의 핵심 업적인 천-사이먼즈 이론(Chern-Simons theory)을 발표했다. 1978년에 학계를 떠나 르네상스 테크놀로지스(Renaissance Technologies)라는 헤지펀드를 설립했는데, 수학자와 물리학자를 고용하여 금융 시장의 패턴을 양적으로 분석하는 전략을 개척했다. 이 펀드는 역사상 가장 수익률이 높은 투자 회사 중 하나가 되었다.
사이먼즈와 그의 아내 매릴린 사이먼즈(Marilyn Simons)는 1994년에 사이먼즈 재단(Simons Foundation)을 설립하여 기초과학 연구를 지원하기 시작했다. 짐과 매릴린은 학문적, 개인적 이유 모두에서 신경과학에 관심을 가지고 있었다. 2003년, 사이먼즈 부부는 신경과학자와 자폐 전문가들을 모아 원탁회의를 열었고, 이 자리에서 자폐 연구에 대한 체계적 투자의 청사진이 만들어졌다. 이것이 SFARI 재단(Simons Foundation Autism Research Initiative, SFARI)의 시작이었다. 가족 연구에서 자폐에 유전적 기여가 있다는 초기 증거가 나오고 있었고, SFARI는 유전학을 통해 자폐의 원인을 밝히는 데 집중하기로 했다. 특히 부모에게는 없고 자녀에게서 새로 생겨난 신생변이를 찾는 것이 초기 전략이었다. 신생변이는 부모로부터 물려받은 것이 아니라 생식세포에서 우연히 발생한 것이므로, 그 효과가 클 가능성이 높다는 논리였다.
2004년, SFARI 재단은 제럴드 피시바흐(Gerald Fischbach)를 SFARI의 초대 과학 책임자로 영입했다. 피시바흐는 컬럼비아 대학의 의생명과학 학장이었던 신경과학자로, 사이먼즈와의 첫 만남에서 SFARI의 리더십을 맡아달라는 제안을 받았다. 피시바흐가 2024년에 쓴 추모 글에 따르면, 사이먼즈의 경영 철학은 “최고의 인재를 찾아서, 그들에게 공을 넘기는 것”이었다. 사이먼즈는 연구의 세부 방향에 간섭하지 않았지만, 데이터 관리와 공유에는 특별한 관심을 기울였다. SFARI Gene이라는 중앙 데이터베이스가 만들어져 여러 소스의 정보를 통합했고, 연구자들에게 데이터를 적극적으로 공개하는 문화를 확립했다. 유전체 시퀀싱 비용이 하락하면서 더 많은 표본이 필요해졌을 때, SFARI 재단은 개별 연구자에게 연구비를 지원하는 것을 넘어, 민관 협력을 통해 대규모 코호트를 직접 구축하고 검증된 사후 뇌 조직 컬렉션을 체계적으로 수집하는 새로운 모델을 만들어냈다. SSC가 바로 이 모델의 첫 번째 산물이었다.
사이먼즈는 2024년 5월 10일, 86세의 나이로 뉴욕에서 세상을 떠났다. SFARI 재단 현 대표 데이비드 스퍼겔(David Spergel)은 추모사에서 “짐은 수학, 기초과학, 그리고 자폐에 대한 우리의 이해에 이미 거대한 영향을 미친 조직을 만들었다”고 말했다. SFARI 재단은 영구적으로 운영되도록 설계되어 있어, 그가 떠난 후에도 그의 비전은 계속된다. SFARI, SSC, SPARK는 사이먼즈가 없었으면 존재하지 않았을 자원이며, 이 책에서 다루는 자폐 유전학의 발견 대부분이 이 자원에 기반하고 있다. 수학자의 정밀성, 투자자의 규모, 그리고 과학에 대한 순수한 호기심이 결합된 독특한 자선 모델이었다.
Fischbach and Lord (2010) 연구는 SSC의 설계와 구축 과정을 기술한다. SSC는 2,000가족 이상의 심플렉스 4인 가족(quad) 가족을 모집했다. 4인 가족란 자폐 환자(proband), 영향받지 않은 형제자매(sibling), 그리고 양쪽 부모로 구성된 네 명의 가족 단위를 말한다. 이 설계의 핵심적인 장점은 같은 가족 안에서 자폐 환자와 영향받지 않은 형제자매의 유전체를 직접 비교할 수 있다는 것이다. 형제자매는 부모로부터 같은 유전적 배경을 물려받지만 자폐를 가지고 있지 않으므로, 환자에게만 있고 형제에게는 없는 유전 변이를 찾으면 그것이 자폐와 관련된 변이일 가능성이 높다. 외부의 비관련 대조군을 사용하는 것보다 교란이 적다는 것도 큰 장점이었다. 서로 다른 인종이나 지역 출신의 사람들을 비교하면, 자폐와 관련 없는 인구 집단 간의 유전적 차이가 결과를 왜곡할 수 있는데(이것을 인구 구조에 의한 교란이라 한다), 같은 가족 안에서 비교하면 이 문제가 자동으로 해결된다.
SSC의 모집은 미국과 캐나다의 12개 대학 의료 기관에서 이루어졌고, 엄격한 표현형 검증 절차가 적용되었다. 모든 환자는 ADOS와 ADI-R을 포함한 표준화된 진단 평가를 받았고, 인지 검사, 적응 행동 평가, 의료력 조사가 함께 수행되었다. 기관 간 신뢰도(cross-site reliability)를 확보하기 위해 임상가들이 정기적으로 교정 훈련을 받았고, SFARI Base라는 중앙 데이터베이스에 모든 표현형과 유전체 데이터가 통합 저장되어 연구자들에게 공개되었다. 출판 당시 1,887명의 환자가 등록되어 있었고, 남녀 비율은 약 6:1이었다. 이 코호트에서 나온 유전체 데이터는 이후 자폐 유전학의 이정표가 되는 다수의 발견을 가능하게 했고, Part 3에서 다루게 될 신생 구조 변이, 신생 코딩 변이, 비코딩 변이 연구의 기반이 되었다.
SSC가 자폐스펙트럼장애 진단을 받은 사람에서 유전 변이를 찾는 “표현형 우선(phenotype-first)” 접근이었다면, SFARI 재단은 이와 상보적인 접근도 시도했다. 사이먼즈 변이 개인 프로젝트(Simons Variation in Individuals Project, VIP)는 특정 유전 변이를 가진 사람들을 먼저 찾고, 이들의 표현형을 체계적으로 기술하는 “유전형 우선(genotype-first)” 접근을 취했다. Simons VIP Consortium (2012) 연구에 기술된 이 프로젝트의 첫 번째 대상은 16p11.2 결실 또는 중복을 가진 사람들이었다. 16p11.2는 염색체 16번의 짧은 팔에 위치한 약 600킬로베이스 크기의 영역으로, 이 영역의 결실은 자폐스펙트럼장애, 지적장애, 거대두증(macrocephaly)과 연관되고, 중복은 조현병, 소두증(microcephaly)과 연관되는 것으로 알려진 대표적인 구조 변이 좌위다.
VIP의 의의는 같은 유전 변이를 가진 사람들 사이에서도 표현형이 얼마나 다양한지를 체계적으로 보여주었다는 것이다. 16p11.2 결실을 가진 사람들 중 일부는 자폐스펙트럼장애로 진단받았지만, 다른 일부는 자폐 없이 지적장애만 보였고, 또 다른 일부는 정상 범위의 인지 기능을 가지고 있었다. 같은 유전 변이가 있어도 그 표현형 결과가 사람마다 다르다는 것, 즉 침투도(penetrance)가 불완전하다는 것은 유전적 배경(genetic background)이나 환경적 요인이 표현형을 조절한다는 것을 의미했다. 이 관찰은 이후 자폐 유전학에서 반복적으로 확인되는 주제, 유전적 이질성뿐 아니라 같은 유전 변이 안에서의 표현형 이질성이라는 문제를 처음으로 체계적으로 드러냈다.
SSC와 VIP라는 두 프로젝트는 자폐 유전학에서 표본 설계가 얼마나 중요한지를 보여주는 사례다. 심플렉스 가족에 집중하는 것과 특정 유전 변이 보유자에 집중하는 것은 서로 다른 질문에 답할 수 있게 해준다. SSC는 “자폐의 유전적 원인으로 어떤 유전 변이들이 있는가?”라는 발견 지향적 질문에 최적화되어 있고, VIP는 “특정 유전 변이가 있을 때 어떤 표현형이 나타나는가?”라는 해석 지향적 질문에 최적화되어 있다. 다음 장에서는 이 두 접근을 넘어, 더 큰 규모의 코호트가 어떻게 구축되었는지를 살펴본다.
References
Fischbach, G. D. (2024). Jim Simons (1938–2024). Nature Neuroscience, 27, 1636-1637. doi:10.1038/s41593-024-01723-2
Fischbach, G. D., & Lord, C. (2010). The Simons Simplex Collection: A resource for identification of autism genetic risk factors. Neuron, 68(2), 192-195. doi:10.1016/j.neuron.2010.10.006
Simons VIP Consortium. (2012). Simons Variation in Individuals Project (Simons VIP): A genetics-first approach to studying autism spectrum and related neurodevelopmental disorders. Neuron, 73(6), 1063-1067. doi:10.1016/j.neuron.2012.02.014