지금까지 다룬 연구들 대부분은 엑솜 시퀀싱에 기반한 것이었다. 엑솜 시퀀싱은 유전체의 약 1.5%에 해당하는 단백질 코딩 영역만을 읽는 기술이다. 비용 대비 효율이 좋고, 변이의 효과를 해석하기 쉬운 영역을 집중적으로 분석할 수 있다는 장점이 있었다. 하지만 1.5%만 읽는다는 것은 나머지 98.5%를 건너뛴다는 뜻이기도 하다. 건너뛴 98.5% 안에도 중요한 정보가 들어 있다.
비코딩 영역에는 유전자의 발현을 조절하는 다양한 스위치들이 존재한다. 프로모터(promoter)는 유전자 바로 앞에 위치하여 유전자의 발현을 시작시키는 스위치다. 자동차에 비유하면 시동 버튼에 해당한다. 인핸서(enhancer)는 유전자에서 멀리 떨어져 있으면서도 유전자의 발현을 강화하는 원격 조절 장치로, 자동차의 가속 페달과 비슷하다. 이 조절 장치들에 변이가 생기면 유전자 자체는 멀쩡하지만 그 유전자가 언제, 어디서, 얼마나 발현할지가 달라질 수 있다. 또한 구조 변이 중 일부는 엑솜 시퀀싱의 포착 범위 밖에 있어서 탐지되지 않고, 반복 서열의 확장도 엑솜 기술로는 측정하기 어렵다. 전장 유전체 시퀀싱(whole-genome sequencing, WGS)은 이 모든 것을 포함하여 유전체 전체를 처음부터 끝까지 읽는다.
전장 유전체 시퀀싱이 대규모 코호트에 적용될 수 있게 된 것은 비용의 하락 덕분이었다. 2003년에 인간 유전체 프로젝트가 완료되었을 때 한 사람의 유전체를 읽는 데 약 27억 달러가 들었다. 그것이 2010년대 중반에는 수천 달러, 2020년대에는 1,000달러 이하로 떨어졌다. 가격이 백만 분의 일 이하로 떨어진 셈이다. 이 비용 하락이 수천 명 규모의 전장 유전체 시퀀싱을 현실적으로 가능하게 만들었고, 자폐 유전학의 연구 범위를 엑솜에서 전체 유전체로 확장하는 기술적 전제 조건이었다.
전장 유전체 시퀀싱이 자폐에 대해 보여준 가장 포괄적인 그림은 Trost et al. (2022) 연구에서 나왔다. MSSNG 코호트의 11,312명(자폐 환자 5,100명 포함)에 대한 분석 결과, 엑솜에서는 보이지 않던 변이 유형들의 기여가 정량화되었다. 진단적 변이, 즉 자폐의 원인으로 지목할 수 있는 변이들의 유형별 분포는 이렇다. 서열 수준의 변이(한 글자 변경이나 작은 삽입결실)가 52%, 구조 변이(큰 규모의 결실, 중복, 역위)가 46%, 미토콘드리아 변이가 2%를 차지했다. 미토콘드리아란 세포 안에서 에너지를 생산하는 소기관인데, 자체적인 작은 유전체를 가지고 있으며 이 유전체의 변이도 자폐에 기여할 수 있다는 것이 확인된 것이다.
여기서 주목해야 할 숫자가 있다. 전체 진단 수율(diagnostic yield)이 14.1%라는 것이다. 이것은 가장 포괄적인 시퀀싱 기술을 동원하더라도 약 86%의 자폐 환자에서는 명확한 단일 유전적 원인을 지목할 수 없다는 뜻이다. 이 86%가 유전적 원인이 없다는 의미가 아니다. 이 사례들 대부분은 앞 장에서 다룬 양적유전 구조, 즉 수천 개의 일반 변이가 합산된 효과에 의한 것으로 추정된다. 하지만 비코딩 영역의 희귀 변이, 아직 해석이 되지 않은 복잡한 구조 변이, 유전 변이들 간의 상호작용도 기여하고 있을 가능성이 있다. 상호작용(epistasis)이란 유전 변이 A와 유전 변이 B가 각각은 큰 효과가 없지만 둘이 함께 있으면 표현형에 영향을 미치는 현상을 말한다.
엑솜 시퀀싱과 전장 유전체 시퀀싱이 자폐 유전학에 기여한 바를 요약하면 이렇다. 엑솜은 단백질을 만드는 유전자 영역에서의 변이를 높은 효율로 찾아냈고, 102개에서 185개로 확장된 자폐 위험 유전자 목록과 세 가지 경로의 수렴이라는 핵심 발견이 여기서 나왔다. 전장 유전체 시퀀싱은 세 가지를 추가했다. 첫째, 구조 변이의 기여가 서열 변이에 맞먹는 규모라는 정량적 추정이다. 둘째, 비코딩 영역에서의 변이가 자폐에 기여한다는 초기 증거다. 셋째, 반복 서열 확장이라는 새로운 변이 유형의 발견이다. 다음 두 장에서 비코딩 변이와 반복 서열을 각각 다룬다.
References
Sanders, S. J., Neale, B. M., Huang, H., Werling, D. M., An, J.-Y., Dong, S., … & Buxbaum, J. D. (2017). Whole genome sequencing in psychiatric disorders: The WGSPD consortium. Nature Neuroscience, 20(12), 1661-1668. doi:10.1038/nn.4602
Trost, B., Thiruvahindrapuram, B., Chan, A. J. S., Engchuan, W., Higginbotham, E. J., Howe, J. L., … & Scherer, S. W. (2022). Genomic architecture of autism from comprehensive whole-genome sequence annotation. Cell, 185(23), 4409-4427. doi:10.1016/j.cell.2022.10.009