14장. 전장 유전체 시퀀싱이 바꾼 것

지금까지 다룬 연구 대부분은 엑솜 시퀀싱에 의지했다. 엑솜 시퀀싱은 유전체의 약 1.5%에 해당하는 단백질 코딩 영역만을 읽는 기술이다. 비용 대비 효율이 좋고, 변이의 효과를 해석하기 쉬운 영역에 집중할 수 있다는 장점이 있었다. 하지만 1.5%만 읽는다는 것은 나머지 98.5%를 건너뛴다는 뜻이기도 하다. 건너뛴 98.5% 안에도 중요한 정보가 들어 있다.

비코딩 영역에는 유전자의 발현을 조절하는 다양한 스위치가 있다. 프로모터(promoter)는 유전자 바로 앞에 위치해 그 유전자의 발현을 시작시키는 스위치다. 자동차에 비유하면 시동 버튼에 해당한다. 인핸서(enhancer)는 유전자에서 멀리 떨어져 있으면서 그 유전자의 발현을 강화하는 원격 조절 장치로, 자동차의 가속 페달과 비슷하다. 이 조절 장치에 변이가 생기면 유전자 자체는 멀쩡해도 그 유전자가 언제, 어디서, 얼마나 발현할지가 달라진다. 또 구조 변이 가운데 일부는 엑솜 시퀀싱의 포착 범위 밖에 있어 탐지되지 않고, 반복 서열의 확장도 엑솜 기술로는 측정하기 어렵다. 전장 유전체 시퀀싱(whole-genome sequencing, WGS)은 이 모든 영역을 포함해 유전체 전체를 처음부터 끝까지 읽는다.

전장 유전체 시퀀싱이 대규모 코호트에 적용될 수 있게 된 것은 비용이 떨어진 덕분이었다. 2003년에 인간 유전체 프로젝트가 완료되었을 때 한 사람의 유전체를 읽는 데 약 27억 달러가 들었다. 그것이 2010년대 중반에는 수천 달러, 2020년대에는 1,000달러 이하로 떨어졌다. 가격이 백만 분의 일 이하로 내려간 셈이다. 이 비용 하락이 수천 명 규모의 전장 유전체 시퀀싱을 현실로 끌어내렸고, 자폐 유전학의 시야를 엑솜에서 유전체 전체로 넓힌 기술적 전제 조건이 되었다.

MSSNG의 전체 그림

전장 유전체 시퀀싱이 자폐스펙트럼장애에 대해 보여준 가장 포괄적인 그림은 Trost et al. (2022) 연구에서 나왔다. MSSNG 코호트의 11,312명(자폐 진단군 5,100명 포함)을 분석한 결과, 엑솜에서는 보이지 않던 변이 유형의 기여가 정량화되었다. 진단적 변이, 즉 자폐스펙트럼장애의 원인으로 지목할 수 있는 변이의 유형별 분포는 이렇다. 서열 수준의 변이(한 글자 변경이나 작은 삽입결실)가 52%, 구조 변이(큰 규모의 결실, 중복, 역위)가 46%, 미토콘드리아 변이가 2%를 차지했다. 미토콘드리아는 세포 안에서 에너지를 생산하는 소기관으로, 자체적인 작은 유전체를 가지고 있으며 이 유전체의 변이가 자폐스펙트럼장애에 기여한다는 사실이 이번 분석으로 확인되었다.

여기서 주목할 숫자가 있다. 전체 진단 수율(diagnostic yield)이 14.1%라는 것이다. 가장 포괄적인 시퀀싱 기술을 동원해도 약 86%의 자폐스펙트럼장애 사례에서는 해석 가능한 단일 유전적 원인을 지목할 수 없다는 뜻이다. 86%가 유전적 원인이 없다는 의미는 아니다. 이 사례 대부분은 앞 장에서 다룬 양적유전 구조, 곧 수천 개의 일반 변이가 합산된 효과로 설명된다. 비코딩 영역의 희귀 변이, 아직 해석되지 않은 복잡한 구조 변이, 유전 변이끼리의 상호작용도 기여한다. 상호작용(epistasis)이란 유전 변이 A와 B가 각각은 큰 효과가 없지만 둘이 함께 있으면 표현형에 영향을 미치는 현상을 말한다.

엑솜 시퀀싱과 전장 유전체 시퀀싱은 자폐 유전학에 서로 다른 방식으로 기여했다. 엑솜은 단백질을 만드는 유전자 영역의 변이를 높은 효율로 찾아냈고, 102개에서 185개로 늘어난 자폐 위험 유전자 목록과 세 경로의 수렴이라는 결과가 여기서 나왔다. 전장 유전체 시퀀싱은 여기에 세 가지를 더했다. 구조 변이의 기여가 서열 변이에 맞먹는 규모라는 정량적 추정, 비코딩 영역의 변이가 자폐스펙트럼장애에 기여한다는 초기 증거, 그리고 반복 서열 확장이라는 새로운 변이 유형의 발견이다. 이 가운데 가장 활발하게 탐구되는 영역이 비코딩 유전 변이다.

이 장을 삶으로 옮길 때

전장 유전체 시퀀싱은 DNA 전체를 더 넓게 읽는 기술이지만, 사람의 미래를 전부 읽어내는 기술은 아니다. 엑솜 바깥의 영역까지 보게 되면 더 많은 단서가 생기지만, 동시에 해석하기 어려운 변이도 더 많이 나온다. 가족에게는 결과지를 받는 순간보다, 그 결과가 어떤 근거로 해석되었고 시간이 지나면 재해석될 수 있는지를 아는 일이 중요하다. 당사자에게는 유전체 정보가 매우 개인적인 정보라는 점, 그리고 연구와 임상에서 동의와 개인정보 보호가 필수라는 점이 중요하다. 교사와 상담자는 검사 결과가 없는 사람에게도 지원 필요가 실제로 존재할 수 있음을 잊지 말아야 한다. 더 많이 읽는 기술일수록, 더 조심스럽게 설명하는 책임도 커진다.

참고문헌

Sanders, S. J., Neale, B. M., Huang, H., Werling, D. M., An, J.-Y., Dong, S., … & Buxbaum, J. D. (2017). Whole genome sequencing in psychiatric disorders: The WGSPD consortium. Nature Neuroscience, 20(12), 1661-1668. doi:10.1038/nn.4602

Trost, B., Thiruvahindrapuram, B., Chan, A. J. S., Engchuan, W., Higginbotham, E. J., Howe, J. L., … & Scherer, S. W. (2022). Genomic architecture of autism from comprehensive whole-genome sequence annotation. Cell, 185(23), 4409-4427. doi:10.1016/j.cell.2022.10.009