Chapter 30. Perturb-seq — 유전자 기능의 대규모 해부

오랫동안 유전자 기능 연구는 본질적으로 외로운 작업이었다. 연구자 한 명이 한 개의 유전자를 골라, 그것을 없애거나 과발현시키는 세포주를 만들고, 몇 달에 걸쳐 그 결과를 분석하는 과정이었다. 이 방식은 분명히 작동했다. 수십 년에 걸쳐 수천 개의 유전자 기능이 이런 방식으로 밝혀졌고, 분자생물학의 지식 체계 상당 부분이 이 접근법의 산물이다. 그런데 2014년 이후 상황이 근본적으로 달라졌다. 자폐스펙트럼장애(autism spectrum disorder, ASD) 하나만 놓고 봐도, 전장 엑솜 시퀀싱(whole-exome sequencing) 연구들이 수백 개의 위험 유전자를 쏟아냈다. 희귀 뇌 질환도 아니고, 가장 흔한 신경발달장애 중 하나인 ASD에서만 이미 수백 개가 넘는 유전자가 후보 목록에 올라 있었다. 문제는 분명해졌다. 유전자를 발견하는 속도는 기하급수적으로 빨라졌는데, 유전자 기능을 검증하는 속도는 여전히 선형적이었다. 한 번에 한 유전자라는 전통적인 방식으로는 이 격차를 절대 줄일 수 없었다.

한 번에 하나씩의 한계

이 비대칭의 규모를 실감하려면 간단한 산수가 필요하다. ASD와 연관된 유전자 후보가 200개 있다고 가정하자. 숙련된 연구자 한 명이 하나의 유전자를 인간 유도만능줄기세포(induced pluripotent stem cell, iPSC) 유래 뉴런에서 검증하는 데 평균 2년이 걸린다고 하면, 200개 유전자를 다 검증하는 데 한 사람이 400년이 필요하다는 계산이 나온다. 물론 여러 연구실이 동시에 일하고 있으니 현실은 그보다 빠르지만, 그럼에도 불구하고 새로운 유전자가 발견되는 속도를 따라잡기에는 역부족이다. 그리고 이것은 단순히 속도의 문제만이 아니다. 한 번에 한 유전자만 연구하면 절대로 볼 수 없는 것들이 있다. 서로 다른 유전자들이 어떻게 비슷한 세포 변화를 일으키는지, 즉 수렴(convergence, Chapter 19)의 구조는 개별 연구를 아무리 쌓아도 보이지 않는다. 수백 개의 퍼즐 조각을 하나씩 들여다보는 방식으로는 퍼즐 전체의 그림을 볼 수 없는 것과 같다.

또 다른 문제는 세포의 불투명성이다. 전통적인 기능 연구에서는 유전자를 제거하거나 과발현시킨 뒤, 연구자가 미리 상상한 몇 가지 표현형을 검사한다. 세포의 생존율이 달라지는가, 특정 단백질의 양이 변하는가, 세포 형태가 달라지는가 같은 것들이다. 그런데 세포는 연구자가 상상하지 못한 방식으로 반응할 수 있다. 예상치 못한 신호전달 경로가 활성화되거나, 전혀 연관이 없어 보이던 유전자들의 발현이 바뀌거나, 세포가 서서히 다른 운명으로 방향을 틀 수도 있다. 이런 예상치 못한 변화는 특정 표현형을 겨냥한 단일 실험으로는 잡아낼 수 없다. 편향되지 않은 전체 전사체(transcriptome) 수준의 읽기가 필요하다.

그리고 뇌는 유독 이 문제가 심각한 장기다. 살아있는 인간의 뇌에서 조직을 채취할 수 없다는 근본적인 제약 때문에, 인간 유전자의 기능을 검증하려면 사후 조직이나 체외 모델에 의존해야 한다. 마우스 모델이 있기는 하지만, 인간 뇌에서만 나타나는 세포 유형들, 예를 들어 외측 방사 글리아(outer radial glia, oRG)나 인간 특이적 피질 조직 같은 것들은 마우스에서 재현할 수 없다. 인간 iPSC 유래 뉴런이나 뇌 오가노이드는 이 공백을 부분적으로 메워주지만, 이 시스템에서 수백 개의 유전자를 하나씩 연구하는 것은 여전히 비현실적이었다. 따라서 문제는 하나의 기술적 질문으로 귀결되었다. 수백 개의 유전자 교란을 동시에 진행하면서도, 각각의 교란이 세포 수준에서 어떤 효과를 냈는지를 개별적으로 측정할 수 있을까? 마치 수천 명의 학생들에게 각각 다른 문제를 동시에 풀게 하면서, 나중에 누가 어떤 문제를 풀었는지와 그 풀이 과정을 모두 분리해서 채점할 수 있어야 하는 것이다.

Perturb-seq의 탄생: 교란과 측정의 결합

그 질문에 대한 대답이 2016년 Cell 지에 발표된 Perturb-seq이다. Dixit et al. (2016) 연구는, 두 가지 이미 존재하던 기술을 영리하게 결합했다. 하나는 풀드(pooled) CRISPR 스크리닝이고, 다른 하나는 단일 세포 RNA 시퀀싱(single-cell RNA sequencing, scRNA-seq)이다. 풀드 스크리닝은 수백에서 수천 개의 서로 다른 유전자를 표적으로 하는 가이드 RNA(guide RNA, gRNA)를 한꺼번에 세포 집단에 도입하는 방식이다. 각 세포는 이 혼합물로부터 하나의 gRNA를 받게 되고, 결과적으로 세포 집단 내에서 서로 다른 세포들이 서로 다른 유전자를 교란당하는 모자이크 상태가 만들어진다. 이것만으로는 어느 세포가 어느 유전자를 교란당했는지 알기 어렵고, 더 중요하게는 각 교란이 어떤 전사체 변화를 일으켰는지 알 수 없다. 여기에 두 번째 기술, scRNA-seq가 결합된다. Perturb-seq에서는 gRNA 자체가 세포 내에서 RNA로 발현되어 바코드(barcode) 역할을 하도록 설계되었다. 마트 영수증처럼, 각 세포가 “나는 유전자 X를 교란당했다”는 고유한 태그를 스스로 달고 있는 셈이다. 따라서 scRNA-seq를 통해 각 세포의 전사체를 읽을 때, 동시에 그 세포가 어떤 gRNA를 발현하고 있는지, 즉 어떤 유전자가 교란되었는지도 알 수 있다. 교란의 정체와 교란의 결과를 단일 세포 수준에서 동시에 읽어내는 것이다.

Dixit et al. (2016)이 발표한 이 최초의 Perturb-seq 논문은 뼈수 유래 수지상세포(bone-marrow-derived dendritic cells)와 K562 세포주에서 약 24개의 전사인자(transcription factor)를 동시에 교란하고, 약 200,000개의 세포에서 전사체를 읽어냈다. 한 번의 실험으로 24개 유전자의 기능을 단일 세포 수준에서 동시에 측정한 것은 당시 기준으로 그때까지 시도되지 않았던 규모였다. 또한 이 논문은 MIMOSCA(Multi Input Multi Output Single Cell Analysis)라는 계산 분석 틀도 함께 제시했는데, 이는 개별 교란의 효과뿐 아니라 두 유전자의 동시 교란에서 나타나는 유전 상호작용(genetic interaction)까지 분석할 수 있는 방법이었다. 하나의 논문이 실험 플랫폼과 계산 프레임워크를 동시에 제시한 셈이었고, 이것은 그 이후 등장하는 모든 Perturb-seq 파생 연구들의 기술적 토대가 되었다.

CRISPRi와 CRISPRa: 유전자를 끄고 켜는 기술

Perturb-seq의 성능을 온전히 이해하려면, 이 기술의 엔진 역할을 하는 CRISPR 도구들, 즉 CRISPR 간섭(CRISPR interference, CRISPRi)과 CRISPR 활성화(CRISPR activation, CRISPRa)에 대해 먼저 이야기해야 한다. 원래의 CRISPR-Cas9는 DNA를 잘라서 영구적인 유전 변이(mutation)를 도입하는 방식이다. 두 가닥 DNA를 끊어버리면 세포가 이것을 복구하는 과정에서 염기 삽입이나 결실이 일어나고, 이것이 프레임이동 유전 변이(frameshift mutation)를 일으켜 유전자 기능을 망가뜨린다. 이것이 전통적인 녹아웃(knockout)이다. 그런데 여기에는 문제가 있다. 복구 과정이 불완전하거나 예측 불가능하여, 같은 gRNA로 처리된 세포라도 결과로 생긴 유전 변이의 종류가 서로 다를 수 있다. 스크리닝에서 이런 불균일성은 잡음(noise)이 된다.

CRISPRi는 이 문제를 다른 방식으로 접근한다. DNA를 자르는 대신, DNA 절단 능력이 제거된 비활성 Cas9, 즉 죽은 Cas9(dead Cas9, dCas9)에 강력한 전사 억제 도메인을 붙인다. 이 복합체가 gRNA의 안내를 받아 특정 유전자의 프로모터(promoter) 근처에 결합하면, 물리적인 장애물이 되어 RNA 중합효소(RNA polymerase)가 유전자를 전사하는 것을 방해한다. DNA 서열은 전혀 바뀌지 않지만, 유전자 발현이 크게 억제된다. 녹아웃(knockout)이 유전자를 파괴하는 것이라면, CRISPRi는 유전자를 침묵시키는 것이다. 전기 스위치로 비유하면, 녹아웃은 전선을 아예 끊어버리는 것이고, CRISPRi는 스위치를 끈 채로 놔두는 것이다. 둘 다 불이 꺼지지만, 전선을 끊으면 매번 다르게 끊겨 결과가 들쑥날쑥한 반면, 스위치를 끄는 것은 항상 같은 방식으로 작동한다. 유전 변이의 불균일성이 없기 때문에 스크리닝에서 훨씬 균일하고 재현 가능한 결과를 낸다. CRISPRa는 반대 방향이다. 전사 억제 도메인 대신 강력한 전사 활성화 도메인을 dCas9에 붙여, 원하는 유전자의 발현을 증가시킨다. CRISPRi가 유전자 기능 상실(loss-of-function)을 체계적으로 연구하는 도구라면, CRISPRa는 유전자 기능 획득(gain-of-function)을 연구하는 상보적 도구다. 두 기술을 함께 사용하면, 특정 유전자가 없을 때 무슨 일이 일어나는지와, 그 유전자가 과도하게 활성화될 때 무슨 일이 일어나는지를 동시에 물어볼 수 있다.

뉴런에서의 유전체 규모 스크리닝: Tian et al. (2021)

기술의 잠재력은 분명했지만, 뉴런에서 이것을 구현하는 것은 전혀 다른 이야기였다. 뉴런은 분열하지 않는 세포라는 점이 첫 번째 장벽이다. 대부분의 CRISPR 스크린은 세포가 분열할 때 gRNA의 빈도 변화를 통해 유전자 기능을 추정하는데, 분열하지 않는 세포에서는 이 전략을 사용할 수 없다. 두 번째 장벽은 규모다. 유전체 수준의 스크리닝을 하려면 수만에서 수십만 개의 세포가 필요한데, iPSC를 뉴런으로 분화시키는 것은 세포주를 키우는 것보다 훨씬 복잡하고 시간이 걸리는 과정이다. Tian et al. (2021)이 Nature Neuroscience에 발표한 연구는 이 두 장벽을 모두 넘어선 첫 번째 성공 사례였다. 마틴 캄프만(Martin Kampmann) 연구실의 이 연구는 인간 iPSC 유래 뉴런에서 유전체 규모의 CRISPRi와 CRISPRa 스크리닝을 처음으로 수행했다.

핵심 설계 결정은 신경생성인자 2(Neurogenin 2, Ngn2) 유도 뉴런 시스템의 선택이었다. Ngn2는 피질 흥분성 뉴런의 운명 결정에 관여하는 전사인자인데, 이것을 iPSC에 인위적으로 발현시키면 불균질한 자연 분화 과정을 거치지 않고 빠르고 균일하게 글루타민산성 뉴런(glutamatergic neuron)을 대량으로 생산할 수 있다. 분화의 효율성과 균일성이 보장되어야 유전체 스케일의 스크리닝이 가능하기 때문에, 이 선택은 결정적이었다. 연구진은 CRISPRi용과 CRISPRa용 iPSC 주를 각각 구축하여, 두 모드의 스크린을 독립적으로 진행했다. CRISPRi 스크린에서는 인간 유전체의 거의 모든 단백질 코딩 유전자를 표적으로 하는 gRNA 라이브러리를 도입하고, 뉴런의 생존에 필수적인 유전자들을 찾았다. CRISPRa 스크린에서는 어떤 유전자를 과발현시켰을 때 독성을 나타내는지를 탐색했다. 두 스크린의 결과를 비교함으로써, 유전자 기능의 양방향적 지형도가 만들어졌다.

가장 주목할 발견은 프로사포신(prosaposin, PSAP)과 관련된 것이었다. PSAP는 라이소좀(lysosome) 기능에 관여하는 단백질이다. CRISPRi로 PSAP의 발현을 억제했을 때, 뉴런은 만성 산화 스트레스에 특히 취약해졌다. 흥미롭게도 이 취약성은 iPSC나 HEK293 세포에서는 관찰되지 않았다. 뉴런에서만 특이적으로 나타나는 현상이었다. 더 깊이 파고들었더니, PSAP 결핍이 라이소좀 기능 장애를 일으키고, 이것이 리포푸신(lipofuscin)이라는 노화 관련 세포 내 찌꺼기의 축적으로 이어졌다. 리포푸신은 철(iron)을 가두는 성질이 있는데, 갇힌 철이 반응성 산소종(reactive oxygen species)을 생성하고, 이것이 지질 과산화(lipid peroxidation)를 일으켜 최종적으로 페롭토시스(ferroptosis)라는 세포 사멸을 유도했다. 페롭토시스는 이름 그대로 철(ferro-)에 의해 촉발되는 세포 사멸로, 녹슬어서 부서지는 금속처럼 세포막 지질이 산화되어 구멍이 뚫리는 방식으로 죽는다. 라이소좀 기능 장애가 철 대사 교란을 통해 페롭토시스로 이어지는 경로는, 이 연구 이전에는 뇌 특이적 맥락에서 이렇게 명확하게 규명된 적이 없었다. 게다가 이 경로의 구성 요소들, 라이소좀 기능 장애, 철 축적, 산화 손상은 모두 알츠하이머, 파킨슨병 같은 신경퇴행성 질환에서도 공통적으로 나타나는 특징들이다. 뉴런에서만 나타나는 이 취약성이 노화와 함께 신경퇴행으로 이어지는 과정을 이해하는 단서가 될 수 있다는 것을 이 연구는 시사했다.

뿐만 아니라, 뉴런 생존에 중요한 여러 경로들도 이 연구를 통해 체계적으로 밝혀졌다. 산화 방어에 관여하는 SOD1과 SOD2는 뉴런 생존에 필수적이었는데, 흥미롭게도 이 유전자들은 다른 여러 세포 유형에서는 필수적이지 않았다. 라이소좀 산성화에 필요한 액포형 ATPase(vacuolar ATPase, V-ATPase) 복합체의 서브유닛들, 콜레스테롤 생합성, 철 항상성, 단백질 접힘(protein folding), mRNA 처리, 자가포식(autophagy) 경로들이 모두 뉴런 생존에 중요한 것으로 확인되었다. 하나의 스크린이 뉴런 생물학의 여러 핵심 경로를 동시에 포괄하는 기능 지형도를 그려낸 것이다.

사후 조직의 벽을 넘는 기술

이 기술이 뇌 연구에 특별히 중요한 이유는, 뇌 연구가 직면한 가장 근본적인 한계와 맞닿아 있기 때문이다. 뇌는 살아있는 인간에게서 조직을 채취할 수 없는 장기다. 신경과학자들이 수십 년 동안 의존해온 사후 조직은 유전자 발현 패턴을 보여줄 수는 있지만, 유전자 기능 실험은 거의 불가능하다. 이미 죽은 조직에서는 CRISPR로 유전자를 제거할 수도, 그 결과를 관찰할 수도 없다. 마우스 모델은 강력한 대안이지만, 앞서 언급했듯이 인간 뇌 특이적인 현상을 재현하는 데는 한계가 있다. 결국 인간 iPSC 유래 뉴런과 오가노이드가 이 공백을 메워주는 유일한 선택지인데, 이 시스템에서 Perturb-seq가 작동한다는 것을 Tian et al. (2021)이 증명한 것이다.

비유하자면 이렇다. 건물의 설계 오류를 찾고 싶은데, 완공된 건물만 볼 수 있고 공사 중에는 현장에 들어갈 수 없다고 상상해보라. 사후 조직 연구는 이미 완공된 건물을 들여다보는 것이다. 무엇인가 잘못되었다는 것은 알지만, 어느 시공 단계에서 무엇이 잘못되었는지는 알기 어렵다. 반면 iPSC 유래 뉴런이나 오가노이드는 건물이 지어지는 과정을 실험실에서 재현하는 것이다. 거기에 Perturb-seq를 결합하면, 공사 중에 특정 설계 요소를 하나씩 제거하거나 변경하면서 그 결과를 실시간으로 관찰할 수 있게 된다. 한 번에 수백 개의 설계 요소를 동시에 바꾸면서 각각의 효과를 개별적으로 추적할 수 있다는 점에서, 이것은 이전에는 불가능했던 종류의 실험이다.

또한 Tian et al. (2021)은 이 연구에서 CRISPRbrain이라는 데이터 공개 플랫폼도 함께 만들었다. 서로 다른 세포 유형에서 수행된 기능 유전체학 스크리닝 결과를 한곳에 모아 상호 비교할 수 있도록 한 이 플랫폼은, 어떤 유전자가 어느 세포 유형에서 특이적으로 필수적인지를 시각적으로 탐색할 수 있게 해준다. 뇌 특이적 필수 유전자가 간이나 신장에서는 필수적이지 않을 수 있고, 그 반대도 마찬가지다. 이러한 세포 유형 특이성은 신경퇴행성 질환에서 왜 특정 뉴런 집단이 선택적으로 죽어가는지를 이해하는 열쇠가 될 수 있다. 같은 유전 변이를 가진 사람이라도 특정 세포 유형에서만 취약성이 나타나는 이유, 같은 유전자를 교란해도 세포에 따라 전혀 다른 결과가 나타나는 이유를 이해하는 데, Perturb-seq와 같은 대규모 기능 유전체학 접근법은 필수적인 도구가 되었다.


References

Dixit, A., Parnas, O., Li, B., Chen, J., Fulco, C. P., Jerby-Arnon, L., … & Regev, A. (2016). Perturb-Seq: Dissecting molecular circuits with scalable single-cell RNA profiling of pooled genetic screens. Cell, 167(7), 1853-1866.e17. doi:10.1016/j.cell.2016.11.038

Tian, R., Abarientos, A., Hong, J., & Kampmann, M. (2021). Genome-wide CRISPRi/a screens in human neurons link lysosomal failure to ferroptosis. Nature Neuroscience, 24(7), 1020-1034. doi:10.1038/s41593-021-00862-0


주요 용어 안내

Perturb-seq: CRISPR 교란과 단일 세포 RNA 시퀀싱을 결합한 기술. 수천 개의 유전자를 한꺼번에 교란하면서, 각 교란이 개별 세포의 유전자 발현에 미치는 영향을 동시에 읽어낸다.

CRISPRi(CRISPR interference): 유전자를 절단하지 않고 발현만 억제하는 CRISPR 변형. 세포를 죽이지 않으면서 유전자 기능을 끌 수 있어, Perturb-seq에서 주로 사용된다.

페롭토시스(ferroptosis): 철(iron)에 의해 촉발되는 세포 사멸. 세포막 지질이 산화되어 구멍이 뚫리는 방식으로 세포가 죽으며, 뉴런에서 라이소좀 기능 장애와 연결되어 있다.