Chapter 31. CRISPR 스크리닝 — 유전자 기능의 대규모 해부

앞 장에서 다룬 오가노이드 연구들은 대부분 한 번에 하나의 유전자를 교란하는 방식이었다. CHD8을 망가뜨리면 어떤 일이 일어나는지, SYNGAP1을 망가뜨리면 어떤 일이 일어나는지를 하나씩 보는 것이다. 하지만 자폐 위험 유전자가 185개이고 전체 추정치가 1,000개에 달하는 상황에서, 하나씩 연구하는 속도로는 전체 그림을 그리기까지 수십 년이 걸릴 수 있다. 더욱이 유전자들이 서로 독립적으로 작동하는 것이 아니라 경로와 네트워크 안에서 상호작용하므로, 개별 유전자의 효과를 하나씩 보는 것만으로는 자폐의 생물학을 완전히 이해하기 어렵다. CRISPR 스크리닝은 이 문제를 해결하기 위한 대규모 접근이다.

CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)는 특정 유전자를 정밀하게 편집할 수 있는 기술이다. 이름이 길고 낯설지만, 기본 원리는 단순하다. 가위(Cas9 단백질)와 안내서(guide RNA)로 구성된 시스템인데, 안내서가 유전체의 특정 위치로 가위를 데려가면 가위가 그 위치에서 DNA를 자른다. 안내서는 약 20개의 염기서열로 이루어진 짧은 RNA인데, 찾아가고자 하는 유전자의 서열과 상보적으로 맞아떨어지도록 설계된다. 자물쇠와 열쇠처럼, 안내서의 서열이 유전자의 서열과 정확히 맞아야만 가위가 그 위치에서 DNA를 자를 수 있다. 잘린 DNA가 수리되는 과정에서 작은 결함이 생기면 유전자가 비활성화되고, 또는 원하는 새 서열을 함께 넣어주면 그 서열로 교체할 수도 있다. CRISPR 스크리닝은 수백 개의 서로 다른 안내서를 동시에 세포에 도입하여, 한 번의 실험에서 수백 개의 유전자 각각을 교란하고 그 결과를 단일 세포 시퀀싱으로 읽어내는 것이다.

CRISPR 편집의 정확성도 이 스크리닝의 타당성에 중요한 역할을 한다. Cas9 가위는 대부분의 경우 의도한 위치만 자르지만, 간혹 의도하지 않은 위치를 자르는 “표적 외 효과(off-target effect)“가 발생할 수 있다. 이 표적 외 효과가 실험 결과를 오염시킬 수 있으므로, 연구자들은 보통 하나의 유전자에 두 개 이상의 서로 다른 안내서 RNA를 설계하고, 두 안내서 모두에서 같은 결과가 나타날 때만 신뢰할 수 있는 결과로 인정한다. 또한 고정밀 CRISPR 변종(예: eSpCas9, HiFi Cas9)이 개발되면서 표적 외 효과가 크게 줄었다. 이 기술적 엄밀성은 CRISPR 스크리닝 결과의 신뢰성을 보장하는 핵심 요소다. 최근에는 단일 염기를 자르지 않고 바꾸는 염기 편집(base editing) 기술도 스크리닝에 도입되고 있어, 유전자 비활성화뿐 아니라 실제 환자에서 관찰되는 구체적인 변이의 효과를 오가노이드에서 재현하는 것이 가능해지고 있다.

이 방법이 작동하는 방식을 더 자세히 살펴보면, 먼저 연구자들은 연구하고자 하는 유전자 각각에 맞춤화된 안내서 RNA를 수백 개 합성한다. 이 안내서들을 바이러스 벡터(무해하게 개조된 바이러스)에 실어서 세포에 전달하면, 각 세포가 무작위로 하나의 안내서를 받아들이고, 그 안내서가 지시하는 유전자를 비활성화한다. 결과적으로 수백만 개의 세포들이 저마다 다른 유전자가 망가진 상태로 존재하는 모자이크 시스템이 만들어진다. 이 세포들을 단일 세포 RNA 시퀀싱으로 분석하면, 각 세포에서 어떤 안내서가 작동했는지(어떤 유전자가 교란되었는지)와 그 결과로 유전자 발현이 어떻게 바뀌었는지를 동시에 읽어낼 수 있다. 이 두 가지 정보를 연결하면, 수백 개의 유전자 각각을 교란했을 때 세포가 어떻게 반응하는지를 한 번의 실험에서 파악할 수 있다. 이것을 Perturb-seq라 부르는데, 교란(perturbation)과 시퀀싱(sequencing)을 결합한 이름이다. 마치 수백 개의 전구가 달린 전기 패널에서 각 스위치를 하나씩 끄면서 어떤 불이 꺼지는지를 동시에 기록하는 것과 같다.

CRISPR 스크리닝의 또 다른 방향은 유전자를 단순히 비활성화하는 것이 아니라 활성화하는 것이다. CRISPRa(CRISPR activation)는 DNA를 자르지 않고 전사 인자를 모아서 특정 유전자의 발현을 높이는 방식이다. 이것을 CRISPR 스크리닝에 적용하면, 유전자가 너무 적게 발현될 때의 효과(기능 상실 방향)와 너무 많이 발현될 때의 효과(기능 획득 방향)를 같은 플랫폼에서 동시에 탐구할 수 있다. “기능 획득과 기능 상실” 장에서 다룰 용량 민감성의 문제, 즉 유전자의 양이 적어도 많아도 문제라는 원리를 오가노이드 수준에서 체계적으로 검증하는 것이 가능해지는 것이다. 나아가 특정 유전자가 비활성화되었을 때 나타나는 발달 결함을, 다른 유전자의 활성화로 구제(rescue)할 수 있는지를 스크리닝하면, 잠재적인 치료 표적도 찾아낼 수 있다. 이처럼 CRISPR 스크리닝은 기전 탐구 도구에서 치료 표적 발견 도구로 역할을 확장하고 있다.

Li et al. (2023) 연구는 CHOOSE(CRISPR-based Human Organoid Overexpression/knockout-mediated Single-cell Expression)라는 플랫폼을 개발하여, 36개의 자폐 위험 유전자를 인간 뇌 오가노이드에서 동시에 스크리닝했다. 각 유전자가 교란된 세포들이 모자이크 형태로 하나의 오가노이드 안에 섞여 자라게 하고, 단일 세포 RNA 시퀀싱으로 각 세포에서 어떤 유전자가 교란되었는지와 그에 따른 유전자 발현 변화를 동시에 읽어낸다. 이 접근의 장점은 모자이크 설계에 있다. 서로 다른 유전자가 교란된 세포들이 같은 오가노이드 안에서 나란히 자라므로, 세포 유형 구성의 차이가 아니라 유전자 교란 자체의 효과를 분리해낼 수 있다. 결과에서 ARID1B가 교란되면 배쪽(ventral) 전구세포가 확장된다는 것이 발견되었고, 여러 자폐 유전자가 세포 운명 결정(cell fate decision)에 영향을 미친다는 것이 확인되었다. 세포 운명 결정이란 전구세포가 흥분성 뉴런이 될지, 억제성 뉴런이 될지, 교세포가 될지를 선택하는 과정을 말하는데, 이 선택이 자폐 위험 유전자들에 의해 직접 영향받는다는 것이다.

Meng et al. (2023) 연구는 한 단계 더 나아가, 어셈블로이드에서 CRISPR 스크리닝을 수행했다. 611개의 신경발달 장애 유전자를 표적으로 하는 안내서를 도입하여, 억제성 뉴런의 생산과 이동에 영향을 미치는 유전자를 찾았다. 425개 유전자가 스크리닝되었고, 46개가 억제성 뉴런의 생산이나 이동에 유의한 영향을 미쳤다. 특히 LNPK라는 유전자가 소포체(endoplasmic reticulum)의 위치 조절을 통해 억제성 뉴런의 이동에 필수적이라는 새로운 기전이 발견되었다. 소포체는 세포 안에서 단백질을 접고 가공하는 공장에 해당하는 소기관인데, 이동하는 뉴런에서 이 소기관의 위치가 정확해야 뉴런이 올바른 방향으로 이동할 수 있다는 것이다. LNPK는 기존에 신경발달 장애와 연관된 것으로 알려져 있었지만, 그 기전은 불명확했다. 이 연구를 통해 소포체 위치 조절이라는 새로운 기전이 밝혀진 것은, 대규모 스크리닝이 기존에 알려진 유전자들에 대해서도 새로운 생물학을 드러낼 수 있음을 보여주는 좋은 사례다.

이러한 대규모 스크리닝의 결과를 분석하면 흥미로운 패턴이 나타난다. 서로 다른 자폐 위험 유전자를 교란했을 때 나타나는 전사체 변화가 완전히 제각각인 것이 아니라, 일부 유전자 그룹에서 비슷한 변화가 반복된다는 것이다. 예를 들어 시냅스 관련 유전자들(SHANK3, SYNGAP1 등)을 교란하면 비슷한 신호 전달 경로의 변화가 나타나고, 크로마틴 리모델링 유전자들(CHD8, ARID1B 등)을 교란하면 비슷한 유전자 발현 프로그램의 교란이 나타난다. 이것은 Part 5에서 유전학 데이터를 통해 발견한 경로 수렴의 기능적 검증이다. 유전자들이 서로 다른 진입점을 통해 결국 같은 생물학적 과정에 영향을 미친다는 것을 유전학적 증거뿐 아니라 실험적으로도 확인하는 것이다.

CRISPR 스크리닝의 규모가 커질수록 기술적 도전도 늘어난다. 수백만 개의 세포를 분석하는 단일 세포 시퀀싱은 엄청난 양의 데이터를 생성하며, 이 데이터에서 의미 있는 신호를 추출하기 위해 복잡한 통계 분석과 머신러닝 알고리즘이 필요하다. 각 유전자 교란에 의한 효과가 미묘하고, 기술적 소음(단일 세포 시퀀싱의 측정 오류, 세포마다 다른 교란 효율)과 생물학적 신호를 구분하는 것이 쉽지 않다. 또한 오가노이드 안에서 세포들이 다양한 단계로 발달하고 있으므로, 같은 유전자 교란이 발달 단계에 따라 다르게 나타날 수 있다. 이러한 데이터 분석 문제를 해결하기 위해 생물정보학자와 통계학자가 유전학자, 신경과학자와 함께 팀을 이루는 것이 이 분야 연구의 특징이 되고 있다. 대규모 스크리닝 연구들이 원시 데이터를 공개하는 경향이 늘어나면서, 다른 연구팀이 같은 데이터를 다른 방식으로 분석하여 추가 발견을 이끌어내는 일도 증가하고 있다.

CRISPR 스크리닝이 발견하는 것들은 자폐의 유전적 구조를 이해하는 데도 귀중한 정보를 제공한다. 어떤 유전자들이 교란되었을 때 비슷한 전사체 변화를 보인다면, 이 유전자들은 같은 생물학적 모듈 안에서 기능한다는 뜻이다. 이것은 거꾸로 말하면, 같은 모듈 안에 있는 유전자들을 모두 찾아내면 아직 알려지지 않은 새로운 자폐 위험 유전자를 예측하는 데 도움이 된다는 것이다. 스크리닝에서 발견된 클러스터 안에 기존에 자폐 위험 유전자로 알려진 것과 아직 알려지지 않은 유전자가 함께 있다면, 알려지지 않은 유전자도 자폐 위험에 기여할 가능성이 높다. 이런 방식으로 CRISPR 스크리닝은 유전학 연구와 기능 연구를 연결하는 다리가 된다.

지금까지 다룬 CRISPR 스크리닝은 모두 접시 위의 세포나 오가노이드에서 수행된 것이었다. 살아 있는 뇌에서는 가능하지 않을까? Shi et al. (2026) 연구는 살아 있는 마우스의 뇌에서 유전체 규모의 Perturb-seq를 처음으로 수행했다. 1,947개의 질환 관련 유전자를 동시에 교란하고, 34개의 뉴런 분류와 331개의 하위 유형에 걸쳐 772만 개의 뉴런에서 전사체를 읽었다. 이 연구의 핵심 발견은 전사적 수렴이 다섯 개의 모듈로 조직된다는 것이었다. 단백질 항상성, 소포 운송, RNA 스플라이싱, 크로마틴 리모델링, 흥분성 시냅스 후 신호 전달이 그것이다. 특히 자폐와 지적장애의 핵심 위험 유전자들이 NMDA 수용체 모듈에 수렴했으며, GRIN2A(주로 조현병 관련)와 GRIN2B(주로 자폐 관련)가 같은 뉴런에서 정반대 방향의 전사체 변화를 유도한다는 것이 발견되었다. 이것은 같은 시냅스의 같은 수용체 복합체에서 서로 다른 서브유닛의 변이가 서로 다른 질환을 일으키는 분자적 기반을 제공한다.

이러한 대규모 스크리닝이 보여주는 핵심 교훈은 두 가지다. 첫째, 자폐 위험 유전자들이 교란할 때 나타나는 결과가 시냅스 기능의 변화에만 국한되지 않는다는 것이다. 세포의 운명 결정, 전구세포의 증식, 뉴런의 이동 같은 발달 초기 과정에도 많은 자폐 유전자가 관여한다. 이것은 자폐의 분자적 교란이 태아기 뇌 발달의 매우 이른 단계부터 시작된다는 것을 의미한다. 둘째, 서로 다른 유전자를 교란해도 수렴하는 결과가 나타난다는 것이다. 여러 유전자의 교란이 비슷한 세포 운명 변화나 비슷한 전사체 변화를 초래하며, 이것은 Part 5에서 다룬 경로 수렴의 기능적 검증이기도 하다. 다음 장에서는 유전적 요인이 아닌 환경적 요인, 특히 임신 중 감염에 의한 모체 면역 활성화가 자폐와 어떻게 연결되는지를 살펴본다.

References

Li, C., Fleck, J. S., Martins-Costa, C., et al. (2023). Single-cell brain organoid screening identifies developmental defects in autism. Nature, 621(7978), 373-380. doi:10.1038/s41586-023-06473-y

Meng, X., Yao, D., Imaizumi, K., et al. (2023). Assembloid CRISPR screens reveal impact of disease genes in human neurodevelopment. Nature, 622(7982), 359-366. doi:10.1038/s41586-023-06564-w

Shi, Y., et al. (2026). Genome-scale functional mapping of the mammalian brain with in vivo Perturb-seq. Nature. doi:10.64898/2026.03.16.711480