유전자를 켜고 끄는 것이 전부가 아니다. 그보다 더 근본적인 질문이 있다. 어떤 세포는 왜 그 유전자를 켤 수 있고, 다른 세포는 왜 켤 수 없는가? 같은 유전체를 가진 두 세포, 예를 들어 대뇌 피질의 글루타메이트 뉴런과 척수의 운동 뉴런이 서로 완전히 다른 유전자 발현 프로파일을 가지는 이유는 무엇인가? 이 질문에 답하려면 전사체(transcriptome)를 넘어서 후성유전체(epigenome)로 가야 한다. 후성유전체란 DNA 서열 자체를 바꾸지 않으면서 유전자 발현을 조절하는 화학적 변형들과 구조적 조직을 통칭하는 말이다. DNA 메틸화(DNA methylation), 히스톤 변형(histone modification), 크로마틴 접근성(chromatin accessibility), 그리고 3차원 유전체 구조(3D genome organization)가 모두 여기에 해당한다. 이것들은 마치 책 위에 붙여진 포스트잇이나 형광펜으로 줄 친 부분처럼, 어느 부분을 읽어야 하는지, 어느 부분을 무시해야 하는지를 세포에게 알려주는 주석들이다.
단일 세포 전사체학이 뇌 세포들의 유전자 발현 패턴을 밝혀냈다면, 단일 세포 후성유전체학은 그 발현 패턴이 왜, 어떻게 유지되는지를 이해하는 다음 단계다. 전사체가 “지금 어떤 유전자가 얼마나 켜져 있는가”를 알려준다면, 후성유전체는 “앞으로 어떤 유전자가 켜질 수 있는가, 그리고 그 제어 스위치는 어디에 있는가”를 알려주는 것이다. 그런데 후성유전체를 단일 세포 수준에서 측정하는 것은 전사체를 측정하는 것보다 훨씬 어렵다. mRNA는 세포에서 수천 개의 복사본이 만들어지지만, DNA는 세포당 두 복사본밖에 없다. 신호가 훨씬 약하고, 기술적 요구사항도 훨씬 까다롭다. 그럼에도 불구하고, 2023년을 전후하여 단일 세포 후성유전체학 분야에서 일련의 주요 논문들이 발표되었고, 이것들이 인간 뇌의 후성유전체 지형도를 처음으로 세포 해상도로 그려냈다.
DNA 메틸화는 후성유전적 조절의 가장 오래되고 가장 잘 연구된 형태다. DNA의 사이토신(cytosine) 염기에 메틸기(methyl group, -CH3)가 붙는 것으로, 이 메틸화가 일어난 사이토신은 메틸시토신(methylcytosine, mC)이 된다. 메틸기가 붙는다는 것을 단순하게 이해하면, 책의 특정 페이지를 접어두어 읽지 말라는 표시를 해두는 것과 비슷하다. 포유류에서 DNA 메틸화는 주로 CG 이핵염기(CpG dinucleotide)에서 일어나는데, 이것을 CG 메틸화(mCG)라고 한다. CpG 이핵염기란 DNA 서열에서 C(사이토신) 바로 다음에 G(구아닌)가 오는 위치를 뜻하고, 이런 위치가 유전자 근처에 여럿 모여 있는 것을 CpG 섬이라고 부른다. 유전자의 프로모터 영역에 CpG가 밀집된 CpG 섬(CpG island)이 메틸화되면 그 유전자의 발현이 억제되고, 메틸화되지 않으면 발현이 가능해진다. 이것은 교과서적인 후성유전학이다. 그런데 뇌 뉴런에는 CpG가 아닌 위치에서도 메틸화가 일어나는 비CpG 메틸화(non-CpG methylation, mCH, 여기서 H는 A, C, T를 의미한다)가 높은 수준으로 존재한다는 것이 알려져 있었다. 이 mCH 메틸화는 뉴런에서 특히 높고, 뇌 발달 과정에서 점진적으로 증가하며, 세포 유형에 따라 다른 패턴을 보인다. 하지만 단일 세포 수준에서 이것이 어떻게 세포 정체성과 연결되는지는 아직 밝혀지지 않은 영역이었다.
2023년 솔크 연구소(Salk Institute)의 조셉 에커(Joseph Ecker) 연구실에서 발표한 연구는 이 질문에 대규모로 답했다. Science에 발표한 Tian et al. 연구는 두 가지 독자적인 기술을 사용했다. snmC-seq3는 단일 핵에서 DNA 메틸화 프로파일을 얻는 방법이고, snm3C-seq는 DNA 메틸화와 크로마틴 입체 구조를 동시에 측정하는 방법이다. 3명의 성인 남성 뇌에서 46개 영역을 채취하여 총 517,000개의 세포를 분석했고, 188개의 세포 유형(40개의 주요 유형 포함)을 후성유전체 정보만으로 분류했다. BICCN의 나머지 연구들과 같은 기증자, 같은 뇌 영역을 사용했기 때문에 전사체 데이터와 직접 비교도 가능했다. Tian et al. 연구에서 발견한 가장 기초적이지만 중요한 사실은 mCG와 mCH가 세포 유형에 따라 모두 특이적인 패턴을 보인다는 것이었다. 전체적인 mCG 수준을 보면 세포 유형에 따라 77.7%에서 85.5%까지 변했고, mCH는 0.8%에서 10.7%까지 훨씬 큰 차이를 보였다. 비신경세포와 소뇌 과립세포(cerebellar granule cell)는 mCG와 mCH가 모두 낮은 반면, 피질 억제성 뉴런(cortical inhibitory neuron)은 mCG가 가장 높았다. 이런 전반적인 수준의 차이뿐만 아니라, 특정 유전체 영역에서의 메틸화 패턴도 세포 유형마다 고유한 지문(fingerprint)처럼 나타났다.
나아가 연구팀은 scMCodes(단일 세포 메틸화 바코드, single-cell methylation barcodes)라는 개념을 도입했다. 뇌의 세포 유형을 신뢰할 수 있게 분류하기 위해 꼭 필요한 유전체 위치들의 최소 집합을 선택하여, 이 위치들의 메틸화 상태만으로 어떤 세포 유형인지 예측할 수 있는 것이다. 마치 주민등록번호의 특정 자리만 보고도 생년월일과 성별을 알 수 있는 것처럼, 유전체의 특정 위치들의 메틸화 상태를 보면 세포 유형을 식별할 수 있는 최소한의 ‘식별 코드’가 존재한다는 것이다. 메틸화를 유지하는 효소인 DNMT1의 발현이 세포 유형별 mCG 수준과 강한 양의 상관관계를 보였고(피어슨 상관계수 0.63), mCH와는 더 강한 상관관계를 보였다(0.72). 이것은 세포 유형마다 DNA 메틸화 유지 효소의 발현 수준이 다르고, 이것이 그 세포의 전반적인 메틸화 수준을 결정하는 데 중요한 역할을 한다는 새로운 발견이었다. 인간과 마우스 간의 비교에서는 세포 유형과 차별 메틸화 영역(differentially methylated region)이 두 종 사이에서 광범위하게 보존되어 있으면서도, 인간 특이적인 메틸화 패턴도 존재한다는 것이 확인되었다.
DNA 메틸화가 유전자 발현의 “장기 기억” 같은 것이라면, 크로마틴 접근성(chromatin accessibility)은 “현재 상태”에 더 가깝다. 크로마틴은 DNA가 히스톤 단백질을 감싸고 있는 구조인데, 어떤 부분은 히스톤이 밀집하여 빽빽하게 접혀 있고(폐쇄 크로마틴, closed chromatin), 어떤 부분은 히스톤이 느슨하게 배치되어 열려 있다(개방 크로마틴, open chromatin). DNA가 히스톤에 단단히 감겨 있는 것은 마치 책이 꽁꽁 묶여 있어서 펼칠 수 없는 상태와 같고, 크로마틴이 열려 있다는 것은 그 책을 읽을 수 있도록 펼쳐 놓은 상태와 같다. 전사인자가 DNA에 결합하여 유전자를 활성화하려면, 먼저 그 DNA 서열에 접근할 수 있어야 한다. 즉 크로마틴이 열려 있어야 한다. 따라서 어떤 유전체 영역의 크로마틴 접근성 패턴을 보면, 그 세포에서 어떤 조절 요소들이 활성화 상태에 있는지를 알 수 있다.
ATAC-seq(트랜스포사제 접근성 크로마틴의 시퀀싱, Assay for Transposase-Accessible Chromatin with sequencing)은 개방된 크로마틴 영역을 전장 유전체 수준에서 측정하는 방법으로, 단일 핵 수준으로 적용한 것이 snATAC-seq다. 작동 원리는 이렇다: 트랜스포사제(Tn5)라는 효소는 열려 있는 크로마틴에만 접근하여 그 자리에 시퀀싱 어댑터를 삽입한다. 닫혀 있는 크로마틴은 히스톤에 의해 차단되어 효소가 접근하지 못한다. 따라서 시퀀싱 후 어댑터가 삽입된 위치를 보면 어디가 열려 있었는지를 정확히 알 수 있다. 빙 렌(Bing Ren) 연구팀이 이끈 이 연구는 42개 뇌 영역의 1.1백만 세포를 snATAC-seq로 분석하여, 107개의 세포 유형과 544,735개의 후보 시스 조절 요소(candidate cis-regulatory elements, cCREs)를 포함하는 인간 뇌 크로마틴 접근성 아틀라스를 만들었다. 시스 조절 요소란 같은 DNA 가닥 위에서 가까운 거리에 있는 유전자의 발현을 조절하는 DNA 서열로, 유전자의 발현 여부와 발현 수준을 결정하는 스위치 역할을 한다. 이 cCREs 중 47%는 ENCODE 데이터베이스에 이전에 주석이 달리지 않은 새로운 조절 요소들이었다. 조절 요소의 약 3분의 1은 마우스 뇌에서도 보존되어 있어, 이들이 포유류 공통의 뇌 기능에 중요한 역할을 할 가능성이 있다.
cCREs의 발견만으로도 이미 가치 있는 성과이지만, 이 연구의 진정한 강점은 크로마틴 접근성과 전사체를 통합하여 조절 요소와 표적 유전자를 연결했다는 데 있었다. 114,000개 이상의 추정 인핸서(enhancer)가 약 13,000개의 표적 유전자와 연결되었다. 인핸서란 수백, 수천 염기 쌍 떨어진 거리에서도 유전자의 발현을 강화하는 조절 요소로, 마치 스피커의 앰프처럼 유전자 발현 신호를 증폭시키는 역할을 한다. 이 지도는 어떤 인핸서가 어떤 유전자를 세포 유형 특이적으로 조절하는지를 보여주는 뇌의 유전자 조절 회로 지도다. 이 지도는 뇌의 세포 정체성이 어떻게 만들어지는지를 이해하는 데 필수적인 자원이다. CATlas(catlas.org)라는 공개 웹 포털을 통해 이 데이터에 접근할 수 있다.
Luo et al. (2022) 연구가 개발한 snmCAT-seq(단일 핵 메틸시토신, 크로마틴 접근성, 전사체 시퀀싱)은 DNA 메틸화, 크로마틴 접근성, 전사체를 모두 단일 핵에서 동시에 측정하는 삼중 오믹스(triple-omics) 방법이다. 비스설파이트 변환(bisulfite conversion)으로 메틸화를, M.CviPI 효소로 크로마틴 접근성을, 그리고 cDNA 합성으로 전사체를 같은 핵에서 동시에 얻는다. 이 방법으로 연구팀은 63개의 인간 피질 세포 집단을 세 가지 오믹스 정보 모두를 가진 형태로 특성화했다. 서로 다른 분자 계층들이 대부분의 세포 유형에서는 일치했지만, 일부 세포 유형에서는 특정 계층이 세포 집단을 더 세밀하게 구분하는 경우도 있었다. 전사체만 보았을 때는 하나의 클러스터로 묶이는 세포들이 메틸화나 크로마틴 접근성을 보면 실제로는 서로 다른 집단일 수 있다는 것, 즉 다중 오믹스 접근이 단일 오믹스로는 볼 수 없는 세포 다양성의 차원을 열어준다는 것을 의미한다.
후성유전체와 전사체의 관계에서 가장 근본적인 질문 중 하나는 인과관계(causality)다. 크로마틴이 열리기 때문에 유전자가 켜지는 것인가, 아니면 유전자가 켜지기 때문에 크로마틴이 열리는 것인가? 이것은 닭이 먼저냐 달걀이 먼저냐처럼 들릴 수 있지만, 답은 실제로 중요하다. 만약 전자라면, 크로마틴 상태를 조작하여 세포 운명을 바꿀 수 있다는 것을 의미하고, 후자라면 전사인자의 활성이 먼저 바뀌어야 한다는 것을 의미한다. 세포를 마음대로 원하는 유형으로 바꾸려는 재생 의학의 입장에서는 이 답이 어느 쪽이냐에 따라 치료 전략이 달라질 수 있다. 예를 들어 피부 세포를 뉴런으로 바꾸고 싶다면, 크로마틴을 먼저 뉴런처럼 재구성해야 하는지 아니면 뉴런 전사인자를 집어넣으면 크로마틴이 알아서 따라오는지가 핵심 질문이 된다.
Zhu et al.의 연구는 이 질문에 정면으로 답했다. 이 연구는 태아에서 성인까지 6개 발달 시점에 걸친 45,549개의 발달 중인 인간 대뇌 피질 핵에서 유전자 발현(scRNA-seq)과 크로마틴 접근성(scATAC-seq)을 동시에 측정했다. 두 가지를 같은 세포에서 동시에 측정했기 때문에, 같은 세포에서 크로마틴 접근성과 유전자 발현의 관계를 직접 비교할 수 있었다. 분화 의사시간(differentiation pseudotime) 분석으로 전구세포부터 성숙 뉴런까지의 경로를 따라 세포들을 정렬하고, 각 시점에서 cCRE의 크로마틴 접근성이 해당 유전자의 발현보다 먼저 변하는지, 나중에 변하는지를 분석했다. 의사시간이란 단일 세포 데이터에서 세포들을 분화 정도에 따라 순서대로 배열하는 방법으로, 실제 시간의 흐름이 아니라 분화 진행 정도를 나타내는 가상의 시간 축이다. 결과는 명확했다. 크로마틴 접근성이 유전자 전사(transcription)에 선행했다. 미래에 특정 유전자를 켜게 될 세포에서, 그 유전자의 조절 영역 크로마틴이 먼저 열리고, 그다음에 유전자가 켜졌다. 문이 먼저 열리고, 사람이 들어오는 것이다.
이 발견은 단순한 인과관계를 넘어 더 깊은 함의를 가진다. 세포가 분화 결정을 내리기 전에 이미 크로마틴 수준에서 그 결정을 준비하고 있다는 것이다. 마치 음식점에서 주문을 받기 전에 미리 재료를 손질해두는 것처럼, 전구세포는 앞으로 어떤 세포가 될지 결정하기 전에 이미 크로마틴을 통해 여러 가능성의 문을 조금씩 열어두거나 닫아두기 시작한다. 이것은 세포 운명 결정이 전사인자 수준에서만 일어나는 것이 아니라, 그보다 더 깊은 크로마틴 수준에서부터 시작된다는 것을 의미한다. 이 관계를 뒤집어 생각하면, 크로마틴 접근성 패턴이 세포의 현재 상태뿐만 아니라 미래 운명까지 예측하는 정보를 담고 있다는 것이기도 하다.
후성유전체의 가장 흥미로운 측면 중 하나는 3차원 유전체 구조다. DNA는 일직선이지만, 세포핵 안에서 DNA는 3차원 공간에서 복잡하게 접혀 있다. 인간 세포 하나의 DNA를 꺼내 일자로 펼치면 약 2미터 길이인데, 이것이 직경 6마이크로미터(0.006mm)짜리 핵 안에 빽빽하게 들어가 있다. 이 3차원 구조가 단순한 패키징 문제가 아니라는 것이 밝혀진 것은 비교적 최근의 일이다. 멀리 떨어진 두 유전체 영역이 3차원 공간에서 가까이 위치하게 되면, 인핸서가 먼 거리에 있는 프로모터와 상호작용하여 유전자를 조절할 수 있다. 비유하자면, 책의 1페이지와 200페이지가 물리적으로 접혀서 서로 닿게 되면, 1페이지의 내용이 200페이지의 내용에 영향을 미칠 수 있는 것과 같다. 위상적 연관 도메인(topologically associating domain)은 그 안에서 DNA 상호작용이 더 자주 일어나는 유전체의 단위 구획이고, A/B 구획(A/B compartment)은 더 큰 규모에서 활성(A, active) 또는 비활성(B, inactive) 크로마틴 영역을 구분한다. 이런 3D 유전체 구조가 세포 유형에 따라, 그리고 발달 과정에서 어떻게 변하는지는 매우 중요한 질문이지만, 단일 세포 수준에서 이것을 측정하는 것은 기술적으로 매우 어렵다.
Heffel et al. (2024) 연구는 인간 전전두 피질(prefrontal cortex)과 해마(hippocampus)에서 임신 중기부터 성인까지의 발달 과정에 걸쳐 53,000개 이상의 핵에서 snm3C-seq3 기술로 DNA 메틸화와 크로마틴 입체 구조를 동시에 측정했다. 이 연구의 가장 핵심적인 발견은 DNA 메틸화 동역학과 3D 유전체 구조 변화가 발달 과정에서 같은 타임라인을 따르지 않는다는 것이었다. 즉 메틸화 재구성과 3D 유전체 재구성은 시간적으로 분리된(temporally decoupled) 과정이다. 직관적으로는 이 두 과정이 항상 함께 일어날 것 같지만, 실제로는 그렇지 않았다. 마치 건물을 리모델링할 때 내부 배선 공사와 외벽 도색이 반드시 동시에 이루어지지 않는 것처럼, 후성유전체의 서로 다른 층은 각자의 스케줄대로 변화한다. 어떤 발달 시기에는 메틸화가 급격히 변하면서 3D 구조는 상대적으로 안정적이고, 다른 시기에는 3D 구조가 재구성되면서 메틸화는 느리게 변화했다. 이것은 후성유전체의 서로 다른 층들이 독립적으로 조율되며, 각각 서로 다른 발달 과정과 연결되어 있다는 것을 의미한다. 뉴런과 글리아 사이에서도 차이가 있었는데, 흥분성 뉴런은 전전두 피질과 해마 사이에서 더 강한 지역 특이적 정체성을 보인 반면, 억제성 뉴런과 비신경세포들은 두 영역 사이에서 더 유사한 프로파일을 보였다.
이 장에서 다룬 연구들을 한 발 물러서서 보면, 하나의 큰 그림이 보인다. 뇌 세포의 정체성은 단일한 분자 계층이 아니라 여러 층의 후성유전적 정보가 중첩되어 만들어진다. DNA 메틸화는 세포 유형의 장기적이고 안정적인 정체성을 새기는 글씨이고, 크로마틴 접근성은 현재 활성화된 조절 요소들의 현황판이며, 3D 유전체 구조는 인핸서와 프로모터가 실제로 서로 대화할 수 있도록 해주는 공간적 플랫폼이다. 그리고 전사체는 이 모든 후성유전적 상태가 실제 유전자 발현으로 번역된 최종 결과물이다. Tian et al. 연구에서 보여주었듯이, 같은 46개 뇌 영역에서 메틸화, 크로마틴 접근성, 3D 유전체 구조, 유전자 발현이 모두 일치하는(concordant) 방향으로 변화한다. 어떤 세포 유형에서 특정 유전자가 높이 발현된다면, 그 유전자의 조절 영역은 메틸화가 낮고, 크로마틴이 열려 있으며, 3D 공간에서 활성 구역에 위치해 있다. 이 네 가지 분자 계층이 일관된 방향을 가리킨다. 멀티오믹스 기술들이 뇌 발달 연구에 던진 가장 중요한 메시지는 아마도 이것일 것이다. 유전자 서열이 운명이 아니다. 같은 유전체를 가진 세포들이 서로 완전히 다른 정체성을 갖는 것은, 후성유전체가 그 유전체를 어떻게 읽느냐를 결정하기 때문이다. 그리고 그 후성유전체는 발달 과정에서 전구세포가 분화 결정을 내리기도 전에 이미 변하기 시작하며, 분화 신호보다 크로마틴의 열림이 먼저 일어난다. 뇌가 어떻게 만들어지는지를 이해하려면, 유전자 서열을 읽는 것만으로는 부족하다. 그 서열에 새겨진 후성유전적 주석들까지 함께 읽어야 한다.
References
Tian, W., Zhou, J., Bartlett, A., Zeng, Q., Liu, H., Castanon, R., … & Ecker, J. R. (2023). Single-cell DNA methylation and 3D genome architecture in the human brain. Science, 382(6667), eadf5357. doi:10.1126/science.adf5357
Li, Y. E., Preissl, S., Miller, M., Johnson, N. D., Wang, Z., Jiao, H., … & Ren, B. (2023). A comparative atlas of single-cell chromatin accessibility in the human brain. Science, 382(6667), eadf7044. doi:10.1126/science.adf7044
Zhu, K., Bendl, J., Rahman, S., Vicari, J. M., Coleman, C., Clarence, T., … & Bhatt, D. L. (2023). Multi-omic profiling of the developing human cerebral cortex at the single-cell level. Science Advances, 9(41), eadg3754. doi:10.1126/sciadv.adg3754
Luo, C., Liu, H., Xie, F., Armand, E. J., Siletti, K., Bakken, T. E., … & Mukamel, E. A. (2022). Single nucleus multi-omics identifies human cortical cell regulatory genome diversity. Cell Genomics, 2(3), 100107. doi:10.1016/j.xgen.2022.100107
Heffel, M. G., Zhou, J., Bartlett, A., Luo, C., Lucero, J., Castanon, R., … & Ecker, J. R. (2024). Temporally distinct 3D multi-omic dynamics in the developing human brain. Nature, 635(8039), 706-716. doi:10.1038/s41586-024-08030-7
주요 용어 안내
후성유전체(epigenome): DNA 서열 자체를 바꾸지 않으면서 유전자 발현을 조절하는 화학적 변형들의 총체. DNA 메틸화, 히스톤 변형, 크로마틴 접근성, 3차원 유전체 구조가 모두 포함된다. 같은 악보를 다르게 해석하는 연주자의 주석에 비유할 수 있다.
DNA 메틸화(DNA methylation): DNA의 사이토신 염기에 메틸기(-CH3)가 붙는 화학적 변형. 유전자 근처에서 일어나면 그 유전자의 발현을 억제하는 역할을 한다. 책의 특정 페이지를 접어두어 “읽지 말라”고 표시하는 것과 비슷하다.
크로마틴 접근성(chromatin accessibility): DNA가 히스톤 단백질에 감겨 있는 정도. 크로마틴이 열려 있으면 전사인자가 접근하여 유전자를 켤 수 있고, 닫혀 있으면 접근이 차단된다. snATAC-seq로 단일 세포 수준에서 측정할 수 있다.
시스 조절 요소(cis-regulatory element, cCRE): 같은 DNA 가닥 위에서 가까운 유전자의 발현을 켜거나 끄는 비코딩 서열. 인핸서, 프로모터 등이 포함되며, 인간 뇌에서 544,735개가 확인되었다.
3차원 유전체 구조(3D genome organization): 세포핵 안에서 DNA가 접히는 방식. 멀리 떨어진 유전체 영역이 3차원 공간에서 가까이 위치하면, 인핸서가 먼 거리의 유전자를 조절할 수 있게 된다.