← 목록으로 돌아가기

나의 첫번째 논문 쓰기

1장. 나의 이야기를 만들기

이제 우리 연구실에서 나와 학생들이 함께 연구한 지도 어느덧 6년이 넘었다. 많은 학생들이 실험을 설계하고 데이터를 분석했으며, 자신만의 연구를 완성했다. 그들은 1저자 논문을 작성하면서, 자신의 생각과 첫 이야기를 세상에 내보냈다.

우리 연구실에서는 논문 초안을 작성할 때, 학생들이 처음부터 끝까지 직접 작성된다. 나는 그 거칠고 다듬어지지 않은 첫 원고를 열어보며, 문장 너머로 그 학생의 생각을 이해하기 위해 많은 시간을 들인다. 매일, 매주 반복하는 일이지만, 여전히 쉽지 않다. 글에는 한 개인의 생각의 방향이 담겨 있고, 초안에는 그 사람의 사고 구조가 고스란히 드러난다. 특히 첫 논문을 쓰는 일은 누구에게나 어렵다. 첫 논문을 쓴 학생에게 이것은 한 번도 가보지 않은 길이고, 처음 경험 해보는 과정이기 때문이다.

우리 연구실은 Notion을 활용해 연구 노트를 관리한다. 분석 과정에 쓰인 코드, 도출된 결과나 에러를 비롯해서 논문의 아이디어 등을 학생들이 직접 남긴다. 우리는 그 안에서 서로의 연구 노하우를 공유하고, 문제 해결의 과정을 함께 기록한다. 이런 기록들이 쌓여 나중에는 논문의 Methods 섹션이 되고, Results의 뼈대가 된다.

나는 그동안 학생들에게 “논문을 잘 작성하는 법”이라는 노션 페이지를 만들어 제공해 왔다. 수십개의 페이지로 이뤄진 이 문서는 수십 페이지에 이른다. 글의 구성부터 문단 전개, 문장의 구조, 그리고 피겨와 테이블 작성법까지 포함되어 있다. 연구의 큰 그림을 어떻게 제시할 것인지, 각 결과를 어떤 논리 순서로 배열할 것인지, 결론을 어떤 어조로 닫을 것인지까지 구체적으로 설명한다.

이 책은 그 자료들을 정리하고 다시 쓴 것이다. 또한 지난 몇년간 작성한 학생들의 “첫 논문 원고”를 다시 열어보면서, 내가 학생들에게 남긴 코멘트를 정리해서 글을 쓴다. 우리 연구실에 들어올 새로운 학생들, 그리고 생애 첫 논문을 쓰는 연구자들에게 도움이 되길 바란다. 특히 오믹스 데이터를 이용해 유전적·생물학적 현상을 탐구하는 학생들이 본인의 첫 논문을 작성할 때 필요한 기본 정보들을 제공한다. 이 책의 내용은 지극히 개인적인 경험을 바탕으로 한다. 지난 몇 년간 학생들을 지도하며 쌓은 실제 사례와 조언을 중심으로 구성했다.

1장에서는 내가 어떻게 논문 쓰기를 배웠는지, 그리고 연구자로서 어떤 질문들을 이어왔는지를 이야기한다. 여러분도 언젠가는 자신만의 연구 서사를 갖게 될 것이다. 이 장은 그 여정의 시작에 대한 이야기다.


처음 논문을 썼던 시절

2010년, 나는 호주에서 석사 과정을 시작했다. John Mattick 교수님의 연구실에서 로테이션 학생으로 있으면서 처음으로 논문이라는 것을 써야 했다. 주제는 Long noncoding RNA가 뇌 발달과 정신질환에 어떤 영향을 주는지를 다루는 리뷰 논문이었다. 7,500 단어 분량의 원고에 200편이 넘는 선행 연구를 인용했지만, 결국 출간되지는 못했다. 그러나 그 시기는 내게 과학 글쓰기를 처음 배운, 의미 있는 시절이었다. Mattick 교수님의 글을 자주 읽었다. 그의 문장은 명확했고, 논리적이면서도 부드러웠다. 데이터와 해석 사이의 거리를 짧게 유지하면서도, 문장 속에는 늘 사고의 흔적이 남아 있었다. 그의 글을 읽다 보면 연구자의 생각이 문장 구조 안에서 어떻게 흐르는지가 보였다. 나는 그런 글을 쓰고 싶었다.

대학원을 막 입학한 신입생이었고, 유학 생활도 처음이라 영어로 글을 쓰는 일이 쉽지 않았다. 글쓰기 수업을 체계적으로 받을 수도 없던 시기였다. 그래서 내가 선택한 방법은 단순했다. 잘 쓰여진 논문을 찾아 그 문법과 구조, 표현을 하나씩 따라 써보는 일이었다. 예를 들어, NatureCell에 실린 논문 중 특히 Introduction이 잘 쓰인 글을 골랐다. 그 문단의 첫 문장이 어떻게 주제를 연다음 두 번째 문장이 어떻게 배경을 확장하는지, 단락의 마지막 문장이 다음 단락으로 어떻게 연결되는지를 손으로 따라 썼다. 처음에는 문장 하나하나를 베껴 쓰는 수준이었지만, 점차 그 구조 안에서 나만의 문장을 만들 수 있게 되었다.

그렇게 6개월 동안 여러 연구자들의 글을 필사하며, 문장이 생각을 담는 그릇이라는 것을 배워갔다. 단락을 어떻게 열고 닫는지, 주제를 어떻게 이어가는지, 결론에서 어떤 어조로 마무리하는지를 손끝으로 익혔다. 그때 썼던 리뷰 논문은 세상에 나가지 못했지만, 내게는 큰 전환점이었다. 논문을 쓴다는 것은 단순히 결과를 기록하는 일이 아니라, 자신의 생각을 정리하고 방향을 세우는 일이라는 사실을 처음 깨달았기 때문이다.


연구를 통해 이야기를 배우다

2012년, 나는 박사과정을 시작했다. 직접 실험을 설계하고 데이터를 생산했으며, 그 결과를 바탕으로 첫 번째 1저자 논문을 쓰기 시작했다. 연구 주제는 호주 자폐 스펙트럼 장애 가족들의 유전체 데이터를 분석하는 일이었다. 샘플을 모으고, 실험을 수행하고, 데이터를 정리했다. 그러나 단순히 데이터를 분석하는 데서 그치지 않았다. 결과로부터 의미를 도출해야 했다. 데이터의 흐름을 이해하고, 그 안에서 논리적 결론을 세우는 일이 필요했다. 이 과정이 바로 연구와 논문 쓰기의 핵심이다.

제1 지도교수 Charles 교수님, 제2 지도교수 Alex 박사님은 유전체 분석을 전공하지 않았다. 그래서 나는 데이터를 보여주는 대신, 그 분석이 어떤 의미를 가지는지를 글로 설득해야 했다. 원고를 여러 번 수정하고 문장을 고쳐 쓰면서, 글이 단순히 결과의 요약이 아니라 사고의 구조라는 것을 배웠다.

그 시기에 학교에서 제공하는 아카데믹 글쓰기 수업을 들었고, How to Write a Scientific Writing이라는 책을 도서관에서 빌려 읽었다. 그 책은 문법적 기초뿐 아니라, 글을 통해 사고를 정리하는 법을 알려주었다. 나는 아마존에서 책을 구입해 밑줄을 치며 읽었고, 문장의 형태와 논리의 흐름을 함께 익히면서 연구자의 언어가 어떻게 만들어지는지를 배웠다. 그때 배운 것은 글쓰기의 형식이 아니라 사고의 습관이었다. 데이터를 보고 “이건 의미가 있다” 또는 “이건 예상과 다르다”라고 느끼는 것과, 그것을 논리적인 문장으로 풀어내는 것은 전혀 다른 능력이다. 후자는 훈련을 통해서만 키울 수 있다.

논문을 쓸 때 가장 어려운 부분은 “무엇을 발견했는가”가 아니라 “왜 이것이 중요한가”를 설명하는 일이다. 이 질문에 답하기 위해서는 자신의 연구를 더 큰 맥락 속에 위치시킬 수 있어야 한다. 관련 문헌을 많이 읽고, 자신의 결과가 기존 연구와 어떻게 대화하는지를 생각해 보라.


나를 사로잡은 질문

그 시절, 나는 자폐 연구를 하며 한 가지 질문에 몰두했다. 자폐는 하나의 유전자가 아니라 여러 유전자의 상호작용으로 설명될 수 있는 복합적 현상이라는 점이었다. 환자마다 다른 유전적 원인이 있었고, 그 유전자들이 서로 영향을 주고받으며 작동했다. 어떤 유전자는 다른 유전자의 발현을 조절했고, 그 작은 차이들이 누적되어 뇌의 발달 방향을 바꾸었다. 나는 이 복잡한 연결 구조를 이해하고 싶었다. 이 주제는 우리 연구실에서 이미 진행 중이던 연구였다. 두 번째 지도교수였던 Alex 박사님은 자폐 환자군의 유전 변이를 통합 분석하여, 유전자 네트워크의 연결성이 자폐의 중요한 단서가 될 수 있다는 연구를 진행한 적이 있었다. 나는 그 논문을 읽고 강한 인상을 받았다. 그가 던진 질문을 내 방식으로 이어가고 싶었다.

새로운 데이터를 수집하고, 다른 분석 방법을 적용했다. 그 과정은 단순한 후속 연구가 아니라, 그가 열어둔 질문을 내 언어로 다시 써 내려가는 일이었다. 내가 만든 표와 그래프는 그의 연구 속 문장들과 대화를 나누는 듯했다. 여기서 중요한 점이 있다. 좋은 연구는 완전히 새로운 것에서만 나오지 않는다. 오히려 기존의 질문을 더 깊이 파고들거나, 다른 각도에서 접근하거나, 새로운 데이터로 재검증하는 과정에서 의미 있는 발견이 나온다. 여러분의 첫 논문도 아마 지도교수나 선배 연구자의 질문에서 출발할 가능성이 크다. 그것은 전혀 부끄러운 일이 아니다. 중요한 것은 그 질문을 자신의 것으로 만들고, 자신만의 답을 찾아가는 과정이다.


질문을 이어 쓰다

박사과정을 마친 뒤에도 나는 같은 질문을 붙들고 있었다. 유전자의 조합과 발달의 복잡한 구조를 어떻게 해석할 수 있을까, 그리고 그 구조가 인간의 뇌에서 어떤 방식으로 작동하는가. 이 질문은 조금씩 형태를 바꾸며 내 연구의 축이 되었다. UCSF에서의 박사후 연구는 자폐 스펙트럼 장애의 유전적 구조를 해부하는 일로 이어졌다. 대규모 엑솜 데이터를 분석해 자폐의 원인이 되는 100여 개의 고신뢰 위험 유전자를 밝혔고, 신규 변이(de novo variant)가 신경 발달에 미치는 영향을 구체적으로 제시했다 (Satterstrom et al. 2020, Cell). 이때 전장 유전체(whole genome sequencing)를 본격적으로 하면서, 자폐의 다양한 유전적 조성을 연구할 수 있었다. 논코딩 영역에서 발생하는 regulatory variant가 자폐의 위험 요인으로 작동한다는 점을 보였고, 이를 검증하기 위해 ‘Category-Wide Association Study (CWAS)’라는 새로운 분석 체계를 만들었다 (An et al. 2018, Science; Werling et al. 2018, Nature Genetics). 이 연구는 논코딩 영역이 단순한 여분의 서열이 아니라 유전자 발현을 조절하는 핵심적 공간임을 드러냈다.

한국으로 돌아와, 내 연구실을 시작하면서 이 질문을 한국인 자폐 가족들에게 묻기 시작했다. 자폐 환자 가족의 유전체 데이터를 분석해 신규 변이가 임상적 표현형의 다양성에 어떤 영향을 미치는지를 정량화하고, 가족 내 성별에 따라 나타나는 유전적 패턴의 차이를 제시했다 (Kim et al. 2024, Genome Medicine; Kim et al. 2025, Genome Medicine). 또한 전두엽의 피질 층에 특이적 유전자에서 발견되는 짧은 텐덤 반복(expansion)이 자폐의 임상적 중증도와 적응력에 관여한다는 결과도 얻었다 (Kim et al. 2024, Psychiatry and Clinical Neurosciences).

이후에는 유전적 정보들을 세포 수준에서 해석하기 위해 단일세포 전사체나 다중 오믹스 데이터를 통합해 분석했다. 뇌 발달 과정에서 특정 세포 유형과 시기에 따라 자폐 관련 유전자들이 다르게 작동한다는 점을 정리하고, 이를 인간 뇌 발달 지도로 시각화했다 (Kim et al. 2024, Experimental & Molecular Medicine; Darbandi et al. 2024, Cell Reports). 이런 세포 유형별 기능 정보를 논코딩 변이 분석에 통합하기 위해 CWAS-Plus라는 확장 분석 방법을 개발했다 (Kim et al. 2024, Briefings in Bioinformatics). 이 방법은 기존 CWAS에 싱글셀 데이터를 추가해 드물지만 기능적으로 중요한 논코딩 변이를 탐색할 수 있도록 설계되었다.

여러분에게 보여주고 싶은 것은, 하나의 질문이 어떻게 10년 넘게 이어지며 진화할 수 있는지, 그리고 그 과정에서 논문들이 어떻게 서로 연결되어 하나의 큰 서사를 만드는지다. 첫 논문을 쓸 때는 이런 큰 그림이 보이지 않는다. 당장 눈앞의 데이터와 씨름하고, 한 문단을 쓰는 데도 며칠이 걸린다. 하지만 그 첫 논문이 다음 질문의 씨앗이 되고, 그 질문이 또 다른 연구로 이어진다. 지금 쓰고 있는 여러분의 첫 문장도 언젠가는 누군가의 출발점이 될 것이다.


이 책을 통해 전하고 싶은 것

지난 6년간 첫 세대의 학생들이 독립연구자로 성장했다. 논문을 스스로 구상하고, 작성하며, 연구한다. 많은 시행착오가 있었지만, 훌륭하게 해냈다. 올해 연말에 있을 Year-In-Review 모임(매년 연말에 연구실의 아젠다를 논의하는 자리)을 준비하는데, 한 선배 학생이 “몇 년 전 저희에게 해주신 조언들을 이번 신입생들에게도 해주시면 어떨까요?”라고 제안했다. 그래서 곰곰이 생각해보니 몇 년간 축적된 원고들, 그 안에 남겨진 코멘트들, 노션의 가이드라인 등을 모아서 책으로 만들면 좋겠다는 생각이 들었다.

이 책은 우리 연구실에 들어와 첫 논문을 쓰려는 학생들을 떠올리며 만들었다.

처음 논문을 쓰는 사람은 누구나 막막하다. 어디서부터 시작해야 할지, 어떤 순서로 써야 할지, 심지어 첫 문장을 어떻게 시작해야 할지조차 감이 오지 않는다. 데이터는 있는데 그것을 어떻게 문장으로 만들어야 할지 모르겠고, 레퍼런스를 찾아 읽어도 내 글과 어떻게 연결해야 할지 막막하다. Introduction은 너무 거창해 보이고, Methods는 지루하기만 하고, Discussion은 뭘 써야 할지 갈피가 잡히지 않는다. 그래도 괜찮다. 모두가 그렇게 시작한다. 나도 처음 논문을 쓸 때는 한 문단을 쓰는 데 며칠이 걸렸다. 문장 하나를 고치고 또 고치면서, “이게 맞나?” 하고 수없이 의심했다. 지금 돌이켜보면 그 첫 논문은 완벽하지 않았다. 하지만 그 경험이 없었다면 지금의 나도 없었을 것이다.

대학에 연구실을 열고 학생들을 지도하고, 운이 좋게도 휼륭한 학생들을 만났다. 각자가 다른 모양으로 처음을 시작했다. 논문의 구조화가 어색했던 학생, 복문 형태의 문장을 즐겨해서 대표기도문처럼 논문을 쓰는 학생, 데이터를 정확하게 기술하지 못했던 학생, 군복무를 하며 싸지방에서 리뷰 논문을 적은 학생, 한문장을 짓기 위해, 밤새 고심하는 학생 등등. 지금은 그떄보다 나은 것을 보며, 우리가 그간 해온 방식을 정리해본다.

이 책에서는 논문의 각 섹션을 어떻게 쓰는지를 구체적으로 설명한다. Introduction에서 질문을 어떻게 제시하고, Methods에서 재현 가능한 서술을 어떻게 하며, Results에서 데이터를 어떻게 말하게 하는지, 그리고 Discussion에서 질문으로 어떻게 되돌아가는지를 다룬다. 막막하게 느껴지는 각 단계를 구체적인 예시와 함께 하나씩 풀어갈 것이다. 논문 쓰기는 특별한 재능이 아니라 배울 수 있는 기술이다. 처음에는 서툴러도, 한 문장씩 쓰다 보면 점점 나아진다. 이 책은 여러분이 그 첫 문장을 시작할 수 있도록, 그리고 마지막 문장까지 완주할 수 있도록 돕기 위해 쓰였다.

여러분의 첫 논문이 완벽할 필요는 없다. 중요한 것은 자신의 생각을 문장으로 만드는 연습을 시작하는 것이다. 데이터를 해석하고, 질문을 정리하고, 그것을 다른 사람이 이해할 수 있는 형태로 만드는 과정 자체가 여러분을 성장시킬 것이다. 논문은 한 번 쓰고 끝나는 결과물이 아니라, 질문이 자라나는 과정을 기록하는 일이다. 여러분이 지금 쓰는 첫 논문은 다음 연구의 출발점이 되고, 그 질문은 또 다른 질문으로 이어진다. 내가 쓴 글이 다음 세대의 질문으로 이어지듯, 여러분의 첫 번째 문장도 언젠가 누군가의 출발점이 될 것이다.

자, 이제 시작해보자. 함께 첫 논문을 완성해보자. 그 여정이 이 책과 함께 시작되기를 바란다.