← 목록으로 돌아가기

나의 첫번째 논문 쓰기

7장. 참고문헌 조사 및 서지 관리

논문은 어벤져스 시리즈와 같다. 각 영화가 독립적인 이야기를 다루지만 결국 하나의 거대한 서사로 연결되듯, 논문도 마찬가지다. 한 연구자가 던진 질문에 다른 연구자가 답하고, 그 답은 또 다른 질문을 낳는다. 누군가의 생각이 다른 누군가의 생각으로 전승되고 이어지며, 때로는 변증적으로 발전해온 지적 대화의 기록이다. 어떤 가설은 검증되고, 어떤 주장은 반박되며, 그 과정에서 지식은 조금씩 정교해진다. 어쩌면 당신이, 우리가 지금 던지려는 질문도 그럴 것이다. 그렇기에 논문을 쓰기 전에 가장 먼저 해야 할 일은 “이 대화가 어디에서 시작되었고, 지금 어디까지 왔는가”를 파악하는 것이다. 참고문헌 조사는 단순한 리스트 정리가 아니라, 이 거대한 지적 계보 속에서 내 연구가 어디에 위치하는지 찾아내는 작업이다. 그리고 그것이 바로 서론의 첫 문단과 두 번째 문단을 쓰기 위한 준비가 된다.

이 장에서는 참고문헌 조사와 서지 관리를 하나의 연구 과정으로 정리한다. 프로젝트별로 별도의 라이브러리 파일을 만들어 관리하는 방식을 사용하며, 초보자도 쉽게 따라 할 수 있도록 실제 화면 기준으로 구성한다. 여기서는 첫 논문 작성을 위한 방법을 제시하기에, 논문 읽기 자체가 어려운 학생들은 내가 미리 작성해 둔 “논문 읽기 방법”을 참고하길 바란다.


문헌 조사의 목적과 흐름: 연구의 계보 읽기

문헌 조사의 첫 단계는 ‘왜 조사하는가’를 분명히 하는 것이다. 서론의 첫 문단은 연구 분야의 큰 흐름을 보여주고, 두 번째 문단은 그 안의 공백을 설명해야 한다. 따라서 문헌 조사는 이 두 문단을 쓰기 위한 논리적 배경 조사라고 볼 수 있다. 리뷰 논문으로 큰 틀을 잡고, 원저 논문으로 세부 근거를 채운다. 논문을 단순히 요약하는 것이 아니라, ‘무엇이 알려졌고 무엇이 아직 남아 있는가’를 구분해 놓아야 한다. 이 작업이 잘 되면 인트로의 방향은 자연스럽게 결정된다.

논문은 저자들의 생각이 이어져온 타래다. 논문에는 저자들이 있고, 그 저자들의 생각이 이어져온 흐름이 있다. 각 논문은 독립적이지만 서로 연결되어 있다. 몇 가지 중요한 흐름과 생각들을 찾아서 모으는 것이 문헌 조사의 핵심이다.

사례: 두 개의 리뷰 논문에서 공통으로 인용되는 핵심 논문 찾기

최근 자폐 스펙트럼 장애(ASD) 유전학 분야의 두 리뷰 논문을 예로 들어보자:

  1. “Genomics, convergent neuroscience and progress in understanding autism spectrum disorder” (Willsey et al., Nature Rev Neurosci, 2022)
  2. “Advancing precision diagnosis in autism: Insights from large-scale genomic studies” (Kim et al., Mol Cells. , 2025)

이 두 리뷰는 3년 차이로 발표되었지만, 둘 다 Satterstrom et al., 2020 논문을 핵심 연구로 반복해서 인용한다.

첫 번째 리뷰에서 Satterstrom 2020이 언급되는 방식:

“Contemporary association analyses…have emerged, providing the field with robust and consistent results. For WES studies specifically, it has become commonplace to require a discovery P value of less than or equal to 2.5 × 10–6… the recent omnibus analysis by the Autism Sequencing Consortium is commonly cited as identifying 102 ASD risk genes, based on the Bayesian FDR threshold of 0.1”

→ 이 문장에서 Satterstrom 2020은 현재 ASD 유전학의 “표준 방법론”을 정립한 연구로 인정받고 있음을 알 수 있다. 통계적 기준(FDR ≤ 0.1)과 102개 유전자라는 구체적 숫자가 분야의 공통 언어가 되었다.

“The initial progress in ASD gene discovery relied heavily on the identification of rare heterozygous de novo mutations… However, missense de novo mutations as well as rare inherited and somatic mutations have now also been demonstrated to carry risk”

→ Satterstrom 2020 이전에는 주로 de novo 변이만 주목받았으나, 이 연구가 missense 변이와 유전 변이까지 체계적으로 포함시킴으로써 연구 범위를 확장했다는 맥락을 보여준다.

“scRNA-seq has provided some additional granularity…ASD risk genes tend to be highly and/or specifically expressed in developing excitatory and inhibitory neurons”

→ Satterstrom 2020의 유전자 목록이 단세포 전사체 분석의 기준 데이터로 활용되고 있음을 보여준다.

두 번째 리뷰에서 Satterstrom 2020이 언급되는 방식:

“Subsequent efforts focused on integrating previously published WES datasets with SSC WES data, culminating in the identification of 65 ASD risk genes. These efforts continued over the years, resulting in a large-scale analysis of 35,584 WES samples in 2020. Expanding TADA to include rare inherited variants, this study identified 102 ASD-associated genes (FDR ≤ 0.1)”

→ 여기서는 Satterstrom 2020을 Sanders 2015 (65개 유전자)에서 진화한 연구로 위치시킨다. 샘플 수 증가(35,584명)와 방법론 확장(TADA에 희귀 유전 변이 포함)이 핵심 기여로 강조된다.

“Early WES studies identified the critical role of de novo PTVs in ASD…providing the first large-scale genetic insights into the disorder. To further refine de novo association analyses and improve gene discovery, the Autism Sequencing Consortium was established”

→ Satterstrom 2020은 Autism Sequencing Consortium의 집단적 노력의 정점으로 묘사된다. 개별 연구가 아니라 컨소시엄 기반 협력 연구의 성과물이라는 점을 강조한다.

“Early genomic investigations of ASD identified recurrent de novo CNVs in synaptic genes…Subsequent large-scale exome sequencing revealed a significant excess of de novo PTVs in genes governing neuronal communication (NC) and gene expression regulation (GER)”

→ Satterstrom 2020이 발견한 유전자들을 기능별로 분류(NC vs. GER)하면서, 이 분류가 이후 연구의 해석 틀로 자리 잡았음을 보여준다.

두 리뷰를 비교하면 보이는 것:

  1. 공통 인식: 두 리뷰 모두 Satterstrom 2020을 ASD 유전자 발견의 “이정표”로 간주하며, 102개 유전자 목록과 통계적 기준을 강조한다.

  2. 맥락의 차이:

    • 2023년 리뷰는 이 연구를 “뇌 발달의 시공간적 수렴” 연구의 출발점으로 활용
    • 2025년 리뷰는 “임상 진단과 치료 개발”을 위한 기초 자료로 활용
  3. 연구의 계보:

    • 이전: De Rubeis et al. 2014 (33개 유전자), Sanders et al. 2015 (65개 유전자)
    • Satterstrom 2020: 102개 유전자, TADA 방법론 확장
    • 이후: Fu et al. 2022 (72개 유전자, CNV 포함), Trost et al. 2022 (53개 유전자, WGS 기반)

이처럼 하나의 핵심 논문이 두 개의 다른 리뷰에서 어떻게 인용되는지 추적하면, 그 논문이 분야에서 차지하는 위치와 이후 연구 방향을 파악할 수 있다. Satterstrom 2020은 “새로운 발견”이라기보다는 “체계적인 목록 구축”으로 기능했고, 이 목록이 이후 모든 연구의 기준점이 되었다.


데이터베이스 탐색 전략

PubMed, Web of Science, Scopus 같은 데이터베이스를 활용한다.

처음에는 넓게 검색하고, 그다음에는 키워드 조합을 줄여가며 핵심 논문만 남긴다. Boolean 연산자(AND, OR, NOT) 조합을 이용하면 검색 정확도를 높일 수 있다.

단계별 문헌 조사 깊이를 정리하면 다음과 같다.

  1. 1차 조사: 리뷰 논문 3-5편 (큰 그림 파악)
  2. 2차 조사: 핵심 원저 논문 10-15편 (방법론과 결과 이해)
  3. 3차 조사: 최신 논문 업데이트 (지난 1-2년)
  4. Citation chaining: 핵심 논문의 참고문헌과 그 논문을 인용한 최신 논문 추적

논문 탐색은 하루 이틀에 끝나지 않는다. 한 프로젝트를 진행하는 동안에도 새로운 논문이 나오면 계속 업데이트해야 한다.

Predatory Journal 논문은 피하라. MDPI, Frontiers와 같은 일부 출판사의 논문은 동료 심사가 느슨하여 질이 낮은 경우가 많다. 특히 이런 저널들은 기존 연구를 중복적으로 정리한 리뷰 논문이 많아서, 논문 조사에 실질적인 도움이 되지 않는다.

고품질 리뷰를 찾으려면 Nature Reviews, Cell, Annual Reviews 시리즈처럼 impact factor가 높고 편집 기준이 엄격한 저널을 우선적으로 찾아야 한다.


EndNote를 이용한 논문 관리

EndNote는 참조 수집, 검색, 그리고 MS Word 인용에 가장 효율적인 도구다. 나는 각 논문을 작성할 때마다 그 논문 전용 폴더를 만들고, 그 안에 독립된 .enl 파일을 생성한다. 논문마다 별도의 라이브러리를 유지하는 이유는, 프로젝트가 완결될 때까지 그 논문에 집중할 수 있고, 나중에 다시 참조할 때도 혼란이 없기 때문이다. 필요하면 압축 백업(.enlx) 형태로 보관한다. 라이브러리를 만든 뒤에는 논문을 추가하고 정리한다. 데이터베이스에서 내보내기(Export), PDF 가져오기(Import), 또는 수동 입력 방식으로 참조를 추가한다. EndNote는 자동으로 저자, 제목, 연도 같은 메타데이터를 인식하지만, 정확하지 않을 때는 직접 수정한다.

그룹 기능을 이용하면 “읽은 논문(Read)” “리뷰 대상(To Review)” 처럼 상태별로 정리할 수 있다. EndNote 내부 검색 기능을 활용하면 라이브러리 전체를 빠르게 탐색할 수 있다. 특정 저널만 정렬해서 논문 수를 세거나, 조건에 맞는 논문을 자동 분류하는 Smart Group을 활용하면 문헌 정리가 훨씬 효율적이다.


서지 관리의 습관

서지 관리의 핵심은 도구가 아니라 습관이다. 참조 파일을 프로젝트 시작 단계부터 정리해두면, 서론을 쓸 때 시간을 절반으로 줄일 수 있다. 논문을 읽을 때 핵심 문장을 요약하고, 태그로 “결과 요약” “한계점” “적용 기술” 등을 남겨두면 나중에 서론을 쓸 때 매우 유용하다.

읽으면서 메모하는 템플릿:

  • 연구 질문: 이 논문이 답하려는 핵심 질문은?
  • 방법: 어떤 데이터와 분석을 사용했는가?
  • 핵심 결과: 가장 중요한 발견 1-2개
  • 한계점: 저자가 인정한 약점 또는 내가 발견한 문제
  • 내 연구와의 연결점: 이 논문이 내 서론/방법/고찰에 어떻게 쓰일까?

그리고 무엇보다 중복 참조나 출처 누락은 연구 신뢰도에 직결된다. 정확한 서지 관리 습관이 좋은 논문을 만든다.

“안티 라이브러리” 효과가 있다. 웹툰 《익명의 독서 중독자들》에서처럼, 책을 책장에 꽂아만 두어도 뭔가 아는 것 같은 기분이 드는 것처럼, EndNote 라이브러리도 비슷한 효과가 있다. 모든 논문을 당장 다 읽을 수는 없지만, 라이브러리에 정리해두면 “이 주제는 어디를 찾아봐야 한다”는 감이 생긴다.

이것은 단순한 착각이 아니다. 논문 제목과 저자명이 반복해서 눈에 들어오면서, 연구 분야의 지형도가 머릿속에 그려지기 때문이다. 서론을 쓸 때 “어디서 본 것 같은데…”라는 기억을 단 5초 만에 찾아낼 수 있는 것, 그것이 서지 관리의 진짜 힘이다.

주 단위 문헌 업데이트 루틴을 만들어두면, 최신 논문을 놓치지 않고 프로젝트 진행 중에도 지속적으로 지식을 업데이트할 수 있다. 프로젝트 종료 후에는 라이브러리를 .enlx 형태로 아카이빙하여 나중에 다시 활용할 수 있도록 보관한다.