2025년 2월, OpenAI의 공동 창립자 안드레이 카파시(Andrej Karpathy)가 트위터에 “바이브 코딩(Vibe Coding)“이라는 용어를 처음 사용했다. 코드의 문법을 외우고 한 줄 한 줄 직접 작성하는 대신, AI에게 자연어로 지시하여 프로그램을 만드는 새로운 개발 방식이다.
바이브 코딩에서 사람의 역할은 코드를 작성하는 것이 아니라, 무엇을 만들지 결정하고, AI가 만든 결과를 검증하는 것이다. “BLAST 검색 결과를 테이블로 보여주는 웹 페이지를 만들어줘”라고 요청하면, AI가 코드를 생성하고 파일을 수정하고 테스트까지 수행한다. 사람은 결과를 확인하고 방향을 조정한다.
이 방식이 가능해진 것은 AI 코딩 에이전트의 발전 덕분이다. 단순한 코드 자동 완성을 넘어, 파일 시스템을 탐색하고, 터미널 명령을 실행하고, 여러 파일을 동시에 수정할 수 있는 에이전트가 등장했다. 이 책에서 사용하는 Claude Code가 대표적이다.
바이브 코딩의 힘을 보여주는 사례가 있다. 2025년 Anthropic이 개최한 Claude Code 해커톤에서 5명의 수상자 중 소프트웨어 개발자는 2명뿐이었다. 금상은 캘리포니아 건설 허가 법률 전문가가, 동상은 벨기에 심장내과 과장이, 우간다 인프라 엔지니어가 수상했다. 각자 자신의 도메인에서 발견한 문제를 Claude Code로 해결한 것이다. 어떻게 만드는가(코딩 기술)보다 무엇이 필요한가(문제 인식)가 AI 시대의 핵심 경쟁력이라는 점을 잘 보여준다.
생명정보학은 바이브 코딩과 특히 잘 어울리는 분야이다. 그 이유는 다음과 같다.
도메인 지식이 코딩 실력보다 중요하다. BLAST 검색 결과에서 E-value가 의미하는 바를 이해하는 것, 단일세포 데이터에서 미토콘드리아 유전자 비율이 높은 세포를 제거해야 하는 이유를 아는 것 — 이런 판단은 AI가 대신하기 어렵다. 반면 그 판단을 코드로 구현하는 작업은 AI가 할 수 있다.
도구와 포맷이 다양하다. FASTA, FASTQ, BAM, VCF, AnnData 등 생명정보학에서 다루는 파일 포맷은 수십 가지이고, 각각을 처리하는 도구도 다르다. 이 모든 도구의 사용법을 외우는 것은 비효율적이다. AI에게 “이 BAM 파일에서 매핑 퀄리티 30 이상인 리드만 추출해줘”라고 요청하는 것이 더 효과적이다.
재현 가능한 분석이 중요하다. 생명정보학 분석 결과는 논문에 실린다. 다른 연구자가 동일한 결과를 재현할 수 있어야 한다. Docker로 환경을 고정하고, Snakemake로 파이프라인을 자동화하고, Git으로 버전을 관리하는 것 — 이 과정을 AI와 함께 구축하면 훨씬 빠르고 체계적으로 진행할 수 있다.
이 책은 네 개의 파트로 구성되어 있다.
파트 I. 개발 기초 도구에서는 개발 환경을 구성하고(1장), Git으로 버전을 관리하고(2장), Docker로 일관된 환경을 만드는 방법(3장)을 다룬다. 모든 후속 장의 기반이 되는 내용이다.
파트 II. 파이썬으로 분석하기에서는 Python 데이터 분석의 기초(4장)부터 Scanpy를 이용한 단일세포 RNA-seq 분석(5장), Snakemake를 이용한 워크플로우 자동화(6장)까지 다룬다. 생명정보학 연구자가 가장 자주 수행하는 분석 작업이다.
파트 III. 생명정보 웹 툴 만들기에서는 SvelteKit과 Tailwind CSS로 프로젝트를 설정하고(7장), 랜딩 페이지(8장)와 일반 페이지(9장)를 디자인한 뒤, 실제로 동작하는 BLAST 검색 도구(10장)를 만든다. 분석 결과를 웹으로 공유하고, 연구실 내부 도구를 만드는 데 활용할 수 있다.
파트 IV. AI Co-scientist 만들기에서는 MCP 프로토콜로 Claude Code의 기능을 확장하고(11장), AI Co-scientist 에이전트를 설계하고(12장), AI를 활용한 논문 작성 워크플로우(13장)를 소개한다.
이 책은 프로그래밍 경험이 없거나 적은 생명과학 연구자를 주요 독자로 상정한다. Python 문법을 몰라도, 웹 개발을 해본 적이 없어도 괜찮다. 각 장에서 필요한 개념을 설명하고, 구현은 Claude Code와 함께 진행한다.
다만 생명정보학의 기본 개념 — 유전자, 시퀀싱, 전사체 등 — 은 어느 정도 알고 있다고 가정한다. 이 책은 생명정보학 자체를 가르치는 교재가 아니라, 생명정보학 도구를 AI와 함께 만드는 실습서이기 때문이다.