1943년, 존스 홉킨스 대학의 소아정신과 의사 레오 캐너(Leo Kanner)는 11명의 아이들에 대한 임상 보고서를 발표한다. 8명의 남자아이와 3명의 여자아이로 구성된 이 집단은 공통적으로 사회적 접촉에 대한 심각한 무관심, 반복적인 행동, 환경의 사소한 변화에 대한 강한 저항을 보였다. 캐너는 이 아이들이 태어날 때부터 다른 사람들과의 정서적 접촉을 형성하지 못하는 상태에 있다고 기술하면서, 이를 “초기 유아 자폐(early infantile autism)“라고 명명했다. 여기서 자폐라는 말은 스위스 정신과 의사 오이겐 블로일러(Eugen Bleuler)가 1911년에 조현병을 경험하는 사람의 내면 철수를 기술하기 위해 만든 용어에서 빌려온 것이었다. 캐너가 같은 단어를 선택한 것은 의도적이었지만, 이 선택은 이후 수십 년간 자폐와 조현병을 혼동하게 만드는 씨앗이 되었다.
거의 같은 시기에, 오스트리아 빈의 소아과 의사 한스 아스퍼거(Hans Asperger)도 유사한 관찰을 하고 있었다. 1944년에 발표된 그의 보고서는 사회적 상호작용에 어려움이 있지만 언어 발달이 비교적 유지되어 있고, 특정 주제에 대해 깊이 몰두하는 경향을 보이는 소년들을 기술했다. 캐너가 기술한 사례들이 더 많은 지원이 필요한 양상을 보였다면, 아스퍼거가 기술한 사례들은 언어 능력이 유지되면서도 사회성의 질적 저하를 보이는 집단이었다. 그러나 아스퍼거의 논문은 독일어로 출판되었고, 전쟁이라는 시대적 상황 속에서 영어권 학계에 알려지기까지 수십 년이 걸렸다. 1981년이 되어서야 로나 윙(Lorna Wing)이 아스퍼거가 기술한 사례들을 영어로 재정리한 논문(Wing 1981a)을 발표하면서 상황이 바뀌기 시작했다. 윙은 5세에서 35세까지 34명의 사례를 직접 관찰하여, 현학적 언어, 단조로운 목소리, 운동 서투름(90%에서 관찰), 강렬한 특정 관심사(76%)라는 구체적인 임상 특성을 기술했다. 이 논문의 가장 큰 기여는 개별 증상의 나열이 아니라, 자폐와 아스퍼거 증후군이 별개의 질환이 아니라 하나의 연속체에 속한다는 제안이었다. 윙은 사회적 상호작용, 의사소통, 유연한 상상력이라는 세 영역의 어려움, 곧 ‘장애의 삼조(triad of impairments)‘가 자폐 관련 조건을 통합하는 틀이 되어야 한다고 주장했다. 같은 해 발표된 캠버웰 역학 연구(Wing 1981b)에서 윙은 이 삼조가 지적장애와 독립적으로 나타남을 확인했다. 지능이 매우 낮은 아이들 중에서도 삼조가 있는 아이와 사회적으로 잘 지내는 아이가 구분되었고, 반대로 평균 범위 지능을 가진 아이에서도 삼조가 나타났다. 이 삼조 개념은 이후 30여 년간 자폐 진단의 골격으로 기능했으며, DSM-5가 하위 범주를 통합하여 하나의 자폐스펙트럼장애를 만든 것도 결국 윙이 제안한 연속체 개념의 귀결이었다. 자폐가 캐너가 기술한 심각한 형태만이 아니라 더 넓은 범위를 포괄한다는 인식이 이때 싹트기 시작했다. 자폐를 가진 사람들이 보여주는 특성, 말하자면 사회적 소통의 양상, 반복 행동의 정도, 언어 발달 수준, 지적 능력 등은 사람마다 다양하다. 과학에서는 이렇게 겉으로 관찰되는 특성의 총체를 표현형(phenotype)이라 부른다. 키나 눈 색깔 같은 신체적 특성도 표현형이고, 행동 패턴이나 인지 능력도 표현형이다. 이 인식의 변화는 이후 진단 기준의 확대와 유병률의 변화에 핵심적인 역할을 하게 된다.
캐너의 보고 이후, 자폐에 대한 초기 해석은 정신분석학의 틀 안에서 전개되었다. 1950년대와 1960년대, 자폐는 아이의 내면에서 일어나는 환상과 무의식의 산물로 이해되었고, 심지어 부모의 양육 방식이 원인이라는 이른바 “냉장고 어머니(refrigerator mother)” 가설까지 등장했다. 자폐 아동의 사회적 철수가 차갑고 거부적인 양육 환경에 대한 방어 반응이라는 이 가설은 과학적 근거가 없었지만, 수십 년간 부모들에게 깊은 죄책감을 안겨주었다. 당시 영국에서 자폐라는 개념이 어떻게 사용되었는지를 추적한 역사 연구(Evans 2013)에 따르면, 자폐는 조현병과 제대로 구분되지 않은 채 유아기 환각이나 무의식적 환상 같은 개념들과 뒤섞여 있었다. 장 피아제(Jean Piaget), 로레타 벤더(Lauretta Bender), 엘윈 제임스 앤서니(Elwyn James Anthony) 같은 아동심리학자들이 자폐라는 단어를 사용했지만, 그 의미는 캐너가 기술한 특정 증후군이 아니라 유아기의 자기중심적 사고와 외부 세계로부터의 퇴행을 가리키는 더 넓은 개념이었다.
이 정신분석적 시대에서 벗어나게 된 결정적 계기는 1960년대와 1970년대에 일어난 역학적, 통계적 연구의 성장이었다. 역학(epidemiology)이란 한 명의 참여자가 아니라 수백, 수천 명의 데이터를 모아서 “이 조건이 얼마나 흔한가”, “어떤 요인이 위험을 높이는가”를 분석하는 학문이다. 영국에서 마이클 러터(Michael Rutter)와 그의 동료들은 자폐를 조현병과 구분하는 경험적 근거를 축적해나갔다. 러터는 자폐가 조현병과 발병 연령, 가족력, 치료 반응, 신경학적 동반 소견에서 체계적으로 다르다는 점을 밝혔다. 자폐는 생후 초기부터 시작되는 반면 소아 조현병은 보다 늦은 시기에 발병했고, 자폐 아동의 가족에서 조현병의 빈도가 높지 않았으며, 자폐 아동에게 뇌전증이 동반되는 빈도가 높다는 사실은 자폐가 뇌에서 비롯한 발달 조건임을 가리켰다. 또한 1960년대 영국에서 지적장애인 수용시설의 폐쇄와 언어치료 서비스의 확대는, 자폐를 정신분석의 영역에서 꺼내 발달과 교육의 맥락에서 다시 정의하도록 만드는 사회적 조건을 형성했다.
콜빈(Kolvin)은 1971년과 1972년에 발표한 연구들에서 유아기 정신병과 후기 발병 조현병을 임상적으로 구분하는 증거를 제시했고, 러터는 1978년에 자폐의 진단 기준을 보다 구체적으로 정식화했다. 이와 함께, 폴스타인과 러터(Folstein and Rutter)는 1977년 쌍둥이 연구에서 자폐에 강한 유전적 기반이 있음을 처음으로 입증했다. 일란성 쌍둥이에서 자폐의 일치율이 이란성 쌍둥이보다 훨씬 높다는 발견은, 자폐가 양육 방식의 결과가 아니라 생물학적으로 결정되는 조건이라는 것을 증명하는 전환점이었다. 이러한 축적된 증거들은 마침내 1980년, 미국정신의학회의 진단편람인 DSM-III에서 자폐를 공식 진단으로 인정하는 결과로 이어졌다.
캐너가 11명의 아이들을 처음 기술한 1943년부터 DSM-III에 자폐가 공식적으로 등재된 1980년까지, 거의 40년이 걸렸다. 이것은 자폐라는 개념이 과학적으로 확립되기까지 얼마나 오랜 시간과 논쟁이 필요했는지를 말해준다. DSM-III는 자폐를 “전반적 발달장애(Pervasive Developmental Disorders, PDD)“라는 새로운 범주 아래에 배치했고, “유아 자폐(infantile autism)“라는 이름을 부여했다. 자폐가 독립된 진단으로 확립되기까지 어떤 증거들이 축적되었는지를 정리한 연구(Rosen et al. 2021)에 따르면, 임상 관찰, 발병 시기, 가족력, 치료에 대한 반응, 뇌전증 같은 신경학적 동반 소견, 쌍둥이 연구 결과라는 여섯 가지 방향에서 증거가 모였다.
DSM은 이후에도 계속 변화했다. 1987년의 DSM-IIIR은 진단 기준을 처음으로 확장했고, 1994년의 DSM-IV는 아스퍼거 장애(Asperger’s disorder)와 달리 명시되지 않는 전반적 발달장애(PDD-NOS)를 별도의 진단 범주로 추가하면서, 자폐 진단의 범위를 크게 넓혔다. 언어 발달이 유지되면서 사회적 어려움을 보이는 사람들이 아스퍼거 장애로 진단받게 되었고, 전형적인 자폐나 아스퍼거 장애의 기준을 모두 충족하지 않는 경우에도 PDD-NOS라는 이름 아래 진단이 가능해졌다. 이 확장은 진단적 포괄성을 높였지만, 동시에 이전에는 자폐로 진단받지 않았을 사람들이 새로운 범주 안으로 들어오면서 연구 대상 집단의 특성이 달라지는 결과를 낳았다. 이 변화가 유병률 추정치에 미친 영향은 5장에서 자세히 다룬다.
2013년에 도입된 DSM-5는 분류 체계를 다시 근본에서 재편했다. 자폐 장애, 아스퍼거 장애, PDD-NOS라는 별도의 진단명을 하나의 “자폐스펙트럼장애(Autism Spectrum Disorder, ASD)“로 통합한 것이다. DSM-5는 사회적 의사소통의 차이와 어려움과 제한적이고 반복적인 행동이라는 두 가지 핵심 영역을 기준으로 삼았고, 이전에 세 영역(사회적 상호작용, 의사소통, 제한적 행동)으로 나뉘었던 진단 기준을 두 영역으로 재구조화했다. 이 통합에는 실증적 근거가 있었다. SSC 코호트의 12개 대학 기관에서 2,102명의 아이를 같은 도구(ADOS, ADI-R)로 평가했음에도, 자폐 장애와 아스퍼거 장애, PDD-NOS 사이의 하위 진단 분류가 기관마다 일관되지 않았다(Lord et al. 2012). 같은 아이가 한 기관에서는 자폐 장애로, 다른 기관에서는 PDD-NOS로 분류되기도 했다. 하위 범주 간 경계가 임상적으로 안정적이지 않다는 이 증거를 근거로 한 통합이었지만, 동시에 아스퍼거 장애라는 진단을 정체성의 일부로 여기던 사람들에게는 논란이 되기도 했다. 현재 자폐스펙트럼장애의 유병률은 고소득 국가에서 약 1~2%에 달하며, 남성이 여성보다 약 4배 더 많이 진단받는다(Lord et al. 2018). 왜 남성에게 더 많은지는 파트 4에서 자세히 다룬다.
자폐스펙트럼장애는 혈액 검사나 뇌 영상으로 진단하는 조건이 아니다. 진단에 곧바로 쓸 수 있는 생체지표(biomarker)는 아직 없으며, 진단은 전적으로 행동의 관찰과 발달력의 평가에 의존한다. DSM-5의 두 핵심 영역 외에도, 자폐를 가진 사람들의 90% 이상이 감각 처리의 특이성을 보인다는 점도 중요하다(Leekam et al. 2007). 특정 소리에 극도로 예민하거나, 옷의 촉감을 견디기 어렵거나, 특정 냄새에 강하게 반응하는 것이 그 예다. DSM-5는 이를 반영하여 제한적이고 반복적인 행동 영역에 감각 반응의 과민성 또는 둔감성을 포함시켰다. 그렇다고 자폐 진단이 주관적이라는 뜻은 아니다. 수십 년에 걸쳐 정교한 표준화 도구들이 개발되어왔고, 이 도구들이 진단의 신뢰도를 높여왔다. 다만 도구의 종류와 적용 방식이 달라지면 누가 진단을 받는지도 함께 달라진다는 점에서, 진단 도구를 이해하는 일은 자폐 연구 전체를 이해하는 출발점이 된다.
자폐의 조기 발견에 가장 널리 사용되는 선별 도구(screening tool)는 M-CHAT(Modified Checklist for Autism in Toddlers)이다. M-CHAT은 16~30개월 영유아를 대상으로 보호자가 작성하는 20문항의 설문지다. “아이가 다른 아이들에게 관심을 보이나요?”, “아이에게 무언가를 가리키면 그쪽을 보나요?” 같은 질문들로 구성되어 있다. 선별 도구의 목적은 자폐를 확정 진단하는 것이 아니라, 추가 평가가 필요한 아이를 선별하는 데 있다. M-CHAT의 개선판인 M-CHAT-R/F(Revised with Follow-up)는 양성으로 나온 항목에 대해 추가 면접을 수행하여 위양성(실제로는 자폐가 아닌데 양성으로 나오는 것)을 줄인다. 선별 도구는 어디까지나 첫 번째 그물이고, 여기서 선별된 아이들이 전문 평가를 받아야 한다. 다만 이 그물이 완벽하지는 않다. 임상 현장의 데이터를 보면, 나중에 자폐 진단을 받는 아이 중 상당수가 M-CHAT 선별에서 음성으로 나와 놓치는 경우가 있다. 선별 도구가 “선별하는” 것이지 “확정하는” 것이 아니라는 점을 기억해야 한다. 한국에서는 국가 발달 선별검사인 K-DST(한국 영유아 발달선별검사)가 생후 14일부터 71개월까지 8차례에 걸쳐 발달을 감시하며, 12개월 이후에는 자폐 관련 항목이 포함되어 있다. 한국에서 개발된 BeDevel(행동발달 선별검사)은 반구조화된 놀이 관찰과 보호자 면접을 결합하여 영유아의 자폐를 선별하는 도구다. 다만 선별에서 이상 소견이 나온 아이가 실제로 소아정신과 전문의에게 의뢰되는 비율은 아직 낮다는 지적이 있어(Kim and Yoo 2024), 도구의 존재만으로 조기 진단이 보장되지는 않는다.
전문 평가의 핵심이 되는 진단도구가 ADOS(Autism Diagnostic Observation Schedule)와 ADI-R(Autism Diagnostic Interview-Revised)이다. ADOS는 훈련받은 임상가가 아이와 직접 상호작용하면서 사회적 소통, 언어, 놀이, 반복 행동 등을 체계적으로 관찰하는 도구다. 아이의 언어 수준에 따라 네 가지 모듈 중 하나를 선택하여 사용하며, 약 40~60분이 소요된다. ADI-R은 보호자를 대상으로 하는 구조화된 면접으로, 아이의 발달력과 현재 행동을 약 1.5~2.5시간에 걸쳐 상세히 조사한다. ADOS가 현재 상태의 직접 관찰이라면, ADI-R은 과거부터 현재까지의 발달 경과를 보호자의 보고를 통해 파악한다. 두 도구를 함께 사용하는 것이 진단의 황금 표준(gold standard)으로 여겨진다.
다만 이 황금 표준 도구에는 실용적 한계가 있다. ADOS와 ADI-R을 모두 수행하려면 훈련받은 전문가가 수 시간을 투자해야 하고, 이런 전문가의 수가 제한적이어서 대기 시간이 수개월에서 수년에 달하는 경우도 흔하다. 특히 전문 기관에서 먼 지역에 사는 가족이나, 의료 접근성이 낮은 환경에서는 진단 자체가 장벽이 된다. 이 문제를 해결하기 위해 최근에는 디지털 기술을 활용한 새로운 접근이 개발되고 있다. SenseToKnow라는 시스템은 태블릿에서 사회적 자극과 비사회적 자극을 번갈아 보여주면서 아이의 시선, 표정, 움직임을 카메라로 분석한다. M-CHAT과 SenseToKnow를 결합하면, 자폐가 있는 아이와 없는 아이를 구분하는 정확도가 높은 수준(0에서 1 사이의 척도에서 0.97)에 도달한다는 결과가 보고되었다. 또한 “디지털 진단과 AI의 역할” 장에서 다루겠지만, FDA가 승인한 AI 기반 진단 보조 시스템도 등장하여 일차 진료 현장에서의 선별 정확도를 높이고 있다. 이러한 디지털 도구들은 전문가의 직접 평가를 대체하는 게 아니라, 선별의 효율성을 높여 진단까지의 시간을 줄이려는 장치다.
진단 기준과 도구의 변화는 단순히 임상적 문제에 그치지 않는다. 연구자의 관점에서 보면, 진단 기준이 어떻게 정의되느냐에 따라 연구에 모집되는 대상의 특성이 달라지고, 그에 따라 연구 결과 자체가 달라진다. DSM-III 시대에 수집된 자폐 코호트와 DSM-5 시대에 수집된 자폐스펙트럼장애 코호트는 같은 이름을 공유하지만, 그 안에 포함된 개인들의 임상적 분포는 서로 다르다. SSC처럼 ADOS와 ADI-R을 엄격하게 적용한 코호트와, SPARK처럼 보호자의 자기 보고에 의존하는 코호트는 표현형의 분포가 다르고, 이 차이가 유전적 발견에도 영향을 미칠 수 있다. 파트 2에서 코호트의 설계를 다룰 때 이 문제를 구체적으로 살펴본다.
지난 40년간 자폐 개념에는 일곱 가지 주요 전환이 일어났다(Happe and Frith 2020). 이 일곱 가지 전환은 각각 이 책의 이후 장들에서 반복적으로 등장한다.
| 전환 | 과거 | 현재 | 관련 장 |
|---|---|---|---|
| 진단의 범위 | 좁은 진단 (캐너형) | 넓은 진단 (스펙트럼) | 2장 |
| 유병률 | 드문 질환 (만 명당 4명) | 흔한 질환 (36명당 1명) | 5장 |
| 시간 범위 | 아동기 질환 | 평생의 조건 | 44장 |
| 분류 방식 | 범주적 구분 (있다/없다) | 차원적 연속체 | 2장, 3장 |
| 원인의 수 | 하나의 자폐 | 여러 자폐 (유전적 이질성) | 4장, 18장 |
| 동반 질환 | 순수한 자폐 | 동반 질환이 일반적 | 22장 |
| 사회적 관점 | 장애 | 신경다양성 | 44장, 45장 |
이 장을 독자의 삶으로 옮기면, 자폐의 이름이 바뀌어 온 역사는 단순한 용어 변천사가 아니다. 캐너와 아스퍼거가 남긴 표현은 당시 의학의 언어였고, 오늘의 자폐 당사자나 가족을 평가하는 말로 그대로 옮겨 써서는 안 된다. 특히 냉장고 어머니 가설은 과학적으로 폐기되었을 뿐 아니라, 부모에게 책임을 돌리는 설명이 얼마나 오래 상처를 남길 수 있는지를 보여주는 사례다. 진단 도구의 발전은 사람을 분류하기 위한 목적만이 아니라, 필요한 지원을 더 정확히 찾기 위한 과정으로 읽어야 한다. 여성, 비구어 당사자, 성인기에 진단받은 사람처럼 과거 기준에서 덜 보였던 이들이 이 역사 속에서 어디에 놓이는지도 함께 보아야 한다. 그래서 이 장의 핵심 질문은 “자폐가 무엇인가”만이 아니라 “우리는 어떤 언어로 자폐를 말해야 하는가”이기도 하다.
Leekam, S. R., Nieto, C., Libby, S. J., Wing, L., & Gould, J. (2007). Describing the sensory abnormalities of children and adults with autism. Journal of Autism and Developmental Disorders, 37(5), 894-910. doi:10.1007/s10803-006-0218-7
Lord, C., Petkova, E., Hus, V., Gan, W., Lu, F., Martin, D. M., … & Risi, S. (2012). A multisite study of the clinical diagnosis of different autism spectrum disorders. Archives of General Psychiatry, 69(3), 306-313. doi:10.1001/archgenpsychiatry.2011.148
Evans, B. (2013). How autism became autism: The radical transformation of a central concept of child development in Britain. History of the Human Sciences, 26(3), 3-31. doi:10.1177/0952695113484320
Happé, F., & Frith, U. (2020). Annual Research Review: Looking back to look forward — changes in the concept of autism and implications for future research. Journal of Child Psychology and Psychiatry, 61(3), 218-232. doi:10.1111/jcpp.13176
Lord, C., Elsabbagh, M., Baird, G., & Veenstra-Vanderweele, J. (2018). Autism spectrum disorder. The Lancet, 392(10146), 508-520. doi:10.1016/S0140-6736(18)31129-2
Kim, J. I., & Yoo, H. J. (2024). Diagnosis and assessment of autism spectrum disorder. Journal of the Korean Academy of Child and Adolescent Psychiatry, 35(1), 3-11. doi:10.5765/jkacap.230009
Rosen, N. E., Lord, C., & Volkmar, F. R. (2021). The diagnosis of autism: From Kanner to DSM-III to DSM-5 and beyond. Journal of Autism and Developmental Disorders, 51(12), 4253-4270. doi:10.1007/s10803-021-04904-1
Wing, L. (1981a). Asperger’s syndrome: A clinical account. Psychological Medicine, 11(1), 115-129. doi:10.1017/S0033291700053332
Wing, L. (1981b). Language, social, and cognitive impairments in autism and severe mental retardation. Journal of Autism and Developmental Disorders, 11(1), 31-44. doi:10.1007/BF01531339