TEXT TRANSLATION WITH MARKER TEXT TRANSLATION WITH MARKER
  • Books
  • Articles
  • Scraps
  • Uncategorized

On this page

  • EPILOGUE
    • 인과관계의 예술과 과학
    • 감사의 말

The Art and Science of Cause and Effect

+ Causal Inference
+ Philosophy of Science
Author

Judea Pearl

CAUSALITY: Models, Reasoning, and Inference, Second Edition

EPILOGUE

The Art and Science of Cause and Effect

A public lecture delivered November 1996 as part of the UCLA Faculty Research Lectureship Program

인과관계의 예술과 과학

1996년 11월 UCLA 교수 연구 강연 프로그램의 일환으로 진행된 공개 강연입니다.

이 강연의 주제는 인과관계(causality)입니다 - 즉, 세상에서 무엇이 무엇을 일으키는지에 대한 우리의 인식과 그것이 왜 중요한지에 관한 것입니다.

비록 인간 사고의 기본이지만, 인과관계는 신비와 논쟁, 그리고 주의로 가려진 개념입니다. 과학자들과 철학자들이 하나의 사건이 다른 사건을 진정으로 일으키는 때를 정의하는 데 어려움을 겪어왔기 때문입니다.

우리 모두는 수탉의 울음이 해가 뜨게 하는 원인이 아니라는 것을 이해하지만, 이런 간단한 사실조차도 수학적 방정식으로 쉽게 변환될 수 없습니다.

오늘, 저는 이러한 종류의 현상을 연구하는 데 매우 유용하다고 생각한 아이디어들을 여러분과 공유하고자 합니다. 이러한 아이디어들은 여러분이 인과관계를 다음에 접할 때 유용할 것이라고 생각하는 실용적인 도구로 이어졌습니다.

여기 계신 분들 중 인과관계를 다루지 않는 사람을 상상하기 어렵습니다.

여러분이 이중 언어 교육 프로그램의 영향을 평가하든, 쥐가 음식과 위험을 어떻게 구별하는지에 대한 실험을 수행하든, 줄리어스 시저가 왜 루비콘 강을 건넜는지에 대해 추측하든, 환자를 진단하든, 누가 대통령 선거에서 이길지 예측하든, 여러분은 복잡하게 얽힌 인과관계를 다루고 있습니다.

제가 지금부터 말씀드릴 이야기는 연구자들이 이러한 고려사항들의 복잡성을 다루고 그 의미를 명확히 하는 데 도움을 주는 것을 목표로 합니다.

이 강연은 세 부분으로 나뉩니다.

먼저 인과관계에 대해 다양한 학문 분야들이 겪어온 어려움에 대한 간략한 역사적 개요를 시작합니다.

다음으로 이러한 역사적 어려움들을 줄이거나 제거하는 아이디어들을 설명합니다.

마지막으로, 제 공학적 배경을 기념하며, 이러한 아이디어들이 어떻게 통계학과 사회과학 분야에서 실증될 간단한 실용적인 도구로 이어지는지 보여드리겠습니다.

처음에는, 우리가 알 수 있는 한, 인과관계는 문제가 되지 않았습니다.

왜라고 묻는 충동과 인과적 설명을 찾는 능력은 인간 발달의 매우 초기 단계에서부터 왔습니다.

예를 들어, 성경은 지식의 나무에서 맛을 본 지 몇 시간 후에 아담이 이미 인과 논쟁의 전문가가 되었다고 알려줍니다.

하나님이 “네가 그 나무에서 먹었느냐?”라고 물으셨을 때, 아담은 이렇게 대답합니다: “당신이 내게 주신 여자가 나무 열매를 내게 주었고, 나는 먹었습니다.”

이브도 마찬가지로 능숙합니다: “뱀이 나를 속였고, 나는 먹었습니다.”

이 이야기에서 주목할 점은 하나님은 설명을 요구하지 않고 단지 사실만을 물었다는 것입니다 - 설명의 필요성을 느낀 것은 아담이었습니다. 메시지는 분명합니다: 인과적 설명은 인간이 만든 개념입니다.

이 이야기의 또 다른 흥미로운 점: 설명은 전적으로 책임을 전가하는 데 사용됩니다.

실제로, 수천 년 동안 설명에는 다른 기능이 없었습니다. 따라서, 오직 신들, 사람들, 그리고 동물들만이 사건을 일으킬 수 있었고, 물체나 사건, 물리적 과정들은 그럴 수 없었습니다.

자연 현상들은 고대 세계에서 사건들이 단순히 예정되어 있었기 때문에 인과적 설명에 훨씬 나중에 들어왔습니다.

폭풍과 지진은 분노한 신들에 의해 통제되었으며, 그 결과에 대한 인과적 책임을 스스로 지지 않을 수 있었습니다.

주사위 던지기와 같은 불규칙하고 예측 불가능한 사건조차도 우연한 사건이 아니라 적절한 해석을 요구하는 신의 메시지로 간주되었습니다.

그러한 메시지 중 하나는 요나 선지자가 하나님의 배신자로 지목되어 바다에 던져졌을 때 그에게 큰 두려움을 주었습니다.

요나서에서 인용하면: “선원들이 말했다: ‘누구 때문에 이 재앙이 닥쳤는지 알아보기 위해 제비를 뽑자.’ 그래서 그들이 제비를 뽑았고 제비는 요나에게 떨어졌습니다.”

분명히, 이 호화로운 페니키아 유람선에서 “제비 뽑기”는 오락이 아니라 소통 수단으로 사용되었습니다 - 중요한 메시지를 처리하기 위한 일방향 모뎀이었습니다.

요약하자면, 고대 세계에서 인과적 힘의 대행자는 목적을 위해 일을 일으키는 신들이거나, 자유 의지를 가진 인간과 동물들이었습니다. 그들은 이로 인해 처벌받거나 보상받았습니다.

이러한 인과관계의 개념은 순진했지만, 명확하고 문제가 없었습니다.

문제들은, 언제나 그렇듯이, 공학에서 시작되었습니다; 기계들이 유용한 일을 하도록 만들어져야 했을 때입니다.

공학자들이 야심을 갖게 되면서, 그들은 지구도 움직일 수 있다고 결정했지만, 단일 지렛대로는 불가능했습니다.

이러한 규모의 프로젝트를 위해서는 하나가 다른 것을 움직이는 많은 도르래와 바퀴로 구성된 시스템이 필요했습니다.

그리고 사람들이 다단계 시스템을 구축하기 시작하면서, 인과관계에 흥미로운 일이 일어났습니다 - 물리적 물체들이 인과적 특성을 갖기 시작했습니다.

그런 시스템이 고장났을 때, 신이나 운영자를 비난하는 것은 무의미했습니다 - 대신, 끊어진 로프나 녹슨 도르래가 더 유용한 설명이었습니다. 단순히 이것들은 쉽게 교체할 수 있고 시스템이 작동하게 만들 수 있기 때문입니다.

역사의 그 시점에서, 신들과 인간들은 인과적 힘의 유일한 대행자가 되기를 멈추었습니다 - 생명이 없는 물체와 과정들이 책임의 파트너가 되었습니다.

앞의 바퀴가 돌고 멈췄기 때문에 바퀴가 돌고 멈췄습니다 - 인간 운영자는 이차적인 존재가 되었습니다.

놀랍게도, 이러한 새로운 인과관계의 대행자들은 그들의 전임자들 - 신들과 인간들의 일부 특성을 받아들였습니다.

자연 물체들은 공로와 비난의 대상이 될 뿐만 아니라 힘, 의지, 심지어 목적의 담지자가 되었습니다.

아리스토텔레스는 목적 측면에서의 설명을 어떤 것이 왜 그런지에 대한 유일하게 완전하고 만족스러운 설명으로 간주했습니다.

그는 심지어 그것을 최종 원인(final cause)이라고 불렀습니다 - 즉, 과학적 탐구의 최종 목표였습니다.

그 시점부터, 인과관계는 이중 역할을 수행했습니다: 원인들은 한편으로는 공로와 비난의 대상이었고, 다른 한편으로는 물리적 제어 흐름의 담지자였습니다.

이러한 이중성은 르네상스 시대에 개념적 어려움에 봉착할 때까지 상대적으로 평온하게 유지되었습니다.

무슨 일이 일어났는지는 1575년에 출판된 영어로 된 첫 번째 과학 서적인 레코드의 “지식의 성”이라는 책의 제목 페이지에서 볼 수 있습니다.

운명의 수레바퀴는 신의 지혜가 아니라 인간의 무지에 의해 움직입니다.

그리고 최종 원인으로서의 신의 역할이 인간 지식에 의해 대체되면서, 인과적 설명의 전체 개념이 공격받기 시작했습니다.

침식은 갈릴레오의 작업으로 시작되었습니다.

우리 대부분은 갈릴레오를 지동설을 옹호하여 종교 재판소에 세워지고 투옥된 사람으로 알고 있습니다.

하지만 그 모든 일이 진행되는 동안, 갈릴레오는 또한 조용히 과학이 알고 있는 가장 심오한 혁명을 일으켰습니다.

이 혁명은 로마에서 멀리 떨어진 레이든에서 출판된 1638년의 “담론(Discorsi)” 책에서 설명되었으며, 두 가지 격언으로 구성되어 있습니다:

첫째, 설명 전에 먼저 묘사 - 즉, “어떻게”가 “왜”보다 선행한다는 것입니다.

둘째, 묘사는 수학의 언어, 즉 방정식으로 수행됩니다.

갈릴레오는 물체가 아래에서 끌려서인지 위에서 밀려서인지 떨어지는 이유를 묻지 말라고 했습니다.

물체가 특정 거리를 이동하는 데 걸리는 시간을 얼마나 정확히 예측할 수 있는지, 그리고 그 시간이 물체마다 어떻게 다를지, 그리고 트랙의 각도가 변할 때 어떻게 달라질지를 물어보라고 했습니다.

더욱이, 갈릴레오는 그러한 질문에 대한 답변을 인간 언어의 질적이고 미끄러운 뉘앙스로 시도하지 말고, 수학적 방정식의 형태로 말하라고 했습니다.

오늘날 우리는 1638년 비에타(Vieta)가 대수적 표기법을 도입한 지 겨우 50년 후에 그 아이디어가 얼마나 이상하게 들렸는지 이해하기 어렵습니다. 대수학을 과학의 보편적 언어로 선언하는 것은 오늘날 에스페란토를 경제학의 언어로 선언하는 것과 같이 들릴 것입니다.

자연이 왜 하필 대수학으로 말하기로 동의했을까요? 모든 언어 중에서요?

하지만 성공에는 이의를 제기할 수 없습니다.

물체가 이동한 거리는 실제로 시간의 제곱에 비례하는 것으로 밝혀졌습니다.

실험 결과를 예측하는 것보다 더 성공적이었던 것은 대수 방정식의 계산적 측면이었습니다.

그것은 엔지니어들이 역사상 처음으로 “만약 ~한다면 어떻게 될까?”라는 질문 외에도 “어떻게 해야 ~할까?”라는 질문을 할 수 있게 했습니다.

“만약 우리가 빔을 좁히면, 그것이 하중을 견딜 수 있을까?”라고 묻는 것 외에도, 그들은 더 어려운 질문을 하기 시작했습니다: “어떻게 빔을 형성해야 하중을 견딜 수 있을까?” [14]

이것은 방정식을 푸는 방법의 가용성으로 가능해졌습니다.

대수적 기계는 변수들을 차별하지 않습니다; 매개변수 측면에서 행동을 예측하는 대신, 우리는 상황을 뒤집어 원하는 행동 측면에서 매개변수를 풀 수 있습니다.

이제 갈릴레오의 첫 번째 격언 - “설명보다 기술이 먼저” - 에 집중해 봅시다. 왜냐하면 그 아이디어는 과학자들에 의해 매우 진지하게 받아들여져 과학의 성격을 사변적인 것에서 경험적인 것으로 바꾸었기 때문입니다.

물리학은 극도로 유용한 경험적 법칙들로 가득 차게 되었습니다.

스넬의 법칙[15], 훅의 법칙, 옴의 법칙, 줄의 법칙은 더 근본적인 원리에 의해 설명되기 훨씬 전에 발견되고 사용된 순수한 경험적 일반화의 예들입니다.

그러나 철학자들은 인과적 설명이라는 아이디어를 포기하기를 꺼려했고, 그 성공적인 갈릴레오 방정식들의 기원과 정당성을 계속 찾았습니다.

예를 들어, 데카르트는 원인을 영원한 진리에 귀속시켰습니다.

라이프니츠는 원인을 자명한 논리적 법칙으로 만들었습니다.

마침내, 갈릴레오 이후 약 100년 후, 데이비드 흄[16]이라는 이름의 스코틀랜드 철학자가 갈릴레오의 첫 번째 격언을 극단적으로 끌고 갔습니다[17].

흄은 ’왜’가 ’어떻게’에 단순히 두 번째가 아니라, ’왜’가 ’어떻게’에 포함되어 있기 때문에 완전히 불필요하다고 설득력 있게 주장했습니다.

흄의 “인간 본성에 관한 논문”[18] 156페이지에서, 우리는 인과관계를 오늘날까지도 회복하지 못할 정도로 철저히 흔들어 놓은 단락을 찾을 수 있습니다.

나는 항상 그것을 읽을 때 흥분합니다: “따라서 우리는 불꽃이라고 부르는 물체의 종류를 보았고, 열이라고 부르는 감각의 종류를 느꼈던 것을 기억합니다. 우리는 마찬가지로 모든 과거의 사례에서 그들의 지속적인 연결을 기억합니다. 더 이상의 의식 없이, 우리는 하나를 원인이라 부르고 다른 하나를 결과라 부르며, 하나의 존재에서 다른 하나의 존재를 추론합니다.”

따라서, 흄에 따르면 인과적 연결은 관찰의 산물입니다. 인과관계는 마치 광학적 환상만큼이나 허구적이고 파블로프의 조건화만큼이나 일시적인, 마음의 배울 수 있는 습관입니다.

흄이 그의 제안된 방법에 내재된 어려움을 인식하지 못했다고 믿기는 어렵습니다.

그는 수탉의 울음이 일출과 지속적으로 연결되어 있지만, 그것이 태양이 뜨는 원인이 아니라는 것을 매우 잘 알고 있었습니다.

그는 기압계 판독이 비와 지속적으로 연결되어 있지만 비의 원인이 아니라는 것을 알고 있었습니다.

오늘날 이러한 어려움들은 ’인과관계를 의미하지 않는 상관관계’라는 이름으로 분류됩니다.

이제, 모든 지식은 마음에 상관관계로 코딩된 경험에서 온다는 흄의 격언과 상관관계가 인과관계를 의미하지 않는다는 우리의 관찰을 고려하면, 우리는 인과관계의 첫 번째 수수께끼로 이어집니다: 사람들은 어떻게 인과관계에 대한 지식을 얻게 되는가?

우리는 수탉의 예에서 연속의 규칙성이 충분하지 않다는 것을 보았습니다; 무엇이 충분할까요?

어떤 경험 패턴이 연결을 “인과적”이라고 부르는 것을 정당화할까요?

게다가: 어떤 경험 패턴이 사람들에게 연결이 “인과적”이라고 확신시킬까요?

첫 번째 수수께끼가 인과 연결의 학습에 관한 것이라면, 두 번째는 그 사용에 관한 것입니다: 내가 특정 연결이 인과적이거나 인과적이 아니라고 말하면 어떤 차이가 있을까요?

우리의 예를 계속하면, 수탉이 태양이 뜨는 원인이라고 말하면 어떤 차이가 있을까요?

이것은 사소한 것처럼 들릴 수 있습니다.

명백한 대답은 “무엇이 무엇의 원인인지” 아는 것이 우리의 행동 방식에 큰 차이를 만든다는 것입니다.

만약 수탉의 울음이 태양이 뜨는 원인이라면, 우리는 우리의 수탉을 더 일찍 깨워서 그를 울게 할 수 있습니다 - 예를 들어, 그에게 최신 수탉 농담을 해줌으로써 - 그래서 밤을 더 짧게 만들 수 있습니다.

하지만 이 수수께끼는 생각처럼 사소하지 않습니다.

만약 인과적 정보가 연속의 규칙성을 넘어서는 경험적 의미를 가지고 있다면, 그 정보는 물리학 법칙에 나타나야 합니다.

하지만 그렇지 않습니다!

철학자 버트란드 러셀은 1913년에 이런 주장을 했습니다[19]:

“모든 철학자들은,” 러셀이 말합니다, “인과관계가 과학의 기본 공리 중 하나라고 상상하지만, 이상하게도 선진 과학에서는 ’원인’이라는 단어가 전혀 등장하지 않습니다… 나는 인과성 법칙이 과거 시대의 유물이라고 믿습니다. 군주제처럼 해를 끼치지 않는다고 잘못 생각되기 때문에만 살아남았습니다.”

인과관계의 중요성을 주장한 또 다른 철학자 패트릭 서페스는 다음과 같이 언급했습니다:

“’물리 리뷰’의 각 호는 제목에 ’원인’이나 ’인과성’을 사용하는 논문을 최소한 하나 이상 포함하고 있지 않은 경우가 거의 없습니다.”

이 교환에서 우리가 결론짓는 것은 물리학자들이 한 가지 방식으로 말하고, 쓰고, 생각하면서 다른 방식으로 물리학을 공식화한다는 것입니다.

그러한 이중 언어 활동은 인과성이 단순히 편리한 의사소통 장치로 사용된다면 - 그렇지 않으면 많은 방정식이 필요한 복잡한 물리적 관계 패턴을 표현하는 약자로 - 용서받을 수 있습니다.

결국! 과학은 약어로 가득 차 있습니다: 우리는 “x를 5번 자신에게 더하기” 대신 “x에 5를 곱하기”를 사용합니다; 우리는 “무게와 부피의 비율” 대신 “밀도”라고 말합니다.

왜 인과성을 문제 삼나요?

“인과성은 다르기 때문입니다,” 러셀 경은 주장할 것입니다. “물리학 법칙은 모두 대칭적이고 양방향으로 작동하는 반면, 인과 관계는 단방향적이며 원인에서 결과로 향하기 때문에 약어일 수 없습니다.”

예를 들어, 뉴턴의 법칙을 살펴보세요: f = ma.

대수학의 규칙은 우리가 이 법칙을 다양한 구문 형식으로 쓸 수 있게 합니다. 모두 같은 의미입니다 - 세 가지 양 중 두 가지를 알면 세 번째가 결정된다는 것입니다.

그러나 일반적인 담론에서 우리는 힘이 가속도의 원인이라고 말합니다 - 가속도가 힘의 원인이라고 말하지 않으며, 우리는 이 구별에 대해 매우 강한 느낌을 가지고 있습니다.

마찬가지로, 우리는 f/a의 비율이 질량을 결정하는 데 도움이 된다고 말하지만, 그것이 질량의 원인이라고 말하지는 않습니다.

그러한 구별은 물리학 방정식에 의해 지지되지 않으며, 이는 인과적 어휘 전체가 순전히 형이상학적인 것인지, “군주제처럼 살아남는지”를 묻게 합니다.

다행히도, 매우 적은 수의 물리학자들만이 러셀의 수수께끼에 주의를 기울였습니다. 그들은 사무실에서 방정식을 쓰고 구내식당에서 원인-결과에 대해 이야기하는 것을 계속했습니다; 놀라운 성공으로 그들은 원자를 분해하고, 트랜지스터와 레이저를 발명했습니다.

엔지니어링에서도 마찬가지입니다.

그러나 다른 영역에서는 이러한 긴장이 눈에 띄지 않을 수 없었습니다. 왜냐하면 그 영역에서는 인과적 관계와 다른 관계를 구별하는 요구가 매우 명확했기 때문입니다.

이 영역은 통계학입니다.

이야기는 약 100년 전, 상관관계의 발견으로 시작됩니다.

프란시스 갈톤[20], 지문법의 발명가이자 찰스 다윈의 사촌은, 꽤 이해할 수 있게도 재능과 미덕이 가족 내에서 이어진다는 것을 증명하고자 했습니다.

갈톤의 연구는 그로 하여금 한 집단의 개인이나 물체의 특성이 다른 집단의 특성과 어떻게 관련되는지 측정하는 다양한 방법을 고려하게 했습니다.

1888년, 그는 사람의 팔뚝 길이와 그 사람의 머리 크기를 측정하고 이 두 양 중 하나가 다른 하나를 어느 정도 예측할 수 있는지 질문했습니다[21].

그는 다음과 같은 발견에 우연히 도달했습니다: 만약 당신이 한 양을 다른 양에 대해 그래프로 그리고 두 축을 적절히 조정한다면, 최적 적합선의 기울기는 몇 가지 좋은 수학적 특성을 가집니다. 기울기는 한 양이 다른 양을 정확히 예측할 수 있을 때만 1이 됩니다; 예측이 무작위 추측보다 나을 것이 없을 때는 0이 됩니다; 그리고 가장 놀랍게도, 기울기는 X를 Y에 대해 그래프로 그리든 Y를 X에 대해 그래프로 그리든 동일합니다.

“상관관계(co-relation)는 두 기관의 변이가 부분적으로 공통 원인에 기인한다는 결과임을 보는 것은 쉽습니다,”라고 갈톤은 말했습니다.

여기에서 우리는 처음으로 두 변수가 서로 어떻게 “관련”되어 있는지에 대한 객관적인 측정법을 갖게 되었습니다. 이는 순전히 데이터에 기반하여, 인간의 판단이나 의견과는 별개로 이루어집니다.

갈톤의 발견은 그의 제자 중 한 명인 칼 피어슨[22]을 매료시켰습니다. 그는 현대 통계학의 창시자 중 한 명으로 간주됩니다.

피어슨은 당시 30세였으며, 변호사로 전향하려던 성취된 물리학자이자 철학자였습니다. 그리고 이것이 그가 45년 후[23] 갈톤의 발견에 대한 그의 초기 반응을 묘사하는 방식입니다:

“나는 드레이크 시대의 해적처럼 느꼈습니다…”

“나는… 갈톤이 인과관계보다 더 넓은 범주, 즉 상관관계가 있으며, 인과관계는 그 한계일 뿐이고, 이 새로운 상관관계 개념이 심리학, 인류학, 의학, 그리고 사회학의 큰 부분을 수학적 처리의 영역으로 가져왔다는 것을 의미한다고 해석했습니다.”

이제, 피어슨은 “한니발을 알프스로, 마르코 폴로를 중국으로 데려간 종류의 추진력과 결단력을 가진 사람”으로 묘사되었습니다.

피어슨이 해적처럼 느꼈을 때, 그가 그의 전리품을 얻게 될 것이라고 확신할 수 있습니다.

1911년에는 그의 책 “과학의 문법”의 3판이 출판되었습니다. 여기에는 “우발성과 상관관계 - 인과관계의 불충분성”이라는 새로운 장이 포함되어 있었고, 이것이 피어슨이 그 장에서 말한 내용입니다:

“’물질’과 ’힘’과 같은 폐기된 기본 개념들을 넘어서, 현대 과학의 불가해한 비밀 가운데 또 다른 우상이 놓여 있습니다. 바로 인과관계의 범주입니다.”

그리고 피어슨은 구시대적인 인과관계 범주를 무엇으로 대체합니까? 여러분은 귀를 믿지 못할 것입니다: 우발성 테이블[24]입니다.

“이러한 표는 우발성 테이블이라고 하며, 두 가지 사이의 관계에 대한 궁극적인 과학적 진술이나 설명은 항상 이러한 우발성 테이블로 되돌릴 수 있습니다…”

“독자가 이러한 표의 성격을 깨닫는 순간, 그는 원인과 결과 사이의 연관 개념의 본질을 파악하게 될 것입니다.”

따라서, 피어슨은 상관관계를 넘어선 독립적인 인과관계 개념의 필요성을 단호히 부정합니다.

그는 평생 동안 이 견해를 유지했으며, 그에 따라 그의 기술적 논문 어디에서도 인과관계를 언급하지 않았습니다.

“의지”와 “힘”과 같은 정령론적 개념들에 대한 그의 십자군 원정은 너무 격렬했고 결정론에 대한 그의 거부는 너무 절대적이어서, 그는 인과관계가 통계학에 뿌리를 내릴 기회를 갖기도 전에 통계학에서 인과관계를 근절시켰습니다.

25년이 더 지나고 또 다른 강한 의지의 인물인 로널드 피셔 경[25]이 등장하기까지 통계학자들은 무작위 실험을 공식화했습니다. 이는 데이터로부터 인과관계를 테스트하는 유일하게 과학적으로 입증된 방법이며, 오늘날까지도 주류 통계학에서 허용되는 유일한 인과 개념입니다.

그리고 대략 오늘날의 상황이 그렇습니다.

인과관계에 관해 작성된 박사 논문, 연구 논문 또는 교과서 페이지 수를 세면, 피어슨이 여전히 통계학을 지배하고 있다는 인상을 받습니다.

“통계과학 백과사전”은 상관관계에 12페이지를 할애하지만 인과관계에는 단 2페이지만 할애하며 - 그 중 한 페이지는 “상관관계가 인과관계를 의미하지 않는다”는 것을 보여주는 데 사용됩니다.

현대 통계학자들이 인과관계에 대해 무엇이라고 말하는지 들어봅시다.

“생물통계학(Biometrika)” (피어슨이 창간한 저널)의 현 편집자 필립 도위드(Philip Dawid)는 인정합니다: “인과추론은 통계학의 가장 중요하고, 가장 미묘하며, 가장 간과된 문제 중 하나입니다.”

생물측정학회(Biometric Society)의 전 회장이자 (O.J. 심슨 살인 재판의 전문 증인으로 기억하실) 테리 스피드(Terry Speed)는 선언합니다: “인과관계에 대한 고려는 통계학에서 항상 다루어진 방식으로 다루어져야 합니다: 가급적이면 전혀 다루지 않되, 필요하다면 매우 큰 주의를 기울여야 합니다.”

데이비드 콕스 경과 낸시 베르무스(Nanny Wermuth)는 몇 달 전에 출판된 책에서 다음과 같이 사과합니다: “우리는 이 책에서 인과적 또는 인과관계라는 단어를 사용하지 않았습니다… 우리가 조심스러운 이유는 한 연구에서 인과관계에 대한 확고한 결론을 내릴 수 있는 경우가 드물기 때문입니다.”

이러한 주의와 회피의 입장은 지침을 위해 통계학을 바라보는 많은 분야, 특히 경제학과 사회과학을 마비시켰습니다.

한 저명한 사회과학자는 1987년에 다음과 같이 말했습니다: “더 많은 연구자들이 원인과 결과와 같은 용어를 생각하고 사용하는 것을 포기한다면 매우 건강할 것입니다.”

이러한 상황이 단 한 사람의 작업일 수 있을까요? 심지어 피어슨 같은 해적도 말입니까?

저는 그것을 의심합니다.

그러나 어떻게 다른 방식으로 통계학이, 가설 검정과 실험 설계와 같은 강력한 개념을 세계에 제공한 분야가, 인과관계에 대해서는 너무 일찍 포기했는지 설명할 수 있을까요?

한 가지 명백한 설명은 물론 인과관계가 상관관계보다 측정하기 훨씬 어렵다는 것입니다.

상관관계는 단일 통제되지 않은 연구에서 직접 추정할 수 있지만, 인과적 결론은 통제된 실험을 필요로 합니다.

하지만 이것은 너무 단순합니다; 통계학자들은 어려움에 쉽게 굴하지 않으며, 아이들은 통제된 실험을 수행하지 않고도 인과관계를 배울 수 있습니다.

답은 제 생각에 더 깊이 있으며, 그것은 통계학의 공식 언어, 즉 확률의 언어와 관련이 있습니다.

이것이 여러분 중 일부에게는 놀라울 수 있겠지만, ’원인’이라는 단어는 확률 이론의 어휘에 없습니다; 우리는 확률의 언어로 ’진흙이 비를 일으키지 않는다’는 문장을 표현할 수 없습니다 - 우리가 말할 수 있는 것은 두 가지가 상호 연관되어 있거나 의존적이라는 것뿐입니다 - 즉, 하나를 발견하면 다른 하나를 예상할 수 있다는 의미입니다.

당연히, 특정 개념을 명시적으로 표현할 언어가 부족하다면, 우리는 그 개념을 중심으로 과학적 활동이 발전할 것을 기대할 수 없습니다.

과학적 발전은 지식이 한 연구에서 다른 연구로 신뢰성 있게 전달되는 것을 요구하며, 갈릴레오가 350년 전에 보여준 바와 같이, 그러한 전달은 형식 언어의 정밀성과 계산적 이점을 필요로 합니다.

저는 곧 언어와 표기법의 중요성에 대해 논의하러 돌아오겠지만, 먼저 인과관계가 어려움을 겪은 또 다른 분야의 이야기로 이 역사적 개요를 마무리하고 싶습니다.

이번에는 컴퓨터 과학입니다 - 기호의 과학으로, 비교적 새로운 분야이지만 언어와 표기법에 엄청난 중요성을 둔 분야이므로 문제에 대한 유용한 관점을 제공할 수 있습니다.

연구자들이 컴퓨터를 사용하여 인과관계를 인코딩하기 시작했을 때, 인과관계의 두 수수께끼가 새로운 활력으로 일깨워졌습니다.

이 로봇[26]의 입장이 되어 주방이나 실험실에서 무슨 일이 일어나고 있는지 이해하려고 노력해보세요.

개념적으로, 로봇의 문제는 국가 부채를 모델링하려는 경제학자나 질병의 확산을 이해하려는 역학자가 직면한 문제와 동일합니다.

우리의 로봇, 경제학자, 역학자 모두 제한된 행동과 노이즈가 있는 관찰을 사용하여 환경에서 인과 관계(cause-effect relations)를 추적해야 합니다.

이것은 그들을 인과관계에 관한 흄(Hume)의 첫 번째 수수께끼로 이끕니다: 어떻게?

인과관계의 두 번째 수수께끼도 로봇의 세계에서 역할을 합니다.

우리가 지름길을 택해서 이 방에서의 원인과 결과에 대해 우리가 알고 있는 모든 것을 로봇에게 가르치고 싶다고 가정해 봅시다[27].

로봇은 이 정보를 어떻게 구성하고 활용해야 할까요?

따라서, 인과관계의 두 가지 철학적 수수께끼는 이제 구체적이고 실용적인 질문으로 변환됩니다:

로봇은 환경과의 상호작용을 통해 어떻게 인과 정보를 획득해야 할까요? 로봇은 창조자-프로그래머로부터 받은 인과 정보를 어떻게 처리해야 할까요?

다시 말하지만, 두 번째 수수께끼는 생각만큼 사소하지 않습니다. 인과 관계와 물리 방정식이 양립할 수 없다는 러셀 경(Lord Russell)의 경고는 이제 논리의 명백한 결함으로 나타납니다.

예를 들어, “잔디가 젖어 있으면, 비가 왔다”와 “이 병을 깨뜨리면, 잔디가 젖을 것이다”라는 정보가 주어지면, 컴퓨터는 “이 병을 깨뜨리면, 비가 왔다”라고 결론을 내릴 것입니다[28].

이러한 프로그래밍 버그가 표면화되는 빠른 속도와 특이성으로 인해 인공 지능 프로그램은 인과관계의 세부 사항을 연구하는 이상적인 실험실이 되었습니다.

이것은 강의의 두 번째 부분으로 이어집니다: 방정식과 그래프를 결합하여 인과관계의 두 번째 수수께끼를 어떻게 해결할 수 있는지, 그리고 이 해결책이 첫 번째 수수께끼를 덜 어렵게 만드는 방법입니다.

원인과 결과의 예술과 과학 413

이 해결책에서 가장 중요한 아이디어는 다음과 같습니다: 첫째 - 인과관계를 개입(interventions) 하에서의 행동의 요약으로 취급하는 것입니다. 둘째 - 방정식과 그래프를 인과적 사고가 표현되고 조작될 수 있는 수학적 언어로 사용하는 것입니다.

그리고 이 둘을 결합하기 위해서는 세 번째 개념이 필요합니다: 개입을 방정식에 대한 수술(surgery)로 취급하는 것입니다.

인과관계를 광범위하게 사용하고 이와 관련해 문제가 없었던 분야부터 시작해 봅시다: 공학입니다.

여기 회로도의 공학 도면[29]이 있는데, 이는 회로의 신호들 간의 인과 관계를 보여줍니다. 이 회로는 AND 게이트와 OR 게이트로 구성되어 있으며, 각각은 입력과 출력 사이에서 논리 함수를 수행합니다. 이 다이어그램을 자세히 살펴봅시다. 그 단순함과 친숙함이 매우 기만적입니다. 사실, 이 다이어그램은 과학의 가장 위대한 경이로움 중 하나입니다. 수백만 개의 대수 방정식이나 확률 함수 또는 논리 표현보다 더 많은 정보를 전달할 수 있습니다. 이 다이어그램을 훨씬 더 강력하게 만드는 것은 정상 조건에서 회로가 어떻게 동작하는지뿐만 아니라 수백만 개의 비정상 조건에서 회로가 어떻게 동작할지 예측할 수 있는 능력입니다. 예를 들어, 이 회로도가 주어지면 어떤 입력이 0에서 1로 변경될 때 출력이 어떻게 될지 쉽게 알 수 있습니다. 이는 정상적이며 간단한 입력-출력 방정식으로 쉽게 표현할 수 있습니다. 이제 비정상적인 부분이 나옵니다. 우리는 Y를 0(제로)으로 설정하거나, X에 연결하거나, 이 AND 게이트를 OR 게이트로 변경하거나, 이러한 작업의 수백만 가지 조합 중 어느 것을 수행할 때 출력이 어떻게 될지도 알 수 있습니다. 이 회로의 설계자는 그러한 이상한 개입을 예상하거나 고려하지 않았지만, 놀랍게도 우리는 그 결과를 예측할 수 있습니다. 어떻게요? 이러한 표현력은 어디서 오는 것일까요?

이는 초기 경제학자들이 자율성(autonomy)이라고 부른 것에서 비롯됩니다. 즉, 이 다이어그램의 게이트들은 독립적인 메커니즘을 나타냅니다 - 다른 것을 변경하지 않고 하나를 변경하는 것이 쉽습니다. 다이어그램은 이러한 독립성을 활용하여 개입 하에서도 변경되지 않는 빌딩 블록을 정확히 사용하여 회로의 정상 기능을 설명합니다.

볼터 홀(Boelter Hall)의 제 동료들은 제가 마치 세계의 8번째 경이로움인 것처럼 공학적 사소함에 대해 떠들고 있는 것을 의아해하고 있을 것입니다. 저는 이렇게 하는 데 세 가지 이유가 있습니다. 첫째, 저는 엔지니어들이 당연시하는 관행에 많은 미개발된 지혜가 있다는 것을 보여드리려고 합니다.

둘째, 저는 경제학자들과 사회과학자들에게 이 다이어그램적 방법의 이점을 상기시키려고 합니다. 그들은 75년 이상 구조방정식 모델링(structural equation modeling)과 경로 다이어그램(path diagrams)이라는 유사한 방법을 간헐적으로 사용해 왔지만, 최근 몇 년 동안 대수적 편의성이 다이어그램 표현과 그 이점을 억제하도록 허용했습니다. 마지막으로, 이러한 다이어그램은 인과관계의 본질, 즉 비정상적인 상황과 새로운 조작의 결과를 예측하는 능력을 포착한다고 생각합니다. 예를 들어, S.Wright의 다이어그램[30]에서는 입력으로 보여지는 환경적 요인(E)이나 심지어 부모와 자손 사이의 중간 노드로 보여지는 유전적 요인(H)을 변경할 경우 기니피그 새끼의 코트 패턴이 어떻게 될지 예측할 수 있습니다. 이러한 예측은 대수적 또는 상관관계 분석만으로는 불가능합니다.

인과관계를 이런 방식으로 보면 과학자들이 왜 그렇게 열성적으로 인과적 설명을 추구하는지, 그리고 인과 모델을 얻는 것이 왜 “깊은 이해”와 “통제력을 가진다”는 느낌을 주는지 설명할 수 있습니다.

깊은 이해[31]란 단지 어제 일이 어떻게 일어났는지 아는 것이 아니라 새로운 가상의 상황에서 일이 어떻게 일어날지 아는 것을 의미하며, 통제는 그러한 상황 중 하나입니다. 흥미롭게도, 우리가 그러한 이해를 가질 때, 실제로 통제할 실용적인 방법이 없더라도 “통제감”을 느낍니다. 예를 들어, 우리는 천체 운동을 통제할 실용적인 방법이 없지만, 그럼에도 불구하고 중력 이론은 우리에게 이해와 통제의 느낌을 줍니다. 왜냐하면 가상의 통제를 위한 청사진을 제공하기 때문입니다. 우리는 예상치 못한 새로운 사건(예: 달이 유성에 부딪히거나 중력 상수가 갑자기 2배로 감소하는 경우)이 조수파에 미치는 영향을 예측할 수 있으며, 똑같이 중요한 것은 중력 이론이 지구상의 일반적인 조작이 조수파를 통제하지 않을 것이라는 확신을 제공한다는 것입니다. 인과 모델이 반응적이거나 본능적인 반응과 의도적인 추론을 구별하는 리트머스 테스트로 간주되는 것은 놀라운 일이 아닙니다. 새와 원숭이들은 깨진 전선을 고치는 것과 같은 복잡한 작업을 수행하도록 훈련될 수 있을지 모르지만, 그것은 시행착오 훈련이 필요합니다. 반면, 의도적인 추론자는 그러한 조작을 시도해보지 않고도 새로운 조작의 결과를 예상할 수 있습니다.

회로도의 일부를 확대해 봅시다[32]. 그러면 왜 다이어그램이 방정식이 예측할 수 없는 결과를 예측할 수 있는지 이해할 수 있습니다. 또한 논리 게이트에서 선형 방정식으로 전환하고(모두가 더 편안하게 느끼도록), 우리가 단 두 개의 구성 요소를 포함하는 시스템을 다루고 있다고 가정해 봅시다: 승수기(multiplier)와 가산기(adder)입니다. 승수기는 입력을 받아 2배의 인자로 곱합니다. 가산기는 입력을 받아 1을 더합니다. 이 두 구성 요소를 설명하는 방정식은 왼쪽에 제시되어 있습니다.

하지만 이 방정식들은 오른쪽의 다이어그램과 동등한가요? 분명히 아닙니다! 만약 그렇다면, 변수들을 바꿔보고, 결과적으로 나온 두 방정식은 아래 표시된 회로와 동등해야 합니다. 하지만 이 두 회로는 다릅니다. 위쪽 회로는 Y를 물리적으로 조작하면 Z에 영향을 미칠 것이라고 알려주지만, 아래쪽 회로는 Y를 조작하면 X에 영향을 미치고 Z에는 영향을 미치지 않을 것을 보여줍니다. 게다가, 우리의 방정식에 추가적인 대수 연산을 수행함으로써, 우리는 아래에 보이는 두 개의 새로운 방정식을 얻을 수 있습니다. 이것들은 구조를 전혀 가리키지 않습니다. 단순히 세 변수에 대한 두 가지 제약 조건을 나타낼 뿐, 그것들이 서로 어떻게 영향을 미치는지 알려주지 않습니다. Y를 물리적으로 조작하는 - 예를 들어, Y를 0으로 설정하는 - 효과를 결정하는 정신적 과정을 더 자세히 살펴봅시다[33]. 분명히, 우리가 Y를 0으로 설정할 때, X와 Y 사이의 관계는 더 이상 곱셈기(multiplier)에 의해 주어지지 않습니다. 이제 X가 아무런 영향을 미치지 못하는 새로운 메커니즘이 Y를 제어합니다. 방정식 표현에서는 Y → 2X라는 방정식을 Y → 0이라는 새로운 방정식으로 대체하고 새로운 방정식 집합을 풀면 Z → 1이 됩니다. 만약 우리가 하단 모델을 나타내는 하단 방정식 쌍에 이 수술을 수행하면, 당연히 다른 해결책을 얻게 됩니다. 두 번째 방정식을 대체해야 할 것이고, 이는 X → 0을 산출하고 Z는 제약받지 않게 됩니다.

이제 이 중재(intervention) 모델이 어떻게 인과관계의 공식적 정의로 이어지는지 볼 수 있습니다: “Y가 Z의 원인이라는 것은 Y를 조작함으로써 Z를 변경할 수 있다는 것입니다. 즉, Y에 대한 방정식을 외과적으로 제거한 후, Z에 대한 해결책이 Y에 대해 대체한 새로운 값에 의존하게 된다는 것입니다.” 또한 이 과정에서 다이어그램이 얼마나 중요한지도 볼 수 있습니다. 다이어그램은 Y를 조작할 때 어떤 방정식을 삭제해야 하는지 알려줍니다. 그 정보는 화면 하단에 표시된 것처럼 방정식을 대수적으로 동등한 형태로 변환할 때 완전히 사라져버립니다. 이 방정식 쌍만으로는 Y를 0으로 설정한 결과를 예측하는 것이 불가능합니다. 왜냐하면 어떤 수술을 수행해야 할지 모르기 때문입니다 - “Y에 대한 방정식”이라는 것이 존재하지 않습니다.

요약하자면, 중재는 방정식에 대한 수술(다이어그램에 의해 안내됨)이며 인과관계는 그러한 수술의 결과를 예측하는 것을 의미합니다.

이것은 물리적 시스템을 넘어서는 보편적인 주제입니다. 사실, 중재를 “방정식을 지우는” 것으로 모델링하는 아이디어는 1960년에 경제학자인 Herman Wold에 의해 처음 제안되었지만, 그의 가르침은 경제학 문헌에서 거의 사라졌습니다. 역사책들은 이 미스터리한 사라짐을 Wold의 성격 탓으로 돌리지만, 저는 이유가 더 깊다고 믿습니다: 초기 계량경제학자들은 매우 신중한 수학자들이었습니다. 그들은 자신들의 대수학을 깨끗하고 형식적으로 유지하기 위해 열심히 싸웠고, 다이어그램과 같은 요령으로 그것이 오염되는 것을 동의할 수 없었습니다. 그리고 화면에서 볼 수 있듯이, 수술 작업은 다이어그램 없이는 수학적 의미가 없습니다. 왜냐하면 이것은 우리가 방정식을 쓰는 방식에 민감하기 때문입니다.

이 새로운 수학적 연산의 속성을 설명하기 전에, 통계학과 경제학의 개념을 명확히 하는 데 얼마나 유용한지 시연해 보겠습니다.

왜 우리는 비통제 연구보다 통제된 실험을 선호할까요? 특정 장애를 앓고 있는 환자들의 회복에 대한 약물 치료의 효과를 연구하고 싶다고 가정해 봅시다. 각 환자의 행동을 지배하는 메커니즘은 구조적으로 앞서 본 회로 다이어그램과 유사합니다. 회복은 치료와 사회경제적 조건, 생활 방식, 식이요법, 나이 등의 다른 요인들의 함수입니다. 여기서는 그러한 요인 중 하나만 표시됩니다 [34].

통제되지 않은 조건에서는 치료 선택은 환자에게 달려 있으며 환자의 사회경제적 배경에 따라 달라질 수 있습니다. 이것은 문제를 야기합니다. 왜냐하면 회복률의 변화가 치료 때문인지 그러한 배경 요인들 때문인지 알 수 없기 때문입니다. 우리가 원하는 것은 비슷한 배경을 가진 환자들을 비교하는 것이며, 이것이 바로 Fisher의 무작위 실험이 달성하는 것입니다. 어떻게? 실제로 이것은 무작위화(randomization)와 중재(intervention) 두 부분으로 구성됩니다.

중재란 개인의 자연스러운 행동을 변경한다는 것을 의미합니다: 우리는 피험자들을 치료군과 대조군이라는 두 그룹으로 나누고, 피험자들이 실험 정책을 따르도록 설득합니다. 우리는 정상적인 상황에서는 치료를 받지 않을 일부 환자들에게 치료를 할당하고, 그렇지 않으면 치료를 받을 환자들에게 위약(placebo)을 제공합니다. 이것은 우리의 새로운 어휘에서는 수술을 의미합니다 - 우리는 하나의 기능적 연결을 끊고 다른 것으로 대체하고 있습니다. Fisher의 위대한 통찰은 새로운 연결을 무작위 동전 던지기에 연결하면 우리가 끊고자 하는 연결이 실제로 끊어진다는 것을 보장한다는 것이었습니다. 그 이유는 무작위 동전은 거시적 수준에서 우리가 측정할 수 있는 어떤 것에도 영향을 받지 않는 것으로 가정되기 때문입니다 - 물론 환자의 사회경제적 배경도 포함됩니다.

이 그림은 보편적으로 받아들여지는 무작위 시험 절차에 대한 의미 있고 공식적인 근거를 제공합니다. 반면에, 다음 예제는 수술 아이디어를 사용하여 널리 받아들여지는 절차의 부적절함을 지적합니다.

이 예제[35]는 정부 관리가 어떤 정책 - 예를 들어, 과세 - 의 경제적 결과를 평가하려고 시도하는 것을 포함합니다. 세금을 올리거나 내리는 의도적인 결정은 경제 모델에 대한 수술입니다. 왜냐하면 그것은 모델이 구축되었을 때 존재하던 조건을 수정하기 때문입니다. 경제 모델은 일정 기간 동안 수집된 데이터를 기반으로 구축되며, 이 기간 동안 세금은 일부 경제적 조건이나 정치적 압력에 대응하여 내려가고 올라갔습니다.

그러나 정책을 평가할 때, 우리는 동일한 경제적 조건 하에서 대안 정책들을 비교하고 싶습니다 - 즉, 과거에 정책들을 그러한 조건에 연결했던 이 연결을 끊고 싶습니다. 이러한 설정에서는 물론 우리의 정책을 동전 던지기에 연결하고 통제된 실험을 실행하는 것이 불가능합니다. 우리는 그것을 위한 시간이 없고, 실험이 끝나기 전에 경제를 망칠 수도 있습니다. 그럼에도 불구하고 우리가 수행해야 할 분석은 수술되지 않은 모델에 의해 지배되는 데이터로부터 이 절단된 모델의 행동을 추론하는 것입니다.

저는 ’수행해야 한다’고 말했습니다. 왜냐하면 어떤 경제학 교과서에서도 그러한 분석을 찾을 수 없기 때문입니다. 앞서 언급했듯이, Herman Wold의 수술 아이디어는 1970년대에 경제학 문헌에서 철저히 제거되었으며, 제가 찾을 수 있는 모든 정책 분석에 관한 논의는 절단된 모델이 전반적으로 지배한다고 가정합니다. 평가 시점에 과세가 정부 통제 하에 있다는 것이 과세를 전체적으로 외생 변수로 취급하기에 충분하다고 가정되지만, 실제로 과세는 모델 구축 단계에서는 내생 변수이며 평가될 때만 외생 변수가 됩니다. 물론, 저는 수술 모델을 복원하면 정부가 하룻밤 사이에 예산을 균형 잡을 수 있다고 주장하는 것이 아니지만, 그것은 확실히 시도해 볼 가치가 있는 것입니다.

이제 수술 해석이 어떻게 인과 관계의 방향성과 물리 방정식의 대칭성 사이의 충돌에 관한 Russell의 수수께끼를 해결하는지 살펴보겠습니다. 물리학의 방정식은 실제로 대칭적이지만, “A가 B를 일으킨다” 대 “B가 A를 일으킨다”라는 문구를 비교할 때, 우리는 단일 방정식 집합에 대해 이야기하는 것이 아닙니다. 오히려, 우리는 두 가지 다른 방정식 집합으로 표현되는 두 세계 모델을 비교하고 있습니다: 하나는 A에 대한 방정식이 외과적으로 제거된 것이고, 다른 하나는 B에 대한 방정식이 제거된 것입니다. Russell은 아마도 이 시점에서 우리를 멈추고 물을 것입니다: “실제로는 물리학의 모든 방정식을 합친 하나의 세계 모델만 있는데, 어떻게 두 세계 모델에 대해 이야기할 수 있는가?” 대답은: 맞습니다. 만약 당신이 모델에 전체 우주를 포함시키기를 원한다면, 인과관계는 사라집니다. 왜냐하면 중재가 사라지기 때문입니다 - 조작하는 자와 조작되는 것이 그들의 구분을 잃게 됩니다. 그러나 과학자들은 거의 우주 전체를 조사 대상으로 고려하지 않습니다. 대부분의 경우 과학자는 우주에서 한 조각을 잘라내어 그 조각을 ‘인(in)’으로 선언합니다 - 즉, 조사의 초점입니다. 우주의 나머지 부분은 ’아웃(out)’ 또는 배경으로 간주되며 경계 조건이라고 부르는 것으로 요약됩니다. 이러한 인과 아웃의 선택은 우리가 사물을 바라보는 방식에 비대칭성을 만들어내고, 이 비대칭성이 우리로 하여금 “외부 중재”에 대해 이야기할 수 있게 하며, 따라서 인과관계와 원인-결과 방향성에 대해 이야기할 수 있게 합니다.

이것은 데카르트의 고전적인 그림[36]을 사용하여 꽤 멋지게 설명할 수 있습니다. 전체로서, 이 손-눈 시스템은 인과관계에 대해 아무것도 모릅니다. 그것은 단지 슈뢰딩거 방정식을 최선을 다해 따르려는 입자와 광자의 혼란스러운 플라즈마일 뿐이며, 이 방정식은 대칭적입니다.

그러나 그것에서 한 덩어리를 잘라내서 - 예를 들어, 객체 부분[37] - 우리는 손의 움직임이 이 빛의 광선이 각도를 변경하게 하는 원인이라고 말할 수 있습니다.

다른 방식으로 잘라내서, 뇌 부분[38]에 초점을 맞추면, 보라! 이제는 빛의 광선이 손이 움직이게 하는 원인입니다 - 정확히 반대 방향입니다. 교훈은 우리가 우주를 어떻게 잘라내는가가 우리가 원인과 결과와 연관시키는 방향성을 결정한다는 것입니다. 그러한 잘라내기는 모든 과학적 조사에서 암묵적으로 가정됩니다. 인공지능에서는 J. McCarthy에 의해 “circumscription”이라고 불렸습니다. 경제학에서 circumscription은 모델 내에서 어떤 변수가 내생적으로 간주되고 어떤 것이 외생적인지, 모델 내부인지 외부인지를 결정하는 것을 의미합니다.

방정식 모델과 인과 모델 사이의 본질적인 차이를 요약해 봅시다[39]. 둘 다 정상 조건을 설명하기 위해 대칭 방정식 집합을 사용합니다. 그러나 인과 모델은 세 가지 추가 요소를 포함합니다: (i) 인(in)과 아웃(out) 사이의 구별; (ii) 각 방정식이 독립적인 메커니즘에 해당하므로 별도의 수학적 문장으로 보존되어야 한다는 가정; 그리고 (iii) 그러한 메커니즘에 대한 수술로 해석되는 중재. 이것은 우리를 인과관계를 물리학의 친숙한 부분으로 만드는 꿈을 실현하는 데 더 가깝게 합니다. 그러나 하나의 요소가 빠져있습니다: 대수학. 우리는 앞서, 갈릴레오 시대의 과학자들과 엔지니어들에게 대수학의 계산 기능이 얼마나 중요했는지 논의했습니다. 우리는 그러한 대수학적 기능이 인과관계에도 도움이 될 것으로 기대할 수 있을까요? 다르게 표현해 보겠습니다: 우리가 알고 있는 과학적 활동은 두 가지 기본 요소로 구성됩니다:

관찰[40]과 중재[41].

둘의 조합이 우리가 실험실[42]이라고 부르는 것입니다. 실험실은 우리가 일부 조건을 통제하고 다른 조건을 관찰하는 장소입니다. 표준 대수학이 관찰 요소에는 매우 잘 기여했지만 지금까지는 중재 요소에는 혜택을 주지 못했다는 것이 우연히 발생했습니다. 이것은 방정식의 대수학, 부울 대수학, 확률 계산에 모두 해당됩니다 - 모두 관찰 문장을 제공하도록 맞춰져 있지만 중재 문장에는 맞춰져 있지 않습니다.

예를 들어, 확률 이론을 살펴보겠습니다. 만약 우리가 잔디가 젖었다는 것을 보고, 비가 왔을 확률을 알고 싶다면, 우리는 다음과 같이 형식적인 문장으로 우리의 질문을 표현할 수 있습니다: P(Rain | Wet). “젖었다는 것을 보고, 비가 왔을 확률”로 읽습니다[43]. 수직 막대는 “~를 본다는 조건 하에”라는 구문을 나타냅니다. 우리는 이 질문을 공식적인 문장으로 표현할 수 있을 뿐만 아니라, 확률 이론의 기계를 사용하여 문장을 다른 표현으로 변환할 수도 있습니다. 우리 예에서는, 왼쪽 문장을 오른쪽 문장으로 변환할 수 있습니다. 만약 더 편리하거나 유익하다고 생각한다면 말입니다.

그러나 다른 질문을 한다고 가정해 봅시다: “우리가 잔디를 젖게 만든다면, 비가 왔을 확률은 얼마인가?” 우리는 확률의 구문으로 우리의 질문을 표현할 수 없습니다. 왜냐하면 수직 막대는 이미 “~를 본다는 조건 하에”라는 의미로 사용되고 있기 때문입니다. 우리는 ’do’라는 새로운 기호를 발명할 수 있고, 막대 뒤에 do를 볼 때마다 “우리가 ~를 한다는 조건 하에”로 읽을 수 있습니다 - 그러나 이것은 확률의 규칙이 이 새로운 읽기에 적용되지 않기 때문에 우리의 질문에 대한 답을 계산하는 데 도움이 되지 않습니다. 우리는 직관적으로 답이 무엇이어야 하는지 알고 있습니다: P(Rain). 왜냐하면 잔디를 젖게 만드는 것은 비가 올 확률을 변경하지 않기 때문입니다. 그러나 이 직관적인 답변과 이와 유사한 다른 답변들이 직관이 실패할 때 우리의 생각을 위로할 수 있도록 기계적으로 도출될 수 있을까요?

대답은 예이며, 새로운 대수학이 필요합니다. 먼저, 우리는 “우리가 ~를 한다는 조건 하에”라는 새로운 연산자에 기호를 할당합니다. 둘째, 우리는 이 새로운 기호를 포함하는 문장을 조작하는 규칙을 찾습니다. 우리는 수학자들이 표준 대수학의 규칙을 찾은 방식과 유사한 과정을 통해 그것을 수행합니다.

당신이 16세기의 수학자라고 상상해 보세요. 당신은 이제 덧셈의 대수학 전문가이고, 하루 종일 숫자를 자신에게 더하는 데 지쳐서 새로운 연산자, 곱셈을 도입할 급박한 필요성을 느낍니다[44]. 당신이 가장 먼저 하는 일은 새로운 연산자에 기호를 할당하는 것입니다: 곱하기. 그런 다음 연산자의 의미로 내려가서 그 변환 규칙을 추론할 수 있습니다. 예를 들어: 곱셈의 교환 법칙은 그런 방식으로 추론될 수 있습니다. 결합 법칙 등이 있습니다. 우리는 이제 이 모든 것을 고등학교에서 배웁니다.

정확히 같은 방식으로, 우리는 새로운 기호를 지배하는 규칙을 추론할 수 있습니다: do(·). 우리는 보는 것에 대한 대수학을 가지고 있습니다 - 즉, 확률 이론. 우리는 새로운 옷을 입고 매우 명확한 의미를 가진 새로운 연산자를 가지고 있으며, 이것은 수술 절차에 의해 우리에게 주어집니다. 추론의 문이 열려 있고, 그 결과는 다음 슬라이드[45]에 주어져 있습니다.

놀라지 마세요. 저는 당신이 지금 이 방정식들을 읽기를 기대하지 않습니다. 하지만 당신은 이 새로운 계산의 맛을 느낄 수 있을 것이라고 생각합니다. 그것은 행동과 관찰을 포함하는 표현을 다른 유형의 표현으로 변환할 수 있게 해주는 세 가지 규칙으로 구성됩니다. 첫 번째는 무관한 관찰을 무시할 수 있게 해주고, 세 번째는 무관한 행동을 무시할 수 있게 해줍니다. 두 번째는 행동을 같은 사실에 대한 관찰로 교환할 수 있게 해줍니다. 오른쪽에 있는 기호들은 무엇인가요? 그것들은 변환이 합법적일 때마다 다이어그램이 우리에게 주는 “녹색 신호”입니다. 우리는 다음 예제에서 그것들이 작동하는 것을 볼 것입니다.

이것은 강의의 세 번째 부분으로 우리를 인도합니다. 여기서 저는 지금까지 제시된 아이디어들이 실질적으로 중요한 새로운 문제들을 해결하는 데 어떻게 사용될 수 있는지 보여드리겠습니다.

흡연이 폐암에 미치는 영향에 관한 수 세기 동안의 논쟁을 고려해 보세요[46]. 1964년, 미국 공중보건국 국장은 담배 흡연을 사망, 암, 특히 폐암과 연관시키는 보고서를 발표했습니다. 이 보고서는 흡연과 폐암 사이에 강한 상관관계가 발견된 비실험적 연구에 기반했으며, 주장은 발견된 상관관계가 인과적이라는 것이었습니다: 만약 우리가 흡연을 금지한다면, 암 발생률은 대략 오늘날 인구 중 비흡연자들에게서 발견되는 것과 같을 것입니다.

이 연구들은 담배 산업으로부터 심각한 공격을 받았으며, 그들을 지원한 것은 Ronald Fisher 경을 포함한 매우 저명한 통계학자들이었습니다. 그들의 주장은 관찰된 상관관계가 흡연과 폐암 사이에 인과적 연결이 없는 모델로도 설명될 수 있다는 것이었습니다. 대신에, 암을 동시에 유발하고 니코틴에 대한 선천적인 갈망을 생산하는 관찰되지 않은 유전자형이 존재할 수 있다는 것입니다. 공식적으로, 이 주장은 우리의 표기법으로 다음과 같이 작성될 것입니다: P(Cancer | do(Smoke)) = P(Cancer). 이것은 인구가 흡연하게 하거나 흡연을 중단하게 하는 것이 암 발생률에 영향을 미치지 않을 것이라는 의미입니다. 통제된 실험은 두 모델 중 어느 것이 옳은지 결정할 수 있지만, 이러한 실험은 수행하는 것이 불가능하며 (이제는 불법입니다).

이것은 모두 역사입니다. 이제 우리는 양측 대표자들이 만나서 그들의 차이점을 해결하기로 결정하는 가상의 시대로 들어갑니다. 담배 산업은 흡연과 암 사이에 약한 인과적 연결이 있을 수 있다는 것을 인정하고, 보건 그룹의 대표자들은 유전적 요인에 약한 연결이 있을 수 있다는 것을 인정합니다. 따라서, 그들은 이 결합 모델을 그리고, 문제는 데이터로부터 다양한 연결의 강도를 평가하는 것으로 귀결됩니다. 그들은 이 질문을 통계학자에게 제출하고 답변은 즉시 돌아옵니다: 불가능. 즉, 데이터로부터 강도를 추정할 방법이 없습니다. 왜냐하면 어떤 데이터도 이 두 극단적 모델 중 하나에 완벽하게 맞을 수 있기 때문입니다. 그래서 그들은 포기하고 평소처럼 정치적 싸움을 계속하기로 결정합니다. 헤어지기 전에, 한 가지 제안이 제기됩니다: 아마도 우리가 몇 가지 보조 요소들을 측정한다면 우리의 차이점을 해결할 수 있을 것입니다. 예를 들어, 인과 관계 모델(causal-link model)은 흡연이 폐에 타르 축적을 통해 폐암에 영향을 준다는 이해를 기반으로 하므로, 아마도 우리는 표본 개인들의 폐에 있는 타르 축적량을 측정할 수 있고, 이것이 연결 고리를 정량화하는 데 필요한 정보를 제공할 수 있을 것입니다. 양측 모두 이것이 합리적인 제안이라는 데 동의하므로, 그들은 통계학자에게 새로운 질문을 제출합니다: 타르 축적의 중간 측정값이 사용 가능하다고 가정할 때 흡연이 암에 미치는 영향을 찾을 수 있을까요? 통계학자는 좋은 소식을 가지고 돌아옵니다: 그것은 계산 가능하며, 더욱이 그 해결책은 수학적 형태로 닫혀 있습니다. 어떻게 그럴까요?

통계학자는 문제를 받아 고등학교 대수학 문제로 취급합니다: 우리는 가설적 행동 하에서 P(Cancer)를 비실험적 데이터, 즉 행동이 포함되지 않은 표현으로부터 계산해야 합니다. 또는: 우리는 초기 표현에서 “do” 기호를 제거해야 합니다. 제거 과정은 일반적인 대수 방정식 해법과 같이 진행됩니다 - 각 단계에서[47], 다이어그램의 일부 하위 그래프에 의해 허용된 새로운 규칙이 적용되어 결국 “do” 기호가 포함되지 않은 공식으로 이어지며, 이는 비실험적 데이터로부터 계산 가능한 표현을 나타냅니다.

아마도 이 유도가 흡연-암 논쟁을 해결하는지 궁금할 것입니다. 답은 아닙니다. 우리가 타르 축적에 대한 데이터를 얻을 수 있다 하더라도, 우리의 모델은 꽤 단순화되어 있습니다. 왜냐하면 그것은 양측이 동의하지 않을 수 있는 특정 가정에 기반하고 있기 때문입니다 - 예를 들어, 타르 축적에 의해 매개되지 않은 흡연과 폐암 사이의 직접적인 연결이 없다는 것입니다. 그러면 모델은 세분화되어야 할 것이고, 우리는 20개 이상의 변수를 포함하는 그래프로 끝날 수 있습니다. 누군가가 “당신은 이 요소나 저 요소를 고려하지 않았다”라고 말할 때 공황 상태에 빠질 필요가 없습니다. 오히려 그래프는 그런 새로운 아이디어를 환영합니다. 왜냐하면 모델에 요소와 측정을 추가하는 것이 매우 쉽기 때문입니다. 이제 간단한 테스트를 통해 연구자가 그래프를 살펴보고 한 변수가 다른 변수에 미치는 영향을 계산할 수 있는지 결정할 수 있습니다.

다음 예는 오래된 문제가 순전히 그래프적 수단으로 어떻게 해결되는지를 보여줍니다 - 새로운 대수학에 의해 증명됩니다. 이 문제는 조정 문제(adjustment problem) 또는 “공변량 선택 문제(covariate selection problem)”라고 불리며 심슨의 역설(Simpson’s paradox)의 실질적인 측면을 나타냅니다[48].

심슨의 역설은 1899년 칼 피어슨이 처음 발견한 것으로, 두 변수 간의 모든 통계적 관계가 분석에 추가 요소를 포함시킴으로써 역전될 수 있다는 불안한 관찰에 관한 것입니다. 예를 들어, 연구를 실행하여 담배를 피우는 학생들이 더 높은 성적을 받는다는 것을 발견할 수 있습니다. 그러나 나이를 조정하면, 모든 연령 그룹에서 반대가 사실입니다. 즉, 흡연은 낮은 성적을 예측합니다. 부모 소득을 추가로 조정하면, 모든 연령-소득 그룹에서 다시 흡연이 높은 성적을 예측하는 것을 발견하게 됩니다.

마찬가지로 불안한 것은 어떤 요소가 분석에 포함되어야 하는지 누구도 우리에게 말해주지 못했다는 사실입니다. 이러한 요소들은 이제 간단한 그래프적 수단으로 식별될 수 있습니다. 심슨의 역설을 보여주는 고전적인 사례는 1975년 UC-버클리가 대학원 입학에서 성별 편향을 조사받았을 때 발생했습니다. 이 연구에서 전체 데이터는 남성 지원자들 사이에서 더 높은 입학률을 보여주었습니다. 하지만 학과별로 세분화하면, 데이터는 여성 지원자들을 입학시키는 데 약간의 편향을 보여주었습니다. 설명은 간단합니다: 여성 지원자들은 남성보다 더 경쟁이 치열한 학과에 지원하는 경향이 있었고, 이러한 학과에서는 남성과 여성 모두에게 입학률이 낮았습니다.

이 점을 설명하기 위해, 큰 그물망과 작은 그물의 두 가지 그물을 가진 낚시 배를 상상해보세요[49]. 물고기 무리가 배를 향해 헤엄치고 지나가려고 합니다. 암컷 물고기는 작은 그물망의 도전을 시도하는 반면, 수컷 물고기는 쉬운 경로를 시도합니다. 수컷은 통과하고 암컷만 잡힙니다. 최종 포획량으로 판단하면, 암컷에 대한 선호도가 명백히 드러납니다. 그러나 개별적으로 분석하면, 각 그물은 분명히 암컷보다 수컷을 더 쉽게 잡을 것입니다.

또 다른 예는 1970년대 사회과학 문헌에서 다루어진 “역 회귀(reverse regression)”라고 불리는 논쟁을 포함합니다. 우리는 급여 차별 사례에서 동등한 자격을 갖춘 남성과 여성의 급여를 비교해야 할까요, 아니면 동등한 급여를 받는 남성과 여성의 자격을 비교해야 할까요?

놀랍게도, 두 선택은 반대 결론으로 이어졌습니다. 남성은 동등한 자격을 갖춘 여성보다 더 높은 급여를 받았고, 동시에 남성은 동등한 급여를 받는 여성보다 더 자격이 있었습니다. 교훈은 우리가 비교할 때 어떤 변수를 일정하게 유지하기로 선택하느냐에 따라 모든 결론이 극도로 민감하다는 것이며, 그것이 조정 문제가 관찰 연구 분석에서 매우 중요한 이유입니다.

우리가 X가 Y에 미치는 영향, 예를 들어 치료가 반응에 미치는 영향을 찾고자 하는 관찰 연구를 고려해보세요[50]. 우리는 문제와 관련된 많은 요소들을 생각할 수 있습니다. 일부는 치료에 영향을 받고, 일부는 치료에 영향을 미치며, 일부는 치료와 반응 모두에 영향을 미칩니다. 이러한 요소 중 일부는 유전적 특성이나 생활 방식과 같이 측정 불가능할 수 있습니다. 다른 요소들은 성별, 나이, 급여 수준과 같이 측정 가능합니다. 우리의 문제는 측정 및 조정을 위해 이러한 요소들의 부분집합을 선택하여, 우리가 그러한 측정 값이 동일한 대상을 비교하고 평균을 내면 올바른 결과를 얻을 수 있도록 하는 것입니다.

두 개의 후보 측정값 Z₁과 Z₂가 충분한지 테스트하는 데 필요한 단계를 함께 따라가 봅시다[51]. 단계는 상당히 간단하며, 큰 그래프에서도 수동으로 수행할 수 있습니다. 그러나 기계화 가능성을 느끼게 하기 위해, 저는 꽤 빠르게 이 단계들을 진행하겠습니다. 시작합니다[52-56].

이러한 조작의 끝에, 우리는 질문에 대한 답을 얻습니다: “X가 Y와 분리되어 있다면, Z₁과 Z₂는 적절한 측정값입니다.”

이제 이 강의의 중심 메시지를 간략히 요약하고자 합니다. 원인과 결과를 테스트하는 것은 어렵다는 것은 사실입니다. 결과의 원인을 발견하는 것은 더욱 어렵습니다. 하지만 인과 관계는 신비롭거나 형이상학적인 것이 아닙니다. 그것은 간단한 과정으로 이해될 수 있으며, 컴퓨터 분석을 위한 친근한 수학적 언어로 표현될 수 있습니다.

오늘 여러분께 제시한 것은 일종의 포켓 계산기, 즉 수학적 정밀도로 원인과 결과의 특정 문제들을 조사하는 데 도움을 주는 주판[57]입니다. 이것이 인과 관계의 모든 문제를 해결하는 것은 아니지만, 기호와 수학의 힘을 과소평가해서는 안 됩니다[58].

많은 과학적 발견들이 아이디어를 증폭시키고 과학자들이 결과를 소통할 수 있게 해주는 수학적 언어의 부재로 인해 수세기 동안 지연되어 왔습니다. 저는 많은 발견들이 인과 관계를 다룰 수 있는 수학적 언어의 부재로 인해 우리 세기에 지연되었다고 확신합니다. 예를 들어, 저는 칼 피어슨이 1901년에 수학에 인과 다이어그램을 허용했다면 무작위화된 실험 아이디어를 생각해 낼 수 있었을 것이라고 확신합니다.

하지만 정말 도전적인 문제들은 여전히 앞에 있습니다: 우리는 여전히 빈곤과 암과 편협함에 대한 인과적 이해를 갖고 있지 않으며, 오직 데이터의 축적과 위대한 마음들의 통찰력만이 결국 그러한 이해로 이어질 것입니다.

데이터는 모든 곳에 있고, 통찰력은 여러분의 것이며, 이제 주판도 여러분의 처분에 맡겨져 있습니다. 저는 이 조합이 이러한 각 구성 요소들을 증폭시키기를 바랍니다.

감사합니다.

감사의 말

슬라이드 1(뒤러, 아담과 이브, 1504년 판화)은 포그 미술관, 하버드 대학교 미술관, 프랜시스 캘리 그레이 컬렉션에서 윌리엄 그레이의 기증품의 허가를 받았습니다. 사진: 릭 스태포드; 이미지 저작권 © 하버드 대학교 총장 및 연구원, 하버드 대학교. 슬라이드 2(도레, 롯의 탈출) 저작권 윌리엄 H. 와이즈 & 컴퍼니. 슬라이드 3(보드 게임을 하는 네페론페의 이집트 벽화)는 시카고 대학교 동양학 연구소의 허가를 받았습니다.

다음 이미지들은 Bernard Quaritch, Ltd.(런던)의 허가를 받아 고서적 카탈로그에서 복제되었습니다: 슬라이드 4, 5, 6, 7, 8, 9, 15, 27, 31, 36, 37, 38, 40, 42, 58.

슬라이드 10과 11은 The Courier Press의 저작권입니다. 슬라이드 13과 14는 I. Bernard Cohen의 The Album of Science에서 Macmillan Library Reference USA의 허가를 받아 재인쇄되었습니다. 저작권 © 1980 Charles Scribner’s Sons.

슬라이드 16은 캘리포니아 주립 대학교 롱비치 도서관의 허가를 받았습니다. 슬라이드 20과 22는 Cambridge University Press의 허가를 받아 재인쇄되었습니다. 슬라이드 25: 사진 저작권 A. C. Barrington Brown, 허가를 받아 복제되었습니다.

슬라이드 30: S. Wright(1920)의 Proceedings of the National Academy of Sciences, vol. 6에서; 미국 철학 학회와 시카고 대학교 출판부의 허가를 받아 복제되었습니다. 슬라이드 57은 Vandenhoeck & Ruprecht와 MIT Press의 허가를 받아 재인쇄되었습니다.

참고: 슬라이드 19, 26, 28-29, 32-35, 43-56의 컬러 버전은 !http://www.cs.ucla.edu/~judea/에서 다운로드할 수 있습니다.

Back to top

This work © 2025 by Sungkyun Cho is licensed under CC BY-NC-SA 4.0