[해외 DS] 파이 속에 숨겨진 셰익스피어, 무한한 소수에 담긴 모든 가능성

160X600_GIAI_AIDSNote
파이(원주율)는 완벽한 원을 지배하는 무질서한 수다
정규수를 찾는 것은 흔한 일이며, 파이도 정규수일 가능성이 높아 
파이가 정규수라면 셰익스피어의 작품, 미래에 일어날 일, 그리고 상상할 수 있는 모든 정보가 파이의 소수점 아래 어딘가에 담겨 있어

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.


Does_Pi_Contain_All_Of_Shakespeare_ScientificAmerican_20240319
사진=Scientific American

모든 원은 지름보다 원주가 약 3배 더 길다는 특성을 공유한다. 더 정확하게 말하면 원주율은 3.14159로 지름보다 원주가 파이(pi) 배 만큼 크다. 원은 가장 기본적인 도형이기 때문에 이를 지배하는 수인 파이는 수학계 전반에 걸쳐 그 존재감을 드러낸다. 또한 파이의 소수점은 4분의 1(0.25)처럼 끝이 나거나 3분의 1(0.33333…)처럼 반복되지 않는 무리수다. 따라서 이처럼 완벽한 대칭을 이루는, 한때 신성한 도형으로 여겨졌던 원이 파이처럼 무질서하고 비정상적인 수에 의존한다는 사실이 놀랍게 느껴질 수도 있다. 아니면 “왜 우주는 가장 단순한 모양에 3과 같은 일반적인 비율을 선택하지 않았을까”라는 의문이 들 수도 있다.

무작위 속에 담긴 모든 가능성, 파이는 정규수일까?

사실 수학자들은 구어적 의미와 기술적 의미 모두에서 파이가 정규수(normal number)라고 믿는다. 앞으로 살펴보겠지만, 정규수는 기괴하면서도 평범한 숫자다. 10진수의 숫자가 영원히 계속되는 수열이 있다고 상상해보자. 이것이 정규수라면 각 숫자(0, 1, 2…. 9)가 똑같은 빈도로 나타난다. 또한 가능한 두 자리 조합(00, 01, 02…. 99)도 똑같은 빈도를 가진다. 따라서 직관적으로 일반 숫자에서 무작위로 한 자리를 선택하면 7이 될 확률은 10의 1, 0이 될 확률도 10의 1이고, 연속된 두 자리를 선택하면 63 또는 다른 두 자리 수열이 될 확률은 100분의 1이어야 하는 것이다.

이러한 패턴은 세 자리 조합, 네 자리 조합 등에도 적용되는데, 균일 분포에서 오는 무작위성 덕분에 정규수는 이론적으로 가능한 모든 수열을 포함할 수 있다. 다시 말해, 숫자를 문자로 바꾸면 숫자열 어딘가에는 특정 노래의 가사나 책의 전체 텍스트, 심지어 미래에 대한 예언까지도 포함될 수 있다. 더 구체적으로는 01은 ‘a’, 02는 ‘b’로 번역해 모든 문자와 문장 부호에 고유한 두 자리 숫자를 지정하는 암호화 방식이다. 또한 160905를 ‘pie’로 인코딩하는 것과 같이 연속된 숫자 문자열로 단어를 지정하는 것도 가능하다. 이러한 설정으로 정규수는 작성되었거나 작성될 수 있는 가능한 모든 경우의 텍스트를 포함할 수 있는 것이다.

따라서 파이의 소수점 이하의 무한 수열이 정규수라면 그 어딘가에는 비욘세의 모든 가사, 이 기사의 사본, 내일 일어날 일에 대한 자세한 설명, 지금까지 나눈 모든 대화, 셰익스피어의 모든 작품이 그대로 담겨 있다. 물론 찾고자 하는 텍스트가 길수록 소수점 이하를 지나 더 멀리 검색해야 할 가능성이 높다. 예를 들어 02011804로 인코딩된 ‘bard’라는 단어는 8,200만 자리가 넘는 원주율에서 처음 나타난다. 전체 희곡은 말할 것도 없고 소네트 한 편을 찾으려면 상상할 수 없는 깊이로 뛰어들어야 한다. 하지만 원주율 소수점은 무한대로 이어지기 때문에 로미오와 줄리엣의 대사를 찾는 일은 시간의 문제일 뿐, 불가능의 영역이 아니다.

하지만 소수가 무한하고 반복되지 않는다고 해서(즉, 무리수라고 해서) 그 숫자가 반드시 정규수로 분류되는 것은 아니다. 예를 들어 0.01001000100001…과같이 1과 1 사이에 있는 0의 숫자가 계속 늘어나는 소수점 이하 숫자를 생각해 보면, 이 수열은 영원히 계속되고 반복되는 루프에 빠지지 않지만, 단순한 숫자 ‘7’과 ’11’은 절대 나타나지 않는다. 현재 수학자들은 파이가 정규수라는 것을 증명하지 못한 상태다. 이론적으로 숫자는 정규수에서 요구하는 것처럼 모든 문자열이 똑같은 빈도로 나타나지 않고도 모든 텍스트를 포함할 수 있기 때문이다. 이를 불연속성(정규성보다 약한 조건)이라고 부르는데, 파이가 불연속적인지도 알지 못하고 있다.

무한 원숭이 정리, 타자기로 쓴 셰익스피어

실제로 파이에서 어떤 한 자릿수가 무한히 여러 번 나타나지 않을 수도 있다. 우리가 아는 한, 4조 번째 숫자 이후에는 5가 다시는 파이에 나타나지 않을 가능성이 있다. 수조짜리의 파이에 대해선 정규성에 부합하는 통계적 검증 결과가 존재한다. 하지만 유한한 수로 테스트한 결과이기 때문에 정규성을 증명했다고 주장할 수는 없는 단계다. 이렇듯 특정수에 대해 정규성을 증명하는 것은 매우 어려운 일이다. 인류는 몇 가지 구체적인 예만 알고 있는데, 가장 간단한 예가 바로 챔퍼나운 수다. 이 숫자를 만들려면 소수점 뒤에 오름차순으로 모든 정수를 연결하기만 하면 된다:

.12345678910111213…

챔퍼나운 수는 우스꽝스럽지만, 특정 숫자가 정규수임을 가장 먼저 증명한 예 중 하나이며, 이 증명마저도 간단하지 않다. 그런데도 수학자들은 파이, 오일러의 수(e), 2의 제곱근, 그리고 많은 사람이 좋아하는 대부분의 다른 무리수가 정규수라고 전제한다. 정규수의 이상한 속성과 우리가 아는 구체적인 예가 거의 없다는 점을 감안할 때, 왜 수학자들은 파이가 정규수라고 의심할까? 평범하지만 놀라운 사실은 거의 모든 숫자가 정규수라는 것이다. 눈을 감고 숫자 선의 한 점을 무작위로 고른다면, 정규수(따라서 셰익스피어를 모두 암호화하는 수)를 선택할 확률은 100%다. 일반적으로 우리는 100% 확률을 “반드시 일어날 것”이라고 생각하지만, 무한 집합을 다룰 때는 이 의미가 무너진다. 물론 743과 같은 정수나 ⅘과 같은 정규수가 아닌 것을 선택할 수도 있지만, 정규수의 밀도(무한대)는 그러한 가능성을 완전히 압도하기 때문에 확률을 100%라고 부르는 것이 적절하다.

이 모든 것은 원숭이가 타자기로 무작위로 타이핑을 하면 결국 셰익스피어의 작품이 나온다는 유명한 사고 실험 ‘무한 원숭이 정리’와 비슷하다. 다시 말하지만, 원숭이들이 맥베스의 1막을 끝내기까지 영겁을 기다려야 할지도 모르지만 영겁은 무한대 앞에서 티끌에 불과하다. 숫자 선에서 한 점을 고르는 것과 타이핑하는 원숭이 두 가지 비유 모두 정규수가 임의의 숫자 문자열처럼 작동한다는 점을 암시한다. 0에서 9까지의 숫자가 포함된 10면 주사위를 무한히 굴려서 그 결과를 기록하면 정규수가 나오는 것과 같은 맥락이다. 숫자의 연속체 대부분은 이 정적 노이즈에 따른 혼란스러운 정규수로 채워져 있으며, 우연히도 가끔 일관된 질서를 엿볼 수 있게 된다. 우리에게 익숙한 743과 같은 정수와 ⅘과 같은 분수는 예외적인 이상값이라고 할 수 있다.

우리는 철학적 질문으로 시작했다. 단순하고 대칭적인 원이 왜 파이처럼 무질서한 상수의 지배를 받는 것일까? 이 수수께끼에 대한 한 가지 대답은 그 사실이 실제로 우리를 전혀 놀라게 하지 않아야 한다는 것이다. 파이가 정규수일 가능성이 높으며, 자연에서 정규수를 찾는 것은 건초더미에서 건초를 찾는 것만큼이나 흔한 일이기 때문이다.

영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.