심리역사학과 파운데이션, 빅 데이터

2017. 12. 23. 05:31in Teamplay/세상의 힘에 관해



1. 심리역사학 Psychohistory  

아이작 아시모프의 SF소설 파운데이션에 등장하는 가상의 학문입니다. 몰락해가는 은하제국의 해리 셀던이라는 수학자가 창시한 학문으로 인간집단의 행동을 예측할 수 있는 학문이라고 등장합니다. 은하제국의 피할 수 없는 몰락 이후의 수만년의 혼돈을 단 1천년으로 줄일 수 있는 이론적인 학문으로 등장하죠. 다만 셀던은 이 학문이 '적절한 초기조건'을 얻을 수 없어서 카오스적 요소를 제거할 수 없다고 여겨 포기하고 있다고 나오죠.
다만 이 연구를 눈여겨보던 제국의 수상 '에토 데머즐'의 계획과 후원으로 해리 셀던의 심리역사학이 완성되고, 향후 1000년을 이끌어갈 '파운데이션 계획'이 수립됩니다.
세세한 가지들에 대한 언급을 하기에는 스토리도 방대하고 다루기 힘든 면도 있지만, (무엇보다 읽었던 판본이 구판본 - 현대정보문화사라서 순서 및 번역, 가독성이 최저였던듯...) 지금의 이야기에 집중하기 위해 '셀던 계획'이 가능하게 되는 배경을 이야기 해볼까 합니다.
해리 셀던이 심리역사학을 포기했던 이유는 '적절한 표본'을 찾지 못해서라고 말합니다. 서로 거리가 떨어져 있는 수많은 행성의, 행성마다의 특성과 문화들을 이해할 수 없는 상황에서 어떻게 그 표본을 찾을 수 있겠느냐는 반문을 하면서 말이죠.
하지만 그의 연구에 관심을 갖고 있던 (무한에 가까운 수명을 지니고 있던) 에토 데머즐의 채찍과 당근 전법은, 셀던에게 하나의 행성에 수많은 문명을 지니고 있던 제국 수도 '트랜터'에서 적절한 표본을 찾는, '데이터 수집'이 가능하다는 사실을 깨닫게 합니다. 이는 곧 '심리역사학'의 실제화와 이를 통한 '파운데이션'의 건립으로 이어집니다. 



2. 빅 데이터, AI, 머신러닝 

근래 들어 '빅 데이터 Big Data'라는 개념이 언급되어지고 있습니다. 원래는 빅 데이터 프로세싱이라 불리는, 경제가치를 창출해 낼 수 있는 설문조사 결과 모음을 돈이 될 만한 것을 뽑아내는 기술로 정의되는 되죠. 요즘은 경제 분야를 뛰어넘어 사회 전반적인 데이터와 그로 인해 가치를 창출해내는 기술을 의미하는 것으로 바뀌고 있습니다.
현실 사회에서 빅 데이터의 쓰임은 현실가치에 맞게 진행되고 있습니다. 제조업, 의료, 서비스업 등 이전과 다른 수준의 정보량을 분석해냄으로 프로세스의 개선을, 발생되고 있는 일에 대한 기민한 대응을, 행동과 리스크를 예측하여 동향을 만들어내는 것이죠.
이 부분에서 기계의 학습적인 면을 강조하는 것이 'AI 인공지능'이라는 분야입니다. 한국 사회에서는 이세돌과의 바둑대결로 유명한 '알파고'가 있고, 이와 함께 딥러닝, 머신러닝 등의 인공지능 학습에 대한 이야기와 방법들이 소개되었습니다. 이 인공지능 학습의 경우도 일반적으로 빅 데이터를 기반으로 학습을 하는 것을 말합니다. 




3. 빅 데이터와 심리역사학 

소설 파운데이션에 등장하는 심리역사학은 빅 데이터의 방법과는 모양이 좀 다릅니다. 다만 제가 주목하고 싶은 부분은, 수도 '트랜터'에서 전 우주의 그것과 유사한 수준의 다양성을 지닌 문명을 만난 후 심리역사학을 실현한 해리 셀던의 '가능성'이 무엇이었을까 싶습니다. (이에대한 힌트는 '6권 파운데이션의 서막'에 심화는 '7권 파운데이션을 향하여'에 나와있습니다.) 그리고 저는 이것이 오늘날 말하는 빅 데이터와 유사할 것이라 생각합니다.
아직 현 시점에서는 역사적인 상황, 문명적인 요소들을 계수 - 데이터화 할 수 있는 수단이 없습니다. (혹은 없다고 알고 있습니다) 만약 이 영역이 가능하다면 심리역사학의 첫 발을 뗄 수 있겠죠. 공간-문명의 특성값과 시간, 시대값, 거기에 변수로 잡힐 많은 요소들(지도자 성향, 종교, 경제, 정치체제, 교육수준 등등)이 (수학적) 데이터화 되어 계산이 가능해진다면, 앞으로의 미래 예측도 확률적으로 가능해 질 것입니다. (파운데이션에서 해리 셀던이 계산기와 통계값으로 이야기하죠) 실은 그게 어느정도 가능하기 때문에 컴퓨팅과 별개로 '미래학자'라는 직업이 존재하는 것이기도 하겠습니다.
어쩌면 이 부분이 '인간'과 '기계'가 구분되는 지점이 될 수도 있겠다는 생각을 합니다. (강AI, 약AI라는 말도 있고, 뇌과학 측면에서 두뇌의 시냅스를 이야기하는 경우도 있습니다. 과연 전류적 흐름만으로 인간의 두뇌활동을 설명 할 수 있을까요? 어쩌면 우리는 아주 중요한 함수를 빼놓고 현상을 바라보는 것일수도 있겠다는 생각을 합니다. 이 문제는 차후에 다시 얘기해보는 것으로 하고...) 사람은 매 순간 발생하는 돌발변수를 적절한 수준과 가치의 기준에 기대어 판단하고 정리할 수 있는 능력을 지니고 있습니다. 매 순간 발생하는 '다양한 변수'가 핵심입니다. 이 다양한 변수에서 한두가지를 규칙화해 시뮬레이션하거나. 고도화하는 것이 우리가 말하는 '게임'입니다.
모두가 게임을 즐길 수 있는 이유는 이 변수가 제한되어 있고, 변수를 '규칙 rule'이라는 형태로 따르게 하기 때문입니다. 이 규칙을 뛰어넘는 행동이 '결격사유 - 반칙'으로 간주되기 때문에 안심하고 즐길 수 있는 것이죠. 규칙을 모르는 사람의 경우는 게임에 참가, 관전할 수 없다는 것도 특징 중에 하나입니다. - 현재 AI, 빅 데이터 기술에 대한 두려움은 이 규칙이 일반화, 체계화 되지 않은 이유가 크다고 봅니다.



4. 인간과 기계의 차이 

알파고가 현재 나와있는 가장 복잡한 턴 turn제 게임인 '바둑'에서 사람을 뛰어넘을 수 있었던 이유 또한 바둑만의 제한된 공간과 규칙이 존재하기 때문입니다. 그리고 그 룰이 한정되어 있고, 적절하게 통제될 수 있는 수준의 게임이라면 시간이 걸릴 수는 있겠지만 사람은 모든 게임에서 기계에게 패할 수 밖에 없을 것입니다. 인간의 속도는 기계의 속도에 밀릴 수 밖에 없기 때문입니다. (기계는 연산에 최적화 되도록 설계되었기 때문입니다.) 
하지만 그 룰과 다양성이 지나치게 복잡한 상황이라면 어떨까요. 한 인간의 삶도 변수의 연속인데, 그 군집은 어떨까 싶습니다. 인간의 앎(연산)은 배움, 적용, 거부와 수용의 형태로 반복되며, 이것이 끊임없이 되새김질 되는 형태를 띄고 있습니다. (어제 배운 것이 오늘 새롭게 다가오는 것이 인간의 가치 배움의 특징이죠) 오늘 한가지 주제만으로 앎이 추가 되는 것이 아니라 그 주제에서 파생되는 수많은 가지들에서 가치를 찾아내는 작업들을 진행하죠.
인간이 그 변수의 다양성을 입력해주지 않는 이상, 혹은 기계가 그 변수 특이점을 분석해내고 학습해내지 않는 이상 인간과 기계는 분명 차이점을 보일 수 밖에 없을 것입니다. 그 변수 특이점을 발견해내지 못하는 이상 AI는 '경제'나 '과학'분야에 한정된 시뮬레이션을 진행할 수 밖에 없을 것입니다. (물론 경제와 과학 분야는 막강한 힘이 있기 때문에 무시할 수 있는 수준의 무엇이 아닙니다. 때문에 이 두 분야만 충분히 통제된다면 개인의 삶은 통제하고자 하는 '그것'에 끌려다닐 수 밖에 없습니다.) 
물론 이를 보완하기 위해 데이터 마이닝 Data Mining 기법에서 비정형 데이터 Unstructured Data 처리에 대한 고민과 연구들이 진행되고 있습니다. 자율주행, 영상 분석, 필기체 인식 등이 대표적인 예가 되겠습니다. 하지만 어떤 (명화)그림을 보거나 한 시간짜리 드라마를 보고 그것을 설명하는 사람의 생각 및 반응과 그것을 타인에게 소개하는 방법이 100이면 100 모두 다르다는 점은 염두에 둘 필요가 있겠습니다. 




5. 예측능력과 빅 데이터, 기술의 발전 

거듭말하지만 아직까지 AI 혹은 빅 데이터는 인간 지식에 대한 보완재적 성격을 띄고 있습니다. 에드워드 홀의 말에 따르자면 '도구는 인간의 확장체(extension - 연장물이라고 번역되어 있음)'입니다. 마셜 맥루한도 '미디어'를 비슷한 의미로 이야기했죠. 개념이나 프로세스에 따라서 확장물 이상의 밀접도로 간주되기도 하지만 여기서 '확장체'라는 말의 의미를 정확히 알 필요가 있습니다.
프로그램에 기능을 추가하는 작은(?) 프로그램을 익스텐션이라고 하죠. 다양한 분야에서 외국어 표기 Extension 익스텐션은 한국어로 적당히 번역할만한 개념이 아닙니다. 다만 확실하게 정리할 수 있는 것은 익스텐션을 사용하기 위해서는 그것의 모체가 필요하다는 말이죠.
AI가, 빅 데이터가 보다 큰 영향력을 끼치기 위해서는 이 기술 자체가 모체가 되어야 합니다. 아직 인간의 통제와 방향제시가 필요한, 인간 지성의 확장체 또는 단순한 고속연산 및 분류 도구로 사용되는 한 기술자체의 해악은 존재하지 않는다고 볼 수 있습니다. 그것을 이용하는 사람의 문제가 있는 것이겠죠. (역시 이 부분 또한 철학적 물음이... ^^;)
딥러닝, 머신러닝 등을 통한 학습체계는 '분류'를 시도하는 방법입니다. 효율적인 분류, 쓸만한 경험치를 얻어내는 분류에 해당하며, 위에서 언급한 '거시-종합적 변수'를 학습할 수 없는 한 효율높은 자폐인 수준에 불과할 것 이라는 생각을 합니다. - 이게 더 무서운 것일지도 모르겠습니다만.

다만 알파고 이후 바둑의 판도가 바뀌었다고 말하는 것처럼, 빅 데이터를 통한 업무 흐름의 변화와 문제점 개선 등이 일어나는 것처럼 인간 사회에 새로운 깨달음 insight를 줄 수 있는 것은 확실합니다. 비좁은 물리적인 시·청각적 요소에서, 보다 넓어진 매스미디어 요소에서, 더 큰 데이터, 전체에 가까운 데이터는 객관적 요소의 개념을 뒤바꿔버릴 수 있는 요소가 될 테니까 말입니다. 




'in Teamplay > 세상의 힘에 관해' 카테고리의 다른 글

투표율에 대한 오해와 고착  (0) 2014.06.02
선거철의 세가지 거짓말  (0) 2014.04.22
세대유감  (0) 2013.02.26
복지를 위한 복지?  (0) 2011.01.24