(한국학분야 토대연구지원사업, 2016-2019, 조선시대 유서 관련 지식 DB 및 지식지도 구축, 책임자: 박종천)
박종천(고려대 민족문화연구원 부교수)
유서는 다양한 지적 관심의 방식과 맥락 및 양상이 복합된 집성물로서 지식의 구조와 역사적 지층을 잘 보여준다. 따라서 지식이 구성되는 방식과 맥락의 구조를 분석하는 지식학적 접근과 지식의 범위, 성격, 변동 등을 역사적으로 고찰하는 지식사적 접근이 가능하다. 그동안 유서에 대한 연구는 유서의 정의, 성격, 유형 분류와 조선 유서의 특징을 다루는 연구와 더불어 지봉유설, 오주연문장전산고, 대동운부군옥 등 개별 유서의 다양한 주제와 소재를 검토하는 학제적 연구들을 중심으로 전개되었다. 그러나 유서 지식의 특성을 고려하여 개별 유서의 한계를 넘어서서 다양하고 방대한 주제와 소재의 유서 지식을 주제를 포괄적으로 분석하고 체계적으로 해석할 만한 지식학 혹은 지식사적 접근은 미흡했다. 이러한 접근을 위해서는 유서지식을 디지털 인문학으로 재구성하는 방법론적 혁신이 필요하다.
고려대 민족문화연구원은 조선시대 전자문화지도(Electronic Cultural Atlas), 한국근대 전자역사지도, 현대 한국어 용례 검색을 위한 물결21 코퍼스 분석 등을 비롯하여 21세기 디지털인문학을 선도해 온 전통의 토대 위에서, 방대한 지식을 집성하고 분류하며 재구성하는 유서류 지식의 특성을 충분히 고려하되, 지식의 범위, 성격, 변동을 비교 검토할 수 있는 시범사업으로서 디지털인문학의 새로운 접근을 통해 다양한 주제어와 연관정보들을 연결한 지식DB의 구축과 그 관계 양상을 시각화하는 지식지도의 시각화를 시도하고 있다. 특히 주제어와 연관어의 의미론 혹은 구문론적 연관관계가 보여주는 지식의 구조와 관심의 맥락을 분석하는 지식학적 접근과 더불어, 주제어 및 연관어가 출현하는 시간, 공간, 출전, 메타정보 등을 다양한 방법으로 연관지어 지식의 범위, 성격, 변동 등을 역사적으로 추적할 수 있는 지식사적 접근을 진행하고 있다.
본 사업은 이런 접근을 위해 유서 지식 범위의 포괄성과 시기별 균분성을 고려하여 대동운부군옥, 지봉유설, 성호사설, 오주연문장전산고, 만국사물기원역사 등 16세기부터 20세기까지 시기별로 조선의 대표적인 유서 5종을 대상으로 유서 지식 DB를 구축하고 그것을 시각화하는 시범사업으로서 3단계로 진행중이며, 올해 8월에 완료될 예정이다.
1단계에서는 유서의 문헌학적 조사 및 지식학적 분석을 근간으로 유서 자료(Resource)를 수집, 조사, 분석하여 2만개 이상의 주제어(Topic)를 추출하고, brat을 활용하여 중요 어휘에 tagging 작업을 하되, 지식의 분류체계를 적용하고 주제어(Topic)와 연관어(Related Word)의 연관관계(Association)를 중심으로 유서 지식의 범위, 성격, 변동을 살필 수 있도록 유서의 주제어 출현 정보(Occurrence)와 인용 정보(시간·공간·인명·서명 등)를 포함하는 20,000개 이상의 ‘주제어 DB’(Topic DB)를 구축한다.
2단계에서는 지식의 범위, 성격, 변화를 보여주는 지식학적 연구 가치, 자료적 중요성과 보편성, 분류체계의 균형과 분야별 대표성을 기준으로 중요한 핵심주제어 1,000개를 추출하여 지식의 맥락을 초점명제로 재구성하고 연관된 정보들을 고도화시킨 ‘주제어 초점 DB(Topic Focus DB)’를 구축한다.
3단계로는 위의 DB들을 주제어 지도(Topic Map)와 주제어 초점 지도(Topic Fous Map) 등 2종의 지식지도(Knowledge Map)로 시각화하는 한편, 유서 지식을 주제어와 연관어의 상관관계와 함께 시간, 공간, 인용 서명, 관계 인물 등을 기준으로 공기어(共起語) 네트워크의 연결 정도를 수량화하여 시대별, 유서별로 비교함으로써 유서 지식의 변화 추이를 추적할 수 있는 18만여개 가량의 지식 지형도(Knowledge Topography)로 시각화하는 작업을 진행한다. 아울러 유서의 다양한 지식이 검색 가능하도록 주제어 네트워크를 검색하고 시각화할 수 있는 효율적 지식 검색 시스템을 구현하는 홈페이지를 구축한다. 이러한 시각화 작업은 지식이 주제어와 연관어의 구문론적 관계에서 초점명제화될 수 있는 다양한 맥락에서 구성되는 양상과 더불어, 시간, 공간, 인물, 서명 등과 연관된 다양한 지식의 연원, 특성, 변화 양상을 추적하거나 비교할 수 있게 해준다.
이러한 지식 DB 및 지식지도가 구현되는 홈페이지가 완성되면 한국학진흥사업단과 민족문화연구원 홈페이지를 통해 다양한 지식의 집성과 분류 및 재구성이 이루어진 조선시대 유서 지식의 연원, 범위, 특성, 재구성, 변화를 중심으로 지식학적 관심의 맥락과 지식사적 변화 양상에 대한 다양한 가설의 단서를 발견할 수 있는 학술적 기반이 제공될 것으로 예상된다. 본 연구는 백과사전적 지식의 특성을 지닌 유서 지식의 특성을 고려하여 지식의 분류체계, 주제어와 연관어의 연관관계, 출현 정보, 인용 정보 등을 포괄하는 온톨로지를 적용하여 다양한 지식지도를 시각화함으로써 온톨로지 구글 트렌드나 엔그렘 뷰어보다 한층 진전된 방식을 선보일 것으로 기대된다. 본 사업은 유서의 특성에 맞는 새로운 디지털인문학적 접근을 시도한 시범사업으로서 의의를 지니지만, 한정된 시간과 예산 및 인력의 한계로 인해 3년간 총5종 132권 분량의 유서 원문 가공, 지식DB 구성, 지식지도 시각화, 검색엔진을 갖춘 홈페이지 구축 등을 진행하였다. 이러한 지식DB와 지식지도가 가설 구성을 넘어서서 검증의 효과적인 토대로서 발전하기 위해서는 향후 더 많은 유서들을 포함한 빅데이터로 사업의 범위를 확대하여 디지털인문학을 적용한 21세기판 유서사업으로 전개할 필요가 있다.