基于關聯數據的數字人文實踐:上海圖書館的探索 講者:夏翠娟/ 上海圖書館
圖書館為何要進行數位人文的研究?講者引用了數位人文新書中的觀點:數位人文是現代化圖書館未來的發展方向。上海圖書館在過去20年中,進行數位圖書館的建設,將紙本的文獻數位化,為讀者提供搜尋與瀏覽的相關服務,並藉由數位化對這些檔案進行長期的保存。
在這個信念下,圖書館開始著眼於開發數位人文的工具。基於內容分析和知識組織,運用數位化的邏輯來組織資料,用科學研究的方法,提供人文研究的工具與服務。
就圖書館來看,數位人文可以區分為兩大區塊,包括了技術與數據。前者包括了大數據 (BIG DATA)、SNS、雲端運算、語意網;而後者則涵蓋了知識單元的細微化,知識組織的語意化,知識呈現的視覺化。
上海圖書館從人、事、時、地、物透析文獻檔案,從中繼資料記錄中提取知識。基於互聯網的規範控制,對資料進行重新組織,發布為關聯數據,為讀者提供新的服務。
舉例而言,如胡適家族的遷徙路線,從上川明經胡氏宗譜來解析,過去研究者必須在字字句句中進行閱讀,但若透過電腦提取遷徙的相關資訊,如:人物、時間、始發地與目的地,把四個元素拉出來,將知識的概念抽取出來,成為本體。便成為了電腦可自動讀取與理解的格式。
將遷徙事件語意化,讓數據可視化,當遷徙圖在螢幕上展示出來,便可從文獻檔案中牽引出精彩的身世故事。如從胡適家譜中,對資料進行分析後,在世系表中找到男性成員8915人、配偶4733人,對姓氏進行比對後,溯及源頭,尋找證據便能多一分證據,考證胡適是否為李唐皇室的後代。
夏翠娟在演講中提到:「圖書館員不一定要進行評判,而是將資料中的信息,如實地展現出來。」而上海圖書館的家譜平台在上線後也積極地運用社群網絡,在群組中進行討論、交流,讓使用者得以在系統上進行評註與資料修改。未來也將更進一步讓使用者可以上傳自己的家譜。
夏翠娟認為:「關聯數據天生就是為了開放而生。」上海圖書館也曾經舉辦競賽,推動資訊與歷史人文研究者的更進一步互動和交流,讓更多人得以參與檔案的活化與再生。
上海圖書館作為公共圖書館,積極地為人文研究建設環境,將數位檔案開放出來,讓過去少數人從事的研究能夠更為普及,讓一般大眾也能來做人文研究。其出發的理念便是希望填補專業人員與普通老百姓之間的信息鴻溝。在實踐數位人文的歷程中,將檔案精緻化、概念化、本體化、語意化、可視化,便產生了許多有趣的故事可以進一步考究,讓知識更為普及,也讓更多人得以走入歷史研究裡。 | http://newsletter.ascdc.sinica.edu.tw/file/file/130/13035.jpg