兩岸三地的文學資料庫
文學研究的良窳,取決研究者能否掌握豐富的文本與文學史料,在資訊時代,特定領域的文學研究是否能夠有突飛猛進的發展,往往仰賴建構完善的文學資料庫。隨著掃描、辨識、系統及全文檢索軟體的逐步成熟,文學的數位資料從圖片資料庫,發展到目錄、摘要乃至全文收錄的資料結構。過去多半是單機版光碟,如今以網路資料庫的形式呈現,甚至以互動結構的WEB2.0乃至3.0形式設計,大幅降低設計的費用,更方便使用者檢索、調閱、閱讀與分享。
由於沒有著作權問題的困擾,有規模的文學資料庫多半是古代文獻,中央研究院自1984年7月開展「史籍自動化計畫」,領先兩岸三地,陸續建成十餘個古籍資料庫,並逐步在網際網路上開放。大陸與香港其後也急起直追,舉凡甲骨文全文、竹簡帛書出土文獻、金文全文乃至四庫全書均有各式各樣的資料庫問世,相形之下現代、當代文學資料庫的發展真是瞠乎其後。
現當代華文文學研究資料庫的建構上,國立台灣文學館一直相當用心經營,最便捷的查詢管道是利用該館「電子資源整合查詢系統」,可以使用:智慧型全台詩知識庫、文學文物典藏系統、台灣作家作品目錄系統、台語文數位典藏資料庫、台灣文學辭典、台灣文學年鑑檢索系統、台灣文學研究學報資料庫、台灣文學館通訊資料庫、台灣現當代作家研究資料庫,以及許多日據時代的報刊資料庫。
在香港方面,香港中文大學中國語言及文學系與大學圖書館系統聯合展開的「中國現代文學研究網站」、「香港文學資料庫」,都有相當翔實的內容,特別是後者,以盧瑋鑾捐贈的資料建構而成,既有豐富的作品與評論史料,又依照盧瑋鑾教授的史觀與史識綱舉目張,造福了華文文學研究社群。
中國大陸的中國國家數位圖書館也正在建構規模宏偉的現代文學文獻,其中民國時期文獻(1911-1949)數位化資源庫中的「民國專欄」,以國家圖書館館藏1949年以前的現代書刊與期刊為基礎,提供電子影像全文閱讀和下載,對現代文學研究者相當有助益。假以時日,如果能夠將民國時期出版圖書約124000種,期刊約29000種,報紙7800種全數上網,絕對會引發學術界的重大研究變革。創刊於1955年的《全國報刊索引》月刊編輯部,則繼2009年推出「晚清期刊全文資料庫(1833-1910)」後,又推出「民國時期期刊全文資料庫(1910-1949)」,收7066種期刊,大有與國家圖書館別苗頭的味道。此外,「大成老舊報刊庫」收錄清末至1949年6000餘種期刊、12萬餘期、130萬多篇文章,可下載單篇文章,雖然部分刊物或期別有所缺漏,但確實讓研究者有機會接觸第一手資料,相當受到研究者的倚重。
在台灣有限的現當代文學資料庫中,「台灣作家作品目錄系統」與「台灣現當代作家研究資料庫」,從資料的調查與編纂,到資料的數位化與建構資料庫,都是由文訊雜誌社承接,這兩個提供作家生平、書目與評論篇目的資料庫,是研究台灣文學時相當實用的工具,資料權威,訊息完整,和香港與大陸的大型資料庫相較,較為缺憾的是此間缺乏文學作品或史料的專業全文資料庫,研究者必須到《聯合知識庫》、《中時電子報》等報刊付費的資料庫系統上,方能獲得全文的訊息。
《文訊》300期資料庫
令人興奮的是,在《文訊》創刊30年的時刻,文訊雜誌社與秀威資訊科技公司推出「《文訊》300期資料庫」與「《文訊》電子書平臺」。這個資料庫將300期的雜誌逐頁數位化,共計四萬多頁,總計四千五百萬字,一萬二千張照片,五千位作家學者出版家的專訪,三萬本文學書籍的資料及提要,三千餘本文學書籍的書評,近三十年的文壇大事紀要,台灣18個縣市的藝文採風。就專題製作上,有超過三百個呈現台灣文學樣貌與文壇發展的專題企畫,每個專題企畫平均五至八萬字,上百個與作家、文史、出版史相關的專欄。光從數量上觀察,這個資料庫的上線,將有助於現、當代文學的研究者可以取得更多文學史料的內容資料,而不再只能閱讀目錄,還要再到圖書館批閱與複印。
就內容觀察《文訊》雜誌,不僅深耕台灣文學,並把觸角延伸至華文文學的各個區域,無論是中國大陸、香港、澳門、馬來西亞、新加坡、歐美等地,華文文學作家、出版與活動的訊息,盡可能收錄在「全球華文文學通訊」中,也曾多次製作專題,擴大研究者的視野。誠如余光中教授所說:「《文訊》所推出的專輯,皆富有意義,由專業的名家來提供高見,對於當代的文運及文學批評貢獻頗大。尤其難能可貴的,是對古典與現代、民族與鄉土能維持圓融平正的態度。」更彰顯出「《文訊》300期資料庫」內容多元並蓄的珍貴。
「《文訊》300期資料庫」的建構歷經兩年的時間,將30年的雜誌內容加以數位化,資料目前悉數上線,可以進行全文檢索與進階查詢。讀者也可以根據期別,或是根據作家專區、人文關懷、書評書介、專題特輯、資深人文出版社與銀光副刊等主題進行閱覽,可謂綱舉目張。而且可以逐期與逐篇閱讀,付費的會員還可以下載文件,並加以列印,相當友善與周到。
建議與期待
相較於其他較為成熟的文學專業資料庫,「《文訊》300期資料庫」目前呈現的功能稍嫌陽春,檢索的精準度與便利性還有待加強。特別在全文檢索上,輸入關鍵詞後,會出現筆數相當可觀的資料,但在檢索結果頁面上並沒有顯示檢索關鍵字對應的段落,讀者幾乎難以判斷資料的合用性,必須相當耗時費力地逐筆下載後,閱讀圖形檔的原始文件,方能確認資料的屬性。加上所下載的圖文檔案並無法檢索內文,更增加確認文件內涵的困難。而且沒有逐步縮小查詢範圍的功能,關鍵字輸入也沒有反應,在在讓檢索的精確性打了折扣。
相較於目前許多電子書以及電子雜誌的介面,可以模擬翻頁閱讀的感覺,甚至可以讓讀者從封面開始閱覽,在個人電腦的螢幕或是平板電腦上,一次讀完整本雜誌或專題。「《文訊》300期資料庫」以篇為基礎單位,在逐期閱覽或是專輯閱讀時,讀者必須逐篇下載後,再進入閱讀器一一閱讀,沒有提供較為流暢的閱讀環境與模式,是較為可惜之處。同時,因為以篇為單位,在瀏覽專題特輯時,沒有專輯名稱的標示與分類,加上各篇的順序是依照頁數的多寡排列,次序也就顛倒了,讓使用者很難明確認定專輯的內涵與內容。
如更細節地觀察檢索結果,既然是以《文訊》雜誌300期為對象,實無必要再列出「中文刊名」,反而應當顯示專題或主題的名稱,才能顯現出資料的系統與類別。而且輸出結果中,只有篇名可以點選,其他如姓名、期別都無法提供超連結,直接轉為關鍵字查詢,這也是另一項可以改善的部分。
事實上,秀威資訊科技股份有限公司不僅擅長資料庫的製作,更是台灣重要的數位出版企業。「《文訊》300期資料庫」一方面可利用網路媒體大量儲存的特性,提供更開闊、多元、整合性的文學史料資料庫。同時,文學雜誌更可以利用線上儲藏機制把過期雜誌甚至是絕版書重行網路發行,尤其一個蒐集了300期雜誌的資料庫,在擁有那麼豐富的內容下,應當可以同時發展更多加值的服務,無論是跨平台發行電子雜誌,或是以隨選列印的模式發行紙本,相信對於讀者或研究者來說,都會是絕大的佳音。
隨著科技的進步,文學資料庫的功能會更多樣,檢索的精確度也會更高,沒有止於至善的一天,所以當「《文訊》300期資料庫」招募封測的使用者時,歡迎更多讀者申請擔任試用者,協助測試並予給予建議,讓這個資料庫有修正與成長的空間。加上「《文訊》300期資料庫」只是一個階段性的里程碑,隨著時間的推移,新的《文訊》持續發行,這個資料庫應當也能次第更新內容,這應當是所有作家、評論家與研究人員共同的期待。
期盼「《文訊》300期資料庫」中,多元、開闊與跨區域的文學觀念、文藝思潮與文學史料,能夠藉由網際網路傳播給所有關心華文文學發展的人們。同時將《文訊》兼容並蓄的精神傳遞下去,促進更多生動、嚴謹又有批判力的華文文學研究成果產出。
回到目錄 上一篇:現當代台灣文學資料庫之介紹與評析
原發表於《文訊》雜誌334期,2013年8月 |