專題演講: 知識組織系統(KOS)的跨典範模式研發- 探討在語義網中KOS潛力與功能的突破 主講人 曾蕾/ 美國肯特大學圖書資訊學院 「知識組織系統」(Knowledge Organization Systems/Structures/Services‚ KOS)強調知識的組織與呈現之功用。現代的知識組織系統大致分為三類:詞單、分類與大致分類及關係組織,例如權威檔、主題標目表、索引典等等,然而KOS在語意網時代來臨後將產生何種變化?本次「語意網視野下的知識組織與文化資產」研討會的首場講者-曾蕾教授從古代學者的知識組織思維談起,再到網路世界中知識組織的運用,最後以幾個數位人文案例作結尾。
曾蕾教授現為美國肯特州立大學(Kent State University)圖書資訊學院教授,研究與教學領域如關聯資料、知識組織系統、後設資料等等,並主持或參與國際標準組織(ISO)索引典及各種結構詞彙互通性國際標準。今年以傅爾布萊特(Fulbright)美國學者身份至台灣中研院數位文化中心擔任訪問並參與研究。遂擔任此次研討會的專題演講講者。
曾蕾教授的講題為「知識組織系統(KOS)的跨典範模式研發--探討在語義網中KOS潛力與功能的突破」,報告內容分為三部分:
一、 追溯人類文明發展的歷史長河中對知識的劃分和組織方法。
二、 分析檢索引擎採用KOS對信息進行檢索查尋和瀏覽的五代變遷。
三、 細看KOS在語義網中的曆程-以Getty詞彙為特例。
人們的知識組織行為,不僅是現代人正從事這份工作,從西元三世紀的羅馬哲學家波菲利所做的波菲利之樹可知,人類始終嘗試組織知識,昔日學者多以樹形圖呈現知識,如十三世紀的拉蒙·柳利-科學樹、十六世紀訪中傳教士利瑪竇-《天學實義》、十八世紀起沿用至今的生物分類法-界門綱目科屬種。
知識組織目的之一是為了知識得以被檢索進而再利用。列舉式的《杜威十進圖書分類法》(Dewey Decimal Classification)可謂是最廣為使用的圖書分類法,目前至少有一百三十個國家採用;二十世紀中,人類計算技術發展,為檢索大量文獻,索引典(Thesaurus)遂此而生;而二十世紀末,網際網路的擴展,致使社會對於資訊工作的需求產生巨大變化,特別是網路服務所需的各類知識組織結構的相容及其用電子詞表和其他新媒體發佈等需求劇增,索引典擴大成控制詞彙(Controlled Vocabularies),1999年11月 4-5日美國更召開「電子索引典工作會議」,討論修訂國家標準《ANSI/NISO Z39.19-1993單語種索引典建造、格式、與管理指南》,從1993的「單語種索引典」改為2005的「單語種控制詞彙」。二十一世紀開始,新型標準的特點是內容上以索引典為基礎,容納各種語言結構,特別是分類結構和自然語言為基礎的結構,促使各種語言有統一標準、邏輯的支持。在W3C的21世紀語意網相關標準中,主要為OWL和SKOS,這兩者為知識本體(Ontology)語言。知識本體在內容上有三種型式:
1. 本體詞彙(classes & properties)作為知識架構,通用 (e.g.‚ event‚ bibo)。
2. 本體詞彙主要供表述分散形式的(distributed)具體個例使用 (e.g.‚ foaf‚ schema.org)。
3. 本體詞彙並加上具體個例(instances)形成獨立的知識庫 (e.g.‚ OpenCyc‚ UMBEL‚ GeoNames‚ Dbpedia)。
而在邏輯推理上大致分為輕量級知識本體及重量級知識本體,輕量級知識本體是不能推理,但具有類別和關係,索引典可謂是輕量級知識本體。當索引典藉由SKOS或OWL重新發佈後,將作為LOD(linked Open Data,關聯開放資料)資料集不可缺少的詞彙,而能發現新的未知知識。如何藉由LOD資料集發現新知?曾蕾教授舉美國SmartLogic公司為例,該公司從LOD雲端資料集蒐集健康相關的資料,使用知識組織系統之一-醫學主題詞表(Medical Subject Headings‚ MeSH)作為聚合資料的概念,並將其視覺化呈現,從視覺化工具上可看出疾病、藥物、副作用及臨時經驗等相互作用,對於醫生、護士、藥師或病人都是有利的工具。
資訊檢索工具中的搜尋引擎,知識組織系統亦提供重要功能-檢索與瀏覽。第一代搜尋引擎提供簡單查尋服務,第二代則增添了以類別瀏覽的功能,如Yahoo!,這些類別背後即為知識分類法(taxonomy),第三代則為分面、多方位搜尋,背後的理論思維乃是印度圖書館學家阮甘納桑的冒點分類法(Colon Classification),第四代增加知識圖譜而建立關聯網絡,以知識本體及知識庫為基礎,曾蕾教授推測第五代搜尋引擎可能為智慧服務,是一個認知運算時代,從語意網轉變成知識網,電腦主動地推薦自己所需要的事物。
本次演講,曾蕾教授從歷史觀點回溯古時學者之KOS理論,認為現今KOS的基礎皆可溯至古代知識的組織方式與邏輯思維,而電腦的視覺化表現亦源於先人智慧。此外,從歷史發展視KOS,KOS一直是應運而生的時代產物,在網際網路、語意網時代,人們的視野更跨越至全球性的規模,KOS亦隨時代潮流跨越單一領域,藉由知識本體、關聯資料等技術串聯各領域的資料,得以揭示未知的新知識。演講末端,曾蕾教授引用一份數位人文研究報告,表示該研究意味著數位人文能透過結構化資料來進行過去未曾想像過的研究。
Figure 1 採用KOS,以結構化資料繪製三千年文化史圖
該報告是以三千年以來的藝術家的人名權威檔、出生時地、死亡時地等實例呈現於世界地圖,揭示出世界性文化中心可能隨著帝國的興亡、交通工具鋪設、民族遷徙等各因素而轉移。 |