中國分類主題詞表是中國最權威、也是影響最大、使用最廣泛的「分類法-敘詞表對照索引式」知識組織系統。
中國分類主題詞表是一部不斷在使用、發展中的綜合性詞表,共收錄分類法類目52992個(22個大類),主題詞110837條、主題詞串59738條、入口詞35690條,主要應用於圖書館界。語意網與關聯數據的發展讓資料大量地開放,對圖書館來說,詞表應如何發展?詞表該要怎麼進化?該如何參照語意網與關聯數據的技術工具,讓詞表成為關聯數據的一部分。
中國分類主題詞表整體來說已實現了基礎語意化的表徵和網絡化的發布。目前,已經完成基於RDF/SKOS 規範的基本語義轉換。在書目的資料檔案中,有書目的分類號,取自中國分類主題詞表,中國出版的書籍與文獻都必須進行編號,此編號有利於後續進行外部連結,達到資源與資源鏈結的基礎,通過詞表之間的映射達到對資源的識別與關聯。
詞表本身的進化,並非為了詞表,而是為了資源的共享集成、檢索發現。中國分類主題詞表由兩部分組成:中國圖書館分類法Chinese Library Classification (CLC)與漢語主題詞表Chinese Thesaurus (CT)。是分類、主題一體化的對照索引,左邊是分類法、右邊是主題詞表。
新世代,我們呼籲數據要開放、資源要共享。中國分類主題詞表建立了分類到主題、主題到分類的雙向對照。於2006年出版了電子版,實際上中分表的結構,相當複雜,在介面上能看到多維度的展示。體系結構來看,以學科為主要的劃分依據,講者以參天大樹形容,分類詞表相當龐大、層累制、矩陣式的,靈活性和多維度化比較欠缺不足。
網路版改善了詞表的開放性與彈性。在網路上可以逕行瀏覽,以5年為週期進行維護,改善缺點。為了改善中國分類主題詞表的靈活度,我們將大樹變為小樹叢提供進行多維度的靈活檢索。
2010-2013年間,針對中分表進行了語意化的改照。要適應圖書館編目者的工作流,建立寶庫,將詞彙挖掘出來,衍生成為小的詞表。放在互聯網上,希望打破應用面上的可能侷限,關聯數據出現後,考量到要如何建立詞表的基本表徵與擴展性的發展性,提供一些思路。 中國分類主題詞表並不是將詞表整個推出去,而是把詞彙,詞彙與詞彙之間的概念,透過檢索與關聯式的發現、而為人所用,成為機器可讀、可用,形成一個知識服務。
中國分類主題詞表致力於推動主題規範數據的語意化,在對應結構上仍有許多語意關係仍待擴展,目前已建立了10萬個主題詞,同時也實現了部分檔案的檢索功能。初步達成數據開放、資源集成共享的理念。 | http://newsletter.ascdc.sinica.edu.tw/file/file/130/13046.jpg