一、前言
隨著數位時代的來臨,作為重要文化遺產和學術研究資源的數位圖像資源量越來越大時,要如何妥善再利用豐富的數位圖像資源,成為現今研究者欲克服的議題。數位圖像能再利用的關鍵障礙為數位圖像普遍缺乏詳細的語意標註,以至於圖像資源的知識發現與利用差強人意,此外數位圖像資源與文本資源之間缺乏有效的語意連結,難有效聚合相關資源。縮小放大地看數位敦煌壁畫專案圖像資源,亦有此研究問題。
數位敦煌壁畫專案自二十世紀九十年代起展開數位化敦煌石窟壁畫工作,期能記錄橫跨一千年歲月的敦煌藝術,歷經20餘年的努力,完成492個石窟中的120個洞窟的攝影採集、40個洞窟的影像處理,以及120個洞窟的全景漫遊和20尊彩塑的3D重建,截至今日,數位敦煌專案已採集94萬張圖像,且預估最終採集量將超過400萬張數位圖像。
大陸武漢大學資訊管理學院王曉光教授以數位敦煌石窟壁畫圖像為案例,嘗試發展出圖像深度描述的語意框架,以作為數位圖像檢索之重要基礎工程,並將其實作經驗於本次「語意網視野下的知識組織與文化資產」研討會中與臺灣同道們分享。
二、 研究實作略述
標註起始需援引相關圖像描述框架,王曉光教授表示部分與圖像標引相關的視覺資源中繼資料標準,如VRA、CDWA、 EXIF、MPEG-7等在主題條目上規範不足,缺乏更細緻的描述框架。該研究計畫目的為深度標註圖像,標註目標不僅是圖像整體主題,更強調使用較為準確的領域專業詞彙和自然語言揭示圖像細節;此外,期能發展出專屬於敦煌石窟壁畫的圖像描述框架,且因圖像語意描述為圖像資訊組織學與圖像學間的跨學科課題,遂引用潘諾夫斯基(Erwin Panofsky)的圖像學三層理論作為最鉅觀的語意框架:前圖像志描述、圖像志分析和圖像學解釋
1. 前圖像志描述涉及圖像的視覺事實,通常為第一性的或自然的題材,如識別出圖像裡的人、動物、活動等。
2. 圖像志分析解釋的是第二性或約定俗成的題材,是對圖像內容的一種知識性解釋,需要一定的專業知識,如識別出特定的人物和場景。
3. 圖像學解釋則闡釋了圖像內在的寓意,這一層次的理解需要綜合考慮圖像產生時代的藝術、文化或社會環境等特徵,以及創作者個人的特質等來進行深度詮釋,如圖像表達的自由、勇氣、忠誠、背叛等主題。
將此三層理論對應為自然描述、傳統闡釋及內在意義,並在此三大類別下再區分出各類別,發展出「敦煌壁畫蘊含主題分析框架」,再將此框架於237 篇文獻嘗試標註,以理解圖像學研究者的標註需求。 於237篇文獻標註後,得出以下結論:
一、 237個樣本的整體提及率大體呈正態分佈,說明本文所構建的資訊分析框架較為科學可靠。
二、 自然描述(第一層)的需求是基礎需求,深度語義描述和標註必須包含自然描述。
三、 傳統闡釋(第二層)的標註必須關注物件間的空間語義關係(不同物件間的空間位置資訊的描述十分重要)。
四、 內在意義(第三層)雖是圖像學研究重點,但不是語義描述和標註的重點,這部分資訊常來自圖像外部。
圖 1 敦煌壁畫蘊含主題分析框架(草稿)
除「敦煌壁畫蘊含主題分析框架」,亦發展「敦煌壁畫領域詞表」以描述圖像。每一個標註詞語的選用需有領域知識支持,故搜括敦煌石窟研究相關文獻,囊括詞典、網站、文獻資料庫、敦煌學書籍專著及期刊等,由上述來源選出3201個詞彙。
表 1 敦煌壁畫領域詞表(草稿)
最後,以「敦煌壁畫蘊含主題分析框架」與「敦煌壁畫領域詞表」實驗標註五幅圖像。
圖2 實驗標註五幅圖像
三、結語
深度標註的意義在於能檢索到更具深層涵義的物件。王曉光教授於研討會次日的討論會中,示範如何運用圖像標註軟體Synaptica,以「九色鹿本生故事畫」為例。當九色鹿救起溺人時,告知其不可向國王告密九色鹿棲息之處,因人們貪圖九色鹿的毛皮之故,然溺人最終向國王告密,圖像中,溺人所披戴的「披巾」從石綠色轉為黑色,似乎象徵其內心從善轉惡。由此例我們便可得知,若無深度標記,日後的研究者不易探究到圖像所隱含的言下之意。 | http://newsletter.ascdc.sinica.edu.tw/file/file/130/13031.jpg