在台灣,學術界和產業界普遍認同建置資料庫的重要性,因為資料透過妥善的分析與詮釋之後所呈現的各種「證據」,能幫助我們解決許多懸宕已久的難題。近年來已經有許多科學家不同程度的參與資料庫的相關工作,準確地說,資料庫已經和他們的研究領域結合在一起,具有相輔相成的關係。台灣大學海洋生物研究所謝志豪教授多年以來,利用國內外資料庫的資料進行計量分析,企圖更具體的掌握海洋資源與氣候、汙染、捕撈等因素之間的關係,希望能為漁業資源日漸枯竭的現況,提出因應的對策。 海上的科學家,化身資料高手 台大海研所的走廊兩側,標本與儀器排放整齊,空氣中飄散著輕微的消毒水氣味,十足實驗室的氛圍。而師生談笑的腳步聲中,隱約聽到冰箱嗡嗡的運轉聲,為這棟樓增添了輕快的節奏感。走廊兩旁的大冰箱裡,樣本井然有序地被存放著,每一個器皿裡裝盛的不是普通的海水,而是師生們辛苦採集而來的「寶物」。 走到盡頭轉個彎,滿臉笑容的謝志豪老師正在跟我們打招呼。從動物學系到動物學研究所,謝志豪一路摸索,在民國80到90年那視分子生物學為「顯學」的年代中,他選擇跟隨海洋生態學家丘臺生老師,研究台灣周邊海域浮游生物與漁業資源之間的關聯性,走上一條截然不同的研究道路,也奠定了他對海洋生態的關懷基礎。公費旅美期間,他優異的表現讓他成為加州大學聖地牙哥海洋研究所的「傳奇人物」。因為在博士班的第三年,其他學生都汲汲自己的研究題目時,但他卻毅然決然地,決定從原指導教授Mark Ohman的實驗室離開,轉換到George Sugihara教授的麾下,原因單純是「覺得自己目前研究的題目不夠挑戰性」。這個轉換意味著他將從熟悉的生物海洋學領域,轉換到理論生態學的世界。 「當時已經到公費留學的第三年了,學費快要用完了,為了必須要有錢,我申請了好幾個計畫,但也不太順利。John Hunter是西南漁業中心裡面非常資深的一個研究員,有一天他來找我的老闆,說他在加州(Southwest Fisheries Science Center NOAA)有一個長期的survey計畫,有一批像寶庫一樣的資料,但是他要退休了,他也希望在他retire之前,可以有someone does something,所以希望我的老闆可以幫他做資料分析。老闆指指我,跟他說:『你問Zac,他需要錢!』這一切完全就是緣分。」謝志豪從此與漁業資料庫結下不解之緣。 John Hunter教授委託的這批漁業資料數量相當多,是1950年左右開始的California Cooperative Oceanic Fisheries Investigations (CalCOFI) 計畫累積的大量原始資料,數量非常多,調查的目的是要解決加州漁業上的問題。後來這就成為他博士論文主要的內容。 漁業的衰落,造就一股新的研究能量 這個調查計畫的歷史背景,跟1940年代末期美國加州漁業資源枯竭有關,謝志豪一邊聊著當時與John Hunter相遇的情景,一邊起身從書架上抽出經典小說《罐頭廠街(Cannery Row)》,侃侃而談這個計畫的時代背景。小說的作者約翰-史坦貝克(John Steinbeck)因為本書而獲得諾貝爾獎殊榮,故事寫於1945年,描寫罐頭廠街在20世紀初興起,成為蒙特利鎮生產沙丁魚罐頭的主力街區,最興旺的1940年代,街上最多曾經有20多家魚罐頭工廠,而一年捕獲超過20萬噸沙丁魚的豐沛漁獲,也讓碼頭出現停滿船隻的繁榮景象。在那個經濟巔峰的年代,街上充滿了埋頭苦幹的工人與作業員,人人有事忙,人人有錢賺。這樣的榮景隨著1970年代漁業資源枯竭,產業也跟著快速凋零,當地的漁民再也抓不到魚,罐頭工廠隨之倒閉,而罐頭廠街也終於歸於平靜。 因為這樣迫在眉睫的經濟危機,讓加州政府與聯邦政府決定聯合起來,進行美國西岸的海洋調查。在那個年代,John Hunter也不過是一個年輕的學者,但當時他們就很有遠見的提出了一些懷疑,他們覺得應該要想辦法去瞭解海洋到底發生了什麼事情。「當時的人不覺得是過度捕撈,只覺得可能是環境變化或氣候變遷,為了知道環境發生了什麼事情,就開始設計這個調查的計畫。」謝志豪說,這個計畫在當時的年代是很可觀的,範圍從墨西哥到加州,一直往北,直抵華盛頓。整個美國西岸每個月都做完整的調查,一年三百六十五天幾乎隨時都有研究船在海上,甚至不止一艘船,一個月就要做完一次,平均一次要二十多天。這是一個耗費驚人金錢的調查計畫,但美國的政府覺得責無旁貸就是要去做,從1949年開始到今天已經六十多年,是全世界最長的漁業採樣計畫。 因緣際會之下,謝志豪獲得John Hunter手中的資料,就開始進行一連串資料分析的工作,「當時我就對理論生態學有興趣,但其實當時我不懂漁業,所以我就去學,把理論生態學跟漁業,跟資料分析,做一個結合之後,就作為我的博士論文。 也修了很多數學系的課,就讓我自己很懂得分析資料,這是我第一次分析大量的資料。」最後他發表了一份讓各界嘩然的論文,他熱情地拿出論文,指著論文裡的彩色表格,格外有耐心地跟我們說明。論文中以確切的證據證實受捕撈的魚種受到環境變動影響的程度,遠高於不受捕撈的魚種,換句話說,沒有受捕撈的魚,生態指標的變動就是環境變遷造成的變動,而有受捕撈的魚的變動,就是環境變遷跟人類捕撈的交互作用的結果。 資料分析的結果,是漁業永續政策的依據 謝志豪發表論文的時候,John Hunter教授已經退休了,但他仍相當雀躍,因為這是對漁業界很重要的貢獻。這篇論文發表之後,對許多漁業單位都造成不小的影響,因為在這之前各界都缺乏證據去證明這樣的現象,也缺乏資料進行對照,所以當時大家都不是很確定到底捕撈帶來的變動有多大?到底影響了什麼?謝志豪的論文等於率先提出證據來解答大家多年來的疑惑,也為後續的漁業政策提供了有力的依據。 這就是資料庫的重要性,但這樣的結果說明了光有資料是不夠的,還必須不斷的挹注、校正,並結合一群學者透過各種方法來進行分析和統整,這些資料才能呈現出一個對我們有幫助的結果。當然,事情不總是那麼單純,漸漸的開始有漁業單位覺得這些研究結果推翻了他們長年來在做的事情,有意無意地指責了他們在政策上的漏失,因而感到臉上無光。對此,謝志豪倒是抱持著樂觀開放的態度,繼續貫徹科學家的本分:讓資料說話。「傳統上認為不應該抓小魚,要讓小魚繁殖一次才能抓。因此,政府告訴漁民魚只要生殖過一次就可以抓,那是不是說抓大魚就可以無上限?我們主要argue的就是這一點,我們認為漁業管理應該對大魚的捕撈制定某種程度的限制,也就是在抓的時候應該做『balanced fishing』,不要只抓最大的,而是要去維持(maintain)魚群的大小組成。」 謝志豪提出建議的同時也承認這不是一件容易的事情,因為不抓小魚比較簡單,只需要控制網目的大小就可以達到,但要如何讓漁民不抓大魚呢?要如何制訂出一套規範告訴漁民多大的魚可以抓多少?不管是台灣或是其他國家,都還沒有辦法制訂出一套很好的方案來執行這件事。因此,謝志豪一直到今天所做的工作當中,也還延續著這些課題,希望有一天可以找到最好的解決方案。 沒錯,保育的確是為了抓更多魚 謝志豪2006那年對加州海洋資料的分析結果,引起了一股小風潮,開始有更多人跟進,投入相關的研究與調查。「我們提出了證據之後,開始有很多人也來做這一塊,而且也出現一些蠻有趣的研究。比方我一個學妹她去蒐集美國釣魚大賽歷年來冠軍的照片,這些釣手會抓著他們釣到的大魚,在比賽的板子前拍照留念,結果把這幾十年的照片拿來對照,就發現照片中冠軍釣手手上拿的魚真的一年比一年小隻!表示大海裡面的大魚真的愈來愈少!」談到保育,科學家的任務是提出讓世人能夠信服的證據,提醒大家環境出現的警訊,但往往提到現實的政策執行,大家就紛紛搖頭嘆氣,感嘆保育之艱難。 「除非國家真的很強硬,否則光是宣導保育的重要性,是沒有用的。我們可以教育漁民,在保護區裡面的魚會有溢出效應,魚變多了自然會游出來,大家都有魚可以抓;但你進去保護區把魚抓光光,那大家以後都沒飯吃。保育的目的是非常經濟層面的,只有用這樣的觀點去宣導,才有辦法真的運作起來。」謝志豪認為大部份國人對於保育的想法,還停留在一種對保育工作過分理想化的階段,而忽略了漁民的立場與觀點,導致每次談到禁漁,都會引起紛爭。「保育是為了抓更多魚」,這樣的說法,謝志豪承認這是有點爭議、矛盾的。但作為一個掌握數據的海洋科學家,其實這樣的想法非常實際。因為只要換個角度,讓漁民知道經過保育,海洋的資源可以永續利用,大家才能長時間都保有經濟收入,只要有了這樣的觀念,漁民之間甚至會開始互相監督,避免有人作弊而影響了自己的利益。 我國重要的海洋資料庫:ODB 海洋資源是有限的,思考如何永續利用,是全球科學家都相當關心的事情。漁業資源與國家產業、生態平衡息息相關,謝志豪認為漁業資料的分析工作無非就是希望能找出管理與分配漁業資源的方法。目前台灣沿近海漁業缺乏系統性的資料收集,即使漁會普遍會做,但對學界來說漁會的資料因疏漏太多,導致參考性很低,此外也缺乏科學家調查(比方說前往魚市場向某些漁船買魚貨,紀錄他們去哪裡捕撈,抓什麼魚,魚的大小等等普查)。 我國目前海洋相關的資料庫包括許多單位,其中科技部海洋學門資料庫(Ocean Data Bank ODB)提供了長期及相當可靠的資料,這些資料主要來自國家海洋研究船的調查資料,謝志豪也參與了相關的工作。「我們在地質、物理、溫度、鹽度、洋流等等這些部份的資料都累積了好幾十年,但生物資料相對短缺,因為採樣之後還要經過要鑑定、秤重、計算一連串繁複的步驟,最後才能產生資料。我國生物多樣性的資料庫在邵廣昭老師的帶領下已經做得非常齊備,所以我們換個方向,做定量統計的工作,比方說什麼時間在什麼地方採樣,獲得什麼種類,以及這些種類的密度。計量的數字才能幫助我們精準的了解環境的變化。」謝志豪形容自己是個問題導向的人,他在資料分析的工作中往往會先察覺到問題,然後去思考這些問題可能的原因,並進一步透過資料試圖來找出答案。在他的團隊裡,證據是非常重要的,要如何透過資料的寶庫找到解答,需要無數科學家耗費漫長時日進行分析工作,才能一點一滴地呈現出來。 分散性的資料庫:保有資料庫特性,資料才能為人所用 而對於資料庫的建置方式,謝志豪依據國際上資料庫建制的過去經驗,認為分散式資料庫(Distributed Database Systems)是一個解決之道。所謂分散性資料庫最重要的特徵,就是保留了每一個資料庫原本的特性,並不是一股腦兒的把「所有的資料」都放進「同一個資料庫」當中,而是成立一個資料中心(data center),透過資料中心去「串聯」國內各個不同性質、不同學門、不同特性的資料庫。 「資料的整合很重要的一點,是跨領域的應用,這個才是國家資料庫未來整合的方向。當我們建立一個data center之後,還要寫一個翻譯器,透過翻譯器進到資料中心的data格式就都會一樣。單純把所有資料匯聚在一起是沒有意義的,每種資料都有自己的特性,去除掉資料庫的特性,單純把資料丟進去,就沒人可以再把資料撈出來,因為沒人知道這個column是什麼東西,小數點是幾位?是六十進位還是十進位?密度是什麼單位?大家的資料都不一樣啊!而且沒有專業的品管,誰知道放進去的資料是對是錯」謝志豪以國外SeaDataNet(http://www.seadatanet.org)為例,他們就是透過這種方式,串聯了不同資料庫,來達到資源共享、資訊開放的目的,但同時能維持資料入庫後校正與判讀的品質,讓這些資料成為彼此都能閱讀的形式,為學術研究增添便利性。 資料庫就像是一片充滿訊息的大海,各種啟示如同海平面上的光點,在太陽的照射下閃閃發亮。當年的偶然,讓謝志豪投身於這片浩瀚的資料之海,不管是在研究船上的採樣工作,或者是實驗室的分析與鑑定,都是科學家在資料之海中試圖捕捉訊息的身影,他們得到的每一份結果,都可能影響人類未來的生活,即使大多數的人們都看不懂這些數據,但我們還是可以透過科學家的眼睛,更透徹的理解海洋的面貌。 |