本文刊載于《中國科學(xué)院院刊》2020年第1期
專(zhuān)題“融合科學(xué)與開(kāi)放數據”
肖小溪1 甘 泉2 蔣 芳2 陳 捷1 李曉軒1,3*
1 中國科學(xué)院科技戰略咨詢(xún)研究院
2 中國科學(xué)院發(fā)展規劃局
3 中國科學(xué)院大學(xué) 公共政策與管理學(xué)院
“融合科學(xué)”是一種基于多學(xué)科融合來(lái)解決重大問(wèn)題的科研新范式,被認為是人類(lèi)解決重大經(jīng)濟社會(huì )問(wèn)題的新機遇。推動(dòng)“融合科學(xué)”意味著(zhù)科研生態(tài)的根本性變革,其中一個(gè)最基礎的方面是數據開(kāi)放共享。
近現代以來(lái),科學(xué)研究極大地推動(dòng)了人類(lèi)探索知識和解決問(wèn)題的能力,成為推動(dòng)人類(lèi)現代化的發(fā)動(dòng)機。然而,現有以學(xué)科分割為基本架構的科學(xué)研究仍然無(wú)法有效解決能源短缺、環(huán)境污染、健康威脅等人類(lèi)面臨的諸多重大問(wèn)題。
為此,自二戰以來(lái)興起的各類(lèi)學(xué)科交叉研究和使命導向的研究,在 21 世紀初期逐漸凝結并演變成一種基于多學(xué)科融合來(lái)解決重大問(wèn)題的科研新范式——“融合科學(xué)”(convergence science,又譯為“會(huì )聚科學(xué)”),并得到以美國為典型代表的科技發(fā)達國家的積極倡議。
中國科技界近年來(lái)的改革探索也與國際上“融合科學(xué)”新范式的發(fā)展趨勢高度契合。例如:中國科學(xué)院立足于多學(xué)科綜合優(yōu)勢,在“十三五”發(fā)展規劃中提出了 8 個(gè)重大創(chuàng )新領(lǐng)域的戰略部署以及從融合視角開(kāi)展的試點(diǎn)評估;以及國家自然科學(xué)基金委員會(huì )推動(dòng)的“新時(shí)代科學(xué)基金資助導向”改革等。
“融合科學(xué)”將帶來(lái)一場(chǎng)科研生態(tài)的根本性變革,需要從規劃、組織、評價(jià)、人事等多個(gè)方面推動(dòng),其中一個(gè)最基礎的方面是數據開(kāi)放共享。
本文首先探討了“融合科學(xué)”作為一種新科研范式的基本特征,提出“融合科學(xué)”對基礎數據的新要求,進(jìn)而介紹了數據開(kāi)放共享支撐“融合科學(xué)”的成功實(shí)踐,最后展望了以開(kāi)放數據推進(jìn)“融合科學(xué)”的未來(lái)圖景。
1 “融合科學(xué)”的基本特征
與傳統科研范式相比,“融合科學(xué)”新范式的根本區別在于“融合”。2011 年美國麻省理工學(xué)院發(fā)布的白皮書(shū)中首次明確提出,生命科學(xué)、物理學(xué)和工程學(xué)的“融合”代表著(zhù)生命科學(xué)領(lǐng)域的第三次重大變革,但其深遠影響將突破生命科學(xué)的范疇,推動(dòng)健康、能源、食品、氣候和水資源等諸多行業(yè)取得重大進(jìn)步。該白皮書(shū)進(jìn)一步抽離出“融合”的本質(zhì),認為“融合”是將原本被認為是分離和割裂的方法、技術(shù)、流程和設備整合成統一整體,以此推動(dòng)新的科學(xué)和技術(shù)進(jìn)步。
2014 年美國國家研究理事會(huì )進(jìn)一步指出:“融合”是一種跨越學(xué)科邊界以解決問(wèn)題的(研究)路徑。該路徑整合了生命與健康科學(xué)、物理學(xué)、數學(xué)、計算機科學(xué)、工程學(xué)及更多種類(lèi)的不同學(xué)科,形成一個(gè)全面、綜合的研究框架,來(lái)解決那些存在于多個(gè)領(lǐng)域交界面上的科學(xué)和社會(huì )挑戰。
基于已有文獻中對“融合”的闡述,可將“融合科學(xué)”新范式定義為:以解決重大問(wèn)題為導向和最終目標的一種科研新范式。該范式通過(guò)整合多個(gè)學(xué)科領(lǐng)域的知識、技能和工具,形成一個(gè)全面、綜合的問(wèn)題解決框架,并形成一個(gè)多方權益主體共同參與的網(wǎng)絡(luò ),以推動(dòng)科研成果轉化為創(chuàng )新和產(chǎn)品。
在形成問(wèn)題解決框架的過(guò)程中,多種要素的耦合是其基本內涵:“融合科學(xué)”既貫穿創(chuàng )新價(jià)值鏈全譜帶,又以多種學(xué)科的交叉和延展為基礎,涉及官產(chǎn)學(xué)研用等多類(lèi)權益主體,通過(guò)各類(lèi)要素的耦合進(jìn)一步催生出新的知識增長(cháng)點(diǎn)乃至重要的融合性領(lǐng)域。本文從 3 個(gè)方面闡述“融合科學(xué)”新范式區別于傳統科研范式的特點(diǎn)。
1 以重大經(jīng)濟社會(huì )問(wèn)題的解決為根本目標
“融合科學(xué)”以解決人類(lèi)生存及發(fā)展中面臨的重大問(wèn)題為研究目標,而不是以一般意義上的科學(xué)進(jìn)步為目標。這意味著(zhù)“融合科學(xué)”更強調科研的組織和有序,比傳統學(xué)科發(fā)展更依賴(lài)于優(yōu)勢布局。從這一點(diǎn)來(lái)看,“融合科學(xué)”與二戰及冷戰時(shí)期以軍事使命(如核彈)或者太空使命(如登月)為目標的“使命導向的科研”(mission-oriented research)具有相似性。相比于后者,“融合科學(xué)”的目標導向主要是圍繞與普通民眾日常生活休戚相關(guān)的重大經(jīng)濟社會(huì )問(wèn)題,這些問(wèn)題在冷戰結束后成為擺在各國政府科技議程上的重要目標。
2 覆蓋從基礎研究到問(wèn)題解決的長(cháng)鏈條
傳統科研范式中,科研活動(dòng)往往以知識發(fā)現或技術(shù)發(fā)明為最終目標。然而,“融合科學(xué)”并不止于新知識的發(fā)現,以及新技術(shù)、新工藝和新設備的研發(fā),而是在重大經(jīng)濟社會(huì )問(wèn)題的目標引導下,進(jìn)一步沿著(zhù)創(chuàng )新價(jià)值鏈向后延展,跨越基礎研究與實(shí)際問(wèn)題解決之間的鴻溝,直到形成真正能夠產(chǎn)業(yè)化的樣機、原型或解決方案,為最終實(shí)現市場(chǎng)上的創(chuàng )新提供保障。
換言之,“融合科學(xué)”在解決重大問(wèn)題的導向下,連接了知識發(fā)現、技術(shù)發(fā)明和市場(chǎng)產(chǎn)品,以創(chuàng )新地解決實(shí)際問(wèn)題為重點(diǎn),有助于在傳統學(xué)術(shù)界和產(chǎn)業(yè)界之間主動(dòng)發(fā)揮重要的橋梁作用,以更有效地跨越技術(shù)發(fā)明與產(chǎn)品市場(chǎng)化之間的“死亡之谷”。
3 依賴(lài)于多種學(xué)科之間的深度交叉融合
“融合科學(xué)”在研究手段上依賴(lài)于多種學(xué)科的深度交叉和融合,但并不是簡(jiǎn)單地把不同學(xué)科的研究人員聚集在一起,而是在重大問(wèn)題凝練伊始就將不同知識背景的研究人員有意識地聚集在一起,共同尋找解決特定問(wèn)題或挑戰的研究方案,并且將學(xué)科交叉融合貫穿于解決問(wèn)題或挑戰的全過(guò)程。
在學(xué)科之間相互滲透的過(guò)程中,不同的知識、理論、方法、數據頻繁地相互交織和影響,直到形成新的研究框架和新的科學(xué)語(yǔ)言??梢?jiàn),相比于已有的各類(lèi)學(xué)科交叉研究(如多學(xué)科研究、跨學(xué)科研究、交叉學(xué)科等),“融合科學(xué)”的目標導向更凸顯。
2 “融合科學(xué)”對基礎數據的新要求
從“融合科學(xué)”的基本特征和典型案例來(lái)看,“融合科學(xué)”的底層基礎數據已經(jīng)與以往科研數據大為不同。要實(shí)現“融合科學(xué)”所依賴(lài)的學(xué)科交叉融合、創(chuàng )新價(jià)值鏈貫通融合、各權益相關(guān)方協(xié)同融合,需要基礎性數據實(shí)現全學(xué)科、全流程和全景式的開(kāi)放共享,使研究人員可以跨界訪(fǎng)問(wèn)、完整獲取解決重大問(wèn)題所需的科學(xué)界、政府界、產(chǎn)業(yè)界及非營(yíng)利機構的數據,以支撐重大問(wèn)題的最終解決。
這方面與大數據時(shí)代國際上“開(kāi)放獲?。╫pen access)”“開(kāi)放數據(open data)”“數據共享(data sharing)”“開(kāi)放科學(xué)(open science)”等理念相呼應。在實(shí)踐上,國際數據組織(如國際科技數據委員會(huì )),以及部分國家和地區正在大力推動(dòng)的開(kāi)放科學(xué)數據中心(如歐洲云計劃“Gaia-X”)等為實(shí)現融合科研的全學(xué)科、全流程和全景式的數據開(kāi)放奠定了重要基礎。
1
“融合科學(xué)”要求改變以往科研數據分學(xué)科管理和使用的狀況,以實(shí)現所有學(xué)科之間的數據開(kāi)放和共享為基本要求
新公共管理運動(dòng)以來(lái),對公共部門(mén)的問(wèn)責推動(dòng)了公共部門(mén)的數據公開(kāi)化(數據共享)要求??蒲蓄I(lǐng)域是較早重視并探索數據共享的公共領(lǐng)域之一。由于實(shí)際科研工作的需要,科學(xué)家自發(fā)地開(kāi)展了局部范圍(如實(shí)驗室、研究機構層面)的科研數據共享。此后,在更大范圍內(如國家層面、全世界范圍內)的科研數據共享要求,推動(dòng)了“開(kāi)放獲?。╫pen access)”的興起。
但是,現有的科研數據開(kāi)放獲取主要是基于學(xué)科或者基于機構來(lái)操作,科研數據的開(kāi)放更多地集中在單一學(xué)科內部、某一機構或出版商內部,數據的開(kāi)放形式也多局限于論文,只有少數機構或個(gè)人擁有查閱或下載權限。這種狀況一方面造成了數據的靜態(tài)化、更新效率低等問(wèn)題,另一方面也不利于知識在科學(xué)共同體之間的交流和傳播。
“融合科學(xué)”則要求所有學(xué)科的科研數據在同一平臺進(jìn)行開(kāi)放和共享。該平臺將所有學(xué)科的學(xué)者和成果進(jìn)行集中展示,打破學(xué)科之間相互交流的壁壘,允許任一學(xué)科的科研人員在平臺上根據研究主題或所關(guān)注的科學(xué)問(wèn)題檢索其他學(xué)科的學(xué)者和研究成果,以便與關(guān)注同一重大問(wèn)題的學(xué)者建立起直接聯(lián)系。
2
“融合科學(xué)”要求改變傳統科研系統中忽視過(guò)程性科研數據的狀況,以實(shí)現科研全流程的數據開(kāi)放和共享
傳統科研系統中僅有少數結果性的數據作為論文的相關(guān)內容公開(kāi)發(fā)表,大量的過(guò)程性數據和未寫(xiě)入論文的結果性數據仍然掌握在科研人員個(gè)人手中,沒(méi)有實(shí)現開(kāi)放和共享,這造成了科研資源的浪費。
“融合科學(xué)”所要求的全流程的科研數據開(kāi)放,包括從提出研究問(wèn)題、科研方法設計積累科研數據到最終科研結果公開(kāi)整個(gè)鏈條所涉及的實(shí)驗室筆記、研究數據、計算模型、論文等,這意味著(zhù)研究人員可以通過(guò)搜集全部的原始信息,真正實(shí)現在基礎數據層的交互融通。
然而,從技術(shù)手段上來(lái)看,由于過(guò)程性的科研數據,如實(shí)驗日志、不完整的數據集、初步分析結果、科學(xué)論文草稿、下一步研究計劃、同行評審報告、與同事的溝通與交流記錄等文字資料,實(shí)驗室樣本等實(shí)物資源,以及未正式發(fā)表的結果性數據等,這些數據種類(lèi)繁多且形式多樣,在存儲和管理方面存在很大困難。
目前,僅有極少數專(zhuān)家和機構在呼吁科研全流程數據的開(kāi)放和共享,在實(shí)踐中也僅有小范圍的試點(diǎn)工作取得進(jìn)展。例如,2014 年美國學(xué)者 Bohle在《自然》雜志發(fā)表文章,倡議美國聯(lián)邦政府層面加大對實(shí)驗日志開(kāi)放共享的重視和投入;2018 年歐盟發(fā)布《開(kāi)放科學(xué)政策論壇建議》以來(lái),強調科研項目的過(guò)程性數據的合理存儲和管理。
3
“融合科學(xué)”要求改變傳統科研范式下僅重視論文、專(zhuān)利等科研數據的開(kāi)放和共享的做法,強調對解決重大經(jīng)濟社會(huì )問(wèn)題相關(guān)的全景式數據的開(kāi)放和共享
一方面,“融合科學(xué)”的基礎數據極大地拓展了科研數據的形式和范疇。傳統科研范式下除了論文和專(zhuān)利數據,以其他形式存在的科研數據(如政府數據、源碼、會(huì )議資源、學(xué)術(shù)專(zhuān)著(zhù)、教科書(shū)、新聞、存檔記錄和手稿、圖像、開(kāi)放教育資源、數字化印本資源等)沒(méi)有受到足夠的重視?!叭诤峡茖W(xué)”則高度重視這些不同種類(lèi)的科研數據的開(kāi)放和共享,特別是致力于推動(dòng)創(chuàng )新價(jià)值鏈不同譜段上的科研數據的關(guān)聯(lián)和銜接。
在這方面,美國國立衛生研究院(NIH)建立并維護多個(gè)開(kāi)放獲取的基因數據庫和臨床數據庫(包括免費開(kāi)放“國際千人基因組計劃”全部數據)就是一種有益探索。
另一方面,“融合科學(xué)”也重視聯(lián)合政府數據、行業(yè)數據及廣泛的經(jīng)濟社會(huì )和法律信息資源等的開(kāi)放和共享,從而為聯(lián)合利用與經(jīng)濟社會(huì )重大問(wèn)題有關(guān)的全景數據,提供解決問(wèn)題的思路或方案。
3 數據開(kāi)放共享支撐“融合科學(xué)”的成功實(shí)踐
21 世紀以來(lái),生命科學(xué)研究在攻克人類(lèi)重大疾病等健康領(lǐng)域肩負重大使命,生命科學(xué)與信息科學(xué)、材料學(xué)的交叉融合非常普遍,這些都推動(dòng)“融合科學(xué)”范式由生命科學(xué)領(lǐng)域的頂尖學(xué)者和機構首先提出。之后,“融合科學(xué)”范式在能源、環(huán)境、食品安全等領(lǐng)域的重大意義也得到認可。以下列舉的生命科學(xué)、能源、農業(yè)三大方面的“融合科學(xué)”典型案例,都證明了數據開(kāi)放共享是“融合科學(xué)”成功的前提。
1 精準醫療
“精準醫療”被認為是最能代表“融合科學(xué)”的令人振奮的案例之一?!熬珳梳t療”以更精細、更準確的疾病分類(lèi)作為診斷、治療和臨床決策的基本要求,從而實(shí)現在分子學(xué)水平為臨床疾病亞型群體提供更精確的診斷和治療。
要實(shí)現這一目標,研究團體、臨床醫師、醫療保健人士及政策法規界人士需要協(xié)同合作,建立起一個(gè)開(kāi)放共享的數據網(wǎng)絡(luò ),將生物醫學(xué)研究者所掌握的研究類(lèi)數據(如基因組、轉錄組、蛋白組、代謝組、表型組等)、臨床醫師和護士掌握的臨床類(lèi)數據、健康管理人員掌握的飲食和運動(dòng)類(lèi)數據,以及患者自身的社會(huì )及物理環(huán)境信息等連接起來(lái),持續更新并對所有相關(guān)人員和公眾進(jìn)行開(kāi)放。在此基礎上,生物醫學(xué)研究者可深入理解疾病發(fā)病機制、確定疾病亞型,臨床醫師則可進(jìn)一步結合患者的個(gè)體信息制定精準治療方案。
以肺癌為例,20 年之前罹患非小細胞肺癌的患者只能選擇化療方案,5 年存活率小于 10%。這是由于當時(shí)的醫生根據組織病理僅可將非小細胞肺癌進(jìn)行細胞學(xué)分類(lèi)(分為鱗狀細胞癌、腺癌和大細胞癌),對病情診斷和治療方案選擇的意義不大。
如今,依賴(lài)于癌癥基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)、信號組學(xué)、臨床標志物研究及社會(huì )物理環(huán)境等多源數據,醫生可依據同樣的組織病理,以及進(jìn)一步提供的癌癥驅動(dòng)因子及信號傳導通路的信息,將患者分成亞群,實(shí)現更加精確的診斷。結合臨床制定出個(gè)性化的精確治療方案,并依據臨床及分子標志物的變化精確調整治療方案,使患者的 5 年臨床緩解率達到 60% 以上。
2 電燃料
電燃料(electrofuels)是一種通過(guò)微生物(如細菌)直接利用電能或者是氫、氨等化學(xué)物質(zhì)(而不是太陽(yáng)能)來(lái)獲取能量生長(cháng)并生產(chǎn)出生物燃料的新技術(shù)。傳統上的生物燃料技術(shù)都需要直接或間接利用植物光合作用,因而需要投入大量的土地、水和肥料以獲取足夠的植物原料,生產(chǎn)效率較為低下。為了解決這一瓶頸問(wèn)題,近些年,美國能源部高級能源研究計劃署(ARPA-E)以“融合科學(xué)”的方式資助學(xué)術(shù)界和產(chǎn)業(yè)界共同解決該問(wèn)題,并取得重大進(jìn)展。
例如,在 ARPA-E 的資助下,可再生化學(xué)品公司——OPX 生物技術(shù)公司利用嗜特異環(huán)境微生物生產(chǎn)出各種工業(yè)用的、富含能量的長(cháng)鏈脂肪酸分子,而北卡羅來(lái)納州立大學(xué)的研究人員則開(kāi)發(fā)出將脂肪酸轉化為液體燃料的化學(xué)方法。該項技術(shù)借助于微生物、化學(xué)、合成生物學(xué)、基因工程學(xué)等不同學(xué)科領(lǐng)域的知識會(huì )聚,有效減少了生物質(zhì)能研究中對于資源的依賴(lài)性,將生物燃料的生產(chǎn)效率提高了10 倍。
隨著(zhù)有關(guān)微生物代謝機制相關(guān)的各類(lèi)數據的進(jìn)一步會(huì )聚并向不同學(xué)科背景人員進(jìn)行開(kāi)放,以電燃料為代表的新型生物燃料將迎來(lái)新的發(fā)展機遇;尤其是有助于篩選出具有較高能量轉換效率的嗜特異環(huán)境微生物,使得新型生物燃料的開(kāi)發(fā)利用呈現出多元化、智能化和網(wǎng)絡(luò )化的發(fā)展態(tài)勢。
3 農業(yè)防病減災
現代農業(yè)通過(guò)傳統農學(xué)、生態(tài)學(xué)、土壤學(xué)、社會(huì )學(xué)等多學(xué)科交叉融合,改變了傳統上農業(yè)靠天吃飯的狀況,尤其是在防病減災方面取得了良好的效果。
以美國為例,惡劣天氣會(huì )對農業(yè)生產(chǎn)和農民收入造成損失。針對這一問(wèn)題,美國 Climate Corp 公司利用美國聯(lián)邦政府數據網(wǎng)站免費提供的數據,如 60 年農作物收成數據、美國超過(guò) 100 萬(wàn)個(gè)氣象監測站的氣象數據和 14 TB 的土壤質(zhì)量數據等,開(kāi)發(fā)了專(zhuān)門(mén)的數據軟件,為農民提供基于數據的各類(lèi)農業(yè)相關(guān)服務(wù)。
例如,美國農民用戶(hù)可以利用軟件上傳農場(chǎng)的坐標和相關(guān)信息,即可獲得農場(chǎng)范圍內的實(shí)時(shí)天氣信息,如溫度、濕度、風(fēng)力、雨水等,再結合軟件提供的土壤質(zhì)量數據,從而幫助用戶(hù)判斷每個(gè)地塊的播種、收獲、耕作時(shí)間。如果系統預測有惡劣天氣,用戶(hù)可以選擇相應的農業(yè)保險,以降低惡劣天氣對農業(yè)生產(chǎn)造成的影響。
以色列的現代農業(yè)技術(shù)也充分體現了基于數據來(lái)解決實(shí)際問(wèn)題的融合范式。例如,以色列 Taranis 公司匯集了衛星圖像、作物實(shí)地生長(cháng)報告及當地病蟲(chóng)害分布等數據資源,為農民提供可視化數據平臺,實(shí)時(shí)監測植物病蟲(chóng)害風(fēng)險和氣候變化。
AKOL 公司則建立了包含不同區域農民工作習慣和方式在內的龐大農業(yè)管理數據庫,依賴(lài)于土壤學(xué)、農學(xué)和社會(huì )學(xué)等專(zhuān)業(yè)知識的會(huì )聚,幫助農民制定更精細的種植方案,如精確霧化灌溉設備的閥值及方向、肥料及殺蟲(chóng)劑使用數量等,實(shí)現農民利益的最大化。
4 未來(lái)展望
21 世紀以來(lái),全球科技界興起兩股重要浪潮。一方面,以科技革命解決能源、資源、人口、環(huán)境等關(guān)乎人類(lèi)未來(lái)可持續發(fā)展的重大問(wèn)題刻不容緩。為此,國際上有關(guān)科研范式變革的呼聲層出不窮,美國提出的“融合科學(xué)”旨在倡導以一種新的科研范式來(lái)解決重大經(jīng)濟社會(huì )問(wèn)題,從而給科研組織、數據基礎和相關(guān)政策等方面帶來(lái)了新的圖景。
另一方面,有關(guān)科研數據公開(kāi)化的呼吁也聲勢浩大,“開(kāi)放獲取”“開(kāi)放數據”“數據共享”“開(kāi)放科學(xué)”等共同在科技界推動(dòng)了科研數據開(kāi)放理念的普及,在實(shí)踐中也推動(dòng)了數據開(kāi)放平臺的建設和運營(yíng)。
本文認為,推動(dòng)重大經(jīng)濟社會(huì )問(wèn)題的解決需要將這兩股浪潮進(jìn)行連通。一方面,要真正實(shí)現“融合科學(xué)”所具有的多學(xué)科交叉融合、創(chuàng )新價(jià)值鏈貫通融合和不同權益相關(guān)方的協(xié)同融合,需要從底層數據上將跨學(xué)科、跨部門(mén)、跨領(lǐng)域、跨環(huán)節的數據進(jìn)行合理的存儲、開(kāi)放、管理和共享。
另一方面,當前與“開(kāi)放數據”有關(guān)的倡議和實(shí)踐重在強調數據的開(kāi)放,但是缺乏對數據開(kāi)放會(huì )為經(jīng)濟社會(huì )帶來(lái)什么效用的思考。事實(shí)上,如果將當前“融合科學(xué)”和“開(kāi)放數據”的發(fā)展結合起來(lái),以“開(kāi)放數據”支撐“融合科學(xué)”的實(shí)現,以“融合科學(xué)”帶動(dòng)“開(kāi)放數據”更好地在解決重大經(jīng)濟社會(huì )問(wèn)題方面發(fā)揮效用,將為人類(lèi)未來(lái)可持續發(fā)展帶來(lái)不可估量的正面推動(dòng)作用。
當然,要實(shí)現“融合科學(xué)”與“開(kāi)放數據”的連通并非易事。從技術(shù)層面來(lái)看,要實(shí)現“融合科學(xué)”所要求的全學(xué)科、全流程和全景式的數據開(kāi)放,無(wú)疑是對人們現有的數據存儲、管理和開(kāi)放技術(shù)都提出了挑戰。所幸的是,當前一些符合“可查找(findable)、可獲?。╝ccessible)、可相互操作(interoperable)和可再利用(reusable)”(FAIR 標準)的跨學(xué)科數據開(kāi)放平臺已經(jīng)運行,美國 ORCID(開(kāi)放研究者與貢獻者身份碼)平臺也為每一位研究者提供了一個(gè)唯一的、全球通用的標識符。
同時(shí),多學(xué)科交叉融合也已經(jīng)催生了一系列顛覆性技術(shù)的誕生,如 DNA 數據存儲技術(shù)和人工智能技術(shù)。未來(lái)有望通過(guò)完善此類(lèi)新技術(shù)來(lái)實(shí)現“融合科學(xué)”所要求的數據開(kāi)放物理設施和服務(wù)架構要求。此外,重大經(jīng)濟社會(huì )問(wèn)題的導向下,全球科技界的視野也進(jìn)一步開(kāi)放,有利于與其他公共部門(mén)(如政府部門(mén))進(jìn)行數據連通。這些都為未來(lái)構建符合“融合科學(xué)”的基礎數據,支撐從傳統科研范式到以重大問(wèn)題解決為導向的“融合科學(xué)”新范式的轉變提供了技術(shù)上的可能性。
此外,實(shí)現“融合科學(xué)”所要求的“開(kāi)放數據”,還需要政府部門(mén)、科研資助機構、學(xué)術(shù)機構、數據平臺商、科研人員等通力支持。
1 從政府部門(mén)來(lái)看
當前政府數據公開(kāi)已經(jīng)取得重要進(jìn)展,一些國家陸續發(fā)布了推動(dòng)政府數據公開(kāi)的政策文件。例如,中國 2015 年印發(fā)《促進(jìn)大數據發(fā)展行動(dòng)綱要》,要求“2018 年底前建成國家政府數據統一開(kāi)放平臺”;2018 年印發(fā)《國家科學(xué)數據管理辦法》,并陸續支持 20 個(gè)國家科學(xué)數據中心。
2 從科研資助機構的角度來(lái)看
目前若干資助機構已經(jīng)對項目承擔方提出了公開(kāi)其承擔項目產(chǎn)生的科研成果和數據的強制性政策要求,未來(lái)需進(jìn)一步推動(dòng)此類(lèi)政策的全面鋪開(kāi)。例如,2017 年起歐盟“地平線(xiàn)計劃”(Horizon 2020)要求所資助項目必須參與研究數據(包括統計資料、實(shí)驗結果、測量值、實(shí)地觀(guān)測結果、調查結果、采訪(fǎng)錄音和圖像等)的開(kāi)放獲取,以便其他人員能夠通過(guò)知識庫訪(fǎng)問(wèn)、挖掘、復制和傳播科研數據。
3 從學(xué)術(shù)機構的角度來(lái)看
一方面需要改變對科研人員的評價(jià)和激勵制度,鼓勵那些將科研成果和科研數據進(jìn)行開(kāi)放的科研人員;另一方面應根據機構特點(diǎn)適時(shí)建立機構層面的知識庫,引導和培訓科研人員進(jìn)行數據的標準化存儲和開(kāi)放。
4 從數據平臺商的角度來(lái)看
目前學(xué)術(shù)期刊的開(kāi)放獲取已經(jīng)取得重要進(jìn)展,一些主流學(xué)術(shù)出版機構(如美國化學(xué)學(xué)會(huì )和英國自然出版集團)等都已陸續加入開(kāi)放獲取行列;Zenodo和 Figshare等其他類(lèi)型(如圖像、視頻、軟件、代碼等)的科研資源數據平臺也陸續上線(xiàn)。但是,如何在這些不同平臺之間建立起關(guān)聯(lián)(如通過(guò)類(lèi)似于美國 ORCID 的數據標識)從而形成一個(gè)跨學(xué)科、跨界的數據平臺還有待開(kāi)發(fā)和完善。
5 從科研人員來(lái)看
科研人員既要調整價(jià)值導向,倡導以解決重大經(jīng)濟社會(huì )問(wèn)題為根本使命的文化,也要在數據開(kāi)放方面接受一定的數據存儲、管理和使用上的培訓,使之轉變傳統觀(guān)念,從以往僅重視論文的發(fā)表轉變?yōu)閷祿沧鳛橹匾蒲匈Y源進(jìn)行開(kāi)放和共享。
肖小溪中國科學(xué)院科技戰略咨詢(xún)研究院助理研究員。主要研究領(lǐng)域:科技管理與評價(jià)。2014年畢業(yè)于中國科學(xué)院大學(xué),獲得管理科學(xué)與工程專(zhuān)業(yè)博士學(xué)位。近年來(lái)主要承擔來(lái)自中國科學(xué)院、國家自然科學(xué)基金委員會(huì )等的科研課題。圍繞科技評價(jià)、科技政策等主題在國內核心期刊發(fā)表學(xué)術(shù)論文10余篇。
李曉軒中國科學(xué)院管理創(chuàng )新與評估研究中心主任,中國科學(xué)院科技戰略咨詢(xún)研究院研究員,博士生導師?,F任北京市政協(xié)委員。主要研究領(lǐng)域為科研管理,涉及科技評價(jià)、科技人力資源管理、科研經(jīng)費管理等研究方向。長(cháng)期從事政府科技管理與政策方面的決策支撐研究工作,近年來(lái)主要承擔來(lái)自中國科學(xué)院、國家發(fā)展和改革委員會(huì )、財政部、科學(xué)技術(shù)部、國家自然科學(xué)基金委員會(huì )等重要科研課題。撰寫(xiě)了大量研究報告和研究論文。
文章源自:
肖小溪,甘泉,蔣芳,陳捷,李曉軒.“融合科學(xué)”新范式及其對開(kāi)放數據的要求.中國科學(xué)院院刊,2020,(1):3-10.
總監制:楊柳春
責任編輯:張帆
助理編輯、校對:PAN
排版:筱小鹿
聯(lián)系客服