發(fā)布時(shí)間:所屬分類(lèi):教育職稱(chēng)論文瀏覽:1次
摘 要: 摘要:以美國(guó)物理學(xué)會(huì)旗下期刊20002019年發(fā)表的論文和WebofScience論文摘要為基礎(chǔ),用模因短語(yǔ)刻畫(huà)知識(shí),構(gòu)建模因關(guān)系網(wǎng)絡(luò)并引入跨學(xué)科測(cè)度Rao-Stirling指數(shù)以計(jì)算模因的跨領(lǐng)域分?jǐn)?shù),從而追蹤物理學(xué)中的跨領(lǐng)域模因。分別從網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)指標(biāo)、跨領(lǐng)域測(cè)度指標(biāo)
摘要:以美國(guó)物理學(xué)會(huì)旗下期刊2000—2019年發(fā)表的論文和WebofScience論文摘要為基礎(chǔ),用模因短語(yǔ)刻畫(huà)知識(shí),構(gòu)建模因關(guān)系網(wǎng)絡(luò)并引入跨學(xué)科測(cè)度Rao-Stirling指數(shù)以計(jì)算模因的跨領(lǐng)域分?jǐn)?shù),從而追蹤物理學(xué)中的跨領(lǐng)域模因。分別從網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)指標(biāo)、跨領(lǐng)域測(cè)度指標(biāo)和專(zhuān)業(yè)術(shù)語(yǔ)對(duì)比3個(gè)方面進(jìn)行驗(yàn)證,證明了所提的模因關(guān)系網(wǎng)絡(luò)和模因的跨領(lǐng)域分?jǐn)?shù)可以有效反映知識(shí)在不同領(lǐng)域間的擴(kuò)散現(xiàn)象。
關(guān)鍵詞:模因;跨領(lǐng)域;社區(qū)發(fā)現(xiàn);美國(guó)物理學(xué)會(huì)數(shù)據(jù)集
近年來(lái),一些社會(huì)問(wèn)題和研究課題往往無(wú)法在單一領(lǐng)域內(nèi)得到解決,于是跨領(lǐng)域研究逐漸成為一種新的解決思路。大數(shù)據(jù)的出現(xiàn)為探索科學(xué)結(jié)構(gòu)及其發(fā)展模式提供了數(shù)據(jù)基礎(chǔ)[1]。計(jì)算機(jī)科學(xué)、網(wǎng)絡(luò)科學(xué)等科技的蓬勃發(fā)展為科學(xué)學(xué)研究提供了多種技術(shù)手段[2]。從研究引文分布[3-4]到合著網(wǎng)絡(luò)[5-6]再到團(tuán)隊(duì)合作[7],科學(xué)學(xué)漸漸成為一門(mén)獨(dú)立的、融合多學(xué)科知識(shí)的學(xué)科。雖然有些科學(xué)家更傾向于主流學(xué)科領(lǐng)域的創(chuàng)新[8-9]而不認(rèn)可跨學(xué)科研究[8],但不可否認(rèn)的是越來(lái)越頻繁的跨領(lǐng)域交流對(duì)科學(xué)研究起到了一定的促進(jìn)作用。文獻(xiàn)[10]的分析表明,論文和發(fā)明專(zhuān)利的組合往往能獲得更高的影響因子。文獻(xiàn)[11]認(rèn)為,如果把看似不相關(guān)的思想和方法成功地結(jié)合起來(lái)可能會(huì)產(chǎn)生很大的影響。但迄今為止這些宏觀的跨學(xué)科研究往往以論文[9]、期刊[12]、學(xué)科領(lǐng)域[9]、團(tuán)體[13]為研究對(duì)象,忽略了跨領(lǐng)域的微觀本質(zhì)——知識(shí)交流。
科學(xué)研究中知識(shí)的傳播和演化從微觀層面體現(xiàn)在知識(shí)隨著論文的引用關(guān)系而傳播[14]。用模因(meme)來(lái)描述知識(shí)的傳播過(guò)程已經(jīng)得到大多數(shù)學(xué)者的認(rèn)同。模因由道金斯在《自私的基因》[15]一書(shū)中首次提出,他認(rèn)為單詞、旋律、食譜、思想等文化實(shí)體與基因的進(jìn)化相似:都具有復(fù)制和突變功能,并且都用人類(lèi)文化代替基因作為繁殖媒介。研究表明,模因的演化可以有效推動(dòng)網(wǎng)絡(luò)的擴(kuò)散和演化[16]。在引文網(wǎng)絡(luò)中,科學(xué)模因可以理解為論文中的短文本單位,在引用文獻(xiàn)中被復(fù)制并以多種表現(xiàn)形式分布在不同領(lǐng)域[14]。分析模因在不同領(lǐng)域的分布可以有效追蹤知識(shí)在不同領(lǐng)域的演進(jìn)過(guò)程。因此,本文利用引文網(wǎng)絡(luò)中的模因短語(yǔ)來(lái)推導(dǎo)知識(shí)在引文網(wǎng)絡(luò)中的演化。
科學(xué)知識(shí)由包含在論文、書(shū)籍、專(zhuān)利、軟件和其他學(xué)術(shù)制品中的概念和關(guān)系構(gòu)成,這些知識(shí)元素又通過(guò)正式和非正式的信息流、思想等連接起來(lái)[17]。因此,科學(xué)知識(shí)可以描述為一個(gè)復(fù)雜的、自組織的、不斷進(jìn)化的多尺度網(wǎng)絡(luò)[2]。網(wǎng)絡(luò)科學(xué)為揭示知識(shí)的傳播和演化提供了一個(gè)高效的工具。作為一種分析網(wǎng)絡(luò)的工具,網(wǎng)絡(luò)科學(xué)有助于更好地理解作者或論文在合著網(wǎng)絡(luò)、引用網(wǎng)絡(luò)中的作用。已有相關(guān)研究通過(guò)構(gòu)建科學(xué)合作網(wǎng)絡(luò)使知識(shí)的微觀特征達(dá)到可視化,從而分析了合作網(wǎng)絡(luò)的結(jié)構(gòu)特性[18]。雖然不同領(lǐng)域表現(xiàn)出不同的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)[5-6],但是許多網(wǎng)絡(luò)結(jié)構(gòu)表現(xiàn)出相似的全局特性。小世界架構(gòu)就是其中之一[6],它反映了領(lǐng)域內(nèi)高度聚集、領(lǐng)域間稀疏連接的情況,為跨領(lǐng)域研究提供了一種思路。
本文從模因角度追蹤跨領(lǐng)域的知識(shí)交流,構(gòu)建模因關(guān)系網(wǎng)絡(luò),從而提出了一種分析科學(xué)文獻(xiàn)中跨領(lǐng)域知識(shí)關(guān)系的研究框架,并將其應(yīng)用于2000—2019年美國(guó)物理學(xué)會(huì)(AmericanPhysicalSociety,APS)數(shù)據(jù)集。在所構(gòu)建的模因關(guān)系網(wǎng)絡(luò)中,節(jié)點(diǎn)代表模因短語(yǔ),邊代表模因短語(yǔ)在論文摘要中的關(guān)聯(lián)程度。利用有權(quán)無(wú)向的模因關(guān)系網(wǎng)絡(luò),本文對(duì)網(wǎng)絡(luò)的結(jié)構(gòu)特性和節(jié)點(diǎn)間關(guān)聯(lián)度進(jìn)行了探索性的研究,并著重進(jìn)行以下實(shí)驗(yàn):1)從引文網(wǎng)絡(luò)中提取科學(xué)模因[14],構(gòu)建模因關(guān)系網(wǎng)絡(luò),以探究其社團(tuán)結(jié)構(gòu)和小世界特性。2)基于之前論文多樣性的研究[19],假設(shè)模因短語(yǔ)可以量化跨領(lǐng)域研究程度,提出了領(lǐng)域相似度,并計(jì)算模因跨領(lǐng)域指標(biāo),追蹤到跨領(lǐng)域模因。
1數(shù)據(jù)和方法
1.1數(shù)據(jù)集
本研究的數(shù)據(jù)集使用物理學(xué)領(lǐng)域的引文網(wǎng)絡(luò),依托于APS數(shù)據(jù)集(包含元信息及引用關(guān)系)和WebofScience數(shù)據(jù)庫(kù)中的APS文獻(xiàn)摘要信息。在選取數(shù)據(jù)集時(shí)從現(xiàn)實(shí)角度出發(fā)主要考慮物理學(xué)對(duì)科學(xué)界長(zhǎng)久以來(lái)的影響力,從數(shù)據(jù)權(quán)威性看APS數(shù)據(jù)集更能代表物理學(xué)的發(fā)展動(dòng)態(tài),且選取單一的數(shù)據(jù)集也有助于形成統(tǒng)一的標(biāo)準(zhǔn)化領(lǐng)域分類(lèi)。
在數(shù)據(jù)預(yù)處理方面,本文根據(jù)文獻(xiàn)唯一索引號(hào)DOI將摘要信息整合到APS數(shù)據(jù)元信息中,并提取出APS數(shù)據(jù)集中的引用關(guān)系形成引文網(wǎng)絡(luò)。
1.2定義科學(xué)模因
文獻(xiàn)中經(jīng)常出現(xiàn)的短語(yǔ)或詞匯可作為重要的模因,但是一些高頻出現(xiàn)的詞匯如理論、研究所包含的知識(shí)價(jià)值往往很低。文獻(xiàn)[14]提出了一種基于引文網(wǎng)絡(luò)識(shí)別科學(xué)模因的算法,利用模因出現(xiàn)的頻率及其在引文中的傳播比例刻畫(huà)出模因短語(yǔ)的得分。
1.4.2領(lǐng)域相似性
模因所屬領(lǐng)域由APS數(shù)據(jù)集中包含該模因的一組論文集確定。如圖1所示,包含模因1的6篇文獻(xiàn)中有4篇文獻(xiàn)屬于領(lǐng)域a,2篇文獻(xiàn)屬于領(lǐng)域b,由此推導(dǎo)出模因1屬于領(lǐng)域a。如果領(lǐng)域i中的論文和領(lǐng)域j中的論文存在引用關(guān)系,那么領(lǐng)域i和領(lǐng)域j更相似[21]。將這一思想推廣到模因關(guān)聯(lián)度網(wǎng)絡(luò)中,若領(lǐng)域i和領(lǐng)域j中的模因存在共現(xiàn)關(guān)系,那么領(lǐng)域i和領(lǐng)域j更相似。
本文提出基于模因關(guān)聯(lián)度網(wǎng)絡(luò)的領(lǐng)域間相似性度量指標(biāo)Sij。如果模因間的關(guān)聯(lián)跨越了領(lǐng)域i和j,則領(lǐng)域i和j的相似度增加;如果模因間的關(guān)聯(lián)跨越了領(lǐng)域i和領(lǐng)域j以外其他領(lǐng)域,則領(lǐng)域i和j的相似度減少;如果模因間的關(guān)聯(lián)在領(lǐng)域內(nèi)部,則不影響領(lǐng)域間的相似度。同時(shí)相似度的計(jì)算考慮模因間的關(guān)聯(lián)權(quán)重Wab。
1.5網(wǎng)絡(luò)跨領(lǐng)域測(cè)度
為了從總體上度量一個(gè)學(xué)科內(nèi)部的跨領(lǐng)域交流情況,單純地累加領(lǐng)域相似度既缺乏可解釋性,又忽略了不同領(lǐng)域維度對(duì)總體度量指標(biāo)影響力的差異性。于是,本文借鑒Dworkin衡量網(wǎng)絡(luò)跨領(lǐng)域程度的思想[22]提出了宏觀的、平衡各領(lǐng)域維度差異的網(wǎng)絡(luò)跨領(lǐng)域測(cè)度。
2結(jié)果和分析
2.1科學(xué)模因
本文在構(gòu)建APS引文網(wǎng)絡(luò)后使用式(2)識(shí)別摘要中的模因[14],模因得分越高的短語(yǔ)或詞匯越有可能成為領(lǐng)域研究中的模因。
表1列出了2015—2019年期間APS引文網(wǎng)絡(luò)中排名前10的科學(xué)模因。在百度詞條中檢索表1中的模因可以發(fā)現(xiàn),近5年物理學(xué)領(lǐng)域的研究熱點(diǎn)主要聚焦在宇宙學(xué)、材料(石墨烯)、量子通信、流體力學(xué)領(lǐng)域。同時(shí)科學(xué)模因分?jǐn)?shù)也在隨著研究的深入不斷演變,進(jìn)而反映出模因短語(yǔ)的熱門(mén)程度隨時(shí)間變化的趨勢(shì)。
2.2模因關(guān)系網(wǎng)絡(luò)
通過(guò)識(shí)別模因可以探究熱點(diǎn)知識(shí)的演變。本文用構(gòu)建模因關(guān)系網(wǎng)絡(luò)的方法實(shí)現(xiàn)模因間關(guān)系的可視化,直觀地展示不同模因間的關(guān)聯(lián)程度,揭示模因演化過(guò)程中的相互影響。使用式(3)計(jì)算模因間的關(guān)聯(lián)程度,并構(gòu)建模因關(guān)聯(lián)度網(wǎng)絡(luò)。圖2描繪了模因關(guān)系網(wǎng)絡(luò),并刻畫(huà)了網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)。網(wǎng)絡(luò)可視化使用Gephi軟件,其中網(wǎng)絡(luò)可視化的具體設(shè)置為FruchtermanReingold布局(力引導(dǎo)布局)、快速模塊化社區(qū)發(fā)現(xiàn)算法[23]和pagerank算法[24]。
模因關(guān)系網(wǎng)絡(luò)不僅能呈現(xiàn)出社區(qū)劃分結(jié)果,而且能夠反映不同領(lǐng)域中科學(xué)模因的社團(tuán)結(jié)構(gòu)。可以看到,具有更多跨領(lǐng)域聯(lián)系的模因(統(tǒng)計(jì)物理、交叉學(xué)科物理等)往往表現(xiàn)出更強(qiáng)類(lèi)間連接,并與非線性物理、量子通信、復(fù)雜網(wǎng)絡(luò)的模因呈現(xiàn)較強(qiáng)的關(guān)聯(lián)度。同一模因往往橫跨多個(gè)領(lǐng)域。
模因關(guān)系網(wǎng)絡(luò)中邊的權(quán)重表示不同模因間關(guān)聯(lián)程度,關(guān)鍵模因周?chē)年P(guān)聯(lián)模因反映了關(guān)鍵知識(shí)隨時(shí)間的演化趨勢(shì)。其他模因與關(guān)鍵模因的距離用余弦相似度度量,模因字體大小與關(guān)聯(lián)程度有關(guān)。圖3顯示2017—2019年期間分?jǐn)?shù)排名第1的模因“darkmatter”、分?jǐn)?shù)排名第2的模因“graphene”與其他模因的關(guān)聯(lián)度變化。
2.3模因多樣性指標(biāo)
本節(jié)在構(gòu)建模因關(guān)系網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)一步探究其跨領(lǐng)域特性,追蹤跨領(lǐng)域模因的多樣性。首先,由模因的領(lǐng)域關(guān)系定義出不同領(lǐng)域間的距離dij=1−Sij。其次,將領(lǐng)域間距離dij代入RS多樣性指標(biāo)∆,得到模因跨領(lǐng)域得分。最后,通過(guò)模因關(guān)系網(wǎng)絡(luò)的社團(tuán)劃分、網(wǎng)絡(luò)跨領(lǐng)域測(cè)度指標(biāo)和對(duì)比百度詞條來(lái)驗(yàn)證模因跨領(lǐng)域分?jǐn)?shù)的準(zhǔn)確性。
2.3.1領(lǐng)域相似性
為了量化不同領(lǐng)域間的模因擴(kuò)散現(xiàn)象,本文以2000—2019年期間APS模因關(guān)系網(wǎng)絡(luò)為基礎(chǔ),由式(5)計(jì)算出APS的領(lǐng)域相似性Sij,從而得到領(lǐng)域間距離如圖4所示。從圖4可以看到,關(guān)聯(lián)度最高的兩個(gè)領(lǐng)域?yàn)镚ravitation,Cosmology&Astrophysics和Particles&Fields,從模因關(guān)系網(wǎng)絡(luò)中得到的領(lǐng)域間相似性均低于0.3,這與以往跨學(xué)科相似度度量指標(biāo)一致[25]。圖4展示的領(lǐng)域相似度與模因社團(tuán)劃分結(jié)果相似,Particles&Fields表現(xiàn)出較強(qiáng)的交叉領(lǐng)域特性,可見(jiàn)領(lǐng)域相似性有效反映了領(lǐng)域間的合作關(guān)系。——論文作者:周毅1,閆光輝1,盧彬煒1,王珊1,李世魁1,衛(wèi)祥3,楊仕博2,靳丹3
相關(guān)期刊推薦:《應(yīng)用科學(xué)學(xué)報(bào)》辦刊宗旨:積極反映我國(guó)應(yīng)用科學(xué)方面的最新科研成果,廣泛開(kāi)展國(guó)內(nèi)外學(xué)術(shù)交流,努力為繁榮科學(xué)研究、推廣科研成果服務(wù),促進(jìn)應(yīng)用科學(xué)領(lǐng)域的發(fā)展。報(bào)道范圍:本刊強(qiáng)調(diào)科學(xué)的應(yīng)用性,主要刊登電子技術(shù)、信息與通信工程、計(jì)算機(jī)科學(xué)、機(jī)電自動(dòng)化、材料科學(xué)、應(yīng)用物理、應(yīng)用化學(xué)、應(yīng)用數(shù)學(xué)等領(lǐng)域內(nèi)的創(chuàng)新性科研成果。