【博主按】這是我編寫的一部教材中對CiteSpace的介紹,估計這一次我是把這個東西想明白了,就是不知道能不能說明白。請各位賜教。
CiteSpace:由美國德雷賽爾大學信息科學與技術學院的陳超美開發。該程序可以登錄到cluster.cis.drexel.edu/~cchen/citespace后免費使用。
如何表現一個研究領域?CiteSpace的開發者陳超美認為:可以用“研究前沿”和“知識基礎”隨著時間相對應地變化情況來表示一個研究領域的狀況。
研究前沿(Research Fronts):在CiteSpace中,采用一種“突發詞檢測”算法來確定研究前沿中的概念,基本原理就是統計相關領域論文的標題和摘要中詞匯頻率,根據這些詞匯的增長率來確定哪些是研究前沿的熱點詞匯。根據這些術語在同一篇文章中共同出現的情況進行聚類分析后,可以得到“研究前沿術語的共現網絡”。因此,研究前沿系指臨時形成的某個研究課題及其基礎研究問題的概念組合,也是正在興起或突然涌現的理論趨勢和新主題,代表一個研究領域的思想現狀。
研究前沿的知識基礎(Intellective Base):即含有研究前沿的術語詞匯的文章的引文,實際上它們反映的是研究前沿中的概念在科學文獻中的吸收利用知識的情況。對這些引文也可以通過它們同時被其他論文引用的情況進行聚類分析,這就是同被引聚類分析(co-citation cluster analysis),最后形成了一組被研究前沿所引用的科學出版物的演進網絡,即“知識基礎文章的同被引網絡”。
因此上,CiteSpace就是利用三個網絡(“研究前沿術語的共現”,“知識基礎文章的同被引”和“研究前沿術語引用知識基礎文章”)隨著時間演變的情況來尋找研究熱點及趨勢,并以可視化的方式展示出來。
具體做法包括:首先,下載相關文獻,用戶可以從Web of Science中檢索并以固定格式下載某一主題的文獻記錄,主要包括作者、題目、摘要和文獻的引文等字段,將檢索到的文獻記錄輸入到系統之后,系統會生成對文章標題、文摘和描述詞的頻率統計,然后設置參數,如確定要分析領域的總的時間段范圍和分割后每一個時間片段的長度等;運行系統后會得到“研究前沿術語的共現網絡”,“知識基礎文章的同被引網絡”和“研究前沿術語引用知識基礎文章網絡”三種可視化的結果