Citespace软件操作问答
Citespace软件操作问答
Citespace软件操作问答(摘自陈超美博士的科学网博客)(8)如何在CiteSpace中控制节点的取舍CiteSpace提供了几种方式来控制最终生成的网络将由哪些节点构成:1.Top N2.Top N%3.Threshold Interpolation4.Select Citers第一种办法最简单,最适于初学阶段,所以目前版本将其放在首位。
其余几种办法逐渐变得复杂,最好等熟悉系统之后再考虑。
下面简要介绍一下各个方法的细节。
Top N:系统设定N=30,意为在每个time slice中提取N个被引次数最高的文献。
N越大生成的网络将相对更全面一些。
Top N%: 将每个time slice中的被引文献按被引次数排序后,保留最高的N%作为节点。
Threshold Interpolation:设定三个time slices的值,其余time slices的值由线性插值赋值。
三组需要设置的slices为第一个,中间一个,和最后一个slice。
每组中的三个值分别为c,cc,和ccv。
c为最低被引次数。
只有满足这个条件的文献才能参加下面的运算。
cc为本slice内的共被引次数。
ccv为规范化以后的共被引次数(0~100)。
Select Citers:与以上方法不同的是这个方法先选施引文献,然后需再用方法1-3之一。
先Check TC Distribution然后填写Use TC Filter 后面的两个数字:最低和最高TC值(Time Cited),选定User TC Filter前的选项。
按Continue,再设定方法1,2,或3。
节点总数在Progress Reports中给出。
节点总数越大需要内存越多。
下回将介绍如何选择网络的连接密度。
CiteSpace提供了多项参数选择,初学者难免有时不知从何下手。
这里介绍一些要点以供参考。
CiteSpace的功能类似一架照相机,只是它拍摄的对象是科学文献而不是自然景色。
Citespace软件操作问答
Citespace软件操作问答(摘自陈超美博士的科学网博客)(8)如何在CiteSpace中控制节点的取舍CiteSpace提供了几种方式来控制最终生成的网络将由哪些节点构成:1.Top N2.Top N%3.Threshold Interpolation4.Select Citers第一种办法最简单,最适于初学阶段,所以目前版本将其放在首位。
其余几种办法逐渐变得复杂,最好等熟悉系统之后再考虑。
下面简要介绍一下各个方法的细节。
Top N:系统设定N=30,意为在每个time slice中提取N个被引次数最高的文献。
N越大生成的网络将相对更全面一些。
Top N%: 将每个time slice中的被引文献按被引次数排序后,保留最高的N%作为节点。
Threshold Interpolation:设定三个time slices的值,其余time slices的值由线性插值赋值。
三组需要设置的slices为第一个,中间一个,和最后一个slice。
每组中的三个值分别为c,cc,和ccv。
c为最低被引次数。
只有满足这个条件的文献才能参加下面的运算。
cc为本slice内的共被引次数。
ccv为规范化以后的共被引次数(0~100)。
Select Citers:与以上方法不同的是这个方法先选施引文献,然后需再用方法1-3之一。
先Check TC Distribution然后填写Use TC Filter 后面的两个数字:最低和最高TC值(Time Cited),选定User TC Filter前的选项。
按Continue,再设定方法1,2,或3。
节点总数在Progress Reports中给出。
节点总数越大需要内存越多。
下回将介绍如何选择网络的连接密度。
CiteSpace提供了多项参数选择,初学者难免有时不知从何下手。
这里介绍一些要点以供参考。
CiteSpace的功能类似一架照相机,只是它拍摄的对象是科学文献而不是自然景色。
Citespace软件操作问答
Citespace软件操作问答(摘自超美博士的科学网博客)(8)如何在CiteSpace中控制节点的取舍CiteSpace提供了几种方式来控制最终生成的网络将由哪些节点构成:1.Top N2.Top N%3.Threshold Interpolation4.Select Citers第一种办法最简单,最适于初学阶段,所以目前版本将其放在首位。
其余几种办法逐渐变得复杂,最好等熟悉系统之后再考虑。
下面简要介绍一下各个方法的细节。
Top N:系统设定N=30,意为在每个time slice中提取N个被引次数最高的文献。
N越大生成的网络将相对更全面一些。
Top N%: 将每个time slice中的被引文献按被引次数排序后,保留最高的N%作为节点。
Threshold Interpolation:设定三个time slices的值,其余time slices的值由线性插值赋值。
三组需要设置的slices为第一个,中间一个,和最后一个slice。
每组中的三个值分别为c,cc,和ccv。
c为最低被引次数。
只有满足这个条件的文献才能参加下面的运算。
cc为本slice的共被引次数。
ccv为规化以后的共被引次数(0~100)。
Select Citers:与以上方法不同的是这个方法先选施引文献,然后需再用方法1-3之一。
先Check TC Distribution然后填写Use TC Filter 后面的两个数字:最低和最高TC值(Time Cited),选定User TC Filter前的选项。
按Continue,再设定方法1,2,或3。
节点总数在Progress Reports中给出。
节点总数越大需要存越多。
下回将介绍如何选择网络的连接密度。
CiteSpace提供了多项参数选择,初学者难免有时不知从何下手。
这里介绍一些要点以供参考。
CiteSpace的功能类似一架照相机,只是它拍摄的对象是科学文献而不是自然景色。
Citespace常见问题500问及解答(一)
Citespace常见问题500问及解答(一)
1、时区图中关键词重叠怎么办?答:放大图标,上下拉动与时间对应即可,注意不要左右拉动。
2、CNKI的数据作机构分析时出现英文怎么处理?答:(1)检查下载的数据看看是否有问题,如有问题手动进行修改(2)与相同的中文机构进行合并(3)如果不重要,将这个点隐藏了。
3、引文半衰期是指什么答:Citation half-life引文半衰期一一是描述引文(文献)老化程度的指标,半衰期越大,显示引文的有效价值越大。
4、用Citespace处理后图谱比较分散怎么回事答:(1)数据量过少,一般应在200条以上记录,效果会比较好;(2)降低数据处理的阈值。
5、连线颜色太淡怎么处理答:display——link transparency——1.
6、下载的数据有某一个机构,但分析时却不显示怎么回事?答:共现强度不够。
7、关键词图谱中,入耳好看关键词的频次?答:在可视化界面左侧,能看到单个关键词的频次,如果想看总共多少关键词及频次,可以copy到excel里面看。
8、term和keyword能不能同时分析?答:不能同时分析,每次只能分析一个。
9、Citespace软件内存如何提升?答:用文本格式打开
startcitespace.bat,将Xmx1g改为Xmx4g即可。
10、在关键词可视化界面,space 右边的数字329,左下角的Records in the dataset: 2618,Records withinthe chosen range: 2365,数字的具体含义是什么?答:329是在其中一年中的keyword的个数,2618 是总数,2365是在From-T o年份之间的总数。
CiteSpace学习指南
CiteSpace学习指南1. CiteSpace基础CiteSpace全球使用的时间和空间特征被引分布:CiteSpace科技文本挖掘及可视化CiteSpace基础001:下载及安装CiteSpace基础002:软件原理CiteSpace基础003:最新安装视频CiteSpace基础004:不同版本使用说明CiteSpace基础005:知识图谱理论与实践CiteSpace:界定一个研究领域的学术格局CiteSpace理论基础与技术CiteSpace软件界面与功能CiteSpace对CNKI数据的分析CiteSpace对CSSCI数据的分析CiteSpace对Web of Science数据的分析CiteSpace对RSCI俄罗斯科学索引数据分析CiteSpace引文网络主路径分析CiteSpace对结构变异的分析CiteSpace的设计和分析原理CiteSpace的分析流程CiteSpace中Pathfinder的作用CiteSpace可视化案例视频Carrot对CiteSpace施引文献的聚类CiteSpace中文指南(最新版)2.CiteSpace可视化设计CiteSpace视图001:时区视图CiteSpace视图002:网络视图CiteSpace视图003:网络叠加图CiteSpace视图004:期刊叠加视图CiteSpace视图005:时间线视图CiteSpace视图006:主题配色3.CiteSpace案例图案例001:CiteSpace最新案例图案例002:CiteSpace最新案例图案例003:CiteSpace最新案例图案例004:CiteSpace最新案例图案例005:CiteSpace最新案例图案例006:CiteSpace最新案例图案例007:CiteSpace最新案例图案例008:CiteSpace最新案例图案例009:CiteSpace最新案例图案例010:CiteSpace最新案例图案例011:CiteSpace最新案例图案例012:CiteSpace最新案例图案例013:CiteSpace最新案例图案例014:CiteSpace最新案例图案例015:CiteSpace最新案例图案例016:CiteSpace最新案例图(主题图)案例017:CiteSpace最新案例图案例018:CiteSpace最新案例图案例019:CiteSpace最新案例图4. CiteSpace案例论文目录CiteSpace实践与应用:2021(1), 1-100CiteSpace实践与应用:2021(2), 101-200CiteSpace实践与应用:2021(3), 201-300CiteSpace实践与应用:2021(4), 301-400CiteSpace实践与应用:2021(5), 401-500CiteSpace实践与应用:2021(6), 501-545CiteSpace实践与应用:2020学位论文CiteSpace实践与应用:2014-2019学位论文CiteSpace实践与应用:10篇CiteSpace知识图谱博士论文CiteSpace实践与应用:10篇情报科学知识图谱学位论文CiteSpace实践与应用:14篇医学科学知识图谱博士论文CiteSpace实践与应用:10篇教育科学知识图谱学位论文CiteSpace实践与应用:10篇体育科学知识图谱学位论文CiteSpace实践与应用:图谱案例著作CiteSpace实践与应用:图谱案例论文5. CiteSpace问题问题001:CiteSpace论文问题问题002:CiteSpace论文问题问题003:CiteSpace论文问题CiteSpace问答001:常见问题CiteSpace问答002:分析中的异常要自己检查和完善CiteSpace问答003:关于国家或地区合作和关键词分析解决CiteSpace与VOSviewer软件字体太小6. 科学知识图谱基础基础知识001:文献共被引分析基础知识002:科研合作网络分析基础知识003:研究主题分析基础知识004:地理可视化基础知识005:科学计量与知识图谱免费指南基础知识006:科学知识图谱典型案例视频基础知识007:认识三计学基础知识008:数据库与数据采集基础知识009:科学知识图谱理论、方法与实践谁最早提出“文献计量学”这个词?文献计量学指标应用的四个群体简介科学计量学科学计量学与情报学的天然联系7. 科学知识图谱基础视频视频001:CiteSpace视频视频002:BibExcel视频视频003:VOSviewer视频视频004:SCI2视频视频005:R-Bibliometrix视频视频006:SCIMAT 视频视频007:文献计量中的基础概念视频008:不同领域的Bibliometrics 视频009:Nature 150年视频010:合作网络可视化。
CiteSpace操作指南
CiteSpace操作指南The CiteSpace ManualVersion 0.96Chaomei ChenCollege of Computing and InformaticsDrexel UniversityHow to cite:Chen, Chaomei (2014) The CiteSpace Manual. /doc/98eefc8258fb770bf68a5543.html /~cchen/citespace/CiteSpaceManual.pdf Contents1How can I find the latest version of the CiteSpace Manual? (5)2What can I use CiteSpace for? (5)2.1What if I have Questions (7)2.2How should I cite CiteSpace? (7)2.3Where are the Users of CiteSpace? (8)3Requirements to Run CiteSpace (10)3.1Java Runtime (JRE) (10)3.2How do I check whether Java is on my computer? (10)3.3Do I have a 32-bit or 64-bit Computer? (12)4How to Install and Configure CiteSpace (12)4.1Where Can I download CiteSpace from the Web? (12)4.2What is the maximum number of records that I can handle with CiteSpace? (13)4.3How to configure the memory allocation for CiteSpace? (13)4.4How to uninstall CiteSpace (14)4.5On Mac or Unix-based Systems (15)5Get Started with CiteSpace (19)5.1Try it with a demonstrative dataset (19)5.1.1The Demo Project (20)5.1.2Clustering (23)5.1.3Generate Cluster Labels (25)5.1.4Where are the major areas of research based on the input dataset? (27)5.1.5How are these major areas connected? (28)5.1.6Where are the most active areas? (28)5.1.7What is each major area about? Which/where are the key papers for a given area?365.1.8Timeline View (38)5.2Try it with a dataset of your own (39)5.2.1Collecting Data (39)5.2.2Working with a CiteSpace Project (43)5.2.3Data Sources in Chinese (44)5.2.4How to handle search results containing irrelevant topics (45)6Configure a CiteSpace Run (47)6.1Time Slicing (47)6.3Configure the Networks (48)6.3.1Bibliographic Coupling (49)6.4Node Selection Criteria (49)6.4.1Do I have the right network? (50)6.5Pruning, or Link Reduction (50)6.6Visualization (51)7Interacting with CiteSpace (51)7.1How to Show or Hide Link Strengths (51)7.2Adding a Persistent Label to a Node (52)7.3Using Aliases to Merge Nodes (53)7.4How to Exclude a Node from the Network (55)7.5How to Use the Fisheye View Slider (55)7.6How to Configure When to Calculate Centrality Scores Automatically (56) 7.7How to Save the Visualization as a PNG File (57)8Additional Functions (58)8.1Menu: Data (58)8.1.1CiteSpace Built-in Database (58)8.1.2Utility Functions for the Web of Science Format (61)8.1.3PubMed (62)8.2Menu: Network (64)8.2.1Batch Export to Pajek .net Files (64)8.3Menu: Geographical (64)8.3.1Generate Google Earth Maps (64)8.4Menu: Overlay Maps (67)8.4.1Add an Overlay (68)8.4.2Further Reading and Terms of Use (70)8.5Menu: Text (70)8.5.1Concept Trees and Predicate Trees (70)8.5.2List Terms by Clumping Properties (73)8.5.3Latent Semantic Analysis (74)9Selected Examples (75)10Metrics and Indicators (77)10.1Information Theoretic (77)10.2Structural (77)10.2.1Betweenness Centrality (77)10.2.2Modularity (77)10.2.3Silhouette (77)10.3Temporal (77)10.3.1Burstness (77)10.4Combined (77)10.4.1Sigma (77)10.5Cluster Labeling (78)10.5.1Term Frequency by Inversed Document Frequency (78)10.5.2Log-Likelihood Ratio (78)10.5.3Mutual Information (78)11References (78)1How can I find the latest version of the CiteSpace Manual?The latest version of the CiteSpace Manual is always at the following location:/doc/98eefc8258fb770bf68a5543.html /~cchen/citespace/CiteSpaceManual.pdfYou can also access the manual from CiteSpace: Help ?View the CiteSpace Manual (PDF). It will open up the PDF file in a new browser window.Figure 1. The latest version of the CiteSpace Manual is accessible from CiteSpace itself.2What can I use CiteSpace for?CiteSpace is designed to answer questions about a knowledge domain, which is a broadly defined concept that covers a scientific field, a research area, or a scientific discipline. A knowledge domain is typically represented by a set of bibliographic records of relevant publications. It is your responsibility to prepare the most appropriate and representative dataset that contains adequate information to answer your questions.CiteSpace is designed to make it easy for you to answer questions about the structure and dynamics of a knowledge domain. Here are some typical questions:What are the major areas of research based on the input datasetHow are these major areas connected, i.e. through which specific articlesWhere are the most active areasWhat is each major area about Which/where are the key papers for a given areaAre there critical transitions in the history of the development of the field Where are the ‘turning points’The design of CiteSpace is inspired by Thomas Kuhn’s structure of scientific revolutions. The central idea is that centers of research focus change over time, sometime incrementally and other times drastically. The development of science can be traced by studying their footprints revealed by scholarly publications.Members of the contemporary scientific community make their contributions. Their contributions form a dynamic and self-organizing system of knowledge. The system contains consensus, disputes, uncertainties, hypotheses, mysteries, unsolved problems, and unanswered questions. It is not enough to study a single school of thought. In fact, a better understanding of a specific topic often relies on an understanding of how it is related to other topics.The foundation of the CiteSpace is network analysis and visualization. Through network modeling and visualization, you can explore the intellectual landscape of a knowledge domain and discern what questions researchers have been trying to answer and what methods and tools they have developed to reach their goals.This is not a simple task. Rather it is often conceptually demanding and complex. If you are about to write a novel, the word processor or a text editor can make the task easier, but it cannot help you to create the plot or enrich the character of your hero. Similarly, and probably to a greater extent, CiteSpace can generate X-ray photos of a knowledge domain, but to interpret what these X-ray photos mean, you need to have some knowledge of various elements involved. The role of CiteSpace is to shift some of the traditionally labor-some burdens to computer algorithms and interactive visualizations so that you can concentrate on what human users are most good at in problem solving and truth finding. However, it is probably easier to generate some mysterious looking visualizations with CiteSpace than to fully understand what these visualizations tell you and who may benefit from such findings.Figure 2. Hierarchically organized functions of CiteSpace, for example, GUI ?Pruning ?Pathfinder: true.2.1What if I have QuestionsIf you have a question regarding the use of CiteSpace, you should first check the manual whether your question is answered in the manual. You can do a simple search through the PDF file to find out.If the manual does not get you anywhere, you can ask your questions on the Facebook page of CiteSpace:https:///doc/98eefc8258fb770bf68a5543.html /pages/CiteSpace/276625072366558You can also post questions to my blog on sciencenet:/doc/98eefc8258fb770bf68a5543.html /home.php?mod=space&uid=496649Please refrain from sending me emails because you will have a much better chance to get my response from either the Facebook or the sciencenet blog.Generally speaking, thoughtful questions get answered quickly. Questions that you may be able to figure out the answer for yourself if you think a little bit more about it would have a lower priority in the answering queue; it is quite possible that some of them never get answered.2.2How should I cite CiteSpace?The following three publications represent the core ideas of CiteSpace.The 2004 PNAS paper is the initial publication on CiteSpace (Chen 2004). In hindsight, it could have been named CiteSpace I. The 19-page 2006 JASIST paper gives the most thorough and in-depth description of CiteSpace II’s key functions (C. M. Chen, 2006), plus a follow-up study of domain experts identified in the visualizations. The 2010 JASIST paper is even longer with 24 pages (C. Chen, Ibekwe-SanJuan, & Hou, 2010), which is the third of the trilogy. It describes technical details on how cluster labels are selected and how each of the three selection algorithms in comparison with labels chosen by domain experts.ReferenceCitations(Google Scholar)800 Chen, C. (2006). "CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature." Journal of the AmericanSociety for Information Science and Technology 57(3): 359-377.394 Chen , C. (2004). "Searching for intellectual turning points: Progressive Knowledge Domain Visualization." Proc. Natl. Acad. Sci. USA101(Suppl.): 5303-5310.157 Chen, C., et al. (2010). "The structure and dynamics of co-citation clusters:A multiple-perspective co-citation analysis." Journal of the AmericanSociety for Information Science and Technology 61(7): 1386-1409.The most recent case study of a topic outside the realm of information science and scientometrics is a scienometric study of regenerative medicine (C. Chen, Hu, Liu, & Tseng, 2012). Chen, C., et al. (2012). "Emerging trends in regenerative medicine: A scientometric analysis in CiteSpace."Expert Opinions on Biological Therapy 12(5): 593-608.2.3Where are the Users of CiteSpace?In terms of the cities where CiteSpace were used, China, the United States, and Europe are prominent. Brazil, Turkey, and Spain also have many cities on the chart.Figure 3. Cities with users of CiteSpace between August 2013 and March 2014 are shown on the map. The colors of markers depict the level of user intensity: green (1-10), yellow (10-100), red (100-1000), and the large red water dropshaped marker (1000+).Figure 4. The use of CiteSpace in China (August 2013 – March 2014).Figure 5. The use of CiteSpace in the United States (August 2013 – March 2014).Figure 6. The use of CiteSpace in Europe (August 2013 – March 2014).3Requirements to Run CiteSpace3.1Java Runtime (JRE)CiteSpace is written in Java. It is a Java application. You should be able to run it on a computer that supports Java, including Windows or Mac.CiteSpace is currently optimized for Windows 64-bit Java 7 (i.e. Java 1.7).To run a Java application on your computer, you need to have Java Runtime (JRE) installed on your computer.3.2How do I check whether Java is on my computer?Figure 7. Select Control Panel.Figure 8. Click into the Programs category to find the Java control panel.Figure 9. Locate the Java control panel.Figure 10. Java Control Panel. Choose the Java tab and press the View button to see more detail.Figure 11. Java Runtime 1.7 is installed.3.3Do I have a 32-bit or 64-bit Computer?You need to find out whether your computer has a 32-bit or a 64-bit operating system.Go to Control Panel ?System and Security ?System. You will see various details about your computer. Under the System type, you will see whether you have a 32-bit or a 64-bit operating system.Follow the link below for further instructions on how to install Java:/doc/98eefc8258fb770bf68a5543.html /en/download/help/index_installing.xmlOnce you have Java Runtime setup on your computer, you can proceed to install CiteSpace.4How to Install and Configure CiteSpaceCiteSpace is provided as a zip file for 64-bit and 32-bit computers. For Mac users, you need to download the 64-bit version.4.1Where Can I download CiteSpace from the Web?You can download the latest version of CiteSpace from the following website:/doc/98eefc8258fb770bf68a5543.html /~cchen/citespace/download.htmlFigure 12.The download page of CiteSpace.After you download the zip file to your computer, unpack the zip file to a folder of your choice.Figure 13. CiteSpace is unpacked to the D drive on a computer.Now you can start CiteSpace by double clicking on the StartCiteSpace file.If you need to modify the amount memory allocated for CiteSpace (more precisely for Java Virtual Machine on which CiteSpace to be running), you can edit StartCiteSpace as a plain text file with any text editor.4.2What is the maximum number of records that I can handle with CiteSpace?This question needs to be answered at two levels: the number of records processed by CiteSpace and the number of nodes visualized, i.e. you can see and interact with them in CiteSpace. The first number is the total number of records in your downloaded dataset. CiteSpace reads through each record in your download files.The second number is determined by the selection criteria you specify and by the amount of memory, i.e. RAM, available on your computer. The more RAM you can make available for CiteSpace, the larger sized network you can visualize with a faster response rate.The speed of processing is also affected by a few computationally expensive algorithms such as Pathfinder network scaling and cluster labeling. Empirically, the best options for Pathfinder network scaling would be 50~500 nodes per slice. With faster computers or if you can wait for a bit longer, you can raise the number accordingly.The completion time of cluster labeling is related to the size of your dataset. If the entire timespan of your dataset is 100 years but you will only need to consider the most recent 10 years, it will be a good idea to carve out a much smaller dataset as long as it covers the 10 years of interest. It will reduce the processing time considerably.4.3How to configure the memory allocation for CiteSpace?The performance of CiteSpace is influenced by the amount of memory accessible to the Java Virtual Machine (JVM) on which CiteSpace is running. To analyze a large amount of records, you should consider allocating as much as memory for CiteSpace to use.You can modify the StartCiteSpace.cmd file to optimize the setting. More specifically, modify line 14 in the file. For example, -Xmx2g means that CiteSpace may get a maximum of 2GB of RAM to work with. Save the file after making any changes. And restart CiteSpace.Figure 14. Configure the memory for Java in line 14.4.4How to uninstall CiteSpaceYou can use the following steps to remove cached copies of CiteSpace from your computer.Figure 15. In a Command Prompt window, type javaws –viewer.When you see a list of cached copies of CiteSpace in the Java Cache Viewer, select the items that you want to remove and then click on the button with a red cross.Figure 16. Select a cached copy of CiteSpace and remove the item.4.5On Mac or Unix-based SystemsThe following example shows you the basic steps to get started with CiteSpace on a Mac. First, go to the CiteSpace homepage in a browser such as Chrome and download the latest 64-bit version.Figure 17. On a Mac, go to the CiteSpace home page in a browser such as Chrome and download the latest 64-bit version. Once the download is completed, follow the option “Show in Finder.” It will take you to a list of files downloaded to your Mac. The most recent file should be the zip file for CiteSpace.Figure 18. Choose “Show in Finder.”Figure 19. The downloaded zip file is shown in your Finder.Double-click on the zip file to unzip the file to a folder in the current folder.Figure 20. The zip file is unzipped to a new folder on the list.Figure 21. The new folder contains CiteSpaceII.jar and a lib folder.The simplest way to get started with CiteSpace is to open the CiteSpaceII.jar by clicking on it while holding the “Control” key on Mac. Select Open from the pop-up menu.Figure 22. Click on the CiteSpaceII.jar while holding the “Control” key and select “Open.”Due to the Java security settings, you will see a dialog box with two options for Open or Cancel.Choose Open to proceed. It will not harm your computer.Figure 23. Choose “Open” from the dialog box to proceed.After you choose Open, CiteSpace is getting started on Mac. You will see its opening page asfollows. Choose “Agree” to continue.Figure 24. CiteSpace is now started on Mac.Figure 25. Screenshots of running the Demo project of CiteSpace on Mac.It is a good idea to get familiar with the basic functions of CiteSpace by going through the Demo project on terrorism, which is included in the zip file.If you want to configure various Java Virtual Machine parameters in more detail than what is shown in the above example, you may generate a bash file for your Mac as follows.The Mac equivalent of the StartCiteSpace.cmd would be a bash file, which should have a file extension of .sh and should be executable. Let’s name the file as StartCiteSpace.sh to be consistent.1.The content of the StartCiteSpace.sh file should have the following two lines:#!/bin/bashjava -Xms1g -Xmx4g -Xss5m -jar CiteSpaceIII.jar2.The following instruction turns the StartCiteSpace.sh file to an executable file:chmod +x StartCiteSpace.sh3.To invoke the executable file, simply type its name or double click on it.StartCiteSpace5Get Started with CiteSpace5.1Try it with a demonstrative datasetWhen you installed CiteSpace for the first time, a demonstrative dataset on terrorism research is setup for you to play with and get familiar with the major analytic functions in CiteSpace. If you have never used CiteSpace before, I strongly recommend you to start with this demo dataset.To launch CiteSpace, double click on the StartCiteSpace.cmd file. You will see a command prompt window first. This window will also display various information on the status and any errors.Figure 26. The command prompt window.You will see another window of “About CiteSpace” – it displays system information of your computer, including the Java version. To proceed, you need to click on the Agree button. CiteSpace may collect user driven events for research purposes.。
CiteSpace介绍与使用
CiteSpace介绍与使用1. What is CiteSpace?CiteSpace:引文空间是一款眼着与分析科学分析中蕴含的潜在知识,是在科学计量学、数据可视化背景下逐渐发展起来的一款引文可视化分析软件。
由于是通过可视化的手段来呈现科学知识的结构、规律和分布情况,因此也将通过此类方法分析得到的可视化图形称为“科学知识图谱”。
(摘自李杰.CiteSpace中文版指南)对于我个人而言,学习使用CiteSpace的目的是快速了解所研究方向的“论文图谱”,被引用数是论文是否优质的重要标志,故通过论文引用图谱,我可以知道哪些论文是优质的,哪些论文是具有开创性的,并且具有开创性质的论文一般不会那么复杂,较容易理解,为日后学习打基础。
2.How to use CiteSpace?在本节我将以自己研究方向为例,构建论文引用图谱首先点击StartCiteSpace.bat ,打开CiteSpace。
然后就可以看到如下较为'原生态’的界面。
CiteSpace自身带了一个example,就是Terrorism。
我现在需要新建一个Project,来建立自己的主题项目。
先点上图的1,“New”,进入下图界面。
上图的2,需要分别建立两个文件夹,一个空文件是Project,另一个Data。
这里简要说一下这两个文件夹的作用,Project文件夹是用来保存分析的结果,不需要添加其他内容。
Data文件是存放将要被分析的数据,这个需要我们去检索,下载,然后放到这个文件夹,具体找什么如下图。
首先找 cross modal 主题 2010-2017年的所有论文。
在上两个图可以知,检索结果有3208篇论文,我们现在要做的是将所有记录信息下载下来,由于Web of Science 限制每次只能下载500条记录,故要多次下载,每次变化的是记录范围1至500,501至1000,1001至1500…,将每次下载的文件改名为download_xxx.txt(这是因为CiteSpace只识别以download_为前缀的文件名)下载后的数据文件:有了数据我就可以使用CiteSpace进行引用分析了,还记得最初的那个“原生态”的界面吗?就是它选择年份,2010-2017,时间间隔为1年。
CiteSpace软件使用方法
使用步骤演示
——以国内红色旅游研究为例
开始之前: 1、首先在电脑D盘(或其它)建立空白文件夹,命名为 “红色旅游” 2、进入文件夹,再建立4个小文件夹,分别命名为 input、output、data、project
使用步骤演示
——以国内红色旅游研究为例
1. 登录中国知网 2. 检索“关键词”或“篇名”中包含“红色旅游”字段文献 3. 得到结果如下:
4、选择并导出文献
2、选中 文献
3、导出参考文献
1、切换到50 篇每页
5、导出文献
1、全选文献
6、筛选文献(删除领导讲话、致辞、目录卷次、征稿启事等等无关文献)
2、导出参考文献
5、导出文献
1、选中Refworks格 式
2、导出
5、保存数据
注意:把保存 的数据改成以 “download_ XX”开头
6、数据转换
1、选择“CNKI类型”
2、选择数据存放文件夹
3、点击转换
7、数据转换结果
转换前
转换后
8、建立分析项目
9、使用CiteSpace进行分析
10、信息可视化
1、黄细嘉 2、卢丽刚 3、方世敏 4、闫友兵 。。。。
10、信息可视化
1、湘潭大学旅游管 理学院 2、南昌大学旅游与 规划研究中心 3、华东交通大学人 文学院 。。。。
10、信息可视化
1、红色旅游 2、红色旅游资源 3、可持续发展 4、旅游资源 5、思想政治教育 6、红色文化 。。。。
10、信息可视化
突现词分析
Keywords
Strength
黄崖洞保卫战 2.256
革命纪念地 2.0045
可持续发展 3.9625
开发战略
CiteSpace中文手册
CiteSpace中文手册CiteSpace是一个专门用于文献可视化分析的工具,它可以帮助研究人员更加方便地进行文献调研和分析。
下面将介绍CiteSpace中文手册的相关内容,帮助用户更好地了解和使用这一工具。
首先,CiteSpace中文手册主要包括以下几个部分:简介、安装与启动、基本功能、高级功能和常见问题解答。
在简介部分,用户可以了解到CiteSpace的基本信息和功能特点,以及如何使用CiteSpace进行文献可视化分析。
在安装与启动部分,用户可以学习到如何下载和安装CiteSpace软件,并快速启动软件进行操作。
在基本功能部分,用户可以详细了解CiteSpace的基本功能,包括导入文献数据、生成知识图谱、查看节点关系等。
在高级功能部分,用户可以学习到如何使用CiteSpace进行更加深入的文献分析,包括社区发现、趋势分析等高级功能。
在常见问题解答部分,用户可以查找常见问题的解决方法,帮助用户更好地使用CiteSpace进行文献可视化分析。
除此之外,CiteSpace中文手册还提供了丰富的案例分析和操作示范,帮助用户更好地理解和掌握CiteSpace的使用方法。
用户可以通过学习手册中的案例分析,快速上手使用CiteSpace进行文献分析,提高工作效率和研究质量。
总的来说,CiteSpace中文手册是一个详细而全面的使用手册,为用户提供了丰富的功能介绍和操作指南,帮助用户更好地了解和使用CiteSpace进行文献可视化分析。
通过学习CiteSpace中文手册,用户可以快速掌握CiteSpace的使用方法,提高文献分析的效率和准确性。
愿本手册能够为广大研究人员提供便利,促进学术交流与合作。
15.如何使用CiteSpace 4.0的结构变异分析功能
CiteSpace 的结构变异分析功能李杰 陈超美2015年9月18日要求版本至少为4.0.R1.64-bit.public.9.17.2015。
下载地址为 /~cch en/citespace/current/4.0.R1.64-bit.public.9.17.2015.zip——如何使用CiteSpace 的一组示范及常见问题解答之(十五)写在前面•关于结构变异理论(Theory of Structural Variation)的研究最初发表在2012年的一篇JASIST论文(见下面参考文献),其中也包括了几个案例研究,题为“结构性变化预测被引次数的效果”。
其核心问题是如何能够量化新发表的论文的新颖性。
•结构变异分析(Structural Variation Analysis - SVA)一方面基于科学创造方面的研究,尤其是新颖的重组在创造性思维中的作用和影响。
这是基于以下观察:科学发现或创新在很大的程度上都具有一个共性,就是新思维能够容纳原本看似风马牛不相及的观念。
换句话说,类似于在不同岛屿之间架起的一座新桥梁。
第2个验证条件就是这座新桥上是否确实吸引很快变得车水马龙。
参考文献•Chen, C. (2012) Predictive effects of structural variation on citation counts. Journal of the American Society for Information Science and Technology, 63(3), 431-449.•Chen, C. (2014) The Fitness of Information: Quantitative Assessments of Critical Evidence. Wiley.基本步骤普通的分析是在没有开启SVA功能下进行的,而在菜单Analytics下开启SVA功能后再运行CiteSpace则会在“Visualize”执行前经过下面几个步骤。
CiteSpace使用手册
CiteSpace使用手册CiteSpace使用手册1:安装与配置1.1 系统要求1.2 与安装1.3 配置步骤2:界面与菜单2.1 主界面2.2 导航菜单2.3 工具栏2.4 设置选项3:导入数据3.1 文件格式要求3.2 导入步骤3.3 数据预处理4:可视化分析4.1 知识图谱4.2 时间轴图4.3 关键词共现图 4.4 簇分析4.5 导出结果5:数据过滤与排序5.1 关键词过滤5.2 文献类型过滤 5.3 时间范围过滤 5.4 排序功能6:检索与搜索6.1 文献检索6.2 高级搜索6.3 检索结果导出7:图表操作7.1 缩放与平移7.2 节点与边的操作7.3 颜色与标签设置8:高级功能8.1 社会网络分析8.2 文献演化路径分析8.3 排他性分析8.4 自定义分析9:常见问题解答9.1 安装与配置问题9.2 数据导入问题9.3 可视化分析问题9.4 其他常见问题附件:本文档涉及附件,请参见附件部分。
法律名词及注释:1: CiteSpace:一款用于科学文献可视化分析的软件工具。
2:可视化分析:通过图形化的方式呈现数据,以便于观察、分析和发现数据中的模式、趋势和关联。
3:数据预处理:在数据分析之前对原始数据进行清洗、转换和归一化等处理,以达到更好的分析效果。
4:关键词共现图:展示关键词之间的共现关系,以便于分析研究领域内的热点和关联性。
5:簇分析:将文献根据某些相似性指标进行聚类,从而发现相关研究领域的研究集合。
6:社会网络分析:通过分析研究者之间的合作关系,揭示研究者、团队和机构之间的科学合作网络。
7:文献演化路径分析:分析文献之间的引用关系,揭示研究领域中的演化过程和研究方向的变化。
CiteSpace常见问题解答
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:/u/jerrycueb
写在前面
对于初学者使用CiteSpace来讲,会遇到一些常见的问题。笔者将比较重要的 总结为以下几点,欢迎大家继续添加。 ① 下载的WoS数据为什么不能做文献共被引分析? ② 图谱左上角的参数是什么意思?图谱参数在什么范围比较合理?
4 1
2
3
2.图谱左上角的参数是什么意思?图谱参数在什么范围比较合理?
① ② ③ ④
⑤பைடு நூலகம்
⑥
CiteSpace, V.3.8 R5(64 bit)表示使用软件的版本信息 September 28,2014 10:31:41PM CEST表示进行结果计算时 的时间 C:\User\Jerry Lee\.CiteSpace… 表示数据所存放的文件夹位 置 Time Span:2007-2014(slice Length=1)表示所分析的时间 区间,括号中代表的是时间切片。也就是说把这个时间 区间按照多少年为一段进行切割。 Selection criteria:Top100 per slice表示的是提取了每个时 间切片排名前100位的数据来生成最终的网络(这里选用 的节点类型不同,top100的具体含义会有差异。如选择 的是作者合作分析时,则提取的是这个时间段内发文量 top 100的作者,做共被引分析时则提取的是被引频次在 每个时间切片top100的数据)。 Network:N=194, E=2352(density=0.1256),N表示网络 节点数量,E表示连线数量,Density则表示网络的密度
节点的基本信息查询 选择聚类命名抽取的方法 对节点按照某一属性进行显示,依 次为引文历史年轮、中心性、Sigma 指数、PageRank、统一尺寸、聚类类 别、Web of Science 范围内引文总量
Citespace常见问题500问及解答(一)
1、时区图中关键词重叠怎么办?
答:放大图标,上下拉动与时间对应即可,注意不要左右拉动。
2、CNKI的数据作机构分析时出现英文怎么处理?
答:(1)检查下载的数据看看是否有问题,如有问题手动进行修改(2)与相同的中文机构进行合并(3)如果不重要,将这个点隐藏了。
3、引文半衰期是指什么
答:Citation half-life引文半衰期一一是描述引文(文献)老化程度的指标半衰期越大显示引文的有效价值越大。
4、用Citespace处理后图谱比较分散怎么回事
答:(1)数据量过少,一般应在200条以上记录,效果会比较好;(2)降低数据处理的阈值。
5、连线颜色太淡怎么处理
答:display——lixxxxnk transparency——1.
6、下载的数据有某一个机构,但分析时却不显示怎么回事?
答:共现强度不够。
7、关键词图谱中,入耳好看关键词的频次?
答:在可视化界面左侧,能看到单个关键词的频次,如果想看总共多少关键词及频次,可以copy到excel里面看。
8、term和keyword能不能同时分析?
答:不能同时分析,每次只能分析一个。
9、Citespace软件内存如何提升?
答:用文本格式打开startcitespace.bat,将Xmx1g改为Xmx4g即可。
10、在关键词可视化界面,space 右边的数字329,左下角的Records in the dataset: 2618,Records withinthe chosen range: 2365,数字的具体含义是什么?
答:329是在其中一年中的keyword的个数,2618 是总数,2365是在From-To年份之间的总数。
Citespace常见问题解答Part4
常见问题解答Part 4李杰1,陈超美21.首都经济贸易大学-安全与环境工程学院2. Drexel University-College ofComputing and InformaticsCiteSpace微信知识分享平台配套教程: 李杰, 陈超美著.CiteSpace科技文本挖掘及可视化[M].首都经济贸易大学出版社.2016.作者博客: 李杰博客:/u/jerrycueb;陈超美博客:/u/ChaomeiChen如何修改节点信息及参考文献分析时注意的问题KHAN FI, 1998, PROCESS SAF PROG, V17, P107, DOI 10.1002/PRS.680170207为什么软件显示是1998年,网页打开是2004年呢?那么如果我们想把KHAN FI, 1998改成KHAN FI, 2004呢?提示:其实1998年是正确的!KHAN FI, 2004, PROCESS SAF PROG, V17, P107, DOI 10.1002/PRS.680170207#KHAN FI, 1998, PROCESS SAF PROG, V17, P107, DOI 10.1002/PRS.680170207编辑上面文件,再次运行软件即可替换。
Publish year 1998Article first published online 2004说明1998年出版是正确的。
前面我们改错了, 那么如何再改回来原来的出版信息呢?但是事实上,这篇文献就是发表在1998年。
当时还没有上网,直到2004年该篇论文才放到了网上,并有了DOI号码。
因此KHAN FI, 1998是正确的。
遇到类似的情况需要分清楚,上网时间和实际出版时间。
Citespace软件操作问答
Citespace软件操作问答(摘自陈超美博士的科学网博客)(8)如何在CiteSpace中控制节点的取舍CiteSpace提供了几种方式来控制最终生成的网络将由哪些节点构成:1.Top N2.Top N%3.Threshold Interpolation4.Select Citers第一种办法最简单,最适于初学阶段,所以目前版本将其放在首位。
其余几种办法逐渐变得复杂,最好等熟悉系统之后再考虑。
下面简要介绍一下各个方法的细节。
Top N:系统设定N=30,意为在每个time slice中提取N个被引次数最高的文献。
N越大生成的网络将相对更全面一些。
Top N%: 将每个time slice中的被引文献按被引次数排序后,保留最高的N%作为节点。
Threshold Interpolation:设定三个time slices的值,其余time slices的值由线性插值赋值。
三组需要设置的slices为第一个,中间一个,和最后一个slice。
每组中的三个值分别为c,cc,和ccv。
c为最低被引次数。
只有满足这个条件的文献才能参加下面的运算。
cc为本slice内的共被引次数。
ccv为规范化以后的共被引次数(0~100)。
Select Citers:与以上方法不同的是这个方法先选施引文献,然后需再用方法1-3之一。
先Check TC Distribution然后填写Use TC Filter 后面的两个数字:最低和最高TC值(Time Cited),选定User TC Filter前的选项。
按Continue,再设定方法1,2,或3。
节点总数在Progress Reports中给出。
节点总数越大需要内存越多。
下回将介绍如何选择网络的连接密度。
CiteSpace提供了多项参数选择,初学者难免有时不知从何下手。
这里介绍一些要点以供参考。
CiteSpace的功能类似一架照相机,只是它拍摄的对象是科学文献而不是自然景色。
Citespace下载、出图入门教程(图文版)
一.简单介绍二.下载与安装三.知网示例四.术语解释五.常见问题•下载——官方下载网址:/~cchen/citespace/download/•开发者陈超美科学网博客(有软件最新相关内容)/home.php?mod=space&uid=496649•作用——辅助分析的工具,帮助我们找出学术文献中文字的关系(包括:作者,杂志,关键词,被引用词汇等等),并可视化表示出来。
但不能作为独立的分析结果,需要该领域的专家对其进行解释和分析。
•用途——帮助刚进入某领域研究的学者建立全面的认识;有利于分析学科的发展脉络;能够识别学科研究热点;帮助预测学科未来的发展走向。
•软件下载软件下载按钮Java运行环境下载按钮◆注意下载与电脑配置相匹配的版本(64位&32位)。
◆注意CiteSpace与Java下载对应版本。
•软件安装安装包解压后,点击该按钮,开始运行•_windows&_mac分别对应windows和mac系统电脑1.等待几秒之后,出现该界面;2.随后在光标处输入数字“2”,3.等待软件启动。
点击“不”点击“同意”1.数据导入与格式转换2.创建新项目3.设置时间分隔与阈值4.聚类分析与调整5.结果解读•操作流程注意:1.知网一次最多导出500条文献,最好按时间或者内容主题等分组导出。
2.将下载txt文件重命名为download开头,例:download_民族教育3.新建四个文件夹:input\output\data\project4.初始下载的文件存入input文件夹,格式转换后存入output文件夹,再将output文件夹中数据复制到data文件夹备用。
数据格式转换注意:分别对应选择刚刚建立的四个文件夹,导出文件存入output文件夹创建新项目项目名称项目保存目录数据所在目录保存开始停止聚类以标题给类命名以引文关键词命名以摘要命名命名算法节点大小的依据配色出现频次中心性最早出现年份•点击以上任意数据,可复制粘贴导出•可剔除不相关项关键词类标签节点标签连线标签每个节点为一个关键词。
citespace介绍及使用
citespace介绍及使用Citespace 介绍及使用在当今信息爆炸的时代,学术研究的领域日益广泛,研究成果也层出不穷。
如何从海量的文献数据中发现知识的脉络、挖掘研究的热点和趋势,成为了科研工作者面临的一个重要挑战。
Citespace 作为一款强大的文献可视化分析工具,为我们提供了一种有效的解决方案。
Citespace 是什么呢?简单来说,它是一款由陈超美教授开发的用于分析和可视化科学文献数据的软件。
通过对文献的作者、机构、关键词、被引文献等信息进行处理和分析,Citespace 能够以直观的图形和图表形式展示知识领域的结构、演变和热点。
那么,Citespace 有哪些主要的功能和特点呢?首先,它能够绘制知识图谱。
这就像是为我们构建了一幅学术研究的地图,让我们清晰地看到不同研究主题之间的关系,以及它们在时间维度上的发展变化。
比如,通过关键词共现图谱,我们可以了解到哪些关键词在某个领域中频繁出现,从而判断出研究的热点;通过引文网络图谱,我们能够追踪重要文献的传播和影响。
其次,Citespace 具有强大的聚类分析功能。
它可以将相似的研究主题或文献自动归为一类,帮助我们快速把握研究的主要方向和分支。
这对于梳理复杂的研究领域非常有帮助,能够让我们发现那些潜在的、尚未被充分关注的研究空白。
再者,Citespace 还支持多种数据来源。
它可以处理来自 Web of Science、Scopus、CNKI 等国内外知名数据库的文献数据,为不同背景的研究者提供了便利。
接下来,让我们来了解一下如何使用 Citespace 进行文献分析。
第一步,准备数据。
我们需要从相关数据库中下载所需的文献数据,并将其保存为特定的格式,如文本格式或 Excel 格式。
第二步,安装和启动 Citespace 软件。
安装过程相对简单,按照提示进行操作即可。
第三步,设置参数。
在这一步,我们需要根据研究的目的和需求,对时间跨度、节点类型、阈值等参数进行设置。
citespace介绍及使用
CiteSpace
介绍及使用
软件作者简介:陈超美,博士,美国德雷塞尔大学 (Drexel University, Philadelphia, PA, USA) 信息科学与技术学院教授(终身教职)。大连理工大 学长江学者讲座教授,Drexel– DLUT知识可视化与科学发现联合研究所美方 所长。
点击“Make Map”得到一个Google Earth 可以打来的KMZ文件。执行完后,对话框会提 示你KMZ文件的保存位置。
在Google Earth中点击节点可以获取相对应的地址处的文献链接,点击可进入该文献页面 (在图书馆可以直接下载)
CSSCI篇
输入路径,对文本格式进行 转换
Q:什么是CiteSpace?
A: Citespace是一款应用于科学文献
中识别并显示科学发展新趋势和新动态
的软件。
CiteSpace能解决的问题:
• 在某个研究领域中,哪些文献是具有开创 性和标志性的? 含有研究前沿术语词汇的文 • 在某个研究领域的发展历程中,哪些文献 某个科学领域中科学文献的 献的引文,实际上,它们反 起着关键作用? 暂时性成分。CiteSpace中, 映的是研究前沿中的概念在 一个科学的研究前沿表现为 • 哪些主题在整个研究领域中占据着主流地 科学文献中的吸收利用知识 涌现的施引文献群组。 位? 的情况。 • 不通的研究领域之间是如何相互关联的? • 基于一定知识基础的研究前沿是如何发生 演变的?
CiteSpace常见问题解答Part2
方法2:导出.net格式,Gephi, Pajek以及Ucinet都可以识别
Pajek
此图是使用CiteSpace得到的图形, 下页将呈现使用Pajek和Gephi的可 视化结果
Gephi
2.CiteSpace 2 other tools:Visualization software- Carrot2- Jigsaw
������������ ������������������, ������������, ������������; ������
=
21������������������������ ������������������ + ������������������ 1������
CiteSpace提供了三种可以用于计 算网络中连接强度的方法,分别 为Cosine,Dice和Jaccard方法。 通常大家都默认使用的是Cosine 方法,至于那种方法好,这里不 好下结论。
Carrot2软件下载: /download.html Jigsaw软件下载(需要提交基本的注册信息)/gvu/ii/jigsaw/
打开CiteSpace,以此在菜单中 打开“Data”, “Import/Export”,“WOS”。 可以看到在CiteSpace对WoS数 据处理的四种功能,Remove duplicates(数据除重)、WoS (Tab)格式向WoS格式转换、 WoS格式转换为Jigsaw格式以 及WoS格式转换为Carrot2可分 析的格式。
常见问题解答 Part 2
李杰1,2,陈超美3
1.上海海事大学 海洋科学与工程学院 2.上海海事大学 科技情报研究所
3. Drexel University- College of Computing and Informatics
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Citespace软件操作问答(摘自陈超美博士的科学网博客)(8)如何在CiteSpace中控制节点的取舍CiteSpace提供了几种方式来控制最终生成的网络将由哪些节点构成:1.Top N2.Top N%3.Threshold Interpolation4.Select Citers第一种办法最简单,最适于初学阶段,所以目前版本将其放在首位。
其余几种办法逐渐变得复杂,最好等熟悉系统之后再考虑。
下面简要介绍一下各个方法的细节。
Top N:系统设定N=30,意为在每个time slice中提取N个被引次数最高的文献。
N越大生成的网络将相对更全面一些。
Top N%: 将每个time slice中的被引文献按被引次数排序后,保留最高的N%作为节点。
Threshold Interpolation:设定三个time slices的值,其余time slices的值由线性插值赋值。
三组需要设置的slices为第一个,中间一个,和最后一个slice。
每组中的三个值分别为c,cc,和ccv。
c为最低被引次数。
只有满足这个条件的文献才能参加下面的运算。
cc为本slice内的共被引次数。
ccv为规范化以后的共被引次数(0~100)。
Select Citers:与以上方法不同的是这个方法先选施引文献,然后需再用方法1-3之一。
先Check TC Distribution然后填写Use TC Filter 后面的两个数字:最低和最高TC值(Time Cited),选定User TC Filter前的选项。
按Continue,再设定方法1,2,或3。
节点总数在Progress Reports中给出。
节点总数越大需要内存越多。
下回将介绍如何选择网络的连接密度。
CiteSpace提供了多项参数选择,初学者难免有时不知从何下手。
这里介绍一些要点以供参考。
CiteSpace的功能类似一架照相机,只是它拍摄的对象是科学文献而不是自然景色。
设置CiteSpace的各项参数大致相当于取景,调焦,对光圈。
不过这些过程在如今的相机中基本都已完全透明。
所以,参数设置对CiteSpace所产生的图谱有直接影响。
最初使用时,最简单的办法是先采用系统的预定参数;熟悉之后,再按下面提供的要点调整参数。
那么什么样的CiteSpace图谱才算好图谱呢?CiteSpace的设计实际上是有针对性的。
能满足CiteSpace设计要求的图谱才视为好图谱。
CiteSpace要展现的是一个领域的知识发展的历史和现状。
这是CiteSpace的取景范围。
由于深受库恩《科学革命的结构》的影响,对CiteSpace来说,焦点自然是在范式(paradigm)和范式转移(paradigm shift)。
近年来大家倾向于这种认识:范式是一种更为广泛的现象,可以在各个层次上出现。
换句话说,并非50年一遇或100年一遇。
所以CiteSpace竭尽全力所要甄别,显示,突出的就是在广义的范式转移中起关键作用的转折点。
与广义范式相对应的是科学文献中自然呈现的聚类。
转折点便是联结不同聚类的桥梁。
如果CiteSpace生成的图谱能清晰的显示出这些要素,这种图谱便属上乘之作。
关于解读CiteSpace图谱的要点,来日再写。
有了这个目标以后,图谱如能显示俩三个或更多的自然网络聚类,而且各聚类之间有少量的联系,便为最佳。
这样的图谱很容易带来有趣的和有意义的发现。
相反,如果图谱中所有节点都纠缠在一起,则很难理出头绪。
如果碰到这种情况,检查下面几种原因:数据范围是否过窄,门槛设置是否过高(threshold),曝光时间是否过短(time slice)。
另外,可用CiteSpace中的链接剔除功能(pruning)来剔除一些次要的链接以突出核心结构。
成像以后,CiteSpace可提供进一步的指标。
比如,modularity大约在0.4~0.8时的图谱通常会符合或接近上述要求。
另外,如果可能从每年或每个时间段中选取数量大致相当的数据,会比每年都使用同样的门槛要更有效(相对于上述目标而言)。
做专利分析的时候,发现转换德温特专利的数据;还有就是,C、CC和CCV阈值的选择有没有什么标准呢?TopN 和TopN% 更直接,建议你用这两项。
c,cc,ccv的选择灵活但较为复杂,参考2004年我的PNAS文章。
从前,c有选5次以上的,ccv有选25%以上等等在文献中都可见到。
阈值低的覆盖面会稍微广一些。
考虑到文献数据本身的误差,以及大部分人的注意力往往集中在最有代表性的工作,所以阈值的选择总是相对的。
WOS并不包括所有的文献。
另外,信息和噪音比也是一个考虑因素。
关于阙值的选择,我是不是可以这样理解,就是说,知识图谱是需要不断探索和试验的,对所选择领域文献的分析必须是基于文献实际情况的,而不只是就图说图,理想的知识图谱应该是能够正确反映文献实际情况的那一张图。
所以,知识图谱的绘制并不是一蹴而就的,阈值的不断切换就是为了找到符合实际情况的知识图谱;在操作过程中经常会遇到有的文献被引频次很高,但是中心度却很低,而有的文献被引频次很低,中心度却很高,对于这样的现象我该怎样去理解?这两类文献中那一种才是关键文献或重要文献?为什么会出现这样的情况。
另外,阈值设定中:top N per slice或者Threshold(c,cc,ccv)数值大小,选用Pathfinder或者Minimum Spanning Tree,即使小小的变化,软件选择出的被引文献或者关键词其中心度变化很大。
如果选择了其中的一组数据进行分析,自己都无法解释选择为什么要选择这组数据?我应该依据什么去选择分析?被引频次和中心度是两种不同的度量。
中心度是定义在网络结构上的。
至于什么是关键文献或重要文献,取决于你要研究什么问题。
如果波动很大说明你选的top N还不够大。
使用默认的top30与设置c、cc,ccv的差别很大,不知什么原因常常软件跑不动了,能给出点阈值调节的具体知道吗?c/cc/ccv的选法不太容易掌握(由下往上选),所以现在系统界面推荐top N的选法(由上往下选)。
建议先用系统预定参数,然后根据选入节点的数量等在调节参数:top N: 30, 50, 100, ... 由低望高增加。
c/cc/ccv:,c: 30, 25, 20, 15, 10, 5, ... 由高往低减少。
cc: 30, 25, 20, 15, 10, 5, ...,ccv: 30, 25, 20, 15, 10, 5,(9)如何解读CiteSpace产生的图谱CiteSpace的核心功能是产生由多个文献共被引网络组合而成的一种独特的共被引网络,以及自动生成的一些相关分析结果。
每个文献共被引网络对应于一个历时一年或几年的时间段。
最终显示的网络不是各个网络之间的简单叠加,而是要满足一些条件(详见2004年PNAS的论文)。
解读这样的网络(我称为递进式知识领域分析)的要点包括:网络整体结构,网络聚类,各聚类之间的关联,关键节点(转折点)和路径。
解读时可从直观显示入手,然后再参照各项指标。
结构:是否能看到自然聚类(未经聚类算法而能直观判定的组合),是否包括转折点(有紫色外圈的节点),通过算法能得到几个聚类?每个节点大小代表它的总被引次数。
大圈则总被引高。
时间:每个自然聚类是否有主导颜色(出现时间相对集中),是否有明显的热点(节点年轮中出现红色年轮,即被引频率是否曾经或仍在急速增加)?通过各个年轮的色彩可判断被引时间分布。
时间线显示将每一聚类按时间顺序排列,相邻聚类常常对应相关主题(聚类间共引)。
聚类之间的知识流向也可从时间(色彩)上看到(由冷色到暖色)。
内容:每个聚类的影响(被引时涉及的主题,摘要,和关键词)和几种不同算法所选出的最有代表性的名词短语?指标:每个聚类是否具有足够的相似性(silhouette值是否足够大,太小则无明确主题可言),整个聚类是否有足够节点(太少则很可能全都出自同一篇文献的参考文献,因而缺乏普遍意义)?Tips:每个节点上,右键弹出的选择中,有一项是通过DOI连接到原文出版社提供的网页。
可用CiteSpace的图谱作为一个直接浏览相关文献的界面黑色字体是提问,蓝色是陈超美的回答,一些很具体的操作,非常实用(图谱各指示值含义类问题)在某文章的sigma值表示什么意思呢?绝大多数的sigma 值是1.00,表示结构上和引文变化中都非常重要。
(具体操作类问题)如何在citespace生成的聚类中查看该聚类成员的文章标题呢?右键点被引成员->Open DOI,我用CiteSpace做被引文献聚类后,想知道每个类中所含被引文献的具体数量,该怎么操作?是否可以将相关数据导出为excel类型文件进行查看?clustering 菜单下:summary table里显示具体个数;我刚开始使用这个软件,请问转折点文章的列表能自动生成,直接链接出来吗?在Display窗口,Networks菜单下,(???)我在您的有关文献里看到citespace的操作步骤1、2、3(extract noun phrase term from title,abstract,descriptors,identifiers of citing articles in the dataset)4----,关于步骤3我在实际操作的过程中并没有执行,而是直接分析共被引等内容,这样的话结果会有影响吗?如果我在分析了共被引等后,然后想作前沿词的探测的话会对结果有影响吗?另外关于提取名词的操作步骤是这样的对面,选择了time scling ,term source,然后在term type里选择noun phrase,然后点go对吗?如果我想探测突现词,必须先进行名词短语的提取然后选择burst term--detect bursts吗?可是这样只能在窗口里显示了几个探测词,我往往再选择go,才能出现相应谱图?CiteSpace中的burst detection 有两种用法:1。
名词短语和2。
单词。
1需要事先提取。
2则不用。
如果后面的分析不涉及名词短语,结果不会受影响。
最后几个问题:对;是;应该如此。
这次的问题是timeline和timezone选项怎么使用和解读呢?t imeline是先把整个网络划分为几个聚类,然后按时间顺序排列出各个聚类中的文献。
这样可以观察到很多现象。
这个状态下的选项主要是显示聚类的标签,节点的特征等等。
如何在生成的可视图中为各个节点标出相应的文字说明?统一标:Article Labeling下面的组合控制,如Freq + threshold (越小符合显示要求的会越多)。
单独标:右键》Label the Node. 也可随后右键取消。