摘要
[目的/意义]分析科技创新路径识别研究中用到的主要研究方法与开源工具,提出利用引文内容挖掘实现科技创新路径识别方法及开源工具。[方法/过程]首先,基于引文分析、结构洞分析、凝聚子群分析、文本内容挖掘、引文内容挖掘等不同角度分析了科技创新路径识别的主要方法;其次,从数据源、文本格式、挖掘内容、处理能力等方面阐述了用于实现引文内容挖掘的科技创新路径识别的3个开源工具:Mallet、Knime、NLTK;最后,分析了实现科技创新路径可视化的5个开源工具:Pajek、Ucinet、Gephi、D3.js、VOSViewer。[结果/结论]通过研究发现,利用开源工具深入挖掘引文内容中蕴含的丰富语义信息,识别不同引用动机,进而进行可视化展示可以有效的实现科技创新路径表达。
[Purpose/Significance] The main research methods and open source tools used in path recognition research of scientific and technological innovation are analyzed. [Method/Process] Firstly,from different angles of citation analysis,structure analysis,hole subgroup analysis,text mining,content mining based on Citation Method of science and technology innovation path recognition analysis; secondly,for the 3 open source tools of technological innovation path to realize the recognition of citation content mining from the data source,and text format mining content,processing capacity and other aspects: Mallet,Knime,NLTK; finally,it analyzed the realization of the 5 open source tool path visualization technology innovation: Pajek,Ucinet,Gephi,D3. js,VOSViewer. [Result/Conclusion] through research,it is found that using open source tools to mining rich semantic information contained in citation contents,identify different citation motivations and visualize display can effectively achieve the expression of innovation path.
作者
廖君华
陈军营
白如江
Liao Junhua;Chen Junying;Bai Rujiang(Institute of Scientific & Technical Information,Shandong University of Technology,Zibo 255049,China)
出处
《现代情报》
CSSCI
2018年第7期113-121,共9页
Journal of Modern Information
基金
教育部人文社会科学研究青年基金项目"基于引文内容分析的科技创新路径识别研究"(项目编号:16YJC870008)
山东省软科学重点研究计划项目"深化高校
科研院所科研体制改革对策研究"(项目编号:2017RZB01046)
关键词
科技创新路径
引文分析
自然语言处理
引文内容挖掘
开源工具
science and technology innovation path
ciatition analysis
natural language processing
citation con-tent mining
open source tools