摘要
文章从知识单元的角度,提出了一个基于专利文件知识结构的知识单元挖掘方法,并结合最大字符串匹配算法、停用词去除、词性标注预处理等自然语言处理手段,以及知识单元的位置权重,用程序实现了基于知识单元的中文专利知识挖掘。通过对比试验表明,这是一种有效分析专利文件技术细节的方法。
From the perspective of knowledge unit, this paper proposes a knowledge unit mining method based on patent document knowledge structure. And integrating with the natural language processing methods such as the Maximally Repeated String Algorithm, stop-word dismissal and POS tagging, and the weight of the position of knowl- edge unit, the paper uses the program to implement the Chinese patent knowledge mining based on knowledge uniL The contrast test shows that it is an effective method to analyze the technical details of patent documents.
出处
《情报理论与实践》
CSSCI
北大核心
2011年第6期83-86,共4页
Information Studies:Theory & Application
基金
国家社会科学基金项目"学科知识测度体系及其应用研究"的成果之一
项目编号:08BTQ025
关键词
专利文献
知识单元
知识结构
知识挖掘
patent document
knowledge unit
knowledge structure
knowledge mining