摘要
通过对爆发词识别问题的研究和剖析,本文采用了基于条件随机场模型的方法进行爆发特征提取,在此基础上设计了频次、频率和词频文档比三个指标进行计算,选取镍钴产业专利文本为例进行了领域爆发词识别实验,并实现了爆发词识别系统原型的开发。
On the base of research and analysis the problem of burst word recognition, this paper extract- ed the burst feature based on CRF model, then designed three indexes to calculate the weight of burst word, developed a prototype system and experimented on patent text of Ni/Co.
出处
《情报科学》
CSSCI
北大核心
2014年第1期89-93,共5页
Information Science
基金
中国科学院西部之光联合学者项目"基于计算情报方法的甘肃省战略新兴产业竞争发展研究"项目