期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
大数据时代基于统计特征的情报关键词提取方法 被引量:16
1
作者 罗繁明 杨海深 《情报资料工作》 CSSCI 北大核心 2013年第3期64-68,共5页
为克服传统词频—逆向文本频率(TFIDF)关键词提取精度低下的缺点,文章提出一种基于多级统计特征的关键词提取(TFIDF-SK)算法。该算法采用词语TfDf指标的离散系数公式来剔除噪音词,构建基于词偏度、词语位置权重信息和词频—逆向文本频... 为克服传统词频—逆向文本频率(TFIDF)关键词提取精度低下的缺点,文章提出一种基于多级统计特征的关键词提取(TFIDF-SK)算法。该算法采用词语TfDf指标的离散系数公式来剔除噪音词,构建基于词偏度、词语位置权重信息和词频—逆向文本频率的评估函数来度量关键词的重要性。实验结果表明该算法优于传统方法,在大数据时代网络情报监测中具有广泛的应用价值。 展开更多
关键词 大数据 关键提取 词偏度 网络情报监测
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部