期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进的χ~2检验的热点词突发性度量研究 被引量:1
1
作者 翟东海 聂洪玉 +3 位作者 崔静静 于磊 杜佳 王佳君 《计算机与数字工程》 2013年第11期1788-1790,共3页
采用原始χ2检验公式进行突发性度量时存在低频词偏袒问题,论文提出了结合TF的改进的χ2检验方法能有效克服该问题。该方法将词频累加和作为文档统计篇数的影响因子β引入原始χ2检验公式从而解决了低频词偏袒问题,提高了度量热点词突... 采用原始χ2检验公式进行突发性度量时存在低频词偏袒问题,论文提出了结合TF的改进的χ2检验方法能有效克服该问题。该方法将词频累加和作为文档统计篇数的影响因子β引入原始χ2检验公式从而解决了低频词偏袒问题,提高了度量热点词突发性的精确度。动态突发性热点词库依据改进后的χ2检验公式得到的突发性度量值来建立,并将该词库运用在动态突发性向量空间模型中来发现与追踪网络突发性热点话题。实例验证表明,利用该文的方法进行话题发现与追踪,可以获得有更高的准确率、召回率以及F度量。 展开更多
关键词 突发性热点词 χ2检验 词频 动态突发性词库
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部