期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
汉语短文话题提取系统中SDTF*PDF算法的研究 被引量:1
1
作者 陈科 贾焰 +1 位作者 杨树强 王永恒 《计算机应用》 CSCD 北大核心 2005年第1期14-16,共3页
互联网技术得到迅速发展以来,大量信息尤其是文本信息在网上传播。文中面向海量汉语短文话题提取系统中多信源、短文篇幅小的特点,结合词汇语义相似性度量,提出了一个词汇权重计算算法———SDTF PDF(ShortDocumentTermFrequency Propor... 互联网技术得到迅速发展以来,大量信息尤其是文本信息在网上传播。文中面向海量汉语短文话题提取系统中多信源、短文篇幅小的特点,结合词汇语义相似性度量,提出了一个词汇权重计算算法———SDTF PDF(ShortDocumentTermFrequency ProportionalDocumentFrequency),测试表明,基于该算法的汉语短文话题识别系统能够较准确地在海量中文文本信息中自动提取一段时间内(一天或一周,可以指定)的主要话题。 展开更多
关键词 汉语短文 话题识别 SDTF PDF 词汇语义相似性度量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部