期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于知网的概念特征抽取方法 被引量:17
1
作者 赵林 胡恬 +1 位作者 黄萱菁 吴立德 《通信学报》 EI CSCD 北大核心 2004年第7期46-54,共9页
文本特征抽取是文本过滤的一项重要基础,但通常采取的用字、词作为特征项的显著缺点是无法表达文本的语义信息,所以本文在向量空间模型的基础上提出了一种以知网为语义知识库、基于语义信息的文本特征项抽取方法。该方法比单纯的词汇信... 文本特征抽取是文本过滤的一项重要基础,但通常采取的用字、词作为特征项的显著缺点是无法表达文本的语义信息,所以本文在向量空间模型的基础上提出了一种以知网为语义知识库、基于语义信息的文本特征项抽取方法。该方法比单纯的词汇信息更能体现文本的概念特征,提高过滤系统的性能;同时还能降低文本向量的维数,减少计算量,提高过滤效率。我们在引入了该方法的中文文本过滤系统上进行的实验结果也充分证实了其有效性。 展开更多
关键词 文本过滤 特征抽取 向量窄间模型 知网
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部