期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词典词语量化关系的中文文本分割方法 被引量:2
1
作者 钟茂生 胡熠 刘磊 《计算机工程与应用》 CSCD 北大核心 2008年第21期25-29,88,共6页
随着Internet网络资源的快速膨胀,海量的非结构化文本处理任务成为巨大的挑战。文本分割作为文本处理的一个重要的预处理步骤,其性能的优劣直接影响信息检索、文本摘要和问答系统等其他任务处理的效果。针对文本分割中需要解决的主题相... 随着Internet网络资源的快速膨胀,海量的非结构化文本处理任务成为巨大的挑战。文本分割作为文本处理的一个重要的预处理步骤,其性能的优劣直接影响信息检索、文本摘要和问答系统等其他任务处理的效果。针对文本分割中需要解决的主题相关性度量和边界划分策略两个根本问题,提出了一种基于词典词语量化关系的句子间相关性度量方法,并建立了一个计算句子之间的间隔点分隔值的数学模型,以实现基于句子层次的中文文本分割。通过三组选自国家汉语语料库的测试语料的实验表明,该方法识别分割边界的平均错误概率■和最低值均好于现有的其他中文文本分割方法。 展开更多
关键词 文本分割 词语量化关系 句子相关性度量 间隔点 分隔值
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部