期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
领域文本信息抽取中的短语相似度计算方法 被引量:1
1
作者 沈洁 彭敦陆 《软件导刊》 2017年第4期6-9,共4页
随着信息化的深入发展,各应用领域积累了大量采用半结构化方式记录的文本数据。为了快速有效地从大规模面向领域的半结构化文本中抽取有用信息,信息抽取技术应运而生。文本信息抽取的核心算法之一是计算词或短语的相似度,针对面向领域... 随着信息化的深入发展,各应用领域积累了大量采用半结构化方式记录的文本数据。为了快速有效地从大规模面向领域的半结构化文本中抽取有用信息,信息抽取技术应运而生。文本信息抽取的核心算法之一是计算词或短语的相似度,针对面向领域的半结构化文本中的中文短语相似度计算,先采用模式匹配算法从原始半结构化文本中抽取中文短语,然后结合领域语义依存关系,对基于公共子串的短语相似度计算方法进行改进,以此提高短语相似度计算的可靠性。实验结果表明,所提算法具有较好的计算效果。 展开更多
关键词 领域半结构化文本 公共子串 依存关系
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部