期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于渐进式丰富词典的分词方法研究 被引量:1
1
作者 杨柳 袁方 霍亮 《计算机工程与应用》 CSCD 北大核心 2006年第32期164-166,共3页
由于现代社会飞速发展,一些新的名词不断出现,在已有的字符串匹配的分词方法中,大部分的词典是固定的,如果出现新的词,那么就不能被正确识别出来。由此该文提出了渐进式丰富词典的分词方法,把那些不能正确分出来的字符串,利用统计词频... 由于现代社会飞速发展,一些新的名词不断出现,在已有的字符串匹配的分词方法中,大部分的词典是固定的,如果出现新的词,那么就不能被正确识别出来。由此该文提出了渐进式丰富词典的分词方法,把那些不能正确分出来的字符串,利用统计词频的方法记录下来,如果词频达到一定阈值,就可以把它认为是新词,可以把它加入到词典中,使得词典动态的增加。实验证明,该方法在保证分词速度不受影响的基础上,可以提高分词的精度。 展开更多
关键词 渐进式丰富词典 字符串匹配分词方法 统计分词方法
下载PDF
基于自动标引的自然语言检索方法研究 被引量:1
2
作者 王丹 杨晓蓉 马健 《图书馆杂志》 CSSCI 北大核心 2016年第6期66-72,共7页
自从自然语言进入计算机检索系统以来,就因其不受不同职业、不同知识背景、不同检索经验的影响等特点受到终端用户的青睐。由于中文文献的标题是中文文献内容的集中体现,它反映了文献的中心思想。本文介绍的自然语言检索方法,限定在文... 自从自然语言进入计算机检索系统以来,就因其不受不同职业、不同知识背景、不同检索经验的影响等特点受到终端用户的青睐。由于中文文献的标题是中文文献内容的集中体现,它反映了文献的中心思想。本文介绍的自然语言检索方法,限定在文献标题层面进行主题标引。该方法的基本思想是用自动标引方法分别对检索系统中数据库的文献标题和用于检索的自然语言进行自动赋词标引,对给定的关键词进行概念控制,即词义转换,形成最终标引词;然后,用向量空间模型对数据库的索引数据进行"或"运算检索,形成命中文献集合B,对B集合中的每篇文献标题再进行自动标引,形成的标引词与用于检索的自然语言标引词进行相似度计算,根据B集合中的每篇文献的相似度进行排序,把最符合检索要求的文献最先呈现给用户。此方法是一种简便、实用的自然语言检索方法。 展开更多
关键词 转换、自动赋予标引词的主题词、同义词、近义词、相关词和网罗词 有基于字符串匹配分词方法 基于理解的分词方法和基于统计的分词方法.基于字符串匹配分词方法是按照一定的策略将待分析的汉字串与词典中的词条进行匹配 匹配成功则给出一个标引词.按照扫描方向的不同 可分为正向匹配和逆向匹配 按照不同长度优先匹配的不 自动标引 自然语言检索 方法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部