期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
结合主题依存特征和Bigram的汉语语言建模方法
1
作者 崔玉红 胡光锐 《上海交通大学学报》 EI CAS CSCD 北大核心 2002年第6期897-900,共4页
在 Bigram语言模型建模过程中 ,语言被看作符号集序列 ,没有考虑语言本身具有的语法和语义结构特征 .虽然在线的文本训练数据迅速增长 ,但语言模型的性能却很难再获得大幅度的提高 .基于统计方法语言建模的基本原理 ,提出了一种结合 Big... 在 Bigram语言模型建模过程中 ,语言被看作符号集序列 ,没有考虑语言本身具有的语法和语义结构特征 .虽然在线的文本训练数据迅速增长 ,但语言模型的性能却很难再获得大幅度的提高 .基于统计方法语言建模的基本原理 ,提出了一种结合 Bigram和主题依存特征的中文语言建模方法 .初步实验结果表明 ,该方法可有效地补充 Bigram模型提取特征的不足 。 展开更多
关键词 主题依存特征 汉语语言建模方法 统计语言模型 bigram模型 主题依存模型 分支度 自然语语处理
下载PDF
一种新的自动文本分类的算法 被引量:1
2
作者 赵敏涯 沈洁 +1 位作者 陈志敏 林颖 《扬州大学学报(自然科学版)》 CAS CSCD 2006年第1期62-65,共4页
研究了统计语言模型中b igram模型在自动文本分类中的应用,针对传统的向量空间模型在计算文本相似度时假设特征项相互独立的缺点,提出了一种新的利用词对及词序信息来改善文本分类结果的方法.实验结果表明:该方法是可行且有效的.
关键词 统计语言模型 自动文本分类 平滑 bigram模型
下载PDF
汉语词性标注系统的设计与实现
3
作者 刘伟 《中小企业管理与科技》 2009年第25期106-106,共1页
汉语词性标注技术在中文信息处理领域中占有十分重要的地位,本文主要对基于统计的词性标注技术进行了研究,所实现的词性标注系统主要通过隐马尔科夫模型对训练语料库进行数据统计,获取词性和词汇概率信息,并采用Viterbi算法进行标注,实... 汉语词性标注技术在中文信息处理领域中占有十分重要的地位,本文主要对基于统计的词性标注技术进行了研究,所实现的词性标注系统主要通过隐马尔科夫模型对训练语料库进行数据统计,获取词性和词汇概率信息,并采用Viterbi算法进行标注,实验结果表明Bigram模型对不同领域具有一定的适应性,取得了较好的标注正确率。 展开更多
关键词 汉语词性标注 隐马尔科夫模型 bigram模型 词性排歧
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部