期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种基于词矢量的汉语语义量化模型 被引量:7
1
作者 陈清才 王晓龙 《计算机研究与发展》 EI CSCD 北大核心 2001年第2期207-212,共6页
通过建立基于词矢量的汉语语义量化模型来解决语义信息的自动获取及量化问题 ,描述了模型的建立方法及其在汉语词义排歧中的应用 ,最后通过构造伪词的方法对模型的语义辨识能力进行了评测 .实验表明该语义量化模型具有很好的语义表示能... 通过建立基于词矢量的汉语语义量化模型来解决语义信息的自动获取及量化问题 ,描述了模型的建立方法及其在汉语词义排歧中的应用 ,最后通过构造伪词的方法对模型的语义辨识能力进行了评测 .实验表明该语义量化模型具有很好的语义表示能力 ,并且由于模型的建立是通过对大规模生语料库的统计来完成的 ,避免了人工对词语语义进行量化时所需的庞大工作量 。 展开更多
关键词 自然语言处理 词矢量 汉语语义量化模型 语料库 人工智能
下载PDF
基于词矢量相似度的短文本分类 被引量:6
2
作者 马成龙 姜亚松 +2 位作者 李艳玲 张艳 颜永红 《山东大学学报(理学版)》 CAS CSCD 北大核心 2014年第12期18-22,35,共6页
互联网中出现的短文本内容短小,相互共享的词汇较少,因此在分类过程中容易出现大量的集外词,导致分类性能降低。鉴于此,提出了一种基于词矢量相似度的分类方法,首先利用无监督的方法对无标注数据进行训练得到词矢量,然后通过词矢... 互联网中出现的短文本内容短小,相互共享的词汇较少,因此在分类过程中容易出现大量的集外词,导致分类性能降低。鉴于此,提出了一种基于词矢量相似度的分类方法,首先利用无监督的方法对无标注数据进行训练得到词矢量,然后通过词矢量之间的相似度对测试集中出现的集外词进行扩展。通过与基线系统的对比表明,该方法的分类正确率均优于基线系统1%-2%,尤其是在训练数据较少的情况下,所提出的方法的正确率相对提高10%以上。 展开更多
关键词 短文本分类 词矢量相似度 集外
原文传递
基于概率语义分布的短文本分类 被引量:9
3
作者 马成龙 颜永红 《自动化学报》 EI CSCD 北大核心 2016年第11期1711-1717,共7页
在短文本分类中,面对特征稀疏的短文本,如何充分利用文本中的每一个词语成为关键.本文提出概率语义分布模型的思想,首先通过查询词矢量词典,将文本转换为词矢量数据;其次,在概率语义分布模型的假设下利用混合高斯模型对无标注的文本数... 在短文本分类中,面对特征稀疏的短文本,如何充分利用文本中的每一个词语成为关键.本文提出概率语义分布模型的思想,首先通过查询词矢量词典,将文本转换为词矢量数据;其次,在概率语义分布模型的假设下利用混合高斯模型对无标注的文本数据进行通用背景语义模型训练;利用训练数据对通用模型进行自适应得到各个领域的目标领域语义分布模型;最后,在测试过程中,计算短文本属于领域模型的概率,得到最终的分类结果.实验结果表明,本文提出的方法能够从一定程度上利用短文本所提供的信息,有效降低了对训练数据的依赖性,相比于支持向量机(Support vector machine,SVM)和最大熵分类方法性能相对提高了17.7%. 展开更多
关键词 短文本分类 词矢量 语义分布 高斯混合模型
下载PDF
A Comparison of Path Encoding in English and Chinese
4
作者 Zhou Changyin Huang Yinhong 《International Journal of Technology Management》 2014年第11期43-45,共3页
English and Chinese both belong to satellite-flamed languages in lexicalizing motion events. However, they are not entirely identical in Path encoding. Path comprises Vector, Conformation, and Deictic. Vector comprise... English and Chinese both belong to satellite-flamed languages in lexicalizing motion events. However, they are not entirely identical in Path encoding. Path comprises Vector, Conformation, and Deictic. Vector comprises Arrival, Departure and Traversal. English and Chinese use different forms (prepositions vs. verbs) to represent Traversal. The Arrival component in Chinese can denote "realized arrival" while that in English cannot. English is not fine-grained as Chinese in the specification of Conformation. The use of Deictic in Chinese is more pervasive than that in English. Satellite elements in English are realized as particles and prepositions while those in Chinese are realized as directional verbs. 展开更多
关键词 PATH motion event satellite-framed languages VECTOR CONFORMATION Deictic
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部