期刊文献+
共找到168篇文章
< 1 2 9 >
每页显示 20 50 100
A study on the Popular Words on Line——Take the Popular Words of Recent Years as Examples
1
作者 郭晨 《海外英语》 2012年第23期233-235,238,共4页
Popular word on line is a kind of language form which is welcomed by netizens.The popular word on line is the most active part of network language.They are made of expressions what the internet users are established b... Popular word on line is a kind of language form which is welcomed by netizens.The popular word on line is the most active part of network language.They are made of expressions what the internet users are established by usage.The popular words on line have a very strong nature of medium.They are the comprehensive products which come from the facts of social politics,economics,culture,environment and people's psychological activities etc.of a certain time.The total amount of new emerging popular words on line is not so many every year,but the influence of them can not be belittled.This study focuses on the popular words on line with the cases of the popular words occured in recent years.It works on the reasons for their rapid spreading.The author summarizes their characteristics and put forward some ways for the guidance of the popular words on line. 展开更多
关键词 POPULAR words on line internet guide NETIZEN netwo
下载PDF
融合Word2Vec词嵌入的多核卷积神经网络音乐歌词多情感分类方法
2
作者 张昱 冯亚寒 丁千惠 《科学技术与工程》 北大核心 2024年第20期8598-8605,共8页
目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神... 目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神经网络作为分类器的音乐歌词多情感分类方法。该方法首先结合音乐歌词文本,进行数据预处理和可视化分析;其次利用Word2Vec词嵌入提取歌词局部特征,构建特征情感向量,挖掘歌词中情感信息,将歌词转化为更利于分类器模型输入的词向量;最后在分类器中,选用卷积神经网络模型,并在此基础上采用不同高度卷积核的方式构建新模型以此得到多情感分类。结果表明:音乐歌词多情感分类的结果达到94.26%,与传统CNN相比,分类精确率提高了6.86%,取得了良好性能。 展开更多
关键词 自然语言处理 情感分类 卷积神经网络 词嵌入 文本分类 音乐歌词
下载PDF
基于word embedding和CNN的情感分类模型 被引量:20
3
作者 蔡慧苹 王丽丹 段书凯 《计算机应用研究》 CSCD 北大核心 2016年第10期2902-2905,2909,共5页
尝试将word embedding和卷积神经网络(CNN)相结合来解决情感分类问题。首先,利用skip-gram模型训练出数据集中每个词的word embedding,然后将每条样本中出现的word embedding组合为二维特征矩阵作为卷积神经网络的输入,此外每次迭代训... 尝试将word embedding和卷积神经网络(CNN)相结合来解决情感分类问题。首先,利用skip-gram模型训练出数据集中每个词的word embedding,然后将每条样本中出现的word embedding组合为二维特征矩阵作为卷积神经网络的输入,此外每次迭代训练过程中,输入特征也作为参数进行更新;其次,设计了一种具有三种不同大小卷积核的神经网络结构,从而完成多种局部抽象特征的自动提取过程。与传统机器学习方法相比,所提出的基于word embedding和CNN的情感分类模型成功地将分类正确率提升了5.04%。 展开更多
关键词 卷积神经网络 自然语言处理 深度学习 词嵌入 情感分类
下载PDF
Language clustering with word co-occurrence networks based on parallel texts 被引量:6
4
作者 LIU HaiTao CONG Jin 《Chinese Science Bulletin》 SCIE EI CAS 2013年第10期1139-1144,共6页
This study investigates the feasibility of applying complex networks to fine-grained language classification and of employing word co-occurrence networks based on parallel texts as a substitute for syntactic dependenc... This study investigates the feasibility of applying complex networks to fine-grained language classification and of employing word co-occurrence networks based on parallel texts as a substitute for syntactic dependency networks in complex-network-based language classification.14 word co-occurrence networks were constructed based on parallel texts of 12 Slavic languages and 2 non-Slavic languages,respectively.With appropriate combinations of major parameters of these networks,cluster analysis was able to distinguish the Slavic languages from the non-Slavic and correctly group the Slavic languages into their respective sub-branches.Moreover,the clustering could also capture the genetic relationships of some of these Slavic languages within their sub-branches.The results have shown that word co-occurrence networks based on parallel texts are applicable to fine-grained language classification and they constitute a more convenient substitute for syntactic dependency networks in complex-network-based language classification. 展开更多
关键词 网络构建 文本聚类 语言 平行 共生 聚类分析 遗传关系 复杂网络
原文传递
基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究 被引量:2
5
作者 余礼根 郭晓利 +3 位作者 赵红涛 杨淦 张俊 李奇峰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期287-294,共8页
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona... 针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。 展开更多
关键词 畜禽疫病 文本分词 预训练语言模型 双向长短时记忆网络 条件随机场
下载PDF
基于外部知识检测的数学几何单词问题求解
6
作者 魏亚琴 刘斌 +2 位作者 张倩 崔学英 谢秀峰 《太原科技大学学报》 2024年第5期507-513,共7页
随着人工智能技术的不断发展,深度学习方法在数学单词问题智能求解方面得到了广泛应用。基于图到树的编解码网络表现出良好的性能,但外部知识缺乏使得模型求解准确率提升受到限制,构建一种基于几何知识库的检测模块,将其融入编解码器网... 随着人工智能技术的不断发展,深度学习方法在数学单词问题智能求解方面得到了广泛应用。基于图到树的编解码网络表现出良好的性能,但外部知识缺乏使得模型求解准确率提升受到限制,构建一种基于几何知识库的检测模块,将其融入编解码器网络模型,提高了模型的预测能力。通过在中文数学问题数据集GeometryQA上进行验证,模型表现出更高的准确率,具有一定的优越性。 展开更多
关键词 自然语言处理 数学单词问题 几何知识库 检测模块
下载PDF
基于论文语义与引用网络的技术发展趋势分析
7
作者 马健兵 徐池 《软件导刊》 2024年第11期100-106,共7页
随着科学技术的快速发展,识别分析技术领域的发展轨迹和研究热点具有重要意义,但技术数据的爆炸式增长使得人工监测技术趋势的成本和时间增加。鉴于此,提出一种基于论文语义主题和引文分析的技术发展网络图生成方法,以实现技术发展趋势... 随着科学技术的快速发展,识别分析技术领域的发展轨迹和研究热点具有重要意义,但技术数据的爆炸式增长使得人工监测技术趋势的成本和时间增加。鉴于此,提出一种基于论文语义主题和引文分析的技术发展网络图生成方法,以实现技术发展趋势分析。该方法使用自然语言处理(NLP)技术从科学论文中提取潜在的语义特征,并通过聚类分析实现技术领域的主题划分。结合论文技术主题分类和论文引用分析构建由主要论文组成的技术发展网络图,并采用图算法对生成的网络图进行分析以获得有意义的技术趋势结果。根据医疗物联网领域的论文,实现该领域技术主题划分,并生成该领域技术网络图以实现技术趋势分析。特别是,将图算法应用于生成的技术发展网络图,有助于发现医疗保健物联网领域的研究热点及趋势。 展开更多
关键词 技术发展网络图 趋势分析 主题模型 自然语言处理 词嵌入 医疗物联网
下载PDF
基于百度百科的词语相似度计算 被引量:22
8
作者 詹志建 梁丽娜 杨小平 《计算机科学》 CSCD 北大核心 2013年第6期199-202,共4页
词语相似度计算是自然语言处理的关键技术之一,是一个被广泛研究的基础课题。传统的词语相似度量方法大多是基于语义知识和基于语料库统计的方法,即这两类方法需要具有层次关系组织的语义词典和大规模的语料库。提出了一种新的基于百度... 词语相似度计算是自然语言处理的关键技术之一,是一个被广泛研究的基础课题。传统的词语相似度量方法大多是基于语义知识和基于语料库统计的方法,即这两类方法需要具有层次关系组织的语义词典和大规模的语料库。提出了一种新的基于百度百科的词语相似度量方法,通过分析百度百科词条信息,从表征词条的解释内容方面综合分析词条相似度,并定义了词条间的相似度计算公式,通过计算部分之间的相似度得到整体的相似度。实验结果表明,与已有的相似度计算方法对比,提出的算法更加有效合理。 展开更多
关键词 词语相似度 语言网络 百度百科 向量空间模型
下载PDF
基于改进BP网络的中文歧义字段分词方法研究 被引量:12
9
作者 张利 张立勇 +2 位作者 张晓淼 耿铁锁 岳宗阁 《大连理工大学学报》 EI CAS CSCD 北大核心 2007年第1期131-135,共5页
文本挖掘中中文歧义字段的自动分词是计算机科学面临的一个难题.针对汉语书写时按句连写,词间无间隙,歧义字段分词困难的特点,对典型歧义中所蕴含的语法现象进行了归纳总结,建立了供词性编码使用的词性代码库.以此为基础,通过对具有特... 文本挖掘中中文歧义字段的自动分词是计算机科学面临的一个难题.针对汉语书写时按句连写,词间无间隙,歧义字段分词困难的特点,对典型歧义中所蕴含的语法现象进行了归纳总结,建立了供词性编码使用的词性代码库.以此为基础,通过对具有特殊语法规则的歧义字段中的字、词进行代码设定,转化为神经网络能够接受的输入向量表示形式,然后对样本进行训练,通过改进BP神经网络的自学习来掌握这些语法规则.训练结果表明:算法在歧义字段分词上达到了93.13%的训练精度和92.50%的测试精度. 展开更多
关键词 文本挖掘 歧义字段 自然语言处理 神经网络
下载PDF
基于词向量特征的循环神经网络语言模型 被引量:40
10
作者 张剑 屈丹 李真 《模式识别与人工智能》 EI CSCD 北大核心 2015年第4期299-305,共7页
循环神经网络语言模型能解决传统N-gram模型中存在的数据稀疏和维数灾难问题,但仍缺乏对长距离信息的描述能力.为此文中提出一种基于词向量特征的循环神经网络语言模型改进方法.该方法在输入层中增加特征层,改进模型结构.在模型训练时,... 循环神经网络语言模型能解决传统N-gram模型中存在的数据稀疏和维数灾难问题,但仍缺乏对长距离信息的描述能力.为此文中提出一种基于词向量特征的循环神经网络语言模型改进方法.该方法在输入层中增加特征层,改进模型结构.在模型训练时,通过特征层加入上下文词向量,增强网络对长距离信息约束的学习能力.实验表明,文中方法能有效提高语言模型的性能. 展开更多
关键词 语音识别 语言模型 循环神经网络 词向量
下载PDF
深度递归的层次化机器翻译模型 被引量:28
11
作者 刘宇鹏 马春光 张亚楠 《计算机学报》 EI CSCD 北大核心 2017年第4期861-871,共11页
深度学习在自然语言处理中有很多的应用.深度网络的主要作用是捕获隐藏在语言结构中更深的语义信息.该文出发点为根据原有句子中的对齐作为深度网络生成结构的指导,并融合原有深度翻译模型的优点,提出了深度递归的层次化机器翻译模型.... 深度学习在自然语言处理中有很多的应用.深度网络的主要作用是捕获隐藏在语言结构中更深的语义信息.该文出发点为根据原有句子中的对齐作为深度网络生成结构的指导,并融合原有深度翻译模型的优点,提出了深度递归的层次化机器翻译模型.相对于已有的神经翻译模型来说,更好地结合了层次化的翻译过程,同时这种方法结合循环神经网络和递归神经网络的优点.层次化规则的归纳包含两个部分:短语的归纳和形式化规则的归纳,而在该文的建模过程中模拟了这两个部分且符合归纳过程.该文在训练中采用单词级语义错误、单语短语/规则语义错误和双语短语/规则语义错误构造目标函数,训练中能够更好平衡语义中3个部分的影响,同时考虑到对齐信息以指导层次化深度神经网络的训练.在解码过程中通过生成部分翻译结果的语义向量,最终得到句子间的语义关系,这样可以在语法结构中加入语义信息,克服了原有层次化模型语义信息缺乏的问题.该模型的实验结果说明了深度递归的层次化机器翻译模型的有效性,相对于经典的基线系统提高了1.49~1.84BLEU分数. 展开更多
关键词 循环神经网络 递归神经网络 词/短语/规则嵌入 层次化递归神经网络 自然语言处理
下载PDF
结合全局词向量特征的循环神经网络语言模型 被引量:10
12
作者 李华 屈丹 +2 位作者 张文林 王炳锡 梁玉龙 《信号处理》 CSCD 北大核心 2016年第6期715-723,共9页
针对循环神经网络语言模型对长距离历史信息学习能力不足的问题,本文提出了结合全局词向量特征的循环神经网络语言模型。首先利用Glo Ve(Global Word Vectors)算法训练出全局词向量,然后将其作为特征向量输入到引入特征层的循环神经网... 针对循环神经网络语言模型对长距离历史信息学习能力不足的问题,本文提出了结合全局词向量特征的循环神经网络语言模型。首先利用Glo Ve(Global Word Vectors)算法训练出全局词向量,然后将其作为特征向量输入到引入特征层的循环神经网络中进行训练。相对于局部词向量方法,全局词向量能够利用全局统计信息来训练出含有更加丰富的语义和句法信息词向量。为了验证新方法的性能,本文在Penn Treebank和Wall Street Journal语料库上分别进行困惑度和连续语音识别实验。实验结果表明结合全局词向量的循环神经网络语言模型的困惑度相比传统的循环神经网络语言模型降低了20.2%,同时语音识别系统的词错误率降低了18.3%。 展开更多
关键词 循环神经网络 语言模型 全局词向量 语音识别
下载PDF
基于卷积双向长短期记忆网络的事件触发词抽取 被引量:19
13
作者 陈斌 周勇 刘兵 《计算机工程》 CAS CSCD 北大核心 2019年第1期153-158,共6页
传统事件触发词抽取方法在特征提取过程中过分依赖自然语言处理工具,容易造成误差累积。为解决该问题,在卷积双向长短期记忆网络的基础上,提出一种事件触发词抽取方法。通过卷积操作提取单词上下文语境信息,同时利用长短期记忆网络保留... 传统事件触发词抽取方法在特征提取过程中过分依赖自然语言处理工具,容易造成误差累积。为解决该问题,在卷积双向长短期记忆网络的基础上,提出一种事件触发词抽取方法。通过卷积操作提取单词上下文语境信息,同时利用长短期记忆网络保留句子级别特征,从而提高事件触发词的抽取性能。在ACE2005英文语料上的实验结果表明,该方法在事件触发词识别与分类阶段的F值达到69. 5%,具有较好的抽取性能。 展开更多
关键词 事件抽取 触发词 卷积神经网络 循环神经网络 自然语言处理 特征提取
下载PDF
网络流行语的概念辨析与传播过程 被引量:23
14
作者 孙洁 樊启迪 巢乃鹏 《南京邮电大学学报(社会科学版)》 2011年第3期15-19,共5页
伴随着网络的普及,中国网络流行语层出不穷,逐渐从网络渗透到传统媒体和社会生活中,成为公众用语。从网络流行语的概念和其与普通网络语言的区分出发,指出事件关联性是促进网络语言流行化的重要因素,影响网络流行语产生的心理因素包括... 伴随着网络的普及,中国网络流行语层出不穷,逐渐从网络渗透到传统媒体和社会生活中,成为公众用语。从网络流行语的概念和其与普通网络语言的区分出发,指出事件关联性是促进网络语言流行化的重要因素,影响网络流行语产生的心理因素包括个体心理因素和群体心理因素两个部分,网络流行语具有社会性、娱乐性、不规范性这三个语言特色。 展开更多
关键词 网络流行语 网络通用语 事件关联性 网络用语分类
下载PDF
基于语义的汉语文献主题词提取算法研究 被引量:16
15
作者 唐培丽 王树明 胡明 《吉林大学学报(信息科学版)》 CAS 2005年第5期535-540,共6页
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型。该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和... 为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型。该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题。该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引。实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍。 展开更多
关键词 自然语言处理 主题词提取 概念语义网络
下载PDF
基于门循环单元神经网络的中文分词法 被引量:22
16
作者 李雪莲 段鸿 许牧 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第2期237-243,共7页
目前,学术界主流的中文分词法是基于字符序列标注的传统机器学习方法,该方法存在需要人工定义特征、特征稀疏等问题.随着深度学习的研究和应用的兴起,研究者提出了将长短时记忆(long short-term memory,LSTM)神经网络应用于中文分词任... 目前,学术界主流的中文分词法是基于字符序列标注的传统机器学习方法,该方法存在需要人工定义特征、特征稀疏等问题.随着深度学习的研究和应用的兴起,研究者提出了将长短时记忆(long short-term memory,LSTM)神经网络应用于中文分词任务的方法,该方法可以自动学习特征,并有效建模长距离依赖信息,但是该模型较为复杂,存在模型训练和预测时间长的缺陷.针对该问题,提出了基于门循环单元(gated recurrent unit,GRU)神经网络的中文分词法,该方法继承了LSTM模型可自动学习特征、能有效建立长距离依赖信息的优点,具有与基于LSTM神经网络中文分词法相当的性能,并在速度上有显著提升. 展开更多
关键词 自然语言处理 中文分词 门循环单元 字嵌入 循环神经网络
下载PDF
基于迁移学习的个性化循环神经网络语言模型 被引量:7
17
作者 徐萍 吴超 +3 位作者 胡峰俊 吴凡 林建伟 刘静静 《南京理工大学学报》 EI CAS CSCD 北大核心 2018年第4期401-408,共8页
针对在小数据集上开发个性化语言模型仍存在的障碍,提出基于迁移学习的个性化循环神经网络语言模型。设计了基于预训练词向量、预训练电影剧本数据集、基于参数微调和特征提取分类器的迁移学习训练模式,在小数据集上建立了具有较高辨识... 针对在小数据集上开发个性化语言模型仍存在的障碍,提出基于迁移学习的个性化循环神经网络语言模型。设计了基于预训练词向量、预训练电影剧本数据集、基于参数微调和特征提取分类器的迁移学习训练模式,在小数据集上建立了具有较高辨识度的个性化语言模型,降低了模型的困惑度,改进了模型的性能。模型的实验以电视剧Seinfeld角色为基础。结果表明:该模型在特定角色测试数据集上的困惑度比其他角色数据集平均低17.65%,证明其已经学会了该角色的个性化风格;迁移学习使得模型最低困惑度平均降低了36.38%,较好地解决了基于小数据集开发个性化语言模型存在的障碍问题。 展开更多
关键词 语言模型 个性化 循环神经网络 迁移学习 小数据集 预训练词向量
下载PDF
借重于人工知识库的词和义项的向量表示:以HowNet为例 被引量:12
18
作者 孙茂松 陈新雄 《中文信息学报》 CSCD 北大核心 2016年第6期1-6,14,共7页
该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题:一是低频词的词向量质量难以保证;二是多义词的义项向量无... 该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题:一是低频词的词向量质量难以保证;二是多义词的义项向量无法获得。该文提出了融合HowNet和大规模语料库的义原向量学习神经网络模型,并以义原向量为桥梁,自动得到义项向量及完善词向量。初步的实验结果表明该模型能有效提升在词相似度和词义消歧任务上的性能,有助于低频词和多义词的处理。作者指出,借重于人工知识库的神经网络语言模型应该成为今后一段时期自然语言处理的研究重点之一。 展开更多
关键词 词向量 义项向量 义原向量 HOWNET 神经网络语言模型
下载PDF
自然语言网络答疑系统的研究与实现 被引量:10
19
作者 郑庆华 胡云华 张素娟 《小型微型计算机系统》 CSCD 北大核心 2005年第3期554-560,共7页
网络答疑是现代远程教育的重要组成部分,本文提出了一种基于自然语言的新型网络答疑系统的实现模型,介绍其实现原理及框架,并提出了从关键词、提问方式、提问重点三个层次对用户提问进行语义分析、特征向量提取及语义匹配的分析方法.实... 网络答疑是现代远程教育的重要组成部分,本文提出了一种基于自然语言的新型网络答疑系统的实现模型,介绍其实现原理及框架,并提出了从关键词、提问方式、提问重点三个层次对用户提问进行语义分析、特征向量提取及语义匹配的分析方法.实验结果表明,本文提出的关键技术解决方案能有效分析自然语言提问,提高问题答案匹配的精确率及召回率. 展开更多
关键词 网络答疑 自然语言处理 分词 提问方式 语义分析 向量空间模型 概念背景网
下载PDF
一种多基元联合训练的藏文词向量表示方法 被引量:4
20
作者 才智杰 才让卓玛 孙茂松 《中文信息学报》 CSCD 北大核心 2020年第5期44-49,共6页
词向量表示是机器学习的基础性工作,其目标是以优化的向量表示词,以便计算机能更好地理解自然语言。随着神经网络技术的发展,词向量在自然语言处理领域发挥着重要作用。藏文词向量表示技术的研究对藏文特征分析以及用深度学习技术处理... 词向量表示是机器学习的基础性工作,其目标是以优化的向量表示词,以便计算机能更好地理解自然语言。随着神经网络技术的发展,词向量在自然语言处理领域发挥着重要作用。藏文词向量表示技术的研究对藏文特征分析以及用深度学习技术处理藏文具有重要意义。该文提出了一种构件、字和词多基元联合训练的藏文词向量表示方法,设计了多基元联合训练藏文词向量的模型TCCWE,并采用内部评测中的词相似度/相关性评价方式验证了其有效性。实验表明,该文提出的藏文词向量表示方法有效,其性能在TWordSim215上提高了3.35%,在TWordRel215上提高了4.36%。 展开更多
关键词 自然语言处理 藏文 神经网络 词向量表示
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部