期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
基于动态词嵌入对齐的无监督泰语依存句法分析 被引量:1
1
作者 张弘弢 文永华 王剑 《信息技术》 2023年第4期1-7,共7页
泰语的依存句法分析任务具有重要研究价值。但泰语作为低资源语言,缺乏公开可用的句法标注训练集,难以训练有效的依存解析模型。针对这种情况,借助泰语和英语间的动态词嵌入对齐矩阵,将在英语标注数据上训练的依存解析模型迁移到泰语中... 泰语的依存句法分析任务具有重要研究价值。但泰语作为低资源语言,缺乏公开可用的句法标注训练集,难以训练有效的依存解析模型。针对这种情况,借助泰语和英语间的动态词嵌入对齐矩阵,将在英语标注数据上训练的依存解析模型迁移到泰语中,分析无监督泰语依存句法。实验结果表明,该方法能有效地从无标注泰语数据中提取到依存句法知识。此外该方法还支持多语言联合训练迁移到泰语来提升泰语依存句法分析的性能。 展开更多
关键词 依存句法分析 泰语 无监督 动态词嵌入对齐 迁移学习
下载PDF
对外汉语“动态词本位”教学模式
2
作者 李德鹏 《云南师范大学学报(对外汉语教学与研究版)》 2013年第6期7-11,共5页
对外汉语教学以"词本位"为主要模式,是因为"词"作为最小的语法单位,是各级语法单位的核心;"动态词本位"教学模式就是以词为中心培养语言应用能力,遵循以生活为中心和循序渐进、由易到难的原则,配套教材... 对外汉语教学以"词本位"为主要模式,是因为"词"作为最小的语法单位,是各级语法单位的核心;"动态词本位"教学模式就是以词为中心培养语言应用能力,遵循以生活为中心和循序渐进、由易到难的原则,配套教材编写和师资队伍建设是实现该模式的有力保障。 展开更多
关键词 对外汉语 教学模式 动态词本位 原则 保障
下载PDF
动态词与静态词小议
3
作者 丁力 《文教资料》 2010年第2期27-28,共2页
本文简要讨论词的两种重要存在形式——动态词与静态词,认为两者都有各自的物质属性,它们既相互对立。又相互联系。
关键词 动态词 静态 物质属性 对立统一
下载PDF
一个智能动态词切分算法的分析与实现
4
作者 赵雷 《苏州大学学报(自然科学版)》 CAS 2001年第4期63-67,共5页
在简单易行的词切分方法———最大词匹配算法的基础上 ,提出了对该算法的一种调整算法 ,使词切分的结果最大可能地接近真实的语意 .同时 ,还提出了对文本进行多次遍历、标记化处理等方法 ,采用动态词合成技术 ,动态修正词典 ,使词切分... 在简单易行的词切分方法———最大词匹配算法的基础上 ,提出了对该算法的一种调整算法 ,使词切分的结果最大可能地接近真实的语意 .同时 ,还提出了对文本进行多次遍历、标记化处理等方法 ,采用动态词合成技术 ,动态修正词典 ,使词切分的结果更接近人们对自然语言的真实理解 . 展开更多
关键词 切分 最大匹配算法 汉语处理 最大调整算法 遍历 标记化 动态词合成技术
下载PDF
动态词链算法 被引量:3
5
作者 刘素红 刘传汉 王永成 《计算机工程》 CAS CSCD 北大核心 2003年第20期80-81,共2页
介绍了动态词链算法的基本思想。由于该算法是以电子词典WordNet为基础而不是以对文章的语义理解为基础的,因此适用于任何文章。可以用此算法生成词链,再由此生成文章的摘要。
关键词 解释 组件 WORDNET 动态词链算法 电子
下载PDF
基于ALBERT动态词向量的垃圾邮件过滤模型 被引量:3
6
作者 周枝凝 王斌君 +1 位作者 翟一鸣 仝鑫 《信息网络安全》 CSCD 北大核心 2020年第9期107-111,共5页
针对垃圾邮件分类问题中词向量学习不充分的问题,文章引入ALBERT动态词向量生成模型,并提出一种将ALBERT动态词向量与循环神经网络相结合的ALBERT-RNN模型。利用公开的垃圾邮件数据集(TEC06C),对传统统计学模型与4种不同RNN结构的ALBERT... 针对垃圾邮件分类问题中词向量学习不充分的问题,文章引入ALBERT动态词向量生成模型,并提出一种将ALBERT动态词向量与循环神经网络相结合的ALBERT-RNN模型。利用公开的垃圾邮件数据集(TEC06C),对传统统计学模型与4种不同RNN结构的ALBERT-RNN模型进行了对比实验,并用Focal Loss方法对交叉熵损失函数进行了优化。实验结果表明,使用Focal Loss优化的ALBERT-LSTM模型在TEC06C数据集上达到了较高的准确率(99.13%)。 展开更多
关键词 中文垃圾邮件 循环神经网络 ALBERT模型 动态词向量
下载PDF
基于汉语国际教育教材语料的三音节名词型动态词分析
7
作者 郭冬冬 宋继华 +1 位作者 彭炜明 张引兵 《中文信息学报》 CSCD 北大核心 2018年第6期12-18,共7页
国际汉语教学领域中存在大量的动态词。深入细致地研究分析国际汉语教材语料中真实出现的动态词,一方面有助于国际汉语教学的词汇研究与词汇教学;另一方面,对面向国际汉语教学的信息处理工作具有重要的促进作用。三音节名词是国际汉语... 国际汉语教学领域中存在大量的动态词。深入细致地研究分析国际汉语教材语料中真实出现的动态词,一方面有助于国际汉语教学的词汇研究与词汇教学;另一方面,对面向国际汉语教学的信息处理工作具有重要的促进作用。三音节名词是国际汉语教学中一种常见的词汇类型,在词汇教学中占有重要的位置,而其中三音节名词型动态词又占有较高的比重。该文首先介绍三音节名词型动态词结构模式的一种知识表示方法;然后通过标注一定规模的国际汉语教材语料,获取三音节名词型动态词的所有结构模式类型以及对应的动态词及词频信息,构建基于国际汉语教学的三音节名词型动态词结构模式知识库;最后在结构模式知识库的基础上对三音节名词型动态词进行分析。 展开更多
关键词 动态词 三音节名 结构模式 国际汉语教学
下载PDF
基于动态词向量和注意力机制的文本情感分类 被引量:5
8
作者 王璐琳 马力 《计算机应用与软件》 北大核心 2021年第5期164-169,182,共7页
针对Word2vec等静态词向量模型对于每个词只有唯一的词向量表示,无法学习在不同上下文中的词汇多义性问题,提出一种基于动态词向量和注意力机制的文本情感分类方法。在大型语料库上利用深度双向语言模型预训练通用词向量;在情感分类任... 针对Word2vec等静态词向量模型对于每个词只有唯一的词向量表示,无法学习在不同上下文中的词汇多义性问题,提出一种基于动态词向量和注意力机制的文本情感分类方法。在大型语料库上利用深度双向语言模型预训练通用词向量;在情感分类任务的训练语料上对向量模型进行微调,得到最终的上下文相关的动态词向量作为输入特征;搭建双向长短期记忆网络模型,并引入注意力机制以提高特征提取的准确性。实验结果表明,该方法在IMDB和Yelp13数据集上的分类准确率分别提高了0.017和0.011。 展开更多
关键词 文本情感分类 汇多义性 动态词向量 注意力机制 长短期记忆网络
下载PDF
关中方言“人称代词/名词+‘一’+动词/动态词”句式初探
9
作者 安幼薇 赵学清 《文教资料》 2011年第13期24-26,共3页
本文从关中地区方言口语的角度出发,对"人称代词/名词+‘一’+动词/动态词"这一句式结构的实例进行阐述和说明。不仅从语法结构和语义功能上进行系统的分析总结而且与相似结构进行比对分析,从而展现这个句式的特点和多样性,为以后... 本文从关中地区方言口语的角度出发,对"人称代词/名词+‘一’+动词/动态词"这一句式结构的实例进行阐述和说明。不仅从语法结构和语义功能上进行系统的分析总结而且与相似结构进行比对分析,从而展现这个句式的特点和多样性,为以后此类方言语法结构的再次研究作必要的铺垫。 展开更多
关键词 关中方言 “人称代/名+'一’+动/动态词”句式 分析
下载PDF
基于HNC理论的动态词合成
10
作者 吴崇斌 张全 《微计算机应用》 2010年第2期7-11,共5页
采用HNC理论的最新研究成果,从技术上实现动态词的合成。研究的成果集中在动态词合成程序,该程序能将文本分词后产生的单字根据规则库实现动态词的合成,从而提高句类分析的效率。
关键词 HNC理论 动态词 规则处理
下载PDF
DUWe:动态未知词嵌入方法在Web异常检测中的应用
11
作者 王丽 陈刚 +1 位作者 夏明山 胡皓 《计算机科学》 CSCD 北大核心 2024年第S01期914-918,共5页
现有的基于深度学习模型的词嵌入方法用于Web异常检测时,通常将语料库中没有出现的未知词汇(Out of Vocabulary,OOV)设置为unknown,并赋予零或随机向量输入到模型中进行训练,未考虑未知词汇在Web请求语句中的上下文关系。同时,在Web系... 现有的基于深度学习模型的词嵌入方法用于Web异常检测时,通常将语料库中没有出现的未知词汇(Out of Vocabulary,OOV)设置为unknown,并赋予零或随机向量输入到模型中进行训练,未考虑未知词汇在Web请求语句中的上下文关系。同时,在Web系统代码开发过程中,基于个人习惯并为了增加代码的可读性,程序员设计的请求路径代码往往存在一定的模式。因此,考虑到Web请求的模式和单词语义间的相关性,研究基于Word2vec的动态未知词表示方法DUWe(Dynamic Unknown Word Embedding),该方法通过分析Web请求路径中单词上下文的关系来赋予未知词向量的表示内容。在CSIC-2010和WAF Dataset数据集上的实验评估表明,增加未知词表示方法比仅用Word2vec静态特征提取方法具有更好的性能,同时在准确性、精准率、召回率和F1-Score方面均有提高,在训练时间上最大降低1.14倍。 展开更多
关键词 未知 Web异常检测 动态词嵌入 嵌入优化 深度学习
下载PDF
基于多粒度与动态词向量的机器翻译关键技术研究 被引量:1
12
作者 王国英 《自动化与仪器仪表》 2022年第9期181-185,共5页
针对现有机器翻译模型翻译质量低的问题,通过结合多粒度特征融合与基于ELMo模型的动态词向量,并以采用多粒度位置编码和多粒度自注意力机制改进的Transformer模型作为主干网络,构建了一种基于多粒度与动态词向量的机器翻译模型。仿真结... 针对现有机器翻译模型翻译质量低的问题,通过结合多粒度特征融合与基于ELMo模型的动态词向量,并以采用多粒度位置编码和多粒度自注意力机制改进的Transformer模型作为主干网络,构建了一种基于多粒度与动态词向量的机器翻译模型。仿真结果表明,所提模型提高了机器翻译模型性能,在WMT2019Zh-En数据集上和NIST数据集上分别BLEU值分别达到31.53和42.61,相较于单一粒度特征输入和静态词向量嵌入,平均提高了1.1和1.39,具有一定的有效性和优越性。 展开更多
关键词 多粒度特征 动态词向量 Transformer模型 机器翻译
原文传递
微博话题识别中基于动态共词网络的文本特征提取方法 被引量:13
13
作者 商宪丽 王学东 《图书情报知识》 CSSCI 北大核心 2016年第3期80-88,共9页
本文针对微博文本的简短、动态性等特征,提出一种新的文本特征提取方法,提升微博话题识别任务中文本聚类算法效果。利用词项共现的思想,针对微博时序文本构建动态共词网络。在动态共词网络中,边权重随着时间推移而线性衰减,并在此基础... 本文针对微博文本的简短、动态性等特征,提出一种新的文本特征提取方法,提升微博话题识别任务中文本聚类算法效果。利用词项共现的思想,针对微博时序文本构建动态共词网络。在动态共词网络中,边权重随着时间推移而线性衰减,并在此基础上利用网络的度中心性计算微博文本特征权重。从新浪微博中采样构建实验数据集进行实验,结果表明动态共词网络特征提取方法相较于文档频率方法,更适宜于提取微博文本特征,能取得更好的微博话题识别效果。 展开更多
关键词 微博 话题识别 动态网络 特征提取 文本聚类
下载PDF
基于动态匹配词格检索的关键词检测 被引量:2
14
作者 郑永军 张连海 《应用科学学报》 CAS CSCD 北大核心 2014年第2期149-155,共7页
对生活中涌现的海量语音数据需要进行快速而准确的检索.提出一种基于动态匹配词格检索的关键词检测方法,应用TRAP特征和多层感知器创建更为精准的音素Lattice.在索引阶段执行一个改进的维特比算法遍历Lattice来创建一个固定长度的音素... 对生活中涌现的海量语音数据需要进行快速而准确的检索.提出一种基于动态匹配词格检索的关键词检测方法,应用TRAP特征和多层感知器创建更为精准的音素Lattice.在索引阶段执行一个改进的维特比算法遍历Lattice来创建一个固定长度的音素序列数据库,在检索阶段应用最小编辑距离作为置信度来实现关键词的检出.实验结果表明,该方法相比应用MFCC和PLP特征的基线系统具有一定的优势,召回率可提升5%左右. 展开更多
关键词 关键检测 动态匹配格检索 TRAP特征 最小编辑距离
下载PDF
融合后验概率置信度的动态匹配词格检索
15
作者 郑永军 张连海 陈斌 《模式识别与人工智能》 EI CSCD 北大核心 2015年第2期155-161,共7页
在基于动态匹配词格检索(DMLS)的关键词检测系统中,应用最小编辑距离作为关键词检出的置信度,在提高检出率的同时也增加虚警率.针对此问题,文中提出融合后验概率置信度的动态匹配词格检索方法.该方法首先将基于Lattice的后验概率引入到D... 在基于动态匹配词格检索(DMLS)的关键词检测系统中,应用最小编辑距离作为关键词检出的置信度,在提高检出率的同时也增加虚警率.针对此问题,文中提出融合后验概率置信度的动态匹配词格检索方法.该方法首先将基于Lattice的后验概率引入到DMLS的索引建立中,其次应用数据驱动的音素替换、插入和删除代价,实现更灵活的近似匹配,最后通过联合最小编辑距离和后验概率置信度得分进行关键词检测.实验表明,最小编辑距离和后验概率置信度具有一定的互补性,系统的等错误率相对降低. 展开更多
关键词 关键检测 动态匹配格检索(DMLS) 最小编辑距离 后验概率置信度
下载PDF
基于动态共词分析的国际医学信息学领域热点演变
16
作者 敦欣卉 张云秋 冯佳 《医学信息学杂志》 CAS 2016年第10期2-9,共8页
以PubMed数据库医学信息学领域的核心期刊为数据源,基于动态共词分析及信息可视化方法,利用BICOMB、VOSviewer、EXCEL等软件,以知识图谱的形式对国际医学信息学领域近10年热点主题的演变进行分析与呈现,结果表明互联网在医学信息学领域... 以PubMed数据库医学信息学领域的核心期刊为数据源,基于动态共词分析及信息可视化方法,利用BICOMB、VOSviewer、EXCEL等软件,以知识图谱的形式对国际医学信息学领域近10年热点主题的演变进行分析与呈现,结果表明互联网在医学信息学领域的应用一直是国际医学信息学的研究热点。 展开更多
关键词 医学信息学 动态分析 主题热点 可视化
下载PDF
基于BERT-TextCNN的汽车评论情感分析 被引量:1
17
作者 邹旺 张吴波 《天津理工大学学报》 2024年第1期101-108,共8页
通过基于预训练转换器(Transformer)双向编码器表征的文本卷积神经网络(text convolutional neural network model based on pre-training bidirectional encoder representations from transformer,BERT-TextCNN)模型实现汽车网站评论... 通过基于预训练转换器(Transformer)双向编码器表征的文本卷积神经网络(text convolutional neural network model based on pre-training bidirectional encoder representations from transformer,BERT-TextCNN)模型实现汽车网站评论的情感分析,其目的在于研究用户对汽车产品和汽车服务的情感态度。首先采用基于Transformer的双向编码器表征(bidirectional encoder representations from transformer,BERT)模型能有效解决汽车评论中存在的一词多义问题,并产生包含丰富信息的动态词向量,然后结合文本卷积神经网络(text convolutional neural network,TextCNN)模型中的卷积运算和池化运算提取关键特征,最后通过softmax函数计算评论文本情感的概率分布。试验结果表明,BERT-TextCNN模型在情感分类中相比几种常见的神经网络模型的精度、召回率和F1值均有所提升。 展开更多
关键词 情感分析 动态词向量 卷积运算 池化运算
下载PDF
基于汉语字义基元化的新词处理分析
18
作者 张全 袁毅 《微计算机应用》 2010年第3期63-66,共4页
现代汉语中具有"字义基元化,词义组合化"的特点,本文根据这一特点,从汉字动态组合形成新词的角度,对汉语中新词语的释义进行了分析。通过对比词典收录的词语义项和新词语释义,发现字义在网络环境出现的新词中有了拓展。针对... 现代汉语中具有"字义基元化,词义组合化"的特点,本文根据这一特点,从汉字动态组合形成新词的角度,对汉语中新词语的释义进行了分析。通过对比词典收录的词语义项和新词语释义,发现字义在网络环境出现的新词中有了拓展。针对这些义项进一步分析发现,字义的核心语义内容没有发生根本的变化,而是表述对象的拓展。本文以组成网络新词比较活跃的"裸"字为例进行了具体说明,研究结果有助于汉语新词处理。 展开更多
关键词 动态词 汇语义 语义分析
下载PDF
商务英语书信的用词特征 被引量:2
19
作者 肖烨 《邵阳学院学报(社会科学版)》 2004年第2期95-97,共3页
商务英语书信中的词汇具有正式 ,简明的特征。在商务书信中多用小词 ,动态词 ,缩略语 ,有积极意义的词和模糊词 ,少用或不用大词 ,静态词 ,陈腐的词以及带性别歧视的词。
关键词 商务英语 书信 汇特征 性别歧视 动态词 缩略语 模糊表达法
下载PDF
语言艺术发声吐词论 被引量:3
20
作者 杨小锋 《四川师范大学学报(社会科学版)》 CSSCI 北大核心 2008年第5期70-75,共6页
从心理语言学的角度考察,语言艺术发声吐词有静态与动态之分。静态吐词指在脱离语境情况下词语的吐送,目的是使发音准确、饱满、圆润、动听,单位是词和固定短语,而词是静态吐词的基本单位;动态吐词是指进入语境的词语的吐送方式,目的是... 从心理语言学的角度考察,语言艺术发声吐词有静态与动态之分。静态吐词指在脱离语境情况下词语的吐送,目的是使发音准确、饱满、圆润、动听,单位是词和固定短语,而词是静态吐词的基本单位;动态吐词是指进入语境的词语的吐送方式,目的是使吐词更加流畅、自然、生动,基本单位是节奏单元。一个语句可以只有一个节奏单元,也可以有几个节奏单元,节奏单元的划分要受多种因素的制约。语言艺术发声训练应该从单音节词开始,然后进行双音节词语、多音节词语的训练,最后再进行动态吐词训练。 展开更多
关键词 语言艺术 艺术发声 动态 静态吐态
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部