期刊文献+
共找到123篇文章
< 1 2 7 >
每页显示 20 50 100
An Empirical Study of Word Class Labeling of Total Reduplication Lex⁃ emes in New Century Chinese-English Dictionary ( 2nd edition)
1
作者 崔康婕 《海外英语》 2020年第24期115-118,共4页
the widely discussed study of word class categorization has a long history of more than 2000 years,which is known as the study of the“God Particles”in language.As a typical analytic language,Modern Chinese,due to it... the widely discussed study of word class categorization has a long history of more than 2000 years,which is known as the study of the“God Particles”in language.As a typical analytic language,Modern Chinese,due to its lack of morphological changes,is challenged by a thorny problem of word classes especially when it comes to the criteria for word class identification and the treat⁃ment of multiple class membership.As such,all the controversies eventually give rise to some contradiction and confusion in word class labeling in Modern Chinese and Chinese-English dictionaries.As an important grammatical means in Chinese and the focus of lexicology and rhetorics,total reduplication lexemes serve as an essential part of Chinese-English dictionaries with complex and diverse word classes.Guided by the Two-level Word Class Categorization Theory,this thesis focuses on the word class labeling of total reduplication lexemes in New Century Chinese-English Dictionary(2nd edition)backed by large-scale balanced Modern Chi⁃nese corpora.With an innovative theoretical perspective,this study not only contributes to the word class labeling of total reduplica⁃tion lexemes and even sheds light on the compilation of Chinese-English dictionaries,but also drives the study of Modern Chinese word classes in the long term. 展开更多
关键词 New Century Chinese-English Dictionary(2nd edition) total reduplication lexeme word class labeling Two-level word Class Categorization Theory an empirical study
下载PDF
融合词语语义与标签依赖的隐式篇章关系识别
2
作者 吕国英 郭校金 贾荣荣 《软件导刊》 2024年第4期1-7,共7页
中文隐式篇章关系识别旨在推断出两个论元间的篇章关系类型。然而,现有的方法往往忽略了论元中词语所蕴含的关键信息,并且仅考虑单个层级内的篇章关系类型,忽略了各层级间篇章关系的依赖关联。鉴于此,提出融合词语语义和标签依赖的方法... 中文隐式篇章关系识别旨在推断出两个论元间的篇章关系类型。然而,现有的方法往往忽略了论元中词语所蕴含的关键信息,并且仅考虑单个层级内的篇章关系类型,忽略了各层级间篇章关系的依赖关联。鉴于此,提出融合词语语义和标签依赖的方法,以序列生成的方式实现篇章关系识别,先根据相似度权重将词向量嵌入到字编码表示中,应用字词对齐注意力机制强调关键字、词信息,再采用标签注意力编码从蕴含词语语义的论元表示和篇章关系表示中获取篇章关系依赖性的上下文表示,以自下而上的方式预测顶层的篇章关系类型。此外,构建面向阅读理解篇章的篇章关系数据集,并在该数据集上展开实验,结果显示隐式篇章关系识别准确率和F1值分别达到74.19%和73.81%,最终验证了该方法的有效性。 展开更多
关键词 隐式篇章关系 词语语义 标签依赖 序列生成
下载PDF
基于深度学习的中文短文本多标签分类模型
3
作者 曹珍 郭攀峰 《计算机与数字工程》 2024年第6期1809-1814,共6页
目前,中文短文本因其长度短、结构多样和缺乏上下文等特点,常规多标签分类算法无法对其有效区分。针对以上问题,论文提出一种基于深度学习的中文短文本多标签分类模型CRC-MHA。CRC-MHA模型在文本表示层摒弃常规使用Word2vec进行静态词... 目前,中文短文本因其长度短、结构多样和缺乏上下文等特点,常规多标签分类算法无法对其有效区分。针对以上问题,论文提出一种基于深度学习的中文短文本多标签分类模型CRC-MHA。CRC-MHA模型在文本表示层摒弃常规使用Word2vec进行静态词嵌入的方式,采用BERT对输入句子进行动态词嵌入,借助海量预训练文本的优势更好地表征文本的上下文语义,同时在特征提取层设计了一种结合CNN、RCNN和多头自注意力机制的并行特征提取策略,加强捕捉文本内部的关键特征来提升多标签分类效果。实验结果表明,CRC-MHA模型在评价指标加权平均F1值上较BERT模型提高1.95%,较BERT-CNN模型提高0.42%,较BERT-RCNN模型提高0.34%,验证了模型的有效性。 展开更多
关键词 多标签分类 中文短文本 动态词嵌入 特征提取
下载PDF
中文阅读中的情绪词类型效应不受效价的调节:来自眼动的证据
4
作者 胡同文 张阔 +1 位作者 程玉茹 王敬欣 《心理与行为研究》 北大核心 2024年第2期197-203,共7页
本研究利用眼动追踪技术,将不同类型情绪词嵌入到同一句子框架,考察中文自然阅读中的情绪词类型效应及其与效价的关系。结果发现,情绪标签词注视时间显著长于情绪负载词,且这种注视差异不受情绪效价的调节。此外,对积极词的注视显著短... 本研究利用眼动追踪技术,将不同类型情绪词嵌入到同一句子框架,考察中文自然阅读中的情绪词类型效应及其与效价的关系。结果发现,情绪标签词注视时间显著长于情绪负载词,且这种注视差异不受情绪效价的调节。此外,对积极词的注视显著短于消极词,验证了积极效价的语义加工优势,支持了密度假说。结果表明,中文阅读中同样存在情绪词类型效应,且不论情绪效价如何,情绪标签词上情绪信息作用更为显著,更吸引读者注意且难以解离,表现出注意偏向优势。 展开更多
关键词 情绪词类型效应 情绪标签词 情绪负载词 中文阅读
下载PDF
试题库基于Word标签定义试题的策略 被引量:1
5
作者 舒谷生 《湖南城市学院学报(自然科学版)》 CAS 2012年第3期72-74,共3页
介绍了试题库建设过程中试题定义技术方面所取得的研究成果.基于Word标签定义试题所建立的试题库,单个文档中可包含任意多道试题,且能轻易地被外部题库管理系统识别、分析和调用.
关键词 考试 试题库 策略 word标签
下载PDF
Excel、Word与CASS(AutoCAD)在测量绘图中的应用 被引量:9
6
作者 张广伟 《北京测绘》 2006年第2期8-12,共5页
将常用的办公软件:Excel、Word等与CASS绘图软件相结合,提供了解决绘图中常见的批量标注、插值和参数计算等问题的方法,改变了传统的纯手式输入的方式,较好的提高了数据处理的效率和准确性。
关键词 EXCEL word CASS 批量标注 数据处理
下载PDF
EndNote嵌入Word的问题解析 被引量:3
7
作者 罗健 《兰州石化职业技术学院学报》 2007年第4期38-39,共2页
美国科学信息所开发了多种参考文献目录管理软件,其中EndNote因其强大的功能受到了广大用户的青睐,但操作比较繁琐。讨论了EndNote嵌入到Word中遇到的相关问题及部分,极大简化了操作,方便了用户。
关键词 ENDNOTE word OLE 书签
下载PDF
基于语义规则增强的蒙古语情感分布学习
8
作者 杨蕾 苏依拉 +3 位作者 仁庆道尔吉 吉亚图 乌尼尔 路敏 《计算机工程与设计》 北大核心 2024年第7期2082-2089,共8页
为完善基于先验知识的标记增强方法对于情绪信息的捕捉,提出一种基于语义规则增强的蒙古语情感分布学习方法(semantic rule enhancement based Mongolian emotion distribution learning, SRE-MEDL)。在情感轮和情感词典的基础上,引入... 为完善基于先验知识的标记增强方法对于情绪信息的捕捉,提出一种基于语义规则增强的蒙古语情感分布学习方法(semantic rule enhancement based Mongolian emotion distribution learning, SRE-MEDL)。在情感轮和情感词典的基础上,引入程度词典和否定词典,得到各种情感词组合,以此制定相应的语义规则计算情感词权重,将其融入到标记增强中。在情感分布学习中融入从情感分布空间到实例特征空间的反向重构映射来弥补正向映射引起的原始信息丢失问题。对比实验结果显示,在蒙古语和中英文常用数据集上,SRE-MEDL方法在标记增强任务和情感分布学习中的表现均优于现有方法。 展开更多
关键词 标记增强 语义规则 程度词 否定词 情感轮 蒙古语 情感分布学习 反向重构
下载PDF
“突然、忽然”的词类标注问题与对策——一项语言学量子转向视域下的研究
9
作者 王正奎 刘金 《乐山师范学院学报》 2024年第6期59-68,129,共11页
汉语词类问题的争论旷日持久,为了更好解决这一纷繁复杂的问题,语言学研究亟需完成从牛顿经典科学思维到量子思维的转向。查阅10部大中型标注词类的权威汉语汉英词典发现“突然、忽然”的词类标注以及释义配例呈现显著分歧。有鉴于此,... 汉语词类问题的争论旷日持久,为了更好解决这一纷繁复杂的问题,语言学研究亟需完成从牛顿经典科学思维到量子思维的转向。查阅10部大中型标注词类的权威汉语汉英词典发现“突然、忽然”的词类标注以及释义配例呈现显著分歧。有鉴于此,基于语言学量子转向视域,以双层词类范畴化理论模型为指导,考察了“突然、忽然”在国家语委语料库的真实用法模式,根据其规约化程度提取出了“突然、忽然”在词典的真实词类表征。同时论证了汉语形容词包含副词的词类模式违背了汉语语言事实,并探讨其背后症结所在。针对这些问题,未来汉语词类研究亟需完成语言学量子转向,挣脱简约原则的束缚,积极拥抱双层词类范畴化理论模型,大胆开展语言实证研究。 展开更多
关键词 “突然、忽然” 词类标注 形副包含 语言学量子转向
下载PDF
基于Word2Vec的WordNet词语相似度计算研究 被引量:5
10
作者 陈丹华 王艳娜 +3 位作者 周子力 赵晓函 李天宇 王凯莉 《计算机工程与应用》 CSCD 北大核心 2022年第3期222-229,共8页
当前大部分WordNet词语相似度计算方法由于未充分考虑词语的语义信息和位置关系,导致相似度的准确率降低。为解决上述问题,提出了一种使用词向量模型Word2Vec计算WordNet词语相似度的新方法。在构建WordNet数据集时提出一种新形式,不再... 当前大部分WordNet词语相似度计算方法由于未充分考虑词语的语义信息和位置关系,导致相似度的准确率降低。为解决上述问题,提出了一种使用词向量模型Word2Vec计算WordNet词语相似度的新方法。在构建WordNet数据集时提出一种新形式,不再使用传统的文本语料库,同时提出信息位置排列方法对数据集加以处理。利用Word2Vec模型训练WordNet数据集后得到向量表示。在公开的R&G-65、M&C-30和MED38词语相似度测评集上完成了词语相似度计算任务,从多个角度进行了Pearson相关系数对比实验。结果显示该文计算的相似度值与人工判定值计算取得的Pearson相关系数指标得到了显著提升。 展开更多
关键词 词语相似度 wordNET word2Vec 同义词集标号
下载PDF
基于XLNet+BiGRU+Att(Label)的文本分类模型 被引量:1
11
作者 刘柏霆 管卫利 李陶深 《广西科学院学报》 2022年第4期412-419,共8页
传统的词向量嵌入模型,如Word2Vec、GloVe等模型无法实现一词多义表达;传统的文本分类模型也未能很好地利用标签词的语义信息。基于此,提出一种基于XLNet+BiGRU+Att(Label)的文本分类模型。首先用XLNet生成文本序列与标签序列的动态词... 传统的词向量嵌入模型,如Word2Vec、GloVe等模型无法实现一词多义表达;传统的文本分类模型也未能很好地利用标签词的语义信息。基于此,提出一种基于XLNet+BiGRU+Att(Label)的文本分类模型。首先用XLNet生成文本序列与标签序列的动态词向量表达;然后将文本向量输入到双向门控循环单元(BiGRU)中提取文本特征信息;最后将标签词与注意力机制结合,选出文本的倾向标签词,计算倾向标签词与文本向量的注意力得分,根据注意力得分更新文本向量。通过对比实验,本文模型比传统模型在文本分类任务中的准确率更高。使用XLNet作为词嵌入模型,在注意力计算时结合标签词能够提升模型的分类性能。 展开更多
关键词 文本分类 XLNet BiGRU 标签词 注意力机制
下载PDF
基于改进Labeled LDA模型的科技视频文本分类 被引量:3
12
作者 马建红 樊跃翔 《计算机工程》 CAS CSCD 北大核心 2018年第9期274-279,共6页
在对科技领域视频文本进行分类时,容易忽略分类贡献度较高的专业名词。为此,改进传统Labeled潜在Dirichlet分布(LDA)模型,建立用于科技领域视频文本的M ul CHI-Labeled LDA模型,避免偏向高频词的现象。通过构建领域术语库以突出专业名词... 在对科技领域视频文本进行分类时,容易忽略分类贡献度较高的专业名词。为此,改进传统Labeled潜在Dirichlet分布(LDA)模型,建立用于科技领域视频文本的M ul CHI-Labeled LDA模型,避免偏向高频词的现象。通过构建领域术语库以突出专业名词,同时使用卡方加权和文本位置加权算法提升主题词质量。实验结果表明,与Labeled LDA模型相比,该模型可以解决专业名词被忽略的问题,并能有效提高主题词质量和分类准确率。 展开更多
关键词 科技视频 文本分类 标签 卡方加权 领域术语库
下载PDF
基于Schema增强的中文实体关系抽取方法 被引量:2
13
作者 饶东宁 李冉 《软件导刊》 2023年第2期47-52,共6页
针对中文实体关系抽取任务中的实体边界切分错误和实体关系重叠,以及不同数据集的关系种类不能很好地迁移的问题,提出一种基于Schema增强的实体关系抽取方法。首先,采用字词混合嵌入的方式融合字与词的语义信息,避免中文分词时边界切分... 针对中文实体关系抽取任务中的实体边界切分错误和实体关系重叠,以及不同数据集的关系种类不能很好地迁移的问题,提出一种基于Schema增强的实体关系抽取方法。首先,采用字词混合嵌入的方式融合字与词的语义信息,避免中文分词时边界切分出错所造成的歧义问题;其次,利用指针标注的方式解决关系重叠问题;最后,提取出每个数据集的Schema进行合并作为先验特征传入模型中,以解决实体冗余及关系种类迁移问题。在三大中文实体关系抽取数据集DuIE、FinRE、SanWen上进行实验,相较于先前的模型,该方法分别取得10%、18%、11%的F1提升,且表现出更高的稳定性。 展开更多
关键词 命名实体识别 关系抽取 Schema增强 字词混合嵌入 指针标注
下载PDF
词嵌入BERT-CRF玉米育种实体关系联合抽取方法 被引量:1
14
作者 李书琴 庞文婷 《农业机械学报》 EI CAS CSCD 北大核心 2023年第11期286-294,共9页
针对玉米育种文本数据中存在重叠三元组、实体表达方式多样等问题,提出一种嵌入词汇信息的BERT-CRF(Bidirectional encoder representations from transformers-conditional random field)玉米育种实体关系联合抽取方法。首先,分析了玉... 针对玉米育种文本数据中存在重叠三元组、实体表达方式多样等问题,提出一种嵌入词汇信息的BERT-CRF(Bidirectional encoder representations from transformers-conditional random field)玉米育种实体关系联合抽取方法。首先,分析了玉米育种语料表达特征,采用对实体边界、关系类别和实体位置信息同步标注的策略;其次,构建了嵌入词汇信息的BERT-CRF模型进行训练和预测,自建玉米育种知识词典,通过在BERT中嵌入词汇信息,融合字符特征和词汇特征,增强模型的语义能力,利用CRF模型输出全局最优标签序列,设计了实体关系三元组匹配算法(Entity and relation triple matching algorithm,ERTM),将标签进行匹配和映射来获取三元组;最后,为验证该方法的有效性,在玉米育种数据集上进行实验,结果表明,本文模型精确率、召回率和F1值分别为91.84%、95.84%、93.80%,与现有模型相比性能均有提升。说明该方法能够有效抽取玉米育种领域知识,为构建玉米育种知识图谱及其它下游任务提供数据基础。 展开更多
关键词 玉米育种 实体关系联合抽取 序列标注 BERT语言模型 词嵌入
下载PDF
超学科视域下汉英词典医学词条的词类标注研究
15
作者 王仁强 尹蕊 《英语研究》 2023年第2期164-177,共14页
汉英词典医学词条的词类标注面临重重困难。本文运用双层词类范畴化理论的超学科方法论,对汉英词典中“瘫痪”“治疗”类医学词条的词类标注进行了调查。调查发现:不同汉英词典中相同词条的词类标注分歧率高达81.25%,同一部词典中部分... 汉英词典医学词条的词类标注面临重重困难。本文运用双层词类范畴化理论的超学科方法论,对汉英词典中“瘫痪”“治疗”类医学词条的词类标注进行了调查。调查发现:不同汉英词典中相同词条的词类标注分歧率高达81.25%,同一部词典中部分具有对称语义关系词条的词类标注存在矛盾,部分词条的微观结构表征违背兼类与词频的相关性原则和“词类对译”原则,部分配例与词类标注不协调。研究表明,现有汉英词典医学词条的词类标注之所以准确度不够高,是因为受到唯科学主义的束缚,而拥抱超学科方法论(量子思维)方为出路。 展开更多
关键词 汉英词典 医学词条 词类标注 双层词类范畴化理论 超学科性
下载PDF
基于知识增强的文本隐喻识别图编码方法
16
作者 黄河燕 刘啸 刘茜 《计算机研究与发展》 EI CSCD 北大核心 2023年第1期140-152,共13页
隐喻识别是自然语言处理中语义理解的重要任务之一,目标为识别某一概念在使用时是否借用了其他概念的属性和特点.由于单纯的神经网络方法受到数据集规模和标注稀疏性问题的制约,近年来,隐喻识别研究者开始探索如何利用其他任务中的知识... 隐喻识别是自然语言处理中语义理解的重要任务之一,目标为识别某一概念在使用时是否借用了其他概念的属性和特点.由于单纯的神经网络方法受到数据集规模和标注稀疏性问题的制约,近年来,隐喻识别研究者开始探索如何利用其他任务中的知识和粗粒度句法知识结合神经网络模型,获得更有效的特征向量进行文本序列编码和建模.然而,现有方法忽略了词义项知识和细粒度句法知识,造成了外部知识利用率低的问题,难以建模复杂语境.针对上述问题,提出一种基于知识增强的图编码方法(knowledge-enhanced graph encoding method,KEG)来进行文本中的隐喻识别.该方法分为3个部分:在文本编码层,利用词义项知识训练语义向量,与预训练模型产生的上下文向量结合,增强语义表示;在图网络层,利用细粒度句法知识构建信息图,进而计算细粒度上下文,结合图循环神经网络进行迭代式状态传递,获得表示词的节点向量和表示句子的全局向量,实现对复杂语境的高效建模;在解码层,按照序列标注架构,采用条件随机场对序列标签进行解码.实验结果表明,该方法的性能在4个国际公开数据集上均获得有效提升. 展开更多
关键词 隐喻识别 图循环神经网络 知识增强方法 词义项知识 细类别句法知识 序列标注
下载PDF
基于BERT和知识蒸馏的航空维修领域命名实体识别 被引量:3
17
作者 顾佼佼 翟一琛 +1 位作者 姬嗣愚 宗富强 《电子测量技术》 北大核心 2023年第3期19-24,共6页
针对军事航空维修领域命名实体识别训练数据少,标注成本高的问题,改进提出一种基于预训练BERT的命名实体识别方法,借鉴远程监督思想,对字符融合远程标签词边界特征得到特征融合向量,送入BERT生成动态字向量表示,连接CRF模型得到序列的... 针对军事航空维修领域命名实体识别训练数据少,标注成本高的问题,改进提出一种基于预训练BERT的命名实体识别方法,借鉴远程监督思想,对字符融合远程标签词边界特征得到特征融合向量,送入BERT生成动态字向量表示,连接CRF模型得到序列的全局最优结果,在自建数据集上进行实验,F1值达到0.861。为压缩模型参数,使用训练好的BERT-CRF模型生成伪标签数据,结合知识蒸馏技术指导参数量较少的学生模型BiGRU-CRF进行训练。实验结果表明,与教师模型相比,学生模型以损失2%的F1值为代价,参数量减少了95.2%,运算推理时间缩短了47%。 展开更多
关键词 航空维修文本 命名实体识别 BERT 知识蒸馏 伪标签增强 词向量增强
下载PDF
“吐槽”的词类标注与释义研究
18
作者 王琪琪 王仁强 《陇东学院学报》 2023年第3期43-47,共5页
语言学界大多研究集中探讨“吐槽”的语义演变问题。本文从双层词类范畴化理论视角出发,采用语料库的调查模式,对“吐槽”的释义情况及词类归属进行探讨。研究发现:(1)汉语词典中“吐槽”释义信息不一致、不准确、不完整;(2)“吐槽”表... 语言学界大多研究集中探讨“吐槽”的语义演变问题。本文从双层词类范畴化理论视角出发,采用语料库的调查模式,对“吐槽”的释义情况及词类归属进行探讨。研究发现:(1)汉语词典中“吐槽”释义信息不一致、不准确、不完整;(2)“吐槽”表指称的用法具有很高的个例频率和类型频率,名词用法已经规约化,在抽象的社群语言系统层面,即在现代汉语词典中,概括词“吐槽”应兼属动词和名词。调查表明,现有的汉语词典在“吐槽”的释义及其义项设置上存在问题,应修正其动词释义并将之处理为动名兼类词,动词主流义项的离析用法也应收录词典。汉语词典的编纂应基于语料库使用模式调查才能反映词条的真实用法。 展开更多
关键词 “吐槽” 双层词类范畴化理论 语料库 词类标注 释义
下载PDF
语境和情绪词类别对情绪标注的影响:情绪标注机制 被引量:1
19
作者 孙佳禾 何文广 《曲阜师范大学学报(自然科学版)》 CAS 2023年第1期106-112,共7页
研究采用2(语言:母语、二语)×3(任务:情绪负载词标注、情绪标签词标注、非情绪词标注)×2(效价:积极情绪、消极情绪)3因素被试内实验设计,探究情绪标注效应发生的内在机制.研究发现,二语情绪负载词标注可以显著上调正性图片的... 研究采用2(语言:母语、二语)×3(任务:情绪负载词标注、情绪标签词标注、非情绪词标注)×2(效价:积极情绪、消极情绪)3因素被试内实验设计,探究情绪标注效应发生的内在机制.研究发现,二语情绪负载词标注可以显著上调正性图片的积极情绪体验,母语情绪负载词标注在负性图片中产生了情绪标注阻断效应,两种语言类型下情绪标注效应有着相似的发生机制,都主要通过内隐享乐理论实现情绪的调节,其间还受到自我反思和减少不确定性机制的调节. 展开更多
关键词 情绪标注 双语 内隐享乐机制 情绪负载词
下载PDF
用于目标级情感分析的全局指针模型
20
作者 董慧洁 杨林楠 +1 位作者 陈健 费凡 《计算机工程与设计》 北大核心 2023年第12期3754-3760,共7页
针对现有研究中目标级情感分析中文数据集短缺的问题,构建一个目标级情感分析中文评论数据集,提出一种基于依赖关系注意力的全局指针模型DA-GP(dependency-based attention-global pointer)。以具有丰富语义的字词结合特征作为嵌入特征... 针对现有研究中目标级情感分析中文数据集短缺的问题,构建一个目标级情感分析中文评论数据集,提出一种基于依赖关系注意力的全局指针模型DA-GP(dependency-based attention-global pointer)。以具有丰富语义的字词结合特征作为嵌入特征,使用全局指针整体解决多目标抽取及分类,通过依赖关系注意力网络进一步增强模型的目标识别能力,使模型具有良好的泛化能力。在中文评论数据集上进行对比实验及自身消融实验,实验结果表明,DA-GP模型优于其它模型且可行有效。 展开更多
关键词 目标抽取 情感分析 全局指针 依赖关系注意力 字词嵌入 深度学习 标注方式
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部