期刊文献+
共找到81,811篇文章
< 1 2 250 >
每页显示 20 50 100
自然语言处理领域中的词嵌入方法综述 被引量:2
1
作者 曾骏 王子威 +2 位作者 于扬 文俊浩 高旻 《计算机科学与探索》 CSCD 北大核心 2024年第1期24-43,共20页
词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的... 词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的综述文献大多只关注于不同词嵌入方法本身的技术路线,而未能将词嵌入的前置分词方法以及词嵌入方法完整的演变趋势进行分析与概述。以word2vec模型和Transformer模型作为划分点,从生成的词向量是否能够动态地改变其内隐的语义信息来适配输入句子的整体语义这一角度,将词嵌入方法划分为静态词嵌入方法和动态词嵌入方法,并对此展开讨论。同时,针对词嵌入中的分词方法,包括整词切分和子词切分,进行了对比和分析;针对训练词向量所使用的语言模型,从概率语言模型到神经概率语言模型再到如今的深度上下文语言模型的演化,进行了详细列举和阐述;针对预训练语言模型时使用的训练策略进行了总结和探讨。最后,总结词向量质量的评估方法,分析词嵌入方法的当前现状并对其未来发展方向进行展望。 展开更多
关键词 向量 嵌入方法 自然语言处理 语言模型 向量评估
下载PDF
叠音词都是单纯词吗?——兼谈单纯词与合成词的区别
2
作者 叶春东 《教育科学论坛》 1995年第1期28-28,共1页
“叠音词都是单纯词”。这个判断对吗?我认为这是值得商榷的。张志公先生主编的中央广播电视大学教材《现代汉语》中指出:“‘联绵字’就是双音节语素,在这种语素里,每个音节都不表示意义,必得两个音节连在一起才表示一个意义,成为一个... “叠音词都是单纯词”。这个判断对吗?我认为这是值得商榷的。张志公先生主编的中央广播电视大学教材《现代汉语》中指出:“‘联绵字’就是双音节语素,在这种语素里,每个音节都不表示意义,必得两个音节连在一起才表示一个意义,成为一个语素,在书面上,表示每个音节的字自然也无意义,必得两个字连在一起才表示一个意义。”“ 展开更多
关键词 叠音 单纯 合成 现代汉语 联绵字 双音节 语素 张志公 无意义 判断
下载PDF
双声、叠韵词都是单纯词吗?
3
作者 哈东霞 《语文知识》 1996年第10期35-36,共2页
“联绵词都是单纯词”。(人教版卫电教育小学教师培训教材《语文基础知识》第二册第7页)这是现代汉语学习过程中遇到的一个重要的知识点。其中,联绵词的概念和双声、叠韵词关系密切。联绵词:两个音节连缀成义而不能拆开来讲的词叫联绵词... “联绵词都是单纯词”。(人教版卫电教育小学教师培训教材《语文基础知识》第二册第7页)这是现代汉语学习过程中遇到的一个重要的知识点。其中,联绵词的概念和双声、叠韵词关系密切。联绵词:两个音节连缀成义而不能拆开来讲的词叫联绵词。(黄伯荣、廖序东主编的《现代汉语》上册第223页)它有双声。 展开更多
关键词 联绵 单纯 叠韵 现代汉语 语文基础知识 小学教师 音节 并列式合成 能力 学习过程
下载PDF
词间空格对汉语母语者和二语者拼音文本阅读的影响——基于眼动的证据 被引量:1
4
作者 江新 张嫚 龚伶俐 《华文教学与研究》 2024年第1期45-55,共11页
本研究采用眼动跟踪技术考察词间空格对汉语母语者和第二语言学习者汉语拼音文本阅读的影响。实验以中国大学生和在中国学习汉语的外国学生为被试,收集他们阅读三种不同空格条件(词间空格、字间空格和无空格)的汉语拼音句子的眼动数据... 本研究采用眼动跟踪技术考察词间空格对汉语母语者和第二语言学习者汉语拼音文本阅读的影响。实验以中国大学生和在中国学习汉语的外国学生为被试,收集他们阅读三种不同空格条件(词间空格、字间空格和无空格)的汉语拼音句子的眼动数据。研究结果显示,与无空格条件相比,词间空格和字间空格条件的注视时间短,注视次数少,首次注视位置距离词中心近;母语者在词间空格和字间空格条件下阅读效率无显著差异,但二语学习者阅读词间空格文本的阅读效率大于字间空格文本;词间空格对于印欧语母语者的促进作用显著大于泰语母语者。这些结果表明,词间空格对汉语二语者有促进作用,词间空格的促进作用受母语文字背景的影响。 展开更多
关键词 汉语拼音 阅读 间空格 字间空格 眼动
下载PDF
译介学视域下中医典籍中文化负载词的英译策略研究
5
作者 潘海鸥 周方圆 +3 位作者 崔鸿嵘 王睿 乔文军 杨宇峰 《中华中医药学刊》 CAS 北大核心 2024年第7期44-47,共4页
由于中医典籍成书年代久远,其在翻译过程中往往存在着大量的文化对应空缺词汇,因此,中医典籍中的文化负载词翻译成了一个重要的环节,也是一个难点。为了使中医文化更好、更广泛、更有效地传播,译者必须针对现实情况采取相应的对策。基... 由于中医典籍成书年代久远,其在翻译过程中往往存在着大量的文化对应空缺词汇,因此,中医典籍中的文化负载词翻译成了一个重要的环节,也是一个难点。为了使中医文化更好、更广泛、更有效地传播,译者必须针对现实情况采取相应的对策。基于译介学理论,从文化负载词的定义出发,立足文化视角,通过对《黄帝内经》《伤寒杂病论》和《金匮要略》等中医典籍中的文化负载词的识别和解读,提出了中医文化负载词在翻译过程中需要熟练运用语言维转换、文化维转换、交际维转换等转换方法,总结了中医典籍文化负载词可以使用直译、音译/音译和注释相结合、省译或意译的方法。目的是通过中医典籍文化负载词的界定和提出的翻译策略的同时,有助于为中医文化负载词英译研究提供新的翻译视角、拓宽研究思维,旨在为解读文化差异、探寻更加合理有效的文化交流路径和方法提供新的启发和切入点,对推动中医文化负载词英译研究及中医药文化对外传播进程的加快提供有价值的参考。 展开更多
关键词 中医典籍 黄帝内经 伤寒论 文化负载 译介学
下载PDF
基于上下文词预测和窗口压缩编码的数字水印方法
6
作者 向凌云 黄明豪 +1 位作者 张晨凌 杨春芳 《通信学报》 EI CSCD 北大核心 2024年第2期213-224,共12页
针对已有自然语言数字水印方法可替换词数量有限以及水印提取效率低的问题,提出了一种基于上下文词预测和窗口压缩编码的数字水印方法。该方法通过神经网络语言模型自动学习原始文本中每个词的上下文语义特征,预测每个词的候选词列表,... 针对已有自然语言数字水印方法可替换词数量有限以及水印提取效率低的问题,提出了一种基于上下文词预测和窗口压缩编码的数字水印方法。该方法通过神经网络语言模型自动学习原始文本中每个词的上下文语义特征,预测每个词的候选词列表,从而扩充可用于嵌入水印信息的可替换词数量。同时,考虑到不同位置的候选词的替换对句子语义的影响存在差异,该方法以由多个词组成的窗口为单位来嵌入水印信息,并通过词替换前后句子间的相似度来优化水印嵌入时候选词的选择。在此基础上,提出了一种语义无关的窗口压缩编码方法,其根据窗口中词的字符信息对窗口进行水印编码,解决了提取水印信息时对词替换位置的原始上下文的依赖。实验结果表明,所提方法在具有较高嵌入容量和文本质量的前提下,大大提高了水印的提取效率。 展开更多
关键词 数字水印 替换 预测 水印编码
下载PDF
阅读伴随词汇学习的词切分:首、尾词素位置概率的不同作用
7
作者 梁菲菲 冯琳琳 +2 位作者 刘瑛 李馨 白学军 《心理学报》 CSCD 北大核心 2024年第3期281-294,共14页
本研究通过两个平行实验,探讨重复学习新词时首、尾词素位置概率信息作用于词切分的变化模式。采用阅读伴随词汇学习范式,将双字假词作为新词,实验1操纵首词素位置概率高低,保证尾词素相同;实验2操纵尾词素位置概率高低,保证首词素相同... 本研究通过两个平行实验,探讨重复学习新词时首、尾词素位置概率信息作用于词切分的变化模式。采用阅读伴随词汇学习范式,将双字假词作为新词,实验1操纵首词素位置概率高低,保证尾词素相同;实验2操纵尾词素位置概率高低,保证首词素相同。采用眼动仪记录大学生阅读时的眼动轨迹。结果显示:(1)首、尾词素位置概率信息的词切分作用随新词在阅读中学习次数的增加而逐步变小,表现出“熟悉性效应”。(2)首词素位置概率信息的“熟悉性效应”表现在回视路径时间、总注视次数两个相对晚期的眼动指标,而尾词素位置概率信息的“熟悉性效应”则从凝视时间开始,到回视路径时间,再持续到总注视时间。结果表明首、尾词素的位置概率信息均作用于阅读伴随词汇学习的词切分,但首词素的作用时程更长,更稳定,支持了首词素在双字词加工中具有优势的观点。 展开更多
关键词 素位置概率 切分 阅读伴随汇学习 中文阅读
下载PDF
基于词向量扩展的语义信息检索研究综述及应用展望 被引量:1
8
作者 杨曦宇 《林业科技情报》 2024年第1期212-215,共4页
运用词向量技术,对检索关键词进行语义相似度计算和查询扩展,得到查询扩展词集,实现更好的检索效果,提高数字学术文献信息检索的查准率和查全率,并提出基于词向量扩展的数字学术文献语义信息检索框架。
关键词 向量扩展 语义计算 信息检索 数字学术
下载PDF
基于多头注意力机制字词联合的中文命名实体识别
9
作者 王进 王猛旗 +2 位作者 张昕跃 孙开伟 朴昌浩 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第1期77-84,共8页
针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低... 针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低冗余词汇干扰.建立了多头注意力字词联合模型,包含字词匹配、多头注意力、融合等模块.与现有中文命名实体识别方法相比,本算法避免了设计复杂的序列模型,方便与现有基于字的中文命名实体识别模型结合.采用召回率、精确率以及F 1值作为评价指标,通过消融试验验证模型各个部分的效果.结果表明,本算法在MSRA和Weibo数据集上F 1值分别提升0.28、0.69,在Resume数据集上精确率提升0.07. 展开更多
关键词 中文命名实体识别 汇冗余 汇边界信息 联合 多头注意力机制 BIE
下载PDF
“中国古代文学”教学中的旧体诗词创作能力培养 被引量:1
10
作者 张英 《黑龙江教育(理论与实践)》 2024年第3期82-85,共4页
在“中国古代文学”课程教学中加强旧体诗词创作能力的培养,不仅有助于提升学生的审美能力和研究能力,还有助于增强学生未来从事中小学语文教学工作的能力。因此,“中国古代文学”授课教师应在积极创作旧体诗词以起表率作用的基础上,在... 在“中国古代文学”课程教学中加强旧体诗词创作能力的培养,不仅有助于提升学生的审美能力和研究能力,还有助于增强学生未来从事中小学语文教学工作的能力。因此,“中国古代文学”授课教师应在积极创作旧体诗词以起表率作用的基础上,在课程讲授过程中强化作品讲读,激发学生的写作兴趣,并适当加以考核;同时,还应提倡使用新韵以降低写作门槛,明确规定记诵任务以打好写作基础。 展开更多
关键词 “中国古代文学”课程 旧体诗 创作 能力培养
下载PDF
基于词-主题-文本异质网络的短文本分类方法
11
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 -主题-文本异质网络 共现 文本-主题分布 短文本分类
下载PDF
基于组合相似度动态聚类和词熵的网络话题在线检测
12
作者 郭慧 王亚楠 +2 位作者 王欣艳 魏艺泽 王养廷 《情报杂志》 北大核心 2024年第5期159-166,共8页
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题... [研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题的实体相似度,再取文本词向量与话题中心余弦相似度的最大值作为词向量相似度,二者结合判断文本所属话题。在聚类过程中利用时间窗口策略实现话题中心和成员文本的动态更新。同时,计算文本词熵,生成话题的词熵和列表,实现话题主题词提取和演化跟踪。实验以新冠疫情新闻为数据实现话题在线检测,并展示了话题主题词的演化和跟踪过程。[研究结论]实验表明,与传统相似度计算方法相比,组合相似度能够获得更好的聚类效果,聚类过程中提取出的话题主题词也正确地反映了原始数据的热点话题内容。 展开更多
关键词 网络话题 在线话题检测 增量式聚类 主题提取 组合相似度 动态聚类算法
下载PDF
广州话禁止词“咪”为“唔使”合音证
13
作者 王毅力 《语言科学》 北大核心 2024年第2期209-216,共8页
“咪”是广州话中常见的表禁止或劝阻的否定副词。根据方言调查语料和方言历史文献,从音义两方面证明广州话禁止词“咪”确实是来自否定结构“唔使”的合音。合音形式“咪”原本和否定结构“唔使”里的“使”一样读阴上调,今读阳上调是... “咪”是广州话中常见的表禁止或劝阻的否定副词。根据方言调查语料和方言历史文献,从音义两方面证明广州话禁止词“咪”确实是来自否定结构“唔使”的合音。合音形式“咪”原本和否定结构“唔使”里的“使”一样读阴上调,今读阳上调是根据合音形式的声母为次浊而作出的声调调整;历史上的“唔使”兼有必要性否定和禁止性否定两种用法,“唔使”合音为“咪”是在禁止祈使句中实现的,合音词“咪”继承的是“唔使”的禁止性否定用法。 展开更多
关键词 禁止 “咪” “唔使” 合音 音义演变
下载PDF
“特精评品”:况周颐词学的品藻特色
14
作者 杨柏岭 《学术界》 北大核心 2024年第4期125-134,共10页
品藻作为中国文艺批评及创作的特殊方式,在词学中有着鲜明的体现。“特精评品”的况周颐便擅长此道。其词论无论用语、思路、趣味还是内容,均浸染着鲜明的人物品藻特点。其咏物词仍坚守托物言志、借物抒怀的传统,然物之品性并使之人性... 品藻作为中国文艺批评及创作的特殊方式,在词学中有着鲜明的体现。“特精评品”的况周颐便擅长此道。其词论无论用语、思路、趣味还是内容,均浸染着鲜明的人物品藻特点。其咏物词仍坚守托物言志、借物抒怀的传统,然物之品性并使之人性化、伦理化,始终是他品题自然风物的焦点。在关涉自己人生经历及精神生活的词作中,亦不忘对自我性格、操行的品评。通过人物品藻、自然风物品题及性格自我品评,可进一步探知况周颐的词学特点及审美观念。 展开更多
关键词 况周颐 品藻 人物 风物 性格
下载PDF
系统功能语言学视角下中国西南地区文化负载词英译策略研究——以翻译《湘漓文化》为例 被引量:1
15
作者 莫如愚 吉小宇 《文化创新比较研究》 2024年第4期36-40,共5页
在习近平新时代中国特色社会主义思想的指导下,我国越来越注重提高文化软实力。湘漓文化作为中华文化的一部分,其相关资料的外宣翻译质量对我们是否能讲好中国故事有重要影响。湘漓文化史料中的文化负载词众多,如何贴切地将它们翻译出... 在习近平新时代中国特色社会主义思想的指导下,我国越来越注重提高文化软实力。湘漓文化作为中华文化的一部分,其相关资料的外宣翻译质量对我们是否能讲好中国故事有重要影响。湘漓文化史料中的文化负载词众多,如何贴切地将它们翻译出来是译者必须思考的问题。该文从系统功能语言学中的人际元视角出发,结合具体案例讨论文化负载词的翻译策略,灵活运用直译法、意译法和音译加注法,力求寻求最佳的翻译方法。该研究旨在提升湘漓文化相关文本的翻译质量,为文化负载词的翻译提供参考,并通过此次研究,增进世界各国对中国文化的了解,促进中国文化走向世界。 展开更多
关键词 功能语言学 人际元 湘漓文化 文化负载 翻译研究 文化外宣
下载PDF
基于词嵌入的科研主题排序研究
16
作者 何东彬 陶莎 +1 位作者 任延昭 朱艳红 《北方工业大学学报》 2024年第1期136-149,共14页
为准确把握科研领域内文献主题的发展变化,常利用隐式语义特征提取科研主题分布。但由于主题挖掘技术本身的限制,并非所有主题都具有同等重要性或意义。有些主题可能包含太多背景词,信息空泛,或者主题词之间缺乏连贯性,导致主题缺乏实... 为准确把握科研领域内文献主题的发展变化,常利用隐式语义特征提取科研主题分布。但由于主题挖掘技术本身的限制,并非所有主题都具有同等重要性或意义。有些主题可能包含太多背景词,信息空泛,或者主题词之间缺乏连贯性,导致主题缺乏实际意义。针对上述问题,在已有研究基础上,基于词嵌入,提出一种新的多维度评估主题质量算法;针对科研文档的特点,利用语料库的统计特征对无意义主题距离评估方法进行优化,并最终将二者融合到一个统一的主题排序框架中。实验结果表明,本文提出的方法可以有效提高主题排序整体效果,能够识别出非重要和质量差的主题,主题排序的整体效果优于现有方法。 展开更多
关键词 主题模型 潜在狄利克雷分配(LDA) 主题排序 科研主题 嵌入
下载PDF
《草堂诗余》在明代的改编重刊与词学阐释
17
作者 陈水云 《苏州大学学报(哲学社会科学版)》 北大核心 2024年第1期136-146,共11页
明代中后期有一股改编重刊《草堂诗余》的浓厚风气,其目的主要是为了适应它从歌词作品集向文学作品集的转变,还藉此形塑了一个分类、储存、加工古今词作的知识空间。围绕《草堂诗余》的改编重刊,明代中后期形成了采用不同策略(或分类,... 明代中后期有一股改编重刊《草堂诗余》的浓厚风气,其目的主要是为了适应它从歌词作品集向文学作品集的转变,还藉此形塑了一个分类、储存、加工古今词作的知识空间。围绕《草堂诗余》的改编重刊,明代中后期形成了采用不同策略(或分类,或分调)的词学阐释群体,他们通过选词、考调、校勘、笺注、评点等方式,构筑了一个个不同的集词选、词谱、词评于一体的唐宋词阐释系统,对文本施加或预设其特有的阐释意图,或溯源诗乐传统以尊体,或揭示言情特质以别体。《草堂诗余》在明代的改编重刊不但为唐宋词在明代的传播作了突出贡献,而且也为词学知识体系的建构打下了一定基础。 展开更多
关键词 明代 草堂诗余 阐释群体 知识体系
下载PDF
“异化”和“归化”视角下中国文化负载词英译策略研究——以大学英语四、六级翻译文本为例
18
作者 江慧 唐尔龙 +1 位作者 钱秀娟 李婷芳 《英语广场(学术研究)》 2024年第8期32-35,共4页
中国文化负载词是国家文化的语言表现形式,准确翻译中国文化负载词对于正确表达中国观点、提升国家形象具有重大意义。本文运用“异化”和“归化”翻译策略,以全国大学英语四、六级试题翻译文本为研究对象,探索中国文化负载词的翻译策略... 中国文化负载词是国家文化的语言表现形式,准确翻译中国文化负载词对于正确表达中国观点、提升国家形象具有重大意义。本文运用“异化”和“归化”翻译策略,以全国大学英语四、六级试题翻译文本为研究对象,探索中国文化负载词的翻译策略,以期在提升大学生跨文化交际翻译能力的同时增强大学生的文化自信和民族自豪感。 展开更多
关键词 异化 归化 中国文化负载 翻译策略
下载PDF
以文为诗,以诗为词,以古为律:清代诗话的破体观念论析
19
作者 任竞泽 李增 《厦门大学学报(哲学社会科学版)》 北大核心 2024年第1期158-172,共15页
清代诗话是清代文体史料及文体批评的渊薮,其中破体观念在清诗话文体理论中又最为突出和独具特色。目前学界整理的煌煌16册174种清诗话中论及以文为诗、以诗为词、以古为律及其对立范畴以诗为文、以词为诗、以律为古等破体批评的诗话就... 清代诗话是清代文体史料及文体批评的渊薮,其中破体观念在清诗话文体理论中又最为突出和独具特色。目前学界整理的煌煌16册174种清诗话中论及以文为诗、以诗为词、以古为律及其对立范畴以诗为文、以词为诗、以律为古等破体批评的诗话就多达63部,贯穿整个清代诗话史和诗学史。清代诗学史上具有重要学术地位的学者诸如王夫之、叶燮、王士祯、沈德潜、赵翼、翁方纲、潘德舆等,在对相关破体范畴进行文体批评时,往往褒贬倾向不一,或肯定,或否定,或辩证看待,引发了旷日持久的学术争鸣,并在演进递嬗中形成了系统的破体观念体系,堪称中国古代破体理论的集大成和总结者。这对于纵向观照和比较研究宋元明诗话破体观念具有重要的文体批评史学术价值和理论意义。 展开更多
关键词 清代诗话 以文为诗 以诗为 以古为律 破体观念
下载PDF
教育出版融合发展的模式、瓶颈与路径——基于上海外语教育出版社“词达人”平台
20
作者 方颖芝 《出版广角》 北大核心 2024年第7期59-63,共5页
以外教社“词达人”平台为例,结合其创作团队、研发经历、编辑过程和营销推广,从教育出版业的实践出发,分析教育出版融合发展的时代意义、政策导向、常见模式、发展瓶颈与路径等,提出教育出版机构应从发挥资源优势、提供融合服务、坚持... 以外教社“词达人”平台为例,结合其创作团队、研发经历、编辑过程和营销推广,从教育出版业的实践出发,分析教育出版融合发展的时代意义、政策导向、常见模式、发展瓶颈与路径等,提出教育出版机构应从发挥资源优势、提供融合服务、坚持需求出发、培育融合人才等方面推进融合发展。 展开更多
关键词 达人” 教育出版 融合发展
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部