期刊文献+
共找到727篇文章
< 1 2 37 >
每页显示 20 50 100
Analgsis of Chinese Character and English Words
1
作者 孙嘉瑜 《课程教育研究(学法教法研究)》 2015年第3期3-3,共1页
下载PDF
Chinese word segmentation with local and global context representation learning 被引量:2
2
作者 李岩 Zhang Yinghua +2 位作者 Huang Xiaoping Yin Xucheng Hao Hongwei 《High Technology Letters》 EI CAS 2015年第1期71-77,共7页
A local and global context representation learning model for Chinese characters is designed and a Chinese word segmentation method based on character representations is proposed in this paper. First, the proposed Chin... A local and global context representation learning model for Chinese characters is designed and a Chinese word segmentation method based on character representations is proposed in this paper. First, the proposed Chinese character learning model uses the semanties of loeal context and global context to learn the representation of Chinese characters. Then, Chinese word segmentation model is built by a neural network, while the segmentation model is trained with the eharaeter representations as its input features. Finally, experimental results show that Chinese charaeter representations can effectively learn the semantic information. Characters with similar semantics cluster together in the visualize space. Moreover, the proposed Chinese word segmentation model also achieves a pretty good improvement on precision, recall and f-measure. 展开更多
关键词 local and global context representation learning chinese character representa- tion chinese word segmentation
下载PDF
阅读伴随词汇学习的词切分:首、尾词素位置概率的不同作用 被引量:1
3
作者 梁菲菲 冯琳琳 +2 位作者 刘瑛 李馨 白学军 《心理学报》 CSSCI CSCD 北大核心 2024年第3期281-294,共14页
本研究通过两个平行实验,探讨重复学习新词时首、尾词素位置概率信息作用于词切分的变化模式。采用阅读伴随词汇学习范式,将双字假词作为新词,实验1操纵首词素位置概率高低,保证尾词素相同;实验2操纵尾词素位置概率高低,保证首词素相同... 本研究通过两个平行实验,探讨重复学习新词时首、尾词素位置概率信息作用于词切分的变化模式。采用阅读伴随词汇学习范式,将双字假词作为新词,实验1操纵首词素位置概率高低,保证尾词素相同;实验2操纵尾词素位置概率高低,保证首词素相同。采用眼动仪记录大学生阅读时的眼动轨迹。结果显示:(1)首、尾词素位置概率信息的词切分作用随新词在阅读中学习次数的增加而逐步变小,表现出“熟悉性效应”。(2)首词素位置概率信息的“熟悉性效应”表现在回视路径时间、总注视次数两个相对晚期的眼动指标,而尾词素位置概率信息的“熟悉性效应”则从凝视时间开始,到回视路径时间,再持续到总注视时间。结果表明首、尾词素的位置概率信息均作用于阅读伴随词汇学习的词切分,但首词素的作用时程更长,更稳定,支持了首词素在双字词加工中具有优势的观点。 展开更多
关键词 词素位置概率 词切分 阅读伴随词汇学习 中文阅读
下载PDF
基于多头注意力机制字词联合的中文命名实体识别
4
作者 王进 王猛旗 +2 位作者 张昕跃 孙开伟 朴昌浩 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第1期77-84,共8页
针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低... 针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低冗余词汇干扰.建立了多头注意力字词联合模型,包含字词匹配、多头注意力、融合等模块.与现有中文命名实体识别方法相比,本算法避免了设计复杂的序列模型,方便与现有基于字的中文命名实体识别模型结合.采用召回率、精确率以及F 1值作为评价指标,通过消融试验验证模型各个部分的效果.结果表明,本算法在MSRA和Weibo数据集上F 1值分别提升0.28、0.69,在Resume数据集上精确率提升0.07. 展开更多
关键词 中文命名实体识别 词汇冗余 词汇边界信息 字词联合 多头注意力机制 BIE词集
下载PDF
基于深度字词融合的小麦种质信息实体关系联合抽取
5
作者 刘合兵 贾笑笑 +3 位作者 时雷 熊蜀峰 马新明 席磊 《计算机工程与设计》 北大核心 2024年第4期1079-1086,共8页
为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based ... 为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based on deep character and word fusion)。模型编码层通过深度字词融合和上下文语义特征融合,提高密集实体特征识别能力;模型三元组抽取层建立层叠指针网络,提高重叠关系的提取能力。在小麦种质数据集和公开数据集上的一系列对比实验结果表明,WGIE-DCWF模型能够有效提高小麦种质数据实体关系联合抽取效果,同时拥有较好的泛化性,可以为小麦种质信息知识库构建提供技术支撑。 展开更多
关键词 小麦种质信息 字词融合 实体关系抽取 联合抽取 层叠指针网络 实体识别 关系抽取
下载PDF
汉字词进入朝鲜语的适应性
6
作者 金海月 《云南师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2024年第3期36-44,共9页
朝鲜语在与汉语的长期接触中吸收了大量借词,形成了今日的汉字词。朝鲜语中,汉字词的使用十分常见,尤其是在一些专业领域。汉字词在朝鲜语中的适应性很强。汉字词之所以能够适应朝鲜语语言环境实现本语化,与其生存发展的生态环境及自身... 朝鲜语在与汉语的长期接触中吸收了大量借词,形成了今日的汉字词。朝鲜语中,汉字词的使用十分常见,尤其是在一些专业领域。汉字词在朝鲜语中的适应性很强。汉字词之所以能够适应朝鲜语语言环境实现本语化,与其生存发展的生态环境及自身特性有密切关联。在朝鲜语的发展过程中,汉字词的使用有两次大爆发,第一次是约7~15世纪统一新罗时期至朝鲜王朝前期,第二次是1876~1910年开化时期,这两个时期为汉字词的快速发展提供了良好的生存土壤。汉字词的特性有四:一是表达精细、容易理解;二是构词能力强、能产性高;三是竞争力强;四是影响力大,甚至可以影响到语法体系。 展开更多
关键词 朝鲜语 汉字词 适应性 语言接触 生态环境
下载PDF
“膊”字历时记词功能研究
7
作者 张航 《湖北师范大学学报(哲学社会科学版)》 2024年第6期15-21,共7页
文章考察了“膊”字的历时记词情况,归纳为以下八种:第一,记{膊},音pò,义为“曝肉”“干肉”“晒”“陈尸示众”“打开、剖开”“泛指杀”;第二,记{伯},音bó,义为“兄”;第三,记录单纯词{膊膊},音bó,用同{旁薄};第四,作... 文章考察了“膊”字的历时记词情况,归纳为以下八种:第一,记{膊},音pò,义为“曝肉”“干肉”“晒”“陈尸示众”“打开、剖开”“泛指杀”;第二,记{伯},音bó,义为“兄”;第三,记录单纯词{膊膊},音bó,用同{旁薄};第四,作为“膞”字讹写记录{膞}{腨}等词;第五,记{髆},音bó,义为“肩膀”“上臂”“胳膊”;第六,记录{膊膊}{腷膊}{腷腷膊膊}等拟声词,音bó;第七,记{脖},音bó,义为“脖子”;第八,记{拨},音bō,义为“调转”。“膊”字历时记词情况考察的结果对于释读文献、完善辞书具有重要价值,文章对《汉语大字典》《汉语大词典》提出修订建议。 展开更多
关键词 历时演变 记词功能 一字多词 字词关系 辞书指瑕
下载PDF
《说文解字》的“字用”思想发微
8
作者 李运富 《井冈山大学学报(社会科学版)》 2024年第4期72-81,共10页
《说文解字》(简称《说文》)通常被看作“形”书,其说解汉字的方法及对汉字的具体解析得到学史肯定。本文认为,《说文》还有重要的字用学价值,其“字用”思想可以从《说文·叙》和《说文》正文对字的解释两个方面考察。在《说文... 《说文解字》(简称《说文》)通常被看作“形”书,其说解汉字的方法及对汉字的具体解析得到学史肯定。本文认为,《说文》还有重要的字用学价值,其“字用”思想可以从《说文·叙》和《说文》正文对字的解释两个方面考察。在《说文·叙》中,许慎揭示了“假借”之“依声托事”的用字实质;用“古文”泛指古代文字,表面上是字体概念,实际上指的是古文字的结构和古文献中的用字;许慎对文字的定义和文字功能的表述体现了职用实质;许慎对时人谬解文字的批评,对《说文》编撰目的和编撰原则的说明也都是从文字使用角度表述的。《说文》正文对每个字的解说首重意义,形体分析只是对意义的印证;《说文》解说中常用“古文以为某”来揭示古代不同于汉代的用字现象;《说文》的“重文”如“古文作某”“某古文”等也是就字的功能而言;“一曰”的说解则反映了同字异用现象;《说文》还常引用书例来证明字义。这些都说明《说文》从服务解读经书的目的出发,非常重视汉字的使用功能,多方面揭示了汉语字词的各种关系。 展开更多
关键词 《说文解字》 汉字职用 字词关系 字用思想
下载PDF
同译同形性对韩国留学生汉语三字组合加工的影响
9
作者 赵果 黄晶恩 张恩璐 《国际汉语教学研究》 2024年第1期62-69,共8页
同译性,即词语搭配在母语和目的语中的翻译具有一致性,对二语词汇加工的影响已经在多种不同语言的习得中得到验证。但是,当母语和目的语同属汉字文化圈时,在翻译同译性的基础上词语之间还存在是否同形的差异。本文通过词汇判断实验,考... 同译性,即词语搭配在母语和目的语中的翻译具有一致性,对二语词汇加工的影响已经在多种不同语言的习得中得到验证。但是,当母语和目的语同属汉字文化圈时,在翻译同译性的基础上词语之间还存在是否同形的差异。本文通过词汇判断实验,考察在具备同译性条件下,同形性对韩国留学生汉语三字组合加工的影响。结果显示,同译同形性对三字组合加工有影响,具体表现为同译同形组的反应时比同译不同形组更短,二者差异达到显著水平。本研究支持双语词汇通达的非选择性激活。 展开更多
关键词 翻译一致性 韩国语汉字词 三字组合 非选择性激活
下载PDF
混合特征及多头注意力的中文短文本分类
10
作者 江结林 朱永伟 +2 位作者 许小龙 崔燕 赵英男 《计算机工程与应用》 CSCD 北大核心 2024年第9期237-243,共7页
传统的短文本分类研究方法存在两方面不足,一是不能全面地表示文本的语义信息,二是无法充分地提取和融合文本全局和局部信息。基于此,提出一种混合特征及多头注意力(HF-MHA)的中文短文本分类方法。该方法利用预训练模型计算中文短文本... 传统的短文本分类研究方法存在两方面不足,一是不能全面地表示文本的语义信息,二是无法充分地提取和融合文本全局和局部信息。基于此,提出一种混合特征及多头注意力(HF-MHA)的中文短文本分类方法。该方法利用预训练模型计算中文短文本的字符级向量和词级向量表示,以得到更全面的文本特征向量表示;采用多头注意力机制捕捉文本序列中的依赖关系,以提高文本的语义理解;通过卷积神经网络分别提取两种向量表示的特征,并将其融合为一个特征向量,以整合文本的全局和局部信息;通过输出层得到分类结果。在三个公开数据集上的实验表明,HF-MHA能够有效地提升中文短文本分类的性能。 展开更多
关键词 中文短文本分类 注意力机制 词级向量 字符级向量
下载PDF
听到“牛黄”能想到“黄牛”吗?——口语识别中的语音位置编码机制
11
作者 韩海宾 李兴珊 《心理科学进展》 CSSCI CSCD 北大核心 2024年第9期1488-1501,共14页
在众多语言中,都存在一系列词汇,经过语音位置转置后仍能有效成词,典型如中文中的“牛黄”与“黄牛”。阐明这类可转置词汇在语言理解过程中的编码方式,是一项至关重要的研究课题。在阅读领域,学者们已就词汇的位置编码机制展开了讨论,... 在众多语言中,都存在一系列词汇,经过语音位置转置后仍能有效成词,典型如中文中的“牛黄”与“黄牛”。阐明这类可转置词汇在语言理解过程中的编码方式,是一项至关重要的研究课题。在阅读领域,学者们已就词汇的位置编码机制展开了讨论,然而针对口语加工中语音位置编码的认知机制,至今仍存在序列−灵活编码之争:早期口语识别理论认为语音位置编码主要以序列编码方式为主,而近年来的研究则发现,音位、音节和句子等层面上存在以灵活编码为主的语音位置编码方式。未来研究应深入探索与口语识别中语音编码相关的认知机理、神经机制、语言获得以及人工智能等重要问题,由于汉字词在形音对应关系和语音加工单元等方面独具特殊性,后续研究应对汉字词的语音位置编码予以特别关注。 展开更多
关键词 口语识别 语音位置编码 汉字词
下载PDF
徐锴字词关系思想研究
12
作者 张素凤 刘梦学 《唐山师范学院学报》 2024年第5期26-32,共7页
徐锴《说文解字系传》在字词关系研究方面有许多独到之处,具体包括:1.把“词”界定为语气助词并阐释其功能;2.首次把“六书”分为三耦;3.从逻辑上阐释“六书”的排序理据;4.以新颖的视角阐释“六书”每一“书”的内涵;5.以按语形式补充... 徐锴《说文解字系传》在字词关系研究方面有许多独到之处,具体包括:1.把“词”界定为语气助词并阐释其功能;2.首次把“六书”分为三耦;3.从逻辑上阐释“六书”的排序理据;4.以新颖的视角阐释“六书”每一“书”的内涵;5.以按语形式补充说明某些字相关职能的其他用字,并阐释其字词关系变化;6.揭示词义的系统性。徐锴这些独到见解在字词关系研究史上具有重要意义,有力推动了汉字学理论的发展。 展开更多
关键词 徐锴 六书 字词关系
下载PDF
中文重叠关系抽取的动态分层级联标记模型
13
作者 张利 张欢欢 袁玉波 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期450-458,共9页
构建了动态分层级联标记中文重叠关系抽取(RWG-LSA)模型:首先基于预训练语言模型和gated机制构建了动态字词融合特征学习模型(RWG),有效避免了主体标记模块的特征缺失和无法并行计算等问题;其次引入动态权局部自注意力(LSA),自主学习到... 构建了动态分层级联标记中文重叠关系抽取(RWG-LSA)模型:首先基于预训练语言模型和gated机制构建了动态字词融合特征学习模型(RWG),有效避免了主体标记模块的特征缺失和无法并行计算等问题;其次引入动态权局部自注意力(LSA),自主学习到主体层面的语义特征;最后在有效融合了输入序列的全局和主体局部特征的基础上,实现RWG-LSA模型对文本中实体对和关系的抽取。在SKE中文数据集上的实验表明,本模型对重叠关系抽取有显著效果,F1值达到了82.44%。 展开更多
关键词 文本挖掘 中文重叠关系抽取 动态字词融合 预训练语言模型 gated机制 局部自注意力机制
下载PDF
卬、印、卯、斤字际关系考论
14
作者 周阳 《中国文字研究》 2024年第1期181-187,共7页
古代文献在流传过程中产生了众多异文,其中卬、印、卯、斤互异现象普遍,反映了复杂的字际关系。古文字阶段“卬”和“印”关系密切;隶楷阶段“卬”“印”和“卯”形近多混;因行草书楷化,“卬”“印”“卯”误作“斤”成为常例。当它们... 古代文献在流传过程中产生了众多异文,其中卬、印、卯、斤互异现象普遍,反映了复杂的字际关系。古文字阶段“卬”和“印”关系密切;隶楷阶段“卬”“印”和“卯”形近多混;因行草书楷化,“卬”“印”“卯”误作“斤”成为常例。当它们作为构件时,仍保持此类形混讹变现象,由此造成了古书中众多问题的误解。文章厘清系列文字的字际关系,恢复其内在联系,为解决诸多积疑未释的问题提供了线索。 展开更多
关键词 字际关系 文献问题
下载PDF
大型辞书未收的唐五代《切韵》系韵书联绵词词形例释
15
作者 周旺 蔡梦麒 《中国文字研究》 2024年第1期127-140,共14页
唐五代《切韵》系韵书是研究联绵词的重要材料。文章选取唐五代《切韵》系韵书中“鍡鑘”“媿娞”“擨■”“踯躅”四个联绵词,分析联绵词不同书写形式是否应当被《汉语大字典》《汉语大词典》《联绵词大词典》收录,同时梳理文献中联绵... 唐五代《切韵》系韵书是研究联绵词的重要材料。文章选取唐五代《切韵》系韵书中“鍡鑘”“媿娞”“擨■”“踯躅”四个联绵词,分析联绵词不同书写形式是否应当被《汉语大字典》《汉语大词典》《联绵词大词典》收录,同时梳理文献中联绵词各词形产生原因及演变路径。分析可知“[山鬼][山畾]、㱬郲、㱬郲、碨鑘、[石委]鑘”“[女畏]婑、媿娞”“踌[止著]”这8个词形应当被辞书收录。 展开更多
关键词 唐五代《切韵》系韵书 联绵词 《汉语大字典》 《汉语大词典》 《联绵词大词典》
下载PDF
“余”字本义的“帝自称说”汉字字源学考辩——基于“炎黄崇拜”假说
16
作者 朱夏俊 谢京华 +1 位作者 杨阳 葛洪磊 《文化创新比较研究》 2024年第15期37-42,共6页
“余”字本义释义存在多种解说。但究竟哪种解说合乎逻辑思辨和推理的科学性标准,需要进行汉字字源学层面的考证辨析。该文提出“余”字本义的“帝自称说”,借助“炎黄崇拜”假说的理论工具,从“余”字字族、“亼”字字族、专有名称、... “余”字本义释义存在多种解说。但究竟哪种解说合乎逻辑思辨和推理的科学性标准,需要进行汉字字源学层面的考证辨析。该文提出“余”字本义的“帝自称说”,借助“炎黄崇拜”假说的理论工具,从“余”字字族、“亼”字字族、专有名称、专有地名、专有自称5个维度进行了系统的考辩,得出“余”应为上古华夏文明中帝对自己的专有称谓,“余”字造字构型应当从亼从木。其中“亼”字字根代表了“△”形帝陵、神庙或神坛,是“炎黄崇拜”的标志性建筑形制;“木”字字根为“炎黄”二帝来自神授之权杖的简体造型。该文的探索性研究旨在为“余”字本义的“帝自称说”提供有力论证的同时,亦能够验证“炎黄崇拜”假说在建构汉字字源学理论体系中的有效性。 展开更多
关键词 “余”字本义 造字构型 从亼从木 汉字字源学 “帝自称说” “炎黄崇拜”假说
下载PDF
面向藏文文本的人物关系抽取语料库的构建
17
作者 德吉措 安见才让 《青海科技》 2024年第1期81-86,107,共7页
作为实体关系抽取研究的重要基础,构建高质量、标准化的语料库能够提高实体关系抽取任务的精确度和召回率。目前,藏文关系抽取语料库构建大多依靠传统人工标注方法且局限于特定领域,存在标注效率低且人物关系语料库相对缺乏的问题。文... 作为实体关系抽取研究的重要基础,构建高质量、标准化的语料库能够提高实体关系抽取任务的精确度和召回率。目前,藏文关系抽取语料库构建大多依靠传统人工标注方法且局限于特定领域,存在标注效率低且人物关系语料库相对缺乏的问题。文章构建了藏文人名实体识别语料库;通过分析人物关系特征和实体关系类别及其标注规范,构建触发词词典进行语料回标,生成15400条实体识别和8000条藏文人物关系抽取标注语料。为验证语料库的可用性,利用命名实体识别和关系抽取实验进行统计分析,其实体识别F1值达到67.2%,关系抽取F1值达到66.2%,结果表明该语料库的构建对后续面向藏文人物关系抽取研究提供了数据基础。 展开更多
关键词 语料库 人物关系抽取 藏文文本 触发词
下载PDF
基于字形的汉字字符复杂度算法及其应用
18
作者 陈天序 王钗 吴子昂 《语言文字应用》 CSSCI 北大核心 2024年第2期135-144,共10页
汉字字符复杂度是影响汉字识别的重要因素之一,常以笔画数代表,而字形对视觉复杂度的影响尚未得到充分研究。本研究引入汉字字符复杂度的新算法,即将汉字处理为图像后对汉字轮廓进行分块切割,计算字形整体的周长复杂度,得出汉字字符复... 汉字字符复杂度是影响汉字识别的重要因素之一,常以笔画数代表,而字形对视觉复杂度的影响尚未得到充分研究。本研究引入汉字字符复杂度的新算法,即将汉字处理为图像后对汉字轮廓进行分块切割,计算字形整体的周长复杂度,得出汉字字符复杂度值。本研究尝试将新算法应用于国际中文教育的字表研究,发现:相较于用笔画数代表汉字字符复杂度的传统方法,新算法计算出的汉字字符复杂度更能够体现同一笔画数下不同汉字视觉上的字形差异;以国际中文教育领域的等级字表为样本,部分等级之间汉字字符复杂度无显著差异。 展开更多
关键词 汉字字符复杂度 测算方法 等级字表 国际中文教育
下载PDF
出土文献成语的用字差异及其价值探析
19
作者 何余华 李茵茵 《湖北师范大学学报(哲学社会科学版)》 2024年第6期1-8,共8页
成语作为汉语中具有固定格式的短语,它的用字演变与整体意义之间存在着复杂的互动关系。出土文献保留了成语较早的文字资料,从出土文献和传世文献出发对成语语素的用字进行共时描写和历时比较,发现成语沿用过程中既存在用字当代化的现象... 成语作为汉语中具有固定格式的短语,它的用字演变与整体意义之间存在着复杂的互动关系。出土文献保留了成语较早的文字资料,从出土文献和传世文献出发对成语语素的用字进行共时描写和历时比较,发现成语沿用过程中既存在用字当代化的现象,也出现过用字存古滞后的现象。这是字词演变的客观规律、成语结构的稳固性、人们使用成语追求典雅性和文本载体的性质复杂多样等因素综合作用的结果。归纳成语语素的用字差异具有多方面的语料价值,有助于揭示成语的源初意义、探求成语意义的生成途径、梳理成语的发展演变脉络。 展开更多
关键词 出土文献 成语 字词关系 用字差异 语料
下载PDF
汉语阅读中词素位置概率信息对词切分的影响
20
作者 高晓雷 牛丁一 +1 位作者 杨欣雅 张亚兰 《辽宁师范大学学报(社会科学版)》 2024年第4期53-59,共7页
词素位置概率信息在汉语阅读词切分的过程中发挥着非常重要的作用,已有相关研究主要集中于词素位置概率信息独立或与其他因素共同影响词切分两个方面。本文将从上述两个方面梳理相关研究成果,并在此基础上对未来的研究方向提出展望,即... 词素位置概率信息在汉语阅读词切分的过程中发挥着非常重要的作用,已有相关研究主要集中于词素位置概率信息独立或与其他因素共同影响词切分两个方面。本文将从上述两个方面梳理相关研究成果,并在此基础上对未来的研究方向提出展望,即开展词素位置概率信息加工与词切分的先后顺序的研究,丰富有关重叠歧义词词切分的研究,并深入探讨词素位置概率信息、语境多样性,以及多种心理线索对词切分的影响。 展开更多
关键词 词素位置概率信息 词切分 汉语阅读
下载PDF
上一页 1 2 37 下一页 到第
使用帮助 返回顶部