期刊文献+
共找到238篇文章
< 1 2 12 >
每页显示 20 50 100
基于局部Transformer的泰语分词和词性标注联合模型
1
作者 朱叶芬 线岩团 +1 位作者 余正涛 相艳 《智能系统学报》 CSCD 北大核心 2024年第2期401-410,共10页
泰语分词和词性标注任务二者之间存在高关联性,已有研究表明将分词和词性标注任务进行联合学习可以有效提升模型性能,为此,提出了一种针对泰语拼写和构词特点的分词和词性标注联合模型。针对泰语中字符构成音节,音节组成词语的特点,采... 泰语分词和词性标注任务二者之间存在高关联性,已有研究表明将分词和词性标注任务进行联合学习可以有效提升模型性能,为此,提出了一种针对泰语拼写和构词特点的分词和词性标注联合模型。针对泰语中字符构成音节,音节组成词语的特点,采用局部Transformer网络从音节序列中学习分词特征;考虑到词根和词缀等音节与词性的关联,将用于分词的音节特征融入词语序列特征,缓解未知词的词性标注特征缺失问题。在此基础上,模型采用线性分类层预测分词标签,采用线性条件随机场建模词性序列的依赖关系。在泰语数据集LST20上的试验结果表明,模型分词F1、词性标注微平均F1和宏平均F1分别达到96.33%、97.06%和85.98%,相较基线模型分别提升了0.33%、0.44%和0.12%。 展开更多
关键词 泰语分词 词性标注 联合学习 局部Transformer 构词特点 音节特征 线性条件随机场 联合模型
下载PDF
Improving the Syllable-Synchronous Network SearchAlgorithm for Word Decoding in ContinuousChinese Speech Recognition 被引量:2
2
作者 郑方 武健 宋战江 《Journal of Computer Science & Technology》 SCIE EI CSCD 2000年第5期461-471,共11页
The previously proposed syllable-synchronous network search (SSNS) algorithm plays a very important role in the word decoding of the continuous Chinese speech recognition and achieves satisfying performance. Several r... The previously proposed syllable-synchronous network search (SSNS) algorithm plays a very important role in the word decoding of the continuous Chinese speech recognition and achieves satisfying performance. Several related key factors that may affect the overall word decoding effect are carefully studied in this paper, including the perfecting of the vocabulary, the big-discount Turing re-estimating of the N-Gram probabilities, and the managing of the searching path buffers. Based on these discussions, corresponding approaches to improving the SSNS algorithm are proposed. Compared with the previous version of SSNS algorithm, the new version decreases the Chinese character error rate (CCER) in the word decoding by 42.1% across a database consisting of a large number of testing sentences (syllable strings). 展开更多
关键词 large-vocabulary continuous Chinese speech recognition word decoding syllable- synchronous network search word segmentation
原文传递
日语的词源和造词法
3
作者 廖威 《文化创新比较研究》 2024年第20期39-45,共7页
日语原本是一门十分科学且有序的语言。在最初的日语体系中,存在着许多单音节词,但这些词多与后续音节形成整体,从现代语的角度来看往往无法独立存在。正是这种无法独立存在的现象,反映了造词从单音节向多音节转变的过程,单音节词仍然... 日语原本是一门十分科学且有序的语言。在最初的日语体系中,存在着许多单音节词,但这些词多与后续音节形成整体,从现代语的角度来看往往无法独立存在。正是这种无法独立存在的现象,反映了造词从单音节向多音节转变的过程,单音节词仍然保留其原形,即词源。词源反映出各个意义相近的词之间的联系,而造词法则关乎着各种词类的体系化。该文聚焦各种具有共同音节的词群,力图通过对词群的分析还原原始日语中存在的词源,并基于单音节的词源归纳出多音节词的造词法。对词源和造词法的探究,可以使我们更深层次地掌握日语这门语言。 展开更多
关键词 音节 词源 词类 词群 造词法 体系化
下载PDF
Evolution of word-syllable structures and the diversity of world languages
4
作者 Di Jiang Caijun Kang Haixiong Yan 《Chinese Science Bulletin》 SCIE EI CAS 2014年第26期3362-3368,共7页
A fundamental difference among modern languages in the world are made by word-syllable structures(WSS), not by distinctive phonemes. Language diversity is supposed to be an evolutionary result of the WSSs, which is de... A fundamental difference among modern languages in the world are made by word-syllable structures(WSS), not by distinctive phonemes. Language diversity is supposed to be an evolutionary result of the WSSs, which is decided by types of syllable constitution and the length of word by syllables. Here we use Swadesh lists of 179 modern languages to analyze their geographic distribution of WSS diversity index and try to discover their developing positions and depths in the evolutionary processes. We also set an ideal WSS offset model for languages, calculate the offset distance and offset direction of each language, and then divide languages into three groups according to the data result, each of which represents an evolutionary type. Our conclusion is that the WSS diversity and the WSS offset model represent the evolutionary trend of diversity and the evolutionary process of human languages in the world. In addition, every language nowadays keeps the most primary WSS features to some extent. Therefore, the WSS may be regarded as genetic factors of human languages. 展开更多
关键词 人类语言 多样性 音节 世界 结构 单词 进化过程 演变
原文传递
基于藏语字性标注的词性预测研究 被引量:7
5
作者 龙从军 刘汇丹 +1 位作者 诺明花 吴健 《中文信息学报》 CSCD 北大核心 2015年第5期211-215,共5页
该文选取了藏语文中小学教材的部分语料,构建了带有藏语字性标记、词边界标记和词性标记的语料库,通过比较不同的分词、标注方法,证明分词、词性标注一体化效果比分步进行的效果好,准确率、召回率和F值分别提高了0.067、0.073和0.07。... 该文选取了藏语文中小学教材的部分语料,构建了带有藏语字性标记、词边界标记和词性标记的语料库,通过比较不同的分词、标注方法,证明分词、词性标注一体化效果比分步进行的效果好,准确率、召回率和F值分别提高了0.067、0.073和0.07。但词级标注模型难以解决词边界划分的一致性和未登录词的问题。基于此,作者提出可以利用字性和字构词的规律预测合成词的词性,既可以融入语言学知识又可以减少由未登录词导致的标注错误,实验结果证明,作为词性标注的后处理模块,基于字性标注的词性预测准确率提高到了0.916,这个结果已经比分词标注一体化结果好,说明字性标注对纠正词性错误标注有明显的效果。 展开更多
关键词 藏语 语字标注 分词 词性标注
下载PDF
现代藏文音节字自动校对研究 被引量:16
6
作者 关白 才科扎西 《计算机工程与应用》 CSCD 2012年第29期151-156,共6页
在现代藏文自动校对中,对音节字(■)的校对是其基础。现代藏文二维的书写格式和独特的文法,还有格助词的黏着现象、音节字搭配规则和音节字中真词和非词错误等众多问题,使得对藏文自动校对的研究有别于英语和汉语的自动校对。针对现代... 在现代藏文自动校对中,对音节字(■)的校对是其基础。现代藏文二维的书写格式和独特的文法,还有格助词的黏着现象、音节字搭配规则和音节字中真词和非词错误等众多问题,使得对藏文自动校对的研究有别于英语和汉语的自动校对。针对现代藏文中音节字的特点,通过音节字预处理、字表匹配、混淆集匹配、二元接续关系、最小编辑距离法等方法对现代藏文音节字的自动校对进行详细论述。 展开更多
关键词 藏文自动校对 音节字 真词错误 黏着性格助词
下载PDF
石城方言语气词 被引量:7
7
作者 刘纶鑫 何清强 《南昌大学学报(人文社会科学版)》 北大核心 2001年第4期128-133,共6页
石城方言是赣南客家方言的一支。石城方言的语气词可分为单音语气词和双音语气词两类。其单音语气词共 2 1个 ,分别表示疑问、陈述、祈使、揣度与商量、惊叹等语气。其双音语气词共 12个 ,由单音语气词按一定的规律构成 。
关键词 石城方言 单音语气词 双音语气词 客家方言 复合语气词
下载PDF
基于规则的现代藏文音节字检错研究 被引量:5
8
作者 才让叁智 关白 《西藏大学学报(社会科学版)》 CSSCI 2017年第2期70-77,共8页
藏文音节字检错是藏文文本校对的重要环节。文章通过分析现代藏文音节字,将藏文音节字分为规则音节字(遵循组件组合规则的藏文音节字)和不规则音节字(不遵循组件组合规则的音节字)两种。对规则音节字采用了音节字组件组合规则进行检错,... 藏文音节字检错是藏文文本校对的重要环节。文章通过分析现代藏文音节字,将藏文音节字分为规则音节字(遵循组件组合规则的藏文音节字)和不规则音节字(不遵循组件组合规则的音节字)两种。对规则音节字采用了音节字组件组合规则进行检错,对非规则音节字采用建立梵源藏文词典、音译藏文词典和本体非规则音节字词典进行检错。实验表明,文章提出的藏文音节字检错方法对报纸类藏文的检错率为100%。 展开更多
关键词 藏文音节字 音节字组件 组合规则 检错
下载PDF
口语产生中词频效应、音节频率效应和语音促进效应的认知年老化 被引量:10
9
作者 杨群 张清芳 《心理科学》 CSSCI CSCD 北大核心 2015年第6期1303-1310,共8页
采用图画-词汇干扰实验范式,考察了汉语口语产生过程中词频与音节频率效应、语音促进效应的认知年老化现象及其认知机制。结果发现,老年组的图画命名时间长于青年组,且老年组的词频效应和音节频率效应高于青年组,而语音相关效应低于青... 采用图画-词汇干扰实验范式,考察了汉语口语产生过程中词频与音节频率效应、语音促进效应的认知年老化现象及其认知机制。结果发现,老年组的图画命名时间长于青年组,且老年组的词频效应和音节频率效应高于青年组,而语音相关效应低于青年组。老年组中词频和音节频率存在两因素交互作用,青年组则没有,这表明随着年龄增加,老年人的心理词典中不仅语义水平和音韵水平之间的联结强度变弱,而且信息之间的作用模式发生了变化。研究结果为激活不充分假设或传输不足假设提供了证据。 展开更多
关键词 口语产生 词频效应 音节频率效应 语音促进效应 认知年老化
下载PDF
基于统计的藏文音节字校对系统开发研究 被引量:4
10
作者 普布旦增 关白 《西藏大学学报(社会科学版)》 CSSCI 2015年第2期74-78,共5页
音节字是构成藏文文本的基本单位,也是整个现代藏文自动校对的基础。音节字校对的结果直接影响词校对的正确率,从而对词、格助词、句法和语义校对等产生重要影响。文章以语料库统计得到的藏文音节字字表、二元同现表和纠错建议表等作为... 音节字是构成藏文文本的基本单位,也是整个现代藏文自动校对的基础。音节字校对的结果直接影响词校对的正确率,从而对词、格助词、句法和语义校对等产生重要影响。文章以语料库统计得到的藏文音节字字表、二元同现表和纠错建议表等作为语言知识库,以藏文音节字的错误类型为依据,设计了字表匹配和查找同现概率为侦错方法、用纠错建议表进行纠错的音节字校对系统。 展开更多
关键词 音节字 校对 侦错 纠错
下载PDF
近代汉语三音词的结构方式 被引量:3
11
作者 杨爱姣 张蕾 《湖北大学学报(哲学社会科学版)》 CSSCI 北大核心 2003年第3期65-70,共6页
从结构方式上看,近代汉语三音词的结构可分成附加式、偏正式、主谓式、联合式、述宾式、重叠式六种类型。这六种类型具有相对不同的特点,它们的此消彼长,显示了三音词在近代汉语中的基本风貌,并在一定程度上预示了三音词在现代汉语中的... 从结构方式上看,近代汉语三音词的结构可分成附加式、偏正式、主谓式、联合式、述宾式、重叠式六种类型。这六种类型具有相对不同的特点,它们的此消彼长,显示了三音词在近代汉语中的基本风貌,并在一定程度上预示了三音词在现代汉语中的发展方向。 展开更多
关键词 近代汉语 三音词 结构 类型 特点
下载PDF
现代汉语AA式叠音词、重叠词对比研究 被引量:19
12
作者 杨振兰 《齐鲁学刊》 CSSCI 北大核心 2003年第4期65-69,共5页
叠音词与重叠词分属单纯词与合成词两种不同的构词类型 ,但由于词形本身都呈现为AA式 ,因而现代汉语研究中存在一定的模糊、混淆现象。从单纯词与合成词的含义入手 ,以语素构成为中心视点进行分析 ,是划分两者的关键所在。同时 ,叠音词... 叠音词与重叠词分属单纯词与合成词两种不同的构词类型 ,但由于词形本身都呈现为AA式 ,因而现代汉语研究中存在一定的模糊、混淆现象。从单纯词与合成词的含义入手 ,以语素构成为中心视点进行分析 ,是划分两者的关键所在。同时 ,叠音词与重叠词在词类方面的倾向性和选择性以及各自的形成机制 ,与重叠构形的区别 ,语义和语用方面的不同表现和特点等问题 ,都构成叠音词与重叠词对比研究的重要内容。 展开更多
关键词 叠音词 重叠词 重叠构形 语义分析 语用分析
下载PDF
词边界信息在句中的分布 被引量:3
13
作者 杨玉芳 孙健 《心理学报》 CSSCI CSCD 北大核心 1994年第1期8-13,共6页
用经过删除的语音歧义句作材料,研究了词边界信息在句中的分布。结果说明,在歧义句中歧义音节是最重要的切分线索;向歧义音节的前后过渡也对词切分有贡献;歧义音节和过渡以外的部分在一定条件下对切分有帮助。
关键词 词切分 语音歧义句 歧义音节 词边界信息
下载PDF
佛经翻译与汉语四字格的发展 被引量:17
14
作者 孙艳 《中央民族大学学报(哲学社会科学版)》 CSSCI 北大核心 2005年第1期120-125,共6页
 佛经翻译利用并激活了汉语固有的四字格模式,使其构词能力大大加强,直接或间接地推动了汉语四字格的蓬勃发展。首先,佛经翻译的影响是汉语双音化在魏晋时期步伐加快的重要动因,由此导致了多种构词法的增长和完善;其次,佛经翻译对新文...  佛经翻译利用并激活了汉语固有的四字格模式,使其构词能力大大加强,直接或间接地推动了汉语四字格的蓬勃发展。首先,佛经翻译的影响是汉语双音化在魏晋时期步伐加快的重要动因,由此导致了多种构词法的增长和完善;其次,佛经翻译对新文体及与之相适应的四字句的选用,促成了汉语四字格独特的2+2节奏倾向的形成;再次,佛经翻译的口语化倾向影响到各种通俗文学体裁,尤其与后代白话小说中大量出现的四字格俗语有关;最后,源于佛教的四字格成语占了汉语史上外来成语的最高比例,它们与汉语成语融会在一起,成为汉语的有机组成部分。 展开更多
关键词 汉语 佛经翻译 四字格 双音化 构词法
下载PDF
汉语双音合成词结构的非句法特征 被引量:26
15
作者 王宁 《江苏大学学报(社会科学版)》 2008年第1期31-34,44,共5页
20世纪80年代以前,汉语双音合成词的构词研究中,在处理内容与形式的问题上,采用句法与构词法同一的纯形式方法成为主流。近年来,学界已经感到用这种方法研究双音合成词有明显的局限。汉语双音合成词在结构形式上具有非句法的特性,对构... 20世纪80年代以前,汉语双音合成词的构词研究中,在处理内容与形式的问题上,采用句法与构词法同一的纯形式方法成为主流。近年来,学界已经感到用这种方法研究双音合成词有明显的局限。汉语双音合成词在结构形式上具有非句法的特性,对构词法与句法采用相同的术语和结构分析法的做法存在问题,构词法应当脱离语法学而进入词汇学领域,并且应接受理论训诂学语义中心的观点,重视从意义的角度来分析双音合成词的结构模式和用法。 展开更多
关键词 词汇学 构词法 双音合成词 语义中心
下载PDF
儿童早期字词意识的发展 被引量:11
16
作者 徐芬 BruceHomer KangLee 《心理发展与教育》 CSSCI 北大核心 2002年第4期31-35,共5页
探讨了 4~ 6岁儿童早期字 词意识的年龄差异 ,拟为元语言意识的多因素模型提出支持性的证据。实验结果表明 :4岁儿童的字 词意识及 5岁儿童的词意识还很不清晰 ,6岁儿童已达到较高的字意识水平 ;幼儿在字意识任务上的成绩显著地优于... 探讨了 4~ 6岁儿童早期字 词意识的年龄差异 ,拟为元语言意识的多因素模型提出支持性的证据。实验结果表明 :4岁儿童的字 词意识及 5岁儿童的词意识还很不清晰 ,6岁儿童已达到较高的字意识水平 ;幼儿在字意识任务上的成绩显著地优于词意识任务。 展开更多
关键词 儿童心理 词意识 元语言意识 年龄差异 字意识
下载PDF
汉语连动式双音词结构特征分析 被引量:3
17
作者 武文杰 徐艳 《河北大学学报(哲学社会科学版)》 CSSCI 北大核心 2016年第2期26-29,共4页
通过对汉语高频连动式双音词的研究发现,连动式双音词内两个动词性语素具有不同的论元结构特征。根据论元的数量,连动关系可分为以下类型:包含一个论元的、包含两个论元的、包含三个论元的。其中,包含两个论元的连动关系可细分为3个小类... 通过对汉语高频连动式双音词的研究发现,连动式双音词内两个动词性语素具有不同的论元结构特征。根据论元的数量,连动关系可分为以下类型:包含一个论元的、包含两个论元的、包含三个论元的。其中,包含两个论元的连动关系可细分为3个小类,包含三个论元的连动关系细分为7个小类,而且词语的数量分布与子类型数量分布之间不具有对称性。 展开更多
关键词 汉语 连动式 双音词 论元结构 结构特征
下载PDF
藏文音节字的频次统计 被引量:2
18
作者 普次仁 李苗苗 《西藏大学学报(社会科学版)》 CSSCI 2016年第2期50-55,共6页
藏文音节字的频次统计可以准确地掌握藏文音节字中表意字的使用频度。文章以1亿5千万藏文字符的藏文平衡语料库——大型藏文基础语料库为统计源,提出了非藏文字符和93个特殊藏文字符作为音节分隔符来识别藏文音节字的方法,设计实现了藏... 藏文音节字的频次统计可以准确地掌握藏文音节字中表意字的使用频度。文章以1亿5千万藏文字符的藏文平衡语料库——大型藏文基础语料库为统计源,提出了非藏文字符和93个特殊藏文字符作为音节分隔符来识别藏文音节字的方法,设计实现了藏文音节字频次统计软件,并从不同的角度对统计结果和错误音节的类型进行了分析。 展开更多
关键词 藏文 音节字 频次 统计
下载PDF
儿童最初词汇的获得及其过程 被引量:33
19
作者 陈萍 许政援 《心理学报》 CSSCI CSCD 北大核心 1993年第2期195-202,共8页
本文追踪研究了两名儿童获得最初词汇的过程。结果表明:在儿童最初语音发展过程中,所发出的音节日益丰富、分化,产生了连续音节,随意性和指向性逐渐增强。儿童获得最初词汇的过程,是连续音节逐渐被有指向的词取代的过程。根据连续音节... 本文追踪研究了两名儿童获得最初词汇的过程。结果表明:在儿童最初语音发展过程中,所发出的音节日益丰富、分化,产生了连续音节,随意性和指向性逐渐增强。儿童获得最初词汇的过程,是连续音节逐渐被有指向的词取代的过程。根据连续音节和有指向的词的比例及沟通作用的变化,儿童获得最初词汇的过程可分为各具特点的三个阶段。两名儿童的最初词汇在其词类构成和功能意义上具有很高的一致性。结合两名儿童之间的个别差异,本文还初步探讨影响儿童获得最初词汇的因素——言语中枢和言语器官的发展、认知的发展,并探讨它们之间可能存在的相互关系。 展开更多
关键词 最初词汇 语言 认知发展 儿童
下载PDF
当代汉语新词语的词长考察 被引量:9
20
作者 刘晓梅 《吉林师范大学学报(人文社会科学版)》 2004年第4期71-73,共3页
 本文运用计量手段,通过对比不同时期词汇的词长现象,考察并分析当代汉语新词语的词长问题。结论是:以双音节词为主导,单音词零增长,词长的极限是1-12个音节。
关键词 新词语 词长 双音词 单音词
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部