期刊文献+
共找到274篇文章
< 1 2 14 >
每页显示 20 50 100
A Study on Parts of Speech Conversion in English and Chinese from the Perspective of Translation
1
作者 陈志勇 《海外英语》 2016年第1期142-144,共3页
Parts of speech conversion refers to transforming the certain words of the source language into another category words of the target language, which is one of the common methods and techniques used in the translation ... Parts of speech conversion refers to transforming the certain words of the source language into another category words of the target language, which is one of the common methods and techniques used in the translation of English and Chinese languages. This paper starts from a relatively significant difference in English and Chinese language— the tendency of static words in English in contrast to that of dynamic words in Chinese, to explore the theoretical basis of transference in parts of speech in English and Chinese language translation. Combining with a large number of examples, the author puts forward some skills on transformation of parts of speech in English-Chinese translation to guide translation practice. The study found that the theoretical basis of the conversion in English and Chinese mostly including:1) there is a boundary ambiguity between lexical category;2)English SV/SVO structure is rigorous, which leads to expressing the dynamic meaning by means of using other lexical category; 3) the development of social culture not only makes new words continue to increase rapidly, but also gives many used words with new meanings; 4)it is acknowledged in Lexical morphology that English words which come from derivation are in larger number and derivations can make the word class of the corresponding original words either the same or different. The dynamic and specific features of Chinese make it more use of verbs in language use. Thus, in the process of translation, appropriate parts of speech conversion can make the translation more in line with their own habits of expression. 展开更多
关键词 parts of speech CONVERSION STaTIC dynamic chinese ENGLISH
下载PDF
The Comparative Study of Two Translated Texts on Huangdirent Translating Styles o'n s Internal Classics——Simple Analysis on the Diffe Culture-Specific Lexicon, Figure of Speech and Four-Chinese-Character Structures
2
作者 杨峥 《海外英语》 2017年第17期5-6,共2页
Huangdi's Internal Classics(Neijin) is one of the most important ancient medical classics, which plays far-reaching influence in medical field. More and more domestic and overseas scholars published their translat... Huangdi's Internal Classics(Neijin) is one of the most important ancient medical classics, which plays far-reaching influence in medical field. More and more domestic and overseas scholars published their translated texts on Neijing. Due to the diversity of editions and different understanding, the translating styles and contents are widely different. This study will focus on the different translating styles on culture-specific lexicon、figure of speech and four-Chinese-character structures in Neijin. 展开更多
关键词 Huangdi’s Internal Classics the comparative Study of translated texts culture-specific lexicon figure of speech four-chinese-character structures
下载PDF
A lexicalized second-order-HMM for ambiguity resolution in Chinese segmentation and POS tagging 被引量:1
3
作者 陈鄞 Yang Muyun Zhao Tiejun Yu Hao Li Sheng 《High Technology Letters》 EI CAS 2005年第4期346-350,共5页
Hidden Markov Model(HMM) is a main solution to ambiguities in Chinese segmentation and POS (part-of-speech) tagging. While most previous works for HMM-based Chinese segmentation and POS tagging consult POS information... Hidden Markov Model(HMM) is a main solution to ambiguities in Chinese segmentation and POS (part-of-speech) tagging. While most previous works for HMM-based Chinese segmentation and POS tagging consult POS information in contexts, they do not utilize lexical information which is crucial for resolving certain morphological ambiguity. This paper proposes a method which incorporates lexical information and wider context information into HMM. Model induction and related smoothing technique are presented in detail. Experiments indicate that this technique improves the segmentation and tagging accuracy by nearly 1%. 展开更多
关键词 文字信息处理 隐马尔可夫模型 汉语 语言切分 词性标注
下载PDF
现代汉语兼类现象批评认知及常态化研究策略
4
作者 谢明镜 蔡羽 《宜春学院学报》 2024年第4期72-76,107,共6页
现代汉语兼类现象是一种客观存在于语言事实中动态变化的语法现象。兼类现象的研究往往依赖于《现代汉语词典》,而《现代汉语词典》兼类词词类标注的缺失表明:兼类词只是兼类现象在词典里的部分反映,是兼类现象的子集,二者的不平衡动态... 现代汉语兼类现象是一种客观存在于语言事实中动态变化的语法现象。兼类现象的研究往往依赖于《现代汉语词典》,而《现代汉语词典》兼类词词类标注的缺失表明:兼类词只是兼类现象在词典里的部分反映,是兼类现象的子集,二者的不平衡动态关系受到了词典周期性修订、词频的动态监测及对词类活用认知的制约。因此,现阶段兼类现象外延全貌为:词典里的兼类、当下未收录进词典的兼类、活用产生的临时兼类。兼类现象的常态化研究策略可以还原一个更真实的现代汉语兼类情况。 展开更多
关键词 《现代汉语词典》 兼类 词类活用
下载PDF
上古汉语史传文语气系统简论
5
作者 张贺然 《当代教研论丛》 2024年第5期15-19,共5页
在《史记》《汉书》《左传》这些典型的上古汉语史传文中,语气系统作为故事叙述的语言表达机制及手段,发挥了重要作用。这些叙事语篇中对话占有较大篇幅,一部分故事更是以对话为线索进行,穿插了君臣之间的相互问答。这些语篇为研究上古... 在《史记》《汉书》《左传》这些典型的上古汉语史传文中,语气系统作为故事叙述的语言表达机制及手段,发挥了重要作用。这些叙事语篇中对话占有较大篇幅,一部分故事更是以对话为线索进行,穿插了君臣之间的相互问答。这些语篇为研究上古汉语史传文的语气系统提供了大量语料。文章运用系统分析与历史比较的研究方法,重点探究上古汉语史传文语气系统的词类界定、特征流变及再划分三个问题。 展开更多
关键词 上古汉语 史传文 语气系统 词类
下载PDF
应用于SPCE061A的GB2312汉字语音库的制作 被引量:2
6
作者 林洪艺 黄丽敏 林聪仁 《信息技术》 2008年第3期10-12,共3页
汉语语音播放是许多嵌入式系统的重要功能,语音库的制作又是实现这一功能的重要基础。阐述了制作SPCE061A压缩格式GB2312汉字语音库的方法。此方法分生成语音库文件及汉字读音序号索引表、裁剪语音库文件、压缩语音库文件等几个步骤。
关键词 汉字语音库 语音播放 嵌入式 SPCE061a
下载PDF
基于SPCE061A的通用汉字文本播音系统 被引量:1
7
作者 黄丽敏 林洪艺 林聪仁 《电子工程师》 2008年第3期28-31,共4页
采用汉字语音库法,将压缩后的1220个不同读音的语音数据及2个索引表存储于一片512kB的Flash存储器中,实现了基于SPCE061A的嵌入式通用汉字文本语音播放系统。阐述了系统的硬件原理和软件流程。本系统硬件结构简单,成本低廉;软件有汉字... 采用汉字语音库法,将压缩后的1220个不同读音的语音数据及2个索引表存储于一片512kB的Flash存储器中,实现了基于SPCE061A的嵌入式通用汉字文本语音播放系统。阐述了系统的硬件原理和软件流程。本系统硬件结构简单,成本低廉;软件有汉字语音资源地址的计算、文本语音播放及语音播放操作与其他操作的配合等关键算法。系统采用环形缓冲区很好地解决了文本播放与输入间的配合问题,播放语音流畅、清晰。 展开更多
关键词 SPCE061a 语音播放系统 汉字读音序号索引表 语音资源地址索引表 环形缓冲区
下载PDF
Awards Gala for “Chinese Characters and Me” Speech Contest for International Students
8
《Voice of Friendship》 2019年第4期54-54,共1页
关键词 awards Gala for chinese characters and Me speech Contest for International Students
原文传递
融合词性与双向时间卷积网络的中文命名实体识别方法
9
作者 张鹏 周志强 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2023年第4期662-670,共9页
针对目前中文命名时实体识别方法中存在的中文边界识别困难、模型梯度、文本特征不够充分等问题,提出了一种融合词性特征与双向时间卷积网络的中文命名时实体识别模型。该模型提出使用XLNet预训练语言模型生成对应的词嵌入表示,融合后... 针对目前中文命名时实体识别方法中存在的中文边界识别困难、模型梯度、文本特征不够充分等问题,提出了一种融合词性特征与双向时间卷积网络的中文命名时实体识别模型。该模型提出使用XLNet预训练语言模型生成对应的词嵌入表示,融合后使用双向时间卷积网络提取文本前向特征与后向特征。实验中对时间卷积网络的空洞因子、卷积层数和卷积核数进行参数实验并分析其影响原因,结果表明,该模型与其他模型相比,能够更准确且有效地提取文本中的实体。 展开更多
关键词 中文命名实体识别 词性特征 时序卷积网络 神经网络
下载PDF
上古汉语分词与词性标注加工规范——基于《史记》深加工语料库的标注实践
10
作者 郑童哲恒 李斌 《语言文字应用》 北大核心 2023年第4期93-104,共12页
上古(先秦两汉)时期流传至今的古籍经典数量大、价值高,亟需进行计算处理和挖掘,作为词法分析的分词与词性标注就成为古汉语信息处理的基础性工作。古汉语文本具有缺乏词语边界、内容艰深、与现代汉语差异大、不同时期差异大等特点,古... 上古(先秦两汉)时期流传至今的古籍经典数量大、价值高,亟需进行计算处理和挖掘,作为词法分析的分词与词性标注就成为古汉语信息处理的基础性工作。古汉语文本具有缺乏词语边界、内容艰深、与现代汉语差异大、不同时期差异大等特点,古文分词与词性标注一直处于研究不足、缺乏标注规范的状态,限制了语料库构建和自动分析的研究。本文针对这一问题,根据现代汉语研究领域相关成果以及上古汉语词汇特点,构建出信息处理用上古汉语分词与词性标注规范。规范由原则和细则两部分组成。原则部分包括单字词优先等7条分词原则,具体语境中的语法功能等3条词类划分及词性标注原则。古汉语词类划分为14个一级类和15个二级类,细则部分包含了大量语言现象标注实例。该规范在45万余字《史记》语料库的建设过程中不断修改完善。语料统计得出了《史记》单字词和多字词的词例数量以及最高频词类。本文可以为上古汉语深加工语料库建设提供基础支撑,助推古汉语信息处理标准化和规范化。 展开更多
关键词 上古汉语 词语切分 词性标注 规范 《史记》
下载PDF
融合词性句法位置特征的汉老双语句子相似度计算
11
作者 郭雷 周兰江 周蕾越 《中文信息学报》 CSCD 北大核心 2023年第12期76-86,共11页
汉语和老挝语句子表达存在较大的词序差异,在汉老平行句对语料中融入名词、形容词、量词、数词等词性的位置特征能有效提高句子相似度量的准确性。该文提出一种基于词性句法位置特征的相似度计算方法,首先向汉老双语句子添加特征词标签... 汉语和老挝语句子表达存在较大的词序差异,在汉老平行句对语料中融入名词、形容词、量词、数词等词性的位置特征能有效提高句子相似度量的准确性。该文提出一种基于词性句法位置特征的相似度计算方法,首先向汉老双语句子添加特征词标签和特征词性标签使得句子的分布式表示包含更丰富的语义信息,然后利用含有自注意力机制(Self-Attention)的3个不同卷积核尺度的门控线性卷积网络(GCN)和双向长短时记忆网络(BiLSTM)分别挖掘汉老双语句子的深层语义信息,将两个网络输出的特征语义向量拼接,最后计算特征语义向量的相对差和相对积,将二者拼接并输入到全连接层得到汉老双语句子的相似度分数。实验结果表明,该文提出的方法在有限的语料下取得了更好的效果,F_1值达到了77.19%。 展开更多
关键词 汉语-老挝语 词性句法位置特征 门控线性卷积网络 双向长短期记忆网络 自注意力机制
下载PDF
基于BiLSTM-CRF的中文分词和词性标注联合方法 被引量:2
12
作者 袁里驰 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第8期3145-3153,共9页
针对中文分词、词性标注等序列标注任务,提出结合双向长短时记忆模型、条件随机场模型和马尔可夫族模型或树形概率构建的中文分词和词性标注联合方法。隐马尔可夫词性标注方法忽略了词本身到词性的发射概率。在基于马尔可夫族模型或树... 针对中文分词、词性标注等序列标注任务,提出结合双向长短时记忆模型、条件随机场模型和马尔可夫族模型或树形概率构建的中文分词和词性标注联合方法。隐马尔可夫词性标注方法忽略了词本身到词性的发射概率。在基于马尔可夫族模型或树形概率的词性标注中,当前词的词性不但与前面词的词性有关,而且与当前词本身有关。使用联合方法有助于使用词性标注信息实现分词,有机地将两者结合起来有利于消除歧义和提高分词、词性标注任务的准确率。实验结果表明:本文使用的中文分词和词性标注联合方法相比于通常的双向长短时记忆模型−条件随机场分词模型能够大幅度提高分词的准确率,并且相比于传统的隐马尔可夫词性标注方法能够大幅度提高词性标注的准确率。 展开更多
关键词 双向长短时记忆模型 中文分词 词性标注 马尔可夫族模型 树形概率
下载PDF
融合词性位置特征的多任务汉老双语短文本相似度计算方法
13
作者 李炫达 周兰江 张建安 《中文信息学报》 CSCD 北大核心 2023年第4期18-27,33,共11页
老挝语属于低资源语言,在有限的语料中获取更多的语义信息可以有效解决汉语和老挝语短文本相似度计算不准确的问题。多任务学习是有效获取语义信息的一种方法,该文对汉语和老挝语短文本特点进行研究后,提出一种融合词性位置特征的多任... 老挝语属于低资源语言,在有限的语料中获取更多的语义信息可以有效解决汉语和老挝语短文本相似度计算不准确的问题。多任务学习是有效获取语义信息的一种方法,该文对汉语和老挝语短文本特点进行研究后,提出一种融合词性位置特征的多任务汉老双语短文本相似度计算方法:首先,通过词性位置特征权重和TF-IDF权重加权表征双语短文本的同时,使用改进后的TextRank算法获取双语短文本的核心句;然后,通过带有自注意力机制的双向长短时记忆网络分别计算双语短文本的相似度与双语短文本对应核心句的相似度;最后,使用多任务学习方法,将双语短文本的核心句相似度计算作为辅助任务,获取更多的语义信息进行共享以提升汉老双语短文本相似度计算模型的性能。实验结果表明,该文提出的方法在有限的训练语料下取得了更好的效果,F_(1)值达76.16%。 展开更多
关键词 汉语-老挝语 词性位置特征 多任务学习 短文本相似度计算
下载PDF
基于BERT-BiLSTM-CRF的中文分词和词性标注联合方法 被引量:2
14
作者 袁里驰 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1906-1911,共6页
针对中文分词、词性标注等序列标注任务,本文提出了结合BERT语言模型、BiLSTM(双向长短时记忆模型)、CRF(条件随机场模型)和马尔可夫族模型(MFM)或树形概率(TLP)构建的中文分词和词性标注联合方法.隐马尔可夫(HMM)词性标注方法忽略了词... 针对中文分词、词性标注等序列标注任务,本文提出了结合BERT语言模型、BiLSTM(双向长短时记忆模型)、CRF(条件随机场模型)和马尔可夫族模型(MFM)或树形概率(TLP)构建的中文分词和词性标注联合方法.隐马尔可夫(HMM)词性标注方法忽略了词本身到词性的发射概率,而在利用树形概率或马尔可夫族统计模型的词性标记中,一个词的词性不仅和该词前一个词的词性关联,且与该词自身关联.使用联合方法有助于使用词性信息帮助分词,将两者紧密结合能够帮助消除歧义和改进分词、词性标记的性能.实验结果表明本文使用的中文分词和词性标注联合方法与普通的BiLSTM-CRF分词算法相比,可以明显提升分词性能,而且相比于通常的隐马尔可夫词性标注方法能够大幅度提高词性标注的准确率. 展开更多
关键词 BERT 双向长短时记忆模型 中文分词 词性标注 马尔可夫族模型 树形概率
下载PDF
母语字母负迁移对汉语学习者汉字书写偏误的影响分析
15
作者 熊珈玄 《文化创新比较研究》 2023年第26期43-46,共4页
该文以母语字母负迁移导致的留学生汉字书写偏误为研究对象,从中山大学汉语连续性中介语语料库中收集了以英语为母语的汉语学习者的此类汉字偏误实例89例,274频次。通过实例分析发现:母语字母的负迁移多发生于部件层面;笔画相接型构件... 该文以母语字母负迁移导致的留学生汉字书写偏误为研究对象,从中山大学汉语连续性中介语语料库中收集了以英语为母语的汉语学习者的此类汉字偏误实例89例,274频次。通过实例分析发现:母语字母的负迁移多发生于部件层面;笔画相接型构件最可能出现母语字母负迁移类偏误;偏误形式主要包括用圆弧类笔画误代直线笔画、变换笔际关系和变换部件置向;偏误具有顽固性,偏误数量不随学习者汉语水平提升而减少。通过对留学生回访及结合认知心理学的研究成果,该文发现母语字母负迁移的发生与学习者主观认识有密切关系,同时还受汉字通透性、笔画数、字频及教师教学中连笔书写等因素影响。最后针对此类偏误提出具体教学建议,以期为留学生汉字学习与教学提供参考。 展开更多
关键词 英文字母 母语负迁移 汉字偏误 认知心理学 部件 笔画
下载PDF
北京大学现代汉语语料库基本加工规范 被引量:126
16
作者 俞士汶 段慧明 +1 位作者 朱学锋 孙斌 《中文信息学报》 CSCD 北大核心 2002年第5期49-64,共16页
北京大学计算语言学研究所已经完成了一个有2700万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外,还包括专有名词(人名、地名、团体机构名称等)标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规模语... 北京大学计算语言学研究所已经完成了一个有2700万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外,还包括专有名词(人名、地名、团体机构名称等)标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规模语言工程的顺利完成得益于事先制订并不断完善的规范。发表《北京大学现代汉语语料库基本加工规范》是为了抛砖引玉,更广泛地向专家、同行征询意见,以便进一步修订。 展开更多
关键词 北京大学 现代汉语语料库 基本加工规范 词语切分 词性标注 汉字处理系统 名词标注 语素子类标注
下载PDF
一种基于汉字结构特征的车牌照字符分割方法 被引量:11
17
作者 苑玮琦 穆长江 李德胜 《仪器仪表学报》 EI CAS CSCD 北大核心 2003年第z2期472-474,共3页
提出了一种基于汉字结构特征的车牌照字符分割方法。该方法首先找到汉字的主体部件,然后根据汉字上下、左右、包围结构找到组成汉字的其它部件,并结合汉字识别结果对分割得到的汉字进行确定。最后,根据车牌字符串的结构特征找到其它字... 提出了一种基于汉字结构特征的车牌照字符分割方法。该方法首先找到汉字的主体部件,然后根据汉字上下、左右、包围结构找到组成汉字的其它部件,并结合汉字识别结果对分割得到的汉字进行确定。最后,根据车牌字符串的结构特征找到其它字符。特殊车牌图像,要对字符和字符、字符和边界粘连的情况进行分裂,对部分字符进行合并。而且本方法还可以对定位出现车牌字符丢失情况进行重新定位,找到丢掉的字符。对大量车牌图像字符的分割,试验结果证明,该方法能够达到准确分割出车牌图像中字符的目的。 展开更多
关键词 字符分割 汉字结构
下载PDF
北京大学现代汉语语料库基本加工规范(续) 被引量:18
18
作者 俞士汶 段慧明 +1 位作者 朱学锋 孙斌 《中文信息学报》 CSCD 北大核心 2002年第6期58-65,共8页
北京大学计算语言学研究所已经完成了一个有 2 70 0万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外 ,还包括专有名词 (人名、地名、团体机构名称等 )标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规... 北京大学计算语言学研究所已经完成了一个有 2 70 0万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外 ,还包括专有名词 (人名、地名、团体机构名称等 )标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规模语言工程的顺利完成得益于事先制订并不断完善的规范。发表《北京大学现代汉语语料库基本加工规范》是为了抛砖引玉 ,更广泛地向专家、同行征询意见 ,以便进一步修订。 展开更多
关键词 北京大学 现代汉语语料库 加工规范 词语切分 词性标注 名词标注 汉字处理系统
下载PDF
基于多知识源的中文词法分析系统 被引量:29
19
作者 姜维 王晓龙 +1 位作者 关毅 赵健 《计算机学报》 EI CSCD 北大核心 2007年第1期137-145,共9页
汉语词法分析是中文自然语言处理的首要任务.文中深入研究中文分词、词性标注、命名实体识别所面临的问题及相互之间的协作关系,并阐述了一个基于混合语言模型构建的实用汉语词法分析系统.该系统采用了多种语言模型,有针对性地处理词法... 汉语词法分析是中文自然语言处理的首要任务.文中深入研究中文分词、词性标注、命名实体识别所面临的问题及相互之间的协作关系,并阐述了一个基于混合语言模型构建的实用汉语词法分析系统.该系统采用了多种语言模型,有针对性地处理词法分析所面临的各个问题.其中分词系统参加了2005年第二届国际汉语分词评测,在微软亚洲研究院、北京大学语料库开放测试中,分别获得F量度为97.2%与96.7%.而在北京大学标注的《人民日报》语料库的开放评测中,词性标注获得96.1%的精确率,命名实体识别获得的F量度值为88.6%. 展开更多
关键词 词法分析 汉语分词 词性标注 命名实体识别 语言模型
下载PDF
语料库词性标注一致性检查方法研究 被引量:9
20
作者 张虎 郑家恒 刘江 《中文信息学报》 CSCD 北大核心 2004年第5期11-16,共6页
在对大规模语料库进行深加工时 ,保证词性标注的一致性已成为建设高质量语料库的首要问题。本文提出了基于聚类和分类的语料库词性标注一致性检查的新方法 ,该方法避开了以前一贯采用的规则或统计的方法 ,利用聚类和分类的思想 ,对范例... 在对大规模语料库进行深加工时 ,保证词性标注的一致性已成为建设高质量语料库的首要问题。本文提出了基于聚类和分类的语料库词性标注一致性检查的新方法 ,该方法避开了以前一贯采用的规则或统计的方法 ,利用聚类和分类的思想 ,对范例进行聚类并求出阈值 ,对测试数据分类来确定其标注的正误 ,进而得出每篇文章的词性标注一致性情况 。 展开更多
关键词 计算机应用 中文信息处理 词性标注一致性 兼类词 聚类
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部