期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
中文术语社区变体的差异类型与互通度
1
作者 刘锐 贺志军 黄行 《语言文字应用》 CSSCI 北大核心 2024年第3期82-92,共11页
中文术语的社区变体指不同华语社区中使用的、所指概念相同但形式有差异的术语。术语变体的差异分析是促进术语融合发展的基础。本文结合术语学和语言学理论,构建了一个术语差异分类体系。通过借鉴编辑距离理论,提出了改进的编辑操作,... 中文术语的社区变体指不同华语社区中使用的、所指概念相同但形式有差异的术语。术语变体的差异分析是促进术语融合发展的基础。本文结合术语学和语言学理论,构建了一个术语差异分类体系。通过借鉴编辑距离理论,提出了改进的编辑操作,用于分析术语差异的内部构成,并在此基础上将社区变体的互通度分为“高、中、低”三层,探讨了互通度与差异类型之间的关系,构建了基于互通度的术语分析框架。 展开更多
关键词 中文术语 术语变体 社区变体 差异分析 互通度
下载PDF
基于多策略融合的中文术语抽取方法 被引量:28
2
作者 周浪 史树敏 +1 位作者 冯冲 黄河燕 《情报学报》 CSSCI 北大核心 2010年第3期460-467,共8页
中文术语抽取是信息抽取、文本挖掘以及知识获取等信息处理任务中的关键技术。相对于单词型术语,词组型术语的识别过程要更加复杂。由于短语中引入了大量非名词性词汇,随之产生了更多种的噪声数据,不仅需要判断短语结构是否完整,还要考... 中文术语抽取是信息抽取、文本挖掘以及知识获取等信息处理任务中的关键技术。相对于单词型术语,词组型术语的识别过程要更加复杂。由于短语中引入了大量非名词性词汇,随之产生了更多种的噪声数据,不仅需要判断短语结构是否完整,还要考虑短语内部词汇的搭配合理性、衡量短语中所负载领域信息量等问题。文中将词组型术语抽取过程中遇到的这三个问题作为切入点,分别使用子串归并、搭配检验和领域相关度计算技术来解决这三个问题,分析词组型术语自身的结构特征以及其在语料中的分布特征,完善词组型术语的抽取任务。实验证实了该方法能够有效提升低频术语和基础术语的排序位置,从而改善了中文词组型术语抽取系统的性能。 展开更多
关键词 中文术语抽取 语言规则获取 子串归并 搭配检验 词语活跃度 领域相关度
下载PDF
基于隐马尔科夫模型的中文术语识别研究 被引量:37
3
作者 岑咏华 韩哲 季培培 《现代图书情报技术》 CSSCI 北大核心 2008年第12期54-58,共5页
基于对中文文本信息语法构成尤其是词性搭配的概率特征的分析,提出一种基于双层隐马尔科夫模型的中文泛术语识别和提取的思路和系统框架,并实现相关系统,基于训练语料对多个领域的文本信息进行术语提取测试。实验结果表明,所提出的基于... 基于对中文文本信息语法构成尤其是词性搭配的概率特征的分析,提出一种基于双层隐马尔科夫模型的中文泛术语识别和提取的思路和系统框架,并实现相关系统,基于训练语料对多个领域的文本信息进行术语提取测试。实验结果表明,所提出的基于隐马尔科夫模型的中文泛术语识别和提取思想具有较好的实践参考意义。 展开更多
关键词 中文术语识别和提取 隐马尔科夫 HMM
下载PDF
一种基于统计技术的中文术语抽取方法 被引量:15
4
作者 刘剑 唐慧丰 刘伍颖 《中国科技术语》 2014年第5期10-14,共5页
中文术语识别与抽取是中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。文章以互信息和信息熵理论为基础,提出一种基于统计技术的中文术语半自动抽取方法,并且以互... 中文术语识别与抽取是中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。文章以互信息和信息熵理论为基础,提出一种基于统计技术的中文术语半自动抽取方法,并且以互联网新闻话题数据为对象进行了实验验证,结果表明所提方法能够有效支持中文术语的抽取。 展开更多
关键词 互信息 信息熵 中文术语抽取
下载PDF
基于AJAX技术的中文术语抽取系统的设计与实现
5
作者 张昭楠 《电子设计工程》 2016年第18期44-46,共3页
文中从用户需求的角度出发确定并设计实现了基于AJAX技术的中文术语抽取技术,在用户角度层面上将系统飞卫3个相互联系的子系统,即中文术语抽取、中文定义抽取和基于用户反馈的自学习系统,并且对3个子系统的功能和任务进行了划分。本文... 文中从用户需求的角度出发确定并设计实现了基于AJAX技术的中文术语抽取技术,在用户角度层面上将系统飞卫3个相互联系的子系统,即中文术语抽取、中文定义抽取和基于用户反馈的自学习系统,并且对3个子系统的功能和任务进行了划分。本文还采用两种语料分别对中文术语定义抽取系统和中文术语抽取系统进行了一定的测试,测试结果表明系统的准确性相较于之前的系统提升了40%,达到了63.75%,召回率可以达到78.84%,并且在人性化和人机交互等方面都去了很大的创新和改进。 展开更多
关键词 AJAX技术 中文术语抽取 系统设计 系统测试
下载PDF
中文医学术语集在真实世界临床研究中的应用
6
作者 张睿 李蕾 +1 位作者 王丽 吕庆国 《中国数字医学》 2024年第8期86-95,共10页
目的:通过分析国内外医学术语集的应用进展,拓展中文临床术语集在中文电子病历环境下的科研应用场景及范围。方法:检索四川大学数字图书馆出版物,通过文献回顾进行分析归纳。结果:中文医学术语集对电子病历概念识别和数据挖掘具有重要作... 目的:通过分析国内外医学术语集的应用进展,拓展中文临床术语集在中文电子病历环境下的科研应用场景及范围。方法:检索四川大学数字图书馆出版物,通过文献回顾进行分析归纳。结果:中文医学术语集对电子病历概念识别和数据挖掘具有重要作用,有助于语义互操作。基于语义网及语义知识库,可以更深入地进行多种风险预测模型、语义相似度计算和推理性决策支持系统的研究。结论:中文医学术语集是基础性的信息化标准,可支撑多种临床智慧应用构建,建议纳入医学教育。 展开更多
关键词 中文医学术语 真实世界临床研究 数据挖掘 临床决策支持系统 本体论
下载PDF
面向本体学习的中文专利术语抽取研究 被引量:18
7
作者 王昊 王密平 苏新宁 《情报学报》 CSSCI 北大核心 2016年第6期573-585,共13页
本文提出了一个无或少训练语料环境下抽取中文专利术语的解决方案。以"钢铁冶金"领域专利文本为例,首先总结了该领域中文术语的基本特征,进而建立了基于字角色标注的机器学习术语识别模型,并通过循环迭代方式重复条件随机场... 本文提出了一个无或少训练语料环境下抽取中文专利术语的解决方案。以"钢铁冶金"领域专利文本为例,首先总结了该领域中文术语的基本特征,进而建立了基于字角色标注的机器学习术语识别模型,并通过循环迭代方式重复条件随机场的学习过程,最大限度避免因核心词汇库代替人工带来的标注不准确不充分问题;在此基础上,进一步依据合成规则构造新术语,并经过领域专家确认后添加至核心词汇库中。经过实验论证,基于字角色标注的基本术语抽取F1值高于94%,而基于合成规则的复杂术语抽取准确率也可达到75%。在7597件专利的题名和摘要文本中,最终可获得中文基本术语244672个,合成术语61536个,为领域本体的构建奠定了基础。 展开更多
关键词 中文专利术语 机器学习 条件随机场 字角色标注 循环迭代 合成规则 本体学习
下载PDF
中文专利术语层次关系解析研究 被引量:7
8
作者 吴志祥 王昊 王密平 《情报学报》 CSSCI CSCD 北大核心 2017年第4期401-410,共10页
对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体... 对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体。着重研究了基于位置加权的术语语义空间构建方法,基于主成分分析降维技术进行术语分布可视化以辅助聚类类目的确定方法以及术语层次关系结构中非重复性类目标签的抽取方法。本文工作尽可能实现了较大规模中文专利术语层次关系解析的自动化进行,为术语非层次关系解析以及基于术语语义关系解析的深入应用打下基础。 展开更多
关键词 中文专利术语 位置加权 PCA降维 类目标签抽取 术语层次关系 本体学习
下载PDF
中文临床医学术语系统分类框架设计原则与构建思路 被引量:8
9
作者 冀玉静 孙海霞 +3 位作者 邓盼盼 任慧玲 沈柳 李军莲 《中华医学图书情报杂志》 CAS 2018年第11期27-32,共6页
建立具有中国特色和自主知识产权的中文临床医学术语系统,对实现临床电子病历信息标准化及卫生管理、医保支付等不同系统间信息的交互利用具有重要意义。论述了中文临床医学术语系统的分类框架设计原则和顶层概念类的构建思路,深入地为... 建立具有中国特色和自主知识产权的中文临床医学术语系统,对实现临床电子病历信息标准化及卫生管理、医保支付等不同系统间信息的交互利用具有重要意义。论述了中文临床医学术语系统的分类框架设计原则和顶层概念类的构建思路,深入地为进一步全面构建中文临床医学术语系统奠定基础。 展开更多
关键词 中文临床医学术语系统 分类框架 概念体系 构建思路 设计原则
下载PDF
国际音标中文术语表
10
《南开语言学刊》 CSSCI 2008年第1期162-163,共2页
关键词 国际音标 中文术语 唇齿音 语音学 商务印书馆 小舌音 开元音 罗常培 塞音 附加符号
原文传递
基于Bert的中文法律术语角色识别 被引量:1
11
作者 马文博 白宇 张桂平 《信息与电脑》 2020年第11期69-73,共5页
针对法律术语角色识别问题,笔者提出了一种基于BERT预训练语言模型的方法进行法律术语角色识别,并制定了标注规范。由于BERT预训练语言模型本身含有丰富的语义特征,可以一定程度上解决训练语料不足的问题,所以首先通过BERT预训练模型将... 针对法律术语角色识别问题,笔者提出了一种基于BERT预训练语言模型的方法进行法律术语角色识别,并制定了标注规范。由于BERT预训练语言模型本身含有丰富的语义特征,可以一定程度上解决训练语料不足的问题,所以首先通过BERT预训练模型将字向量送入下游任务中,再通过BiLSTM-CRF进行法律术语角色识别。实验结果表明,笔者提出的方法要优于对照组模型,具有重要的现实意义。 展开更多
关键词 命名实体识别 BERT预训练语言模型 BiLSTM-CRF 中文法律术语角色识别
下载PDF
浅谈译者主体性问题——以部分中文政治术语的日译为中心
12
作者 何云竹 《佳木斯职业学院学报》 2021年第4期76-77,共2页
随着我国综合实力的提高,一部分我国常用政治术语的日语翻译也在悄然发生着变化。但在译者的主体性问题上,照顾受众和提高本国对外语言影响力是对立统一的矛盾关系,需要具体问题具体分析,灵活处理。基于此,本文以部分中文政治术语的日... 随着我国综合实力的提高,一部分我国常用政治术语的日语翻译也在悄然发生着变化。但在译者的主体性问题上,照顾受众和提高本国对外语言影响力是对立统一的矛盾关系,需要具体问题具体分析,灵活处理。基于此,本文以部分中文政治术语的日译为中心探析了译者主体性问题,以供参考。 展开更多
关键词 主体性 日语翻译 中文政治术语
下载PDF
中文“旅游”一词产生及其对应概念的变迁 被引量:2
13
作者 史甜甜 保继刚 《旅游科学》 CSSCI 北大核心 2015年第6期81-91,共11页
本文以术语学符号和概念的关系为基础,通过对历史资料的解读,探究中文"旅游"一词的产生及对应概念变迁。研究发现:从时间维度看,"旅游"这一双音词最早出现在民国,其出现与民国时期旅行社业和相关出版物发展以及中... 本文以术语学符号和概念的关系为基础,通过对历史资料的解读,探究中文"旅游"一词的产生及对应概念变迁。研究发现:从时间维度看,"旅游"这一双音词最早出现在民国,其出现与民国时期旅行社业和相关出版物发展以及中国传统游历文化有关;从空间维度看,"旅游"不是舶来词,并非从tourism直接翻译而来。最初"旅游"一词对应单一概念,指"旅行游览"。随后,"旅游"一词对应概念出现多元变化:除"旅行游览(历)"这一概念外,又增加了"经济维度"和"整体性"的对应概念;"旅游"对应概念多元变化,很大程度上受到特定的社会历史背景及研究实践的影响。本文认为,应根据不同的语言环境使用与"旅游"同义的替代性单义术语,以减少其对应概念的含混。 展开更多
关键词 中文术语 旅游 产生 词语 概念变迁
下载PDF
一种基于Web的术语翻译获取及验证方法 被引量:3
14
作者 张晶 曹存根 王石 《计算机科学》 CSCD 北大核心 2012年第7期170-174,共5页
中文术语及未登录词的翻译是机器翻译、跨语言检索中的一个重要问题,这些翻译很难从现有的词典中获取。提出了一种通过搜索引擎从网页中自动获取中文术语英文翻译的方法。通过术语的部分翻译信息,构造出3种查询项模式,提出了多特征的翻... 中文术语及未登录词的翻译是机器翻译、跨语言检索中的一个重要问题,这些翻译很难从现有的词典中获取。提出了一种通过搜索引擎从网页中自动获取中文术语英文翻译的方法。通过术语的部分翻译信息,构造出3种查询项模式,提出了多特征的翻译抽取方法。针对传统方法结果准确率不高、候选翻译干扰项多的问题,提出端类比对齐验证、双语对齐度验证、构词法验证3种验证模型来对候选翻译进行有效验证。实验结果表明,获取的双语翻译对准确率高,TOP1的准确率达到97.4%,TOP3的准确率达到98.3%。 展开更多
关键词 中文术语 网络挖掘 术语翻译 信息检索
下载PDF
准确翻译专业名词和术语的重要性日益显现
15
作者 殷康 《世界电信》 2006年第11期3-6,共4页
首先概括性地描述了我国电信和网络技术领域所面临的一个愈来愈大的挑战,即专业名词和术语如何正确翻译、推广和使用,分析指出了此方面问题的根源及其严重性,并特别列举数例分析专业名词和术语翻译缺乏严肃性带来的不良影响和危害。最后... 首先概括性地描述了我国电信和网络技术领域所面临的一个愈来愈大的挑战,即专业名词和术语如何正确翻译、推广和使用,分析指出了此方面问题的根源及其严重性,并特别列举数例分析专业名词和术语翻译缺乏严肃性带来的不良影响和危害。最后,基于思考和分析,提出了若干改善和规范我国专业名词和术语翻译工作的建议。 展开更多
关键词 电信 网络技术 专业名词 中文术语 译文规范 标准 程序 翻译
下载PDF
基于CRFs的专利文献领域术语抽取方法 被引量:11
16
作者 王健 殷旭 +1 位作者 吕学强 徐丽萍 《计算机工程与设计》 北大核心 2019年第1期279-284,共6页
通过对新能源汽车领域中文专利文献中术语特点的分析,提出利用条件随机场模型,分别基于三词位、四词位和六词位的字序列标注进行术语抽取的方法。以字为切分粒度,避免在术语抽取过程中因分词原因导致术语识别错误问题,并探讨不同词位标... 通过对新能源汽车领域中文专利文献中术语特点的分析,提出利用条件随机场模型,分别基于三词位、四词位和六词位的字序列标注进行术语抽取的方法。以字为切分粒度,避免在术语抽取过程中因分词原因导致术语识别错误问题,并探讨不同词位标注集对术语抽取性能的影响。实验结果表明,基于六词位字标注的条件随机场模型术语抽取的性能最好,准确率、召回率和F值优于对比方法中基于词、词性、词长等信息作为特征的抽取方法,验证了所提方法的有效性。 展开更多
关键词 中文专利术语 术语抽取 条件随机场 序列标注 新能源汽车领域
下载PDF
文本特征和复合统计量的领域术语抽取方法 被引量:7
17
作者 董洋溢 李伟华 于会 《西北工业大学学报》 EI CAS CSCD 北大核心 2017年第4期729-735,共7页
中文领域术语的抽取,是文本知识挖掘的重要内容。传统的中文领域术语抽取方法以人工方法为主,显然这种方法费时费力。目前,处于研究阶段的中文领域术语自动化抽取方法主要有:基于字典的方法、基于规则的方法以及基于统计的方法。但由于... 中文领域术语的抽取,是文本知识挖掘的重要内容。传统的中文领域术语抽取方法以人工方法为主,显然这种方法费时费力。目前,处于研究阶段的中文领域术语自动化抽取方法主要有:基于字典的方法、基于规则的方法以及基于统计的方法。但由于中文自然语言的复杂性,这些自动化抽取方法都存在一定的局限性,比如对特定领域的用户字典及规则存在更新速度慢、文本特征考虑不足等,从而导致抽取的效果不佳。针对这一问题,提出了一种基于文本特征和复合统计量的中文领域术语抽取方法,该方法在对中文文档中的词语进行粗粒度筛选后,再综合考虑候选术语的词性、长度、边界词语等文本特征,构造出信息熵和TFIDF等统计量,计算其综合权值,并将综合权值大于设定阈值的候选术语抽取出来,作为最终的领域术语。实验结果表明,该方法在测试语料下,获得了较好的正确率、召回率和F值。 展开更多
关键词 中文领域术语 文本挖掘 自然语言处理 文本特征
下载PDF
晚清的科学术语翻译——以傅兰雅为视点
18
作者 王红霞 《福建论坛(社科教育版)》 2009年第2期104-106,共3页
文章以傅兰雅(John Fryer)为研究视点,通过解读他所发表的关于科学翻译和中文术语的文章,结合他在江南制造局的翻译成果,分析了他对科学术语翻译问题的看法,介绍了他和中文笔述者一起确定的建立中文科学术语的规则和方法,并考察了益智... 文章以傅兰雅(John Fryer)为研究视点,通过解读他所发表的关于科学翻译和中文术语的文章,结合他在江南制造局的翻译成果,分析了他对科学术语翻译问题的看法,介绍了他和中文笔述者一起确定的建立中文科学术语的规则和方法,并考察了益智书会以傅兰雅的工作为基础进行的统一中文科学术语的工作。 展开更多
关键词 傅兰雅 科学翻译 中文术语
下载PDF
郑贞文与中文化学命名 被引量:3
19
作者 张澔 《科技术语研究》 2006年第3期61-64,共4页
20世纪中文化学名词发展过程中,郑贞文是贡献最多的其中一位,在无机化学命名方面,影响最深远。在有机化学名词上,用天干符号来表示有机化合物中的碳数目也是由他提出的。中文化学名词规范化的成果——1933年出版的《化学命名原则》,他... 20世纪中文化学名词发展过程中,郑贞文是贡献最多的其中一位,在无机化学命名方面,影响最深远。在有机化学名词上,用天干符号来表示有机化合物中的碳数目也是由他提出的。中文化学名词规范化的成果——1933年出版的《化学命名原则》,他是重要整理者之一。 展开更多
关键词 郑贞文 化学 命名 中文术语
下载PDF
质量管理和质量保证术语管理系统(一) 被引量:1
20
作者 肖玉敬 《术语标准化与信息技术》 1998年第1期19-21,共3页
质量管理和质量保证术语管理系统(一)肖玉敬编译编者按:术语标准化是标准化的重要基础性工作,面向专业领域的术语标准化的研究是当前国际术语学发展的重要趋势之一。质量管理和质量保证术语管理系统是由国际标准化组织第176技术... 质量管理和质量保证术语管理系统(一)肖玉敬编译编者按:术语标准化是标准化的重要基础性工作,面向专业领域的术语标准化的研究是当前国际术语学发展的重要趋势之一。质量管理和质量保证术语管理系统是由国际标准化组织第176技术委员会(质量管理和质量保证)的第一... 展开更多
关键词 质量管理和质量保证 术语管理系统 中文术语 英文术语 中文定义 验收抽样 可接收质量水平 准确度 术语标准化 接收常数
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部