期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
64
篇文章
<
1
2
…
4
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文术语社区变体的差异类型与互通度
1
作者
刘锐
贺志军
黄行
《语言文字应用》
CSSCI
北大核心
2024年第3期82-92,共11页
中文术语的社区变体指不同华语社区中使用的、所指概念相同但形式有差异的术语。术语变体的差异分析是促进术语融合发展的基础。本文结合术语学和语言学理论,构建了一个术语差异分类体系。通过借鉴编辑距离理论,提出了改进的编辑操作,...
中文术语的社区变体指不同华语社区中使用的、所指概念相同但形式有差异的术语。术语变体的差异分析是促进术语融合发展的基础。本文结合术语学和语言学理论,构建了一个术语差异分类体系。通过借鉴编辑距离理论,提出了改进的编辑操作,用于分析术语差异的内部构成,并在此基础上将社区变体的互通度分为“高、中、低”三层,探讨了互通度与差异类型之间的关系,构建了基于互通度的术语分析框架。
展开更多
关键词
中文术语
术语
变体
社区变体
差异分析
互通度
下载PDF
职称材料
基于多策略融合的中文术语抽取方法
被引量:
28
2
作者
周浪
史树敏
+1 位作者
冯冲
黄河燕
《情报学报》
CSSCI
北大核心
2010年第3期460-467,共8页
中文术语抽取是信息抽取、文本挖掘以及知识获取等信息处理任务中的关键技术。相对于单词型术语,词组型术语的识别过程要更加复杂。由于短语中引入了大量非名词性词汇,随之产生了更多种的噪声数据,不仅需要判断短语结构是否完整,还要考...
中文术语抽取是信息抽取、文本挖掘以及知识获取等信息处理任务中的关键技术。相对于单词型术语,词组型术语的识别过程要更加复杂。由于短语中引入了大量非名词性词汇,随之产生了更多种的噪声数据,不仅需要判断短语结构是否完整,还要考虑短语内部词汇的搭配合理性、衡量短语中所负载领域信息量等问题。文中将词组型术语抽取过程中遇到的这三个问题作为切入点,分别使用子串归并、搭配检验和领域相关度计算技术来解决这三个问题,分析词组型术语自身的结构特征以及其在语料中的分布特征,完善词组型术语的抽取任务。实验证实了该方法能够有效提升低频术语和基础术语的排序位置,从而改善了中文词组型术语抽取系统的性能。
展开更多
关键词
中文术语
抽取
语言规则获取
子串归并
搭配检验
词语活跃度
领域相关度
下载PDF
职称材料
基于隐马尔科夫模型的中文术语识别研究
被引量:
37
3
作者
岑咏华
韩哲
季培培
《现代图书情报技术》
CSSCI
北大核心
2008年第12期54-58,共5页
基于对中文文本信息语法构成尤其是词性搭配的概率特征的分析,提出一种基于双层隐马尔科夫模型的中文泛术语识别和提取的思路和系统框架,并实现相关系统,基于训练语料对多个领域的文本信息进行术语提取测试。实验结果表明,所提出的基于...
基于对中文文本信息语法构成尤其是词性搭配的概率特征的分析,提出一种基于双层隐马尔科夫模型的中文泛术语识别和提取的思路和系统框架,并实现相关系统,基于训练语料对多个领域的文本信息进行术语提取测试。实验结果表明,所提出的基于隐马尔科夫模型的中文泛术语识别和提取思想具有较好的实践参考意义。
展开更多
关键词
中文术语
识别和提取
隐马尔科夫
HMM
下载PDF
职称材料
一种基于统计技术的中文术语抽取方法
被引量:
15
4
作者
刘剑
唐慧丰
刘伍颖
《中国科技术语》
2014年第5期10-14,共5页
中文术语识别与抽取是中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。文章以互信息和信息熵理论为基础,提出一种基于统计技术的中文术语半自动抽取方法,并且以互...
中文术语识别与抽取是中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。文章以互信息和信息熵理论为基础,提出一种基于统计技术的中文术语半自动抽取方法,并且以互联网新闻话题数据为对象进行了实验验证,结果表明所提方法能够有效支持中文术语的抽取。
展开更多
关键词
互信息
信息熵
中文术语
抽取
下载PDF
职称材料
基于AJAX技术的中文术语抽取系统的设计与实现
5
作者
张昭楠
《电子设计工程》
2016年第18期44-46,共3页
文中从用户需求的角度出发确定并设计实现了基于AJAX技术的中文术语抽取技术,在用户角度层面上将系统飞卫3个相互联系的子系统,即中文术语抽取、中文定义抽取和基于用户反馈的自学习系统,并且对3个子系统的功能和任务进行了划分。本文...
文中从用户需求的角度出发确定并设计实现了基于AJAX技术的中文术语抽取技术,在用户角度层面上将系统飞卫3个相互联系的子系统,即中文术语抽取、中文定义抽取和基于用户反馈的自学习系统,并且对3个子系统的功能和任务进行了划分。本文还采用两种语料分别对中文术语定义抽取系统和中文术语抽取系统进行了一定的测试,测试结果表明系统的准确性相较于之前的系统提升了40%,达到了63.75%,召回率可以达到78.84%,并且在人性化和人机交互等方面都去了很大的创新和改进。
展开更多
关键词
AJAX技术
中文术语
抽取
系统设计
系统测试
下载PDF
职称材料
中文医学术语集在真实世界临床研究中的应用
6
作者
张睿
李蕾
+1 位作者
王丽
吕庆国
《中国数字医学》
2024年第8期86-95,共10页
目的:通过分析国内外医学术语集的应用进展,拓展中文临床术语集在中文电子病历环境下的科研应用场景及范围。方法:检索四川大学数字图书馆出版物,通过文献回顾进行分析归纳。结果:中文医学术语集对电子病历概念识别和数据挖掘具有重要作...
目的:通过分析国内外医学术语集的应用进展,拓展中文临床术语集在中文电子病历环境下的科研应用场景及范围。方法:检索四川大学数字图书馆出版物,通过文献回顾进行分析归纳。结果:中文医学术语集对电子病历概念识别和数据挖掘具有重要作用,有助于语义互操作。基于语义网及语义知识库,可以更深入地进行多种风险预测模型、语义相似度计算和推理性决策支持系统的研究。结论:中文医学术语集是基础性的信息化标准,可支撑多种临床智慧应用构建,建议纳入医学教育。
展开更多
关键词
中文
医学
术语
集
真实世界临床研究
数据挖掘
临床决策支持系统
本体论
下载PDF
职称材料
面向本体学习的中文专利术语抽取研究
被引量:
18
7
作者
王昊
王密平
苏新宁
《情报学报》
CSSCI
北大核心
2016年第6期573-585,共13页
本文提出了一个无或少训练语料环境下抽取中文专利术语的解决方案。以"钢铁冶金"领域专利文本为例,首先总结了该领域中文术语的基本特征,进而建立了基于字角色标注的机器学习术语识别模型,并通过循环迭代方式重复条件随机场...
本文提出了一个无或少训练语料环境下抽取中文专利术语的解决方案。以"钢铁冶金"领域专利文本为例,首先总结了该领域中文术语的基本特征,进而建立了基于字角色标注的机器学习术语识别模型,并通过循环迭代方式重复条件随机场的学习过程,最大限度避免因核心词汇库代替人工带来的标注不准确不充分问题;在此基础上,进一步依据合成规则构造新术语,并经过领域专家确认后添加至核心词汇库中。经过实验论证,基于字角色标注的基本术语抽取F1值高于94%,而基于合成规则的复杂术语抽取准确率也可达到75%。在7597件专利的题名和摘要文本中,最终可获得中文基本术语244672个,合成术语61536个,为领域本体的构建奠定了基础。
展开更多
关键词
中文
专利
术语
机器学习
条件随机场
字角色标注
循环迭代
合成规则
本体学习
下载PDF
职称材料
中文专利术语层次关系解析研究
被引量:
7
8
作者
吴志祥
王昊
王密平
《情报学报》
CSSCI
CSCD
北大核心
2017年第4期401-410,共10页
对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体...
对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体。着重研究了基于位置加权的术语语义空间构建方法,基于主成分分析降维技术进行术语分布可视化以辅助聚类类目的确定方法以及术语层次关系结构中非重复性类目标签的抽取方法。本文工作尽可能实现了较大规模中文专利术语层次关系解析的自动化进行,为术语非层次关系解析以及基于术语语义关系解析的深入应用打下基础。
展开更多
关键词
中文
专利
术语
位置加权
PCA降维
类目标签抽取
术语
层次关系
本体学习
下载PDF
职称材料
中文临床医学术语系统分类框架设计原则与构建思路
被引量:
8
9
作者
冀玉静
孙海霞
+3 位作者
邓盼盼
任慧玲
沈柳
李军莲
《中华医学图书情报杂志》
CAS
2018年第11期27-32,共6页
建立具有中国特色和自主知识产权的中文临床医学术语系统,对实现临床电子病历信息标准化及卫生管理、医保支付等不同系统间信息的交互利用具有重要意义。论述了中文临床医学术语系统的分类框架设计原则和顶层概念类的构建思路,深入地为...
建立具有中国特色和自主知识产权的中文临床医学术语系统,对实现临床电子病历信息标准化及卫生管理、医保支付等不同系统间信息的交互利用具有重要意义。论述了中文临床医学术语系统的分类框架设计原则和顶层概念类的构建思路,深入地为进一步全面构建中文临床医学术语系统奠定基础。
展开更多
关键词
中文
临床医学
术语
系统
分类框架
概念体系
构建思路
设计原则
下载PDF
职称材料
国际音标中文术语表
10
《南开语言学刊》
CSSCI
2008年第1期162-163,共2页
关键词
国际音标
中文术语
唇齿音
语音学
商务印书馆
小舌音
开元音
罗常培
塞音
附加符号
原文传递
基于Bert的中文法律术语角色识别
被引量:
1
11
作者
马文博
白宇
张桂平
《信息与电脑》
2020年第11期69-73,共5页
针对法律术语角色识别问题,笔者提出了一种基于BERT预训练语言模型的方法进行法律术语角色识别,并制定了标注规范。由于BERT预训练语言模型本身含有丰富的语义特征,可以一定程度上解决训练语料不足的问题,所以首先通过BERT预训练模型将...
针对法律术语角色识别问题,笔者提出了一种基于BERT预训练语言模型的方法进行法律术语角色识别,并制定了标注规范。由于BERT预训练语言模型本身含有丰富的语义特征,可以一定程度上解决训练语料不足的问题,所以首先通过BERT预训练模型将字向量送入下游任务中,再通过BiLSTM-CRF进行法律术语角色识别。实验结果表明,笔者提出的方法要优于对照组模型,具有重要的现实意义。
展开更多
关键词
命名实体识别
BERT预训练语言模型
BiLSTM-CRF
中文
法律
术语
角色识别
下载PDF
职称材料
浅谈译者主体性问题——以部分中文政治术语的日译为中心
12
作者
何云竹
《佳木斯职业学院学报》
2021年第4期76-77,共2页
随着我国综合实力的提高,一部分我国常用政治术语的日语翻译也在悄然发生着变化。但在译者的主体性问题上,照顾受众和提高本国对外语言影响力是对立统一的矛盾关系,需要具体问题具体分析,灵活处理。基于此,本文以部分中文政治术语的日...
随着我国综合实力的提高,一部分我国常用政治术语的日语翻译也在悄然发生着变化。但在译者的主体性问题上,照顾受众和提高本国对外语言影响力是对立统一的矛盾关系,需要具体问题具体分析,灵活处理。基于此,本文以部分中文政治术语的日译为中心探析了译者主体性问题,以供参考。
展开更多
关键词
主体性
日语翻译
中文
政治
术语
下载PDF
职称材料
中文“旅游”一词产生及其对应概念的变迁
被引量:
2
13
作者
史甜甜
保继刚
《旅游科学》
CSSCI
北大核心
2015年第6期81-91,共11页
本文以术语学符号和概念的关系为基础,通过对历史资料的解读,探究中文"旅游"一词的产生及对应概念变迁。研究发现:从时间维度看,"旅游"这一双音词最早出现在民国,其出现与民国时期旅行社业和相关出版物发展以及中...
本文以术语学符号和概念的关系为基础,通过对历史资料的解读,探究中文"旅游"一词的产生及对应概念变迁。研究发现:从时间维度看,"旅游"这一双音词最早出现在民国,其出现与民国时期旅行社业和相关出版物发展以及中国传统游历文化有关;从空间维度看,"旅游"不是舶来词,并非从tourism直接翻译而来。最初"旅游"一词对应单一概念,指"旅行游览"。随后,"旅游"一词对应概念出现多元变化:除"旅行游览(历)"这一概念外,又增加了"经济维度"和"整体性"的对应概念;"旅游"对应概念多元变化,很大程度上受到特定的社会历史背景及研究实践的影响。本文认为,应根据不同的语言环境使用与"旅游"同义的替代性单义术语,以减少其对应概念的含混。
展开更多
关键词
中文术语
旅游
产生
词语
概念变迁
下载PDF
职称材料
一种基于Web的术语翻译获取及验证方法
被引量:
3
14
作者
张晶
曹存根
王石
《计算机科学》
CSCD
北大核心
2012年第7期170-174,共5页
中文术语及未登录词的翻译是机器翻译、跨语言检索中的一个重要问题,这些翻译很难从现有的词典中获取。提出了一种通过搜索引擎从网页中自动获取中文术语英文翻译的方法。通过术语的部分翻译信息,构造出3种查询项模式,提出了多特征的翻...
中文术语及未登录词的翻译是机器翻译、跨语言检索中的一个重要问题,这些翻译很难从现有的词典中获取。提出了一种通过搜索引擎从网页中自动获取中文术语英文翻译的方法。通过术语的部分翻译信息,构造出3种查询项模式,提出了多特征的翻译抽取方法。针对传统方法结果准确率不高、候选翻译干扰项多的问题,提出端类比对齐验证、双语对齐度验证、构词法验证3种验证模型来对候选翻译进行有效验证。实验结果表明,获取的双语翻译对准确率高,TOP1的准确率达到97.4%,TOP3的准确率达到98.3%。
展开更多
关键词
中文术语
网络挖掘
术语
翻译
信息检索
下载PDF
职称材料
准确翻译专业名词和术语的重要性日益显现
15
作者
殷康
《世界电信》
2006年第11期3-6,共4页
首先概括性地描述了我国电信和网络技术领域所面临的一个愈来愈大的挑战,即专业名词和术语如何正确翻译、推广和使用,分析指出了此方面问题的根源及其严重性,并特别列举数例分析专业名词和术语翻译缺乏严肃性带来的不良影响和危害。最后...
首先概括性地描述了我国电信和网络技术领域所面临的一个愈来愈大的挑战,即专业名词和术语如何正确翻译、推广和使用,分析指出了此方面问题的根源及其严重性,并特别列举数例分析专业名词和术语翻译缺乏严肃性带来的不良影响和危害。最后,基于思考和分析,提出了若干改善和规范我国专业名词和术语翻译工作的建议。
展开更多
关键词
电信
网络技术
专业名词
中文术语
译文规范
标准
程序
翻译
下载PDF
职称材料
基于CRFs的专利文献领域术语抽取方法
被引量:
11
16
作者
王健
殷旭
+1 位作者
吕学强
徐丽萍
《计算机工程与设计》
北大核心
2019年第1期279-284,共6页
通过对新能源汽车领域中文专利文献中术语特点的分析,提出利用条件随机场模型,分别基于三词位、四词位和六词位的字序列标注进行术语抽取的方法。以字为切分粒度,避免在术语抽取过程中因分词原因导致术语识别错误问题,并探讨不同词位标...
通过对新能源汽车领域中文专利文献中术语特点的分析,提出利用条件随机场模型,分别基于三词位、四词位和六词位的字序列标注进行术语抽取的方法。以字为切分粒度,避免在术语抽取过程中因分词原因导致术语识别错误问题,并探讨不同词位标注集对术语抽取性能的影响。实验结果表明,基于六词位字标注的条件随机场模型术语抽取的性能最好,准确率、召回率和F值优于对比方法中基于词、词性、词长等信息作为特征的抽取方法,验证了所提方法的有效性。
展开更多
关键词
中文
专利
术语
术语
抽取
条件随机场
序列标注
新能源汽车领域
下载PDF
职称材料
文本特征和复合统计量的领域术语抽取方法
被引量:
7
17
作者
董洋溢
李伟华
于会
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2017年第4期729-735,共7页
中文领域术语的抽取,是文本知识挖掘的重要内容。传统的中文领域术语抽取方法以人工方法为主,显然这种方法费时费力。目前,处于研究阶段的中文领域术语自动化抽取方法主要有:基于字典的方法、基于规则的方法以及基于统计的方法。但由于...
中文领域术语的抽取,是文本知识挖掘的重要内容。传统的中文领域术语抽取方法以人工方法为主,显然这种方法费时费力。目前,处于研究阶段的中文领域术语自动化抽取方法主要有:基于字典的方法、基于规则的方法以及基于统计的方法。但由于中文自然语言的复杂性,这些自动化抽取方法都存在一定的局限性,比如对特定领域的用户字典及规则存在更新速度慢、文本特征考虑不足等,从而导致抽取的效果不佳。针对这一问题,提出了一种基于文本特征和复合统计量的中文领域术语抽取方法,该方法在对中文文档中的词语进行粗粒度筛选后,再综合考虑候选术语的词性、长度、边界词语等文本特征,构造出信息熵和TFIDF等统计量,计算其综合权值,并将综合权值大于设定阈值的候选术语抽取出来,作为最终的领域术语。实验结果表明,该方法在测试语料下,获得了较好的正确率、召回率和F值。
展开更多
关键词
中文
领域
术语
文本挖掘
自然语言处理
文本特征
下载PDF
职称材料
晚清的科学术语翻译——以傅兰雅为视点
18
作者
王红霞
《福建论坛(社科教育版)》
2009年第2期104-106,共3页
文章以傅兰雅(John Fryer)为研究视点,通过解读他所发表的关于科学翻译和中文术语的文章,结合他在江南制造局的翻译成果,分析了他对科学术语翻译问题的看法,介绍了他和中文笔述者一起确定的建立中文科学术语的规则和方法,并考察了益智...
文章以傅兰雅(John Fryer)为研究视点,通过解读他所发表的关于科学翻译和中文术语的文章,结合他在江南制造局的翻译成果,分析了他对科学术语翻译问题的看法,介绍了他和中文笔述者一起确定的建立中文科学术语的规则和方法,并考察了益智书会以傅兰雅的工作为基础进行的统一中文科学术语的工作。
展开更多
关键词
傅兰雅
科学翻译
中文术语
下载PDF
职称材料
郑贞文与中文化学命名
被引量:
3
19
作者
张澔
《科技术语研究》
2006年第3期61-64,共4页
20世纪中文化学名词发展过程中,郑贞文是贡献最多的其中一位,在无机化学命名方面,影响最深远。在有机化学名词上,用天干符号来表示有机化合物中的碳数目也是由他提出的。中文化学名词规范化的成果——1933年出版的《化学命名原则》,他...
20世纪中文化学名词发展过程中,郑贞文是贡献最多的其中一位,在无机化学命名方面,影响最深远。在有机化学名词上,用天干符号来表示有机化合物中的碳数目也是由他提出的。中文化学名词规范化的成果——1933年出版的《化学命名原则》,他是重要整理者之一。
展开更多
关键词
郑贞文
化学
命名
中文术语
下载PDF
职称材料
质量管理和质量保证术语管理系统(一)
被引量:
1
20
作者
肖玉敬
《术语标准化与信息技术》
1998年第1期19-21,共3页
质量管理和质量保证术语管理系统(一)肖玉敬编译编者按:术语标准化是标准化的重要基础性工作,面向专业领域的术语标准化的研究是当前国际术语学发展的重要趋势之一。质量管理和质量保证术语管理系统是由国际标准化组织第176技术...
质量管理和质量保证术语管理系统(一)肖玉敬编译编者按:术语标准化是标准化的重要基础性工作,面向专业领域的术语标准化的研究是当前国际术语学发展的重要趋势之一。质量管理和质量保证术语管理系统是由国际标准化组织第176技术委员会(质量管理和质量保证)的第一...
展开更多
关键词
质量管理和质量保证
术语
管理系统
中文术语
英文
术语
中文
定义
验收抽样
可接收质量水平
准确度
术语
标准化
接收常数
下载PDF
职称材料
题名
中文术语社区变体的差异类型与互通度
1
作者
刘锐
贺志军
黄行
机构
北京师范大学文理学院中文系
北京师范大学珠海校区粤港澳术语政策研究基地
北京师范大学珠海校区语言科学研究中心
出处
《语言文字应用》
CSSCI
北大核心
2024年第3期82-92,共11页
基金
全国科学技术名词审定委员会2022年度重大委托项目(WT2022030)
广东省哲学社会科学规划项目(GD23XTQ01)
中央高校基本科研业务费专项资金(2233300005)资助。
文摘
中文术语的社区变体指不同华语社区中使用的、所指概念相同但形式有差异的术语。术语变体的差异分析是促进术语融合发展的基础。本文结合术语学和语言学理论,构建了一个术语差异分类体系。通过借鉴编辑距离理论,提出了改进的编辑操作,用于分析术语差异的内部构成,并在此基础上将社区变体的互通度分为“高、中、低”三层,探讨了互通度与差异类型之间的关系,构建了基于互通度的术语分析框架。
关键词
中文术语
术语
变体
社区变体
差异分析
互通度
Keywords
Chinese terminology
term variant
diatopic variation
difference analysis
mutual intelligibility
分类号
H136 [语言文字—汉语]
下载PDF
职称材料
题名
基于多策略融合的中文术语抽取方法
被引量:
28
2
作者
周浪
史树敏
冯冲
黄河燕
机构
南京理工大学计算机科学与技术学院
北京理工大学计算机学院
出处
《情报学报》
CSSCI
北大核心
2010年第3期460-467,共8页
基金
国家863高技术研究发展计划资助项目(2006AA01Z152)
国家自然科学基金资助项目(60672149)
文摘
中文术语抽取是信息抽取、文本挖掘以及知识获取等信息处理任务中的关键技术。相对于单词型术语,词组型术语的识别过程要更加复杂。由于短语中引入了大量非名词性词汇,随之产生了更多种的噪声数据,不仅需要判断短语结构是否完整,还要考虑短语内部词汇的搭配合理性、衡量短语中所负载领域信息量等问题。文中将词组型术语抽取过程中遇到的这三个问题作为切入点,分别使用子串归并、搭配检验和领域相关度计算技术来解决这三个问题,分析词组型术语自身的结构特征以及其在语料中的分布特征,完善词组型术语的抽取任务。实验证实了该方法能够有效提升低频术语和基础术语的排序位置,从而改善了中文词组型术语抽取系统的性能。
关键词
中文术语
抽取
语言规则获取
子串归并
搭配检验
词语活跃度
领域相关度
Keywords
Chinese term extraction
linguistical rules acquisition
substring reduction
collocation test
word active degree
domain relevant degree
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于隐马尔科夫模型的中文术语识别研究
被引量:
37
3
作者
岑咏华
韩哲
季培培
机构
南京理工大学经济管理学院
南京大学信息管理系
中国科学院国家科学图书馆
中国科学院研究生院
出处
《现代图书情报技术》
CSSCI
北大核心
2008年第12期54-58,共5页
文摘
基于对中文文本信息语法构成尤其是词性搭配的概率特征的分析,提出一种基于双层隐马尔科夫模型的中文泛术语识别和提取的思路和系统框架,并实现相关系统,基于训练语料对多个领域的文本信息进行术语提取测试。实验结果表明,所提出的基于隐马尔科夫模型的中文泛术语识别和提取思想具有较好的实践参考意义。
关键词
中文术语
识别和提取
隐马尔科夫
HMM
Keywords
Chinese term recognition
Hidden markov model
HMM
分类号
H083 [语言文字—语言学]
下载PDF
职称材料
题名
一种基于统计技术的中文术语抽取方法
被引量:
15
4
作者
刘剑
唐慧丰
刘伍颖
机构
解放军外国语学院
中国科学院计算技术研究所
出处
《中国科技术语》
2014年第5期10-14,共5页
文摘
中文术语识别与抽取是中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。文章以互信息和信息熵理论为基础,提出一种基于统计技术的中文术语半自动抽取方法,并且以互联网新闻话题数据为对象进行了实验验证,结果表明所提方法能够有效支持中文术语的抽取。
关键词
互信息
信息熵
中文术语
抽取
Keywords
mutual information information entropy Chinese terminology extraction
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于AJAX技术的中文术语抽取系统的设计与实现
5
作者
张昭楠
机构
陕西职业技术学院
出处
《电子设计工程》
2016年第18期44-46,共3页
文摘
文中从用户需求的角度出发确定并设计实现了基于AJAX技术的中文术语抽取技术,在用户角度层面上将系统飞卫3个相互联系的子系统,即中文术语抽取、中文定义抽取和基于用户反馈的自学习系统,并且对3个子系统的功能和任务进行了划分。本文还采用两种语料分别对中文术语定义抽取系统和中文术语抽取系统进行了一定的测试,测试结果表明系统的准确性相较于之前的系统提升了40%,达到了63.75%,召回率可以达到78.84%,并且在人性化和人机交互等方面都去了很大的创新和改进。
关键词
AJAX技术
中文术语
抽取
系统设计
系统测试
Keywords
AJAX technology
Chinese term extraction
system design
system test
分类号
TM933.4 [电气工程—电力电子与电力传动]
下载PDF
职称材料
题名
中文医学术语集在真实世界临床研究中的应用
6
作者
张睿
李蕾
王丽
吕庆国
机构
四川大学华西医院信息中心
乐山市马边彝族自治县人民医院内科
乐山市马边彝族自治县人民医院信息科
四川大学华西医院内分泌代谢科
出处
《中国数字医学》
2024年第8期86-95,共10页
基金
四川省科技厅重点研发项目-基于语义知识图谱的罕见病决策支持系统在基层医院的推广示范研究(2022YFS0056)。
文摘
目的:通过分析国内外医学术语集的应用进展,拓展中文临床术语集在中文电子病历环境下的科研应用场景及范围。方法:检索四川大学数字图书馆出版物,通过文献回顾进行分析归纳。结果:中文医学术语集对电子病历概念识别和数据挖掘具有重要作用,有助于语义互操作。基于语义网及语义知识库,可以更深入地进行多种风险预测模型、语义相似度计算和推理性决策支持系统的研究。结论:中文医学术语集是基础性的信息化标准,可支撑多种临床智慧应用构建,建议纳入医学教育。
关键词
中文
医学
术语
集
真实世界临床研究
数据挖掘
临床决策支持系统
本体论
Keywords
Chinese medical terminology set
Real-world clinical research
Data mining
Clinical decision support system
Ontology
分类号
R197.3 [医药卫生—卫生事业管理]
R319 [医药卫生—基础医学]
下载PDF
职称材料
题名
面向本体学习的中文专利术语抽取研究
被引量:
18
7
作者
王昊
王密平
苏新宁
机构
南京大学信息管理学院
南京大学江苏省数据工程与知识服务重点实验室
出处
《情报学报》
CSSCI
北大核心
2016年第6期573-585,共13页
基金
江苏省自然科学基金项目"面向专利预警的中文本体学习研究"(BK20130587)
国家社科重大招标项目"面向突发事件应急决策的快速响应情报体系研究"(13&ZD174)等的资助
文摘
本文提出了一个无或少训练语料环境下抽取中文专利术语的解决方案。以"钢铁冶金"领域专利文本为例,首先总结了该领域中文术语的基本特征,进而建立了基于字角色标注的机器学习术语识别模型,并通过循环迭代方式重复条件随机场的学习过程,最大限度避免因核心词汇库代替人工带来的标注不准确不充分问题;在此基础上,进一步依据合成规则构造新术语,并经过领域专家确认后添加至核心词汇库中。经过实验论证,基于字角色标注的基本术语抽取F1值高于94%,而基于合成规则的复杂术语抽取准确率也可达到75%。在7597件专利的题名和摘要文本中,最终可获得中文基本术语244672个,合成术语61536个,为领域本体的构建奠定了基础。
关键词
中文
专利
术语
机器学习
条件随机场
字角色标注
循环迭代
合成规则
本体学习
Keywords
Chinese patent terms, machine learning, conditional random fields (CRFS), character role labeling, snowball, combination rules, ontology learning
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文专利术语层次关系解析研究
被引量:
7
8
作者
吴志祥
王昊
王密平
机构
南京大学信息管理学院
南京大学江苏省数据工程与知识服务重点实验室
出处
《情报学报》
CSSCI
CSCD
北大核心
2017年第4期401-410,共10页
基金
江苏省自然科学基金项目"面向专利预警的中文本体学习研究"(BK20130587)
江苏省"333"工程项目"面向知识服务的中文本体学习研究"(BRA2015401)
国家社科重大招标项目"面向突发事件应急决策的快速响应情报体系研究"(13&ZD174)
文摘
对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体。着重研究了基于位置加权的术语语义空间构建方法,基于主成分分析降维技术进行术语分布可视化以辅助聚类类目的确定方法以及术语层次关系结构中非重复性类目标签的抽取方法。本文工作尽可能实现了较大规模中文专利术语层次关系解析的自动化进行,为术语非层次关系解析以及基于术语语义关系解析的深入应用打下基础。
关键词
中文
专利
术语
位置加权
PCA降维
类目标签抽取
术语
层次关系
本体学习
Keywords
Chinese patent terms
position weight
PCA dimensionality reduction
category label extraction
term hierarchy
ontology learning
分类号
G254 [文化科学—图书馆学]
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文临床医学术语系统分类框架设计原则与构建思路
被引量:
8
9
作者
冀玉静
孙海霞
邓盼盼
任慧玲
沈柳
李军莲
机构
中国医学科学院/北京协和医学院医学信息研究所/图书馆
出处
《中华医学图书情报杂志》
CAS
2018年第11期27-32,共6页
基金
中国医学科学院医学与健康科技创新工程"中文临床医学术语系统构建研究"(2017-I2M-3-014)
文摘
建立具有中国特色和自主知识产权的中文临床医学术语系统,对实现临床电子病历信息标准化及卫生管理、医保支付等不同系统间信息的交互利用具有重要意义。论述了中文临床医学术语系统的分类框架设计原则和顶层概念类的构建思路,深入地为进一步全面构建中文临床医学术语系统奠定基础。
关键词
中文
临床医学
术语
系统
分类框架
概念体系
构建思路
设计原则
Keywords
Chinese clinical medical terminology system
Classification framework
Concept system
Development ideas
Design principles
分类号
R-05 [医药卫生]
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
国际音标中文术语表
10
机构
<南开语言学刊>编辑部
出处
《南开语言学刊》
CSSCI
2008年第1期162-163,共2页
关键词
国际音标
中文术语
唇齿音
语音学
商务印书馆
小舌音
开元音
罗常培
塞音
附加符号
分类号
H083 [语言文字—语言学]
H016 [语言文字—语言学]
原文传递
题名
基于Bert的中文法律术语角色识别
被引量:
1
11
作者
马文博
白宇
张桂平
机构
沈阳航空航天大学
出处
《信息与电脑》
2020年第11期69-73,共5页
文摘
针对法律术语角色识别问题,笔者提出了一种基于BERT预训练语言模型的方法进行法律术语角色识别,并制定了标注规范。由于BERT预训练语言模型本身含有丰富的语义特征,可以一定程度上解决训练语料不足的问题,所以首先通过BERT预训练模型将字向量送入下游任务中,再通过BiLSTM-CRF进行法律术语角色识别。实验结果表明,笔者提出的方法要优于对照组模型,具有重要的现实意义。
关键词
命名实体识别
BERT预训练语言模型
BiLSTM-CRF
中文
法律
术语
角色识别
Keywords
name entity recognition
BERT pre-training language model
BiLSTM-CRF
chinese legal terminology role recognition
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
浅谈译者主体性问题——以部分中文政治术语的日译为中心
12
作者
何云竹
机构
四川外国语大学
出处
《佳木斯职业学院学报》
2021年第4期76-77,共2页
文摘
随着我国综合实力的提高,一部分我国常用政治术语的日语翻译也在悄然发生着变化。但在译者的主体性问题上,照顾受众和提高本国对外语言影响力是对立统一的矛盾关系,需要具体问题具体分析,灵活处理。基于此,本文以部分中文政治术语的日译为中心探析了译者主体性问题,以供参考。
关键词
主体性
日语翻译
中文
政治
术语
分类号
H059 [语言文字—语言学]
下载PDF
职称材料
题名
中文“旅游”一词产生及其对应概念的变迁
被引量:
2
13
作者
史甜甜
保继刚
机构
华南师范大学旅游管理学院
中山大学旅游学院
出处
《旅游科学》
CSSCI
北大核心
2015年第6期81-91,共11页
基金
国家自然科学基金项目"西部边远区域旅游发展中的全球地方化特征
过程与机制--新疆喀纳斯案例"(41501158)
国家留学基金委国家建设高水平大学公派研究生项目(201206380006)
文摘
本文以术语学符号和概念的关系为基础,通过对历史资料的解读,探究中文"旅游"一词的产生及对应概念变迁。研究发现:从时间维度看,"旅游"这一双音词最早出现在民国,其出现与民国时期旅行社业和相关出版物发展以及中国传统游历文化有关;从空间维度看,"旅游"不是舶来词,并非从tourism直接翻译而来。最初"旅游"一词对应单一概念,指"旅行游览"。随后,"旅游"一词对应概念出现多元变化:除"旅行游览(历)"这一概念外,又增加了"经济维度"和"整体性"的对应概念;"旅游"对应概念多元变化,很大程度上受到特定的社会历史背景及研究实践的影响。本文认为,应根据不同的语言环境使用与"旅游"同义的替代性单义术语,以减少其对应概念的含混。
关键词
中文术语
旅游
产生
词语
概念变迁
Keywords
Chinese term
Iv-you
emerging context
word
change of corresponding concepts
分类号
F59 [经济管理—旅游管理]
下载PDF
职称材料
题名
一种基于Web的术语翻译获取及验证方法
被引量:
3
14
作者
张晶
曹存根
王石
机构
江苏科技大学计算机科学与工程学院
中国科学院计算技术研究所
出处
《计算机科学》
CSCD
北大核心
2012年第7期170-174,共5页
基金
国家自然科学基金(61035004)资助
文摘
中文术语及未登录词的翻译是机器翻译、跨语言检索中的一个重要问题,这些翻译很难从现有的词典中获取。提出了一种通过搜索引擎从网页中自动获取中文术语英文翻译的方法。通过术语的部分翻译信息,构造出3种查询项模式,提出了多特征的翻译抽取方法。针对传统方法结果准确率不高、候选翻译干扰项多的问题,提出端类比对齐验证、双语对齐度验证、构词法验证3种验证模型来对候选翻译进行有效验证。实验结果表明,获取的双语翻译对准确率高,TOP1的准确率达到97.4%,TOP3的准确率达到98.3%。
关键词
中文术语
网络挖掘
术语
翻译
信息检索
Keywords
Chinese term, Web mining, Term translation, Information retrieval
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
准确翻译专业名词和术语的重要性日益显现
15
作者
殷康
机构
思科公司
出处
《世界电信》
2006年第11期3-6,共4页
文摘
首先概括性地描述了我国电信和网络技术领域所面临的一个愈来愈大的挑战,即专业名词和术语如何正确翻译、推广和使用,分析指出了此方面问题的根源及其严重性,并特别列举数例分析专业名词和术语翻译缺乏严肃性带来的不良影响和危害。最后,基于思考和分析,提出了若干改善和规范我国专业名词和术语翻译工作的建议。
关键词
电信
网络技术
专业名词
中文术语
译文规范
标准
程序
翻译
Keywords
Telecom Network technology Professional terms Chinese terms Translation specification Standard Procedure Translation
分类号
TS934.3 [轻工技术与工程]
下载PDF
职称材料
题名
基于CRFs的专利文献领域术语抽取方法
被引量:
11
16
作者
王健
殷旭
吕学强
徐丽萍
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京城市系统工程研究中心
出处
《计算机工程与设计》
北大核心
2019年第1期279-284,共6页
基金
国家自然科学基金项目(61671070)
北京成像技术高精尖创新中心基金项目(BAICIT-2016003)
+2 种基金
国家社会科学基金重大基金项目(14@ZH036)
国家语委重点基金项目(ZDI135-53)
国家语委重大课题基金项目(ZDA125-26)
文摘
通过对新能源汽车领域中文专利文献中术语特点的分析,提出利用条件随机场模型,分别基于三词位、四词位和六词位的字序列标注进行术语抽取的方法。以字为切分粒度,避免在术语抽取过程中因分词原因导致术语识别错误问题,并探讨不同词位标注集对术语抽取性能的影响。实验结果表明,基于六词位字标注的条件随机场模型术语抽取的性能最好,准确率、召回率和F值优于对比方法中基于词、词性、词长等信息作为特征的抽取方法,验证了所提方法的有效性。
关键词
中文
专利
术语
术语
抽取
条件随机场
序列标注
新能源汽车领域
Keywords
Chinese patent terminology
term extraction
CRFs
sequence labeling
new energy vehicles
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文本特征和复合统计量的领域术语抽取方法
被引量:
7
17
作者
董洋溢
李伟华
于会
机构
西北工业大学计算机学院
出处
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2017年第4期729-735,共7页
基金
陕西省自然科学基金(2015JM6290)资助
文摘
中文领域术语的抽取,是文本知识挖掘的重要内容。传统的中文领域术语抽取方法以人工方法为主,显然这种方法费时费力。目前,处于研究阶段的中文领域术语自动化抽取方法主要有:基于字典的方法、基于规则的方法以及基于统计的方法。但由于中文自然语言的复杂性,这些自动化抽取方法都存在一定的局限性,比如对特定领域的用户字典及规则存在更新速度慢、文本特征考虑不足等,从而导致抽取的效果不佳。针对这一问题,提出了一种基于文本特征和复合统计量的中文领域术语抽取方法,该方法在对中文文档中的词语进行粗粒度筛选后,再综合考虑候选术语的词性、长度、边界词语等文本特征,构造出信息熵和TFIDF等统计量,计算其综合权值,并将综合权值大于设定阈值的候选术语抽取出来,作为最终的领域术语。实验结果表明,该方法在测试语料下,获得了较好的正确率、召回率和F值。
关键词
中文
领域
术语
文本挖掘
自然语言处理
文本特征
Keywords
Chinese domain term
text mining
natural language processing
text feature
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
晚清的科学术语翻译——以傅兰雅为视点
18
作者
王红霞
机构
复旦大学
出处
《福建论坛(社科教育版)》
2009年第2期104-106,共3页
文摘
文章以傅兰雅(John Fryer)为研究视点,通过解读他所发表的关于科学翻译和中文术语的文章,结合他在江南制造局的翻译成果,分析了他对科学术语翻译问题的看法,介绍了他和中文笔述者一起确定的建立中文科学术语的规则和方法,并考察了益智书会以傅兰雅的工作为基础进行的统一中文科学术语的工作。
关键词
傅兰雅
科学翻译
中文术语
分类号
H059 [语言文字—语言学]
下载PDF
职称材料
题名
郑贞文与中文化学命名
被引量:
3
19
作者
张澔
机构
义守大学通识教育中心
出处
《科技术语研究》
2006年第3期61-64,共4页
文摘
20世纪中文化学名词发展过程中,郑贞文是贡献最多的其中一位,在无机化学命名方面,影响最深远。在有机化学名词上,用天干符号来表示有机化合物中的碳数目也是由他提出的。中文化学名词规范化的成果——1933年出版的《化学命名原则》,他是重要整理者之一。
关键词
郑贞文
化学
命名
中文术语
Keywords
Zheng Zhenwen, chemistry, nomenclature, Chinese terminology
分类号
O6-092 [理学—化学]
下载PDF
职称材料
题名
质量管理和质量保证术语管理系统(一)
被引量:
1
20
作者
肖玉敬
出处
《术语标准化与信息技术》
1998年第1期19-21,共3页
文摘
质量管理和质量保证术语管理系统(一)肖玉敬编译编者按:术语标准化是标准化的重要基础性工作,面向专业领域的术语标准化的研究是当前国际术语学发展的重要趋势之一。质量管理和质量保证术语管理系统是由国际标准化组织第176技术委员会(质量管理和质量保证)的第一...
关键词
质量管理和质量保证
术语
管理系统
中文术语
英文
术语
中文
定义
验收抽样
可接收质量水平
准确度
术语
标准化
接收常数
分类号
N61 [自然科学总论]
C931.6 [经济管理—管理学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
中文术语社区变体的差异类型与互通度
刘锐
贺志军
黄行
《语言文字应用》
CSSCI
北大核心
2024
0
下载PDF
职称材料
2
基于多策略融合的中文术语抽取方法
周浪
史树敏
冯冲
黄河燕
《情报学报》
CSSCI
北大核心
2010
28
下载PDF
职称材料
3
基于隐马尔科夫模型的中文术语识别研究
岑咏华
韩哲
季培培
《现代图书情报技术》
CSSCI
北大核心
2008
37
下载PDF
职称材料
4
一种基于统计技术的中文术语抽取方法
刘剑
唐慧丰
刘伍颖
《中国科技术语》
2014
15
下载PDF
职称材料
5
基于AJAX技术的中文术语抽取系统的设计与实现
张昭楠
《电子设计工程》
2016
0
下载PDF
职称材料
6
中文医学术语集在真实世界临床研究中的应用
张睿
李蕾
王丽
吕庆国
《中国数字医学》
2024
0
下载PDF
职称材料
7
面向本体学习的中文专利术语抽取研究
王昊
王密平
苏新宁
《情报学报》
CSSCI
北大核心
2016
18
下载PDF
职称材料
8
中文专利术语层次关系解析研究
吴志祥
王昊
王密平
《情报学报》
CSSCI
CSCD
北大核心
2017
7
下载PDF
职称材料
9
中文临床医学术语系统分类框架设计原则与构建思路
冀玉静
孙海霞
邓盼盼
任慧玲
沈柳
李军莲
《中华医学图书情报杂志》
CAS
2018
8
下载PDF
职称材料
10
国际音标中文术语表
《南开语言学刊》
CSSCI
2008
0
原文传递
11
基于Bert的中文法律术语角色识别
马文博
白宇
张桂平
《信息与电脑》
2020
1
下载PDF
职称材料
12
浅谈译者主体性问题——以部分中文政治术语的日译为中心
何云竹
《佳木斯职业学院学报》
2021
0
下载PDF
职称材料
13
中文“旅游”一词产生及其对应概念的变迁
史甜甜
保继刚
《旅游科学》
CSSCI
北大核心
2015
2
下载PDF
职称材料
14
一种基于Web的术语翻译获取及验证方法
张晶
曹存根
王石
《计算机科学》
CSCD
北大核心
2012
3
下载PDF
职称材料
15
准确翻译专业名词和术语的重要性日益显现
殷康
《世界电信》
2006
0
下载PDF
职称材料
16
基于CRFs的专利文献领域术语抽取方法
王健
殷旭
吕学强
徐丽萍
《计算机工程与设计》
北大核心
2019
11
下载PDF
职称材料
17
文本特征和复合统计量的领域术语抽取方法
董洋溢
李伟华
于会
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2017
7
下载PDF
职称材料
18
晚清的科学术语翻译——以傅兰雅为视点
王红霞
《福建论坛(社科教育版)》
2009
0
下载PDF
职称材料
19
郑贞文与中文化学命名
张澔
《科技术语研究》
2006
3
下载PDF
职称材料
20
质量管理和质量保证术语管理系统(一)
肖玉敬
《术语标准化与信息技术》
1998
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
4
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部