-
题名计算机领域术语的自动获取与层次构建
被引量:4
- 1
-
-
作者
林源
陈志泊
孙俏
-
机构
北京林业大学信息学院
北京航空航天大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第2期172-174,共3页
-
基金
国家"863"计划基金资助项目(2006AA10Z232)
-
文摘
设计一种能够自动获取计算机领域术语的方案,提出基于规则与统计相结合的抽取方法,使用亚马逊网站的计算机类图书作为语料库,通过分词、去停止词预处理以及词频统计的方法提取出计算机类领域术语,并插入到由ODP构建的树中,形成计算机领域术语的层次结构。实验结果表明,与人工标注结果相比,使用该方法自动获取的术语有很高的准确率与召回率。
-
关键词
计算机领域术语
术语获取
层次结构
ODP项目
-
Keywords
computer domain term
term extraction
hierarchical structure
Open Directory Project(ODP)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Web的中英术语翻译获取方法研究
被引量:2
- 2
-
-
作者
董燕举
白宇
蔡东风
-
机构
沈阳航空工业学院知识工程中心
沈阳航空工业学院计算机学院
-
出处
《沈阳航空工业学院学报》
2010年第2期55-58,54,共5页
-
基金
辽宁省自然科学基金(20062006)
辽宁省高校创新团队支持计划项目(2007T140)
-
文摘
从Web双语资源中获取术语翻译具有很大应用价值。从实用化术语翻译角度出发,设计了一个基于Web的中英术语翻译系统。该系统使用Google搜索引擎,通过关键词扩展技术搜索词汇表类型网页,从其搜索结果摘要中抽取术语翻译。实验结果表明系统取得良好性能:TOP1的正确率达到90.9%,TOP3的正确率达到95.4%。
-
关键词
术语翻译获取
WEB信息抽取
术语翻译
信息检索
WEB挖掘
-
Keywords
term translation acquisition
Web information extraction
term translation
information retrieval
Web mining
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于OMKast的术语关系获取和验证
被引量:1
- 3
-
-
作者
王娜娜
黄运有
唐素勤
王石
曹存根
-
机构
广西师范大学计算机科学与信息工程学院
中国科学院计算技术研究所智能信息处理重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第11期3319-3323,共5页
-
基金
广西省自然科学基金资助项目(2011GXNSFA018159)
国家自然科学基金青年基金资助项目(61103169)
+1 种基金
中国科学院计算技术研究所合作项目(国家自然科学基金(61173063)子课题)
广西省研究生教育创新计划资助项目(YCSZ2014097)
-
文摘
为了从海量数据中获取知识,提出了术语间关系的抽取方法:定义了上下位关系和整分关系,在此基础上新增加了N条关系,从关系的定义域和值域、关系的限制条件、关系的公理等出发,准确地定义出关系的内涵,并根据关系的内涵定义出关系的语义特征。最后针对关系表达的灵活性,总结出了关系表述的语法特征和表述文法。结合上述语法特征和语义特征,编写了一种可执行的知识抽取程序——OMKast程序,并从原始文本语料中抽取关系。利用语义特征和统计学的方法验证抽取出的关系。实验结果表明,该方法具有良好的有效性。
-
关键词
术语
术语间关系
关系公理
文本知识获取
术语关系获取
术语关系验证
-
Keywords
term
relationship between terms
axiom of relationships
knowledge acquisition from text
term relationship acquisition
term relationship verification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名种子概念方法及其在基于文本的本体学习中的应用
被引量:13
- 4
-
-
作者
梁健
吴丹
-
机构
中国科学技术信息研究所
北京大学信息管理系
-
出处
《图书情报工作》
CSSCI
北大核心
2006年第9期18-21,共4页
-
基金
国家自然科学基金"面向自然语言处理的逻辑语义表达与演算模型研究"(项目编号:60173025)成果之一。
-
文摘
介绍基于文本的本体学习及其层次,分析本体学习中术语获取的主要方法。针对术语获取中存在的问题,在术语形成的经济规律基础上,引入种子概念方法,并利用统计和规则两种方法抽取与种子概念相关的领域术语;证明种子概念方法是一种有效获取领域术语的方法。实验证明少量种子词可以获取大量领域术语,为本体构建提供基础和框架。
-
关键词
本体学习
文本
术语获取
种子概念
-
Keywords
ontology learning text term acquisition seed concept
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-