摘要
利用维基百科备份数据库自动构建领域概念语义网络,为领域信息智能检索提供技术基础。对维基百科备份数据库进行下载、分析、筛选处理后,以网络技术学科为研究领域,利用维基百科数据库中的条目数据,设计算法,提取网络技术领域的所有概念;通过维基百科备份数据库中的分类、链接、重定向数据,提取该领域概念之间的同义及上下级关系,最终汇总形成网络技术领域概念语义网络。
We use the Wikipedia backup database to build the concept semantic network in the field automatically, providing the technical basis for intelligent retrieval of the field information. After downloading, analyzing, filtering the Wikipedia backup data- base, with the network technology discipline as the field of study, we use the entry data in the Wikipedia database, design algo- rithms to extract all of the concepts in the field of network technology. We extract synonymous and superior-subordinate relation- ship between the concepts by using of the classification data, links data and redirects data in Wikipedia database. Finally, the concept semantic network of the network technology field is formed by collecting the concepts and the relationships between them.
出处
《计算机与现代化》
2016年第1期1-5,45,共6页
Computer and Modernization
基金
国家自然科学基金资助项目(61163064)
新疆"十一五"规划项目(070708)
教育部人文社会科学工程科技人才培养专项(15JDGC022)
新疆师范大学校级教学改革研究一般项目(SDJGY2014-01)
新疆师范大学研究生科技创新基金资助项目(XSY201502012)
关键词
维基百科
概念语义网络
概念提取
概念关系提取
网络技术
Wikipedia
concept semantic network
concept extraction
extract relationships between the concepts
network tech-nology