-
题名引文信息在科技文献检索中的应用
被引量:3
- 1
-
-
作者
陈鑫卿
张永奎
白丽君
赵辄谦
-
机构
山西大学计算机科学系
-
出处
《情报学报》
CSSCI
北大核心
2003年第3期287-290,共4页
-
基金
山西省自然科学基金
-
文摘
科技文献之间的相互引证关系反映了一种科学交流活动,显示了科学文献之间(甚至是学科之间)的内在联系,而通过追溯文献之间的这种关系,可以改善传统的基于内容的科技文献检索的方法.本文应用一篇文章的被引用信息提出了文献的"重要性"的概念,并将它应用到基于内容的检索结果的排序中.
-
关键词
引文信息
科技文献
重要性
算法
文献检索
科学交流
-
分类号
G252.7
[文化科学—图书馆学]
G350
[文化科学—情报学]
-
-
题名一种协调的科技文献分类方法
被引量:3
- 2
-
-
作者
陈鑫卿
张永奎
李荣陆
-
机构
山西大学计算机科学系
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第26期91-93,共3页
-
基金
山西省自然科学基金资助项目
-
文摘
科技文献之间的相互引证关系反映了一种科学交流活动,显示了科学文献之间(甚至是学科之间)的内在联系,而通过追溯文献之间的这种关系,可以改善和提高传统的基于内容的科技文献的分类的方法。论文利用有相互引证关系,有同引关系,以及有耦合关系的两篇文献一般是属于同一类的这一特点,提出了文献之间的引用相似度,同引相似度,耦合相似度这三个概念,再利用这三个概念生成了文献之间的“结构相似度”,并将它用于K-NN分类法中得出一种基于结构的分类法。最后,论文将这种基于结构的分类法和基于内容的NaveBayes分类法结合起来提出了一种新的协调分类法。
-
关键词
分类
科技文献
引用
同引
耦合
-
Keywords
Classification,scientific documents,citation,co-citation,coupling
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于互联网的中文问答系统
被引量:9
- 3
-
-
作者
张永奎
赵辄谦
白丽君
陈鑫卿
-
机构
山西大学计算机科学系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第15期84-85,F003,共3页
-
基金
山西省自然科学基金资助项目(991035)
-
文摘
搜索引擎(如Google等)返回的是与用户查询相关的文档集,并不是所提出的问题的答案。该文提出了一个基于互联网的中文问答系统,用来增强已有的搜索引擎的功能,使它们能够支持自然语言的回答。
-
关键词
问答系统
搜索引擎
命名实体
-
Keywords
Question-answering
Search engine
Named-entity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于机器学习的网页主题词自动抽取
被引量:4
- 4
-
-
作者
张永奎
赵辄谦
陈鑫卿
白丽君
-
机构
山西大学计算机科学系
-
出处
《计算机应用》
CSCD
北大核心
2003年第3期1-3,共3页
-
基金
山西省自然科学基金项目 (991 0 35)
-
文摘
主题词在信息处理和信息检索过程中有广泛的用途 ,然而大量网页没有主题词 ,手工抽取主题词是一个繁重的过程。可以将主题词自动抽取看作是分类问题 ,充分利用网页的结构信息并且使用有监督的机器学习方法来自动地抽取网页中的主题词。
-
关键词
机器学习
网页
主题词
自动抽取
贝叶斯算法
信息处理
信息检索
计算机网络
-
Keywords
machine learning
keyphrase
automatic extraction
Bayesian algorithm
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
G354.4
[文化科学—情报学]
-
-
题名协作过滤研究概述
被引量:15
- 5
-
-
作者
白丽君
张永奎
陈鑫卿
-
机构
山西大学
-
出处
《电脑开发与应用》
2002年第11期2-3,8,共3页
-
基金
山西省自然科学基金 (9910 35 )
山西省归国人员基金资助
-
文摘
协作过滤分析用户兴趣 ,在用户群中找到指定用户的相似 (兴趣 )用户 ,综合这些相似用户对某一信息的评价 ,形成系统对该指定用户对此信息的喜好程度的预测。其协作过滤具有推荐新信息的能力等多种优点 ,介绍了其现状与发展趋势。
-
关键词
INTERNET
信息资源
协作过滤
社会过滤
文本过滤
信息过滤
信息检索
-
Keywords
collaborative filtering,social filtering,text filtering,message filtering
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
G354.4
[文化科学—情报学]
-