-
题名基于数学表达式特征的科技文档检索模型
被引量:1
- 1
-
-
作者
田学东
崔晓娟
-
机构
河北大学计算机科学与技术学院
-
出处
《河北大学学报(自然科学版)》
CAS
北大核心
2017年第6期652-661,共10页
-
基金
国家自然科学基金资助项目(61375075)
河北省教育厅河北省高等学校科学技术研究重点项目(ZD2017208)
-
文摘
现有全文检索技术多是以文本信息为处理对象,对于以数学表达式为主要成分的科技文档检索还处在探索阶段.为了使用户可以方便地以数学公式作为查询语言对科技文档进行检索,提出了一种基于数学表达式特征的科技文档检索模型.首先通过将公式解析为二叉树得到数学表达式的子式信息,利用数学表达式及子式构造检索特征向量;在索引阶段,利用所提取的文档特征向量构建分层结构的索引表;在匹配阶段,对文档向量采用tf-idf进行加权操作,利用余弦相似度对检索向量和文档向量进行相似度计算,得到一个有序的文档检索结果.实验选取了来自不同领域的期刊、学术网站以及公共数据集的5 017篇科技文档,其中包含了96 362条数学公式,平均检索时间为0.428s,表明该模型达到了实现较高效率科技文档检索的目标.
-
关键词
科技文档
数学表达式
检索
索引
匹配
二叉树
特征
-
Keywords
scientific documents
mathematical expressions
retrieval
indexing
matching
binary tree
features
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名《数学评论》概况和文献检索
被引量:1
- 2
-
-
作者
郝剑华
-
机构
厦门大学数学系
-
出处
《数学研究》
CSCD
1995年第1期100-102,共3页
-
文摘
本文着重介绍《数学评论》及其索引的有关知识,并提供利用《数学评论》查找数学文献的检索途径.
-
关键词
《数学评论》
文献检索
数学文献
数学研究
-
Keywords
mathematical reviews, index,document, retrieval
-
分类号
G354.43
[文化科学—情报学]
O1-1
[理学—基础数学]
-
-
题名《数学评论》与数学教育文献
- 3
-
-
作者
谷琲
-
机构
华东师范大学数学系
-
出处
《数学教育学报》
2001年第3期101-102,共2页
-
文摘
随着数学教育研究的日益深入,造成了数学教育文献量的不断增加.作为数学领域一种最重要的检索工具──《数学评论》,在2000年的主题分类中增加了“数学教育”这一大类,方便了数学教育文献的检索.同时也给广大数学教育工作者打了一针“兴奋剂”.
-
关键词
《数学评论》
主题分类
数学教育文献
文献检索
-
Keywords
mathematical reviews
subject classification
mathematics education document
document retrieval
-
分类号
O1-4
[理学—基础数学]
G252.7
[文化科学—图书馆学]
-