-
题名基于傅立叶变换的一种时间序列相似搜索算法
被引量:1
- 1
-
-
作者
陈晓航
彭宏
谢运祥
-
机构
华南理工大学计算机工程与科学系
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第18期202-203,共2页
-
基金
国家自然科学基金(编号:50007001)
广东省自然科学基金(编号:990582)
广州市科委基金(编号:2000-J-006-01)
-
文摘
该文提出了基于傅立叶变换的一种新的时间序列相似搜索算法。该算法利用高效的索引方法,达到快速的匹配,解决了多序列的子序列匹配问题。大量算例验证了该算法的通用性和有效性,它可以应用到求解各种时间序列相关的实际问题。
-
关键词
傅立叶变换
时间序列相似搜索算法
时序数据库
数据挖掘
离散傅立叶变换
R+树
-
Keywords
Time Series,DFT,R+Tree
-
分类号
TP311.132
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于广义超曲面树的相似性搜索算法
被引量:2
- 2
-
-
作者
张兆功
李建中
-
机构
哈尔滨工业大学计算机科学与技术学院
黑龙江大学
-
出处
《软件学报》
EI
CSCD
北大核心
2002年第10期1969-1976,共8页
-
基金
国家自然科学基金资助项目(69873014)
国家高技术研究发展计划资助项目(2001AA415410)
+2 种基金
国家重点基础研究发展规划973资助项目(G1999032704)
国家教育部博士点基金资助项目(2000021303)
黑龙江省自然科学基金资助项目(F00-11)~
-
文摘
相似性搜索是数据挖掘的主要领域之一.它在数据库中检索出相似的数据,发现数据间的相似性.它可以应用于图像数据库、空间数据库和时间序列分析.对于欧氏空间(一种特殊的度量空间),相似性搜索算法中基于R-tree的方法,在低维时是高效的,当维数增加时,R-tree的方法将退化为线性扫描.该现象被称为维数灾难(dimensionality curse),主要原因是存在数据重复.当数据量很大且维数很高时,距离计算和I/O操作将非常费时.提出了度量空间上新的空间分割方法和索引结构rgh-tree,利用数据库的数据对象与很少几个固定参考对象的距离信息进行数据分割和分布,产生一个各节点没有数据重复的平衡树.另外,在rgh-tree的基础上提出了相应的相似性搜索算法,该算法具有较小的I/O代价和距离计算次数,平均复杂性近似为o(n0.58).解决了目前算法存在的一些问题.
-
关键词
广义超曲面树
相似性搜索算法
数据库
数据挖掘
数据查询
-
Keywords
algorithm
similarity search query
metric space
database
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名飞行时序数据相似性挖掘算法研究
被引量:3
- 3
-
-
作者
闫伟
赵杨
高原
-
机构
中国民航大学计算机科学与技术学院
中国电子科技集团公司第五十四研究所
-
出处
《计算机与网络》
2008年第21期54-57,共4页
-
基金
自然科学基金资助项目(60672174)
-
文摘
提出了一种基于时间序列数据挖掘的飞行数据处理方法,结合大量 QAR 数据和领域专家经验知识,采用基于离散傅立叶变换的数据挖掘算法,将时间序列相似性匹配的方法引入到数据挖掘的研究中,并在时序搜索数据时考虑了噪声、幅度和孤立点等问题。
-
关键词
飞机故障预警
QAR数据
时序数据挖掘
相似搜索算法
-
Keywords
aircraft early warning
QAR data
time series data mining
similarity search
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名时序数据库中快速相似搜索的算法研究
被引量:5
- 4
-
-
作者
黄河
熊范纶
杭小树
黄轲
-
机构
中国科学院合肥智能机械研究所
宜春大学生物化学系
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2003年第2期169-173,共5页
-
基金
国家自然科学基金资助项目(No.69835010)
-
文摘
针对时间序列,本文提出了一种新的数据表示方法。该方法通过将时间序列分成若干段,并从每个分段中提取一个特征向量,从而用一个特征向量集作为该时间序列的逻辑表示。在此基础上,采用时间弯曲距离作为相似模型,提出了一种改进的KMP算法作为检索方法。此算法能够快速挖掘出时序数据库中与给定查询序列相似的所有(子)序列。该算法具有较高的效率。
-
关键词
时序数据库
快速相似搜索算法
数据表示
数据模型
-
Keywords
Time-Series, Feature Vector, Time-Warping Distance, Similarity Search
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于和声搜索的协同过滤算法研究
被引量:1
- 5
-
-
作者
王华秋
-
机构
重庆理工大学计算机学院
-
出处
《现代图书情报技术》
CSSCI
北大核心
2012年第12期79-84,共6页
-
基金
教育部人文社会科学研究青年基金项目"虚拟专用网环境下图书馆服务多引擎专家系统的研制"(项目编号:10YJC870037)的研究成果之一
-
文摘
改进传统的相似度计算方法,为寻找最优的相似度函数,采用参数优化的和声搜索算法来寻找相似度函数的最优权值向量。为提高推荐速度,得到最优的相似度函数后,对于用户的推荐计算不再采用和声搜索算法。实验表明,和传统算法相比,该算法能提高预测精度和覆盖率,有更好的推荐效果,并能够更快地获得目标用户的最邻近用户,加快推荐的速度。
-
关键词
协同过滤相似度函数权值向量和声搜索算法
-
Keywords
Collaborative filtering Similarity function Weights vector Harmony search algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名中国蜘蛛抱蛋属植物DNA条形码研究
被引量:2
- 6
-
-
作者
吕定豪
刘安莉
徐文芬
何顺志
-
机构
遵义市第四人民医院
贵阳中医学院第二附属医院
贵阳中医学院
-
出处
《植物科学学报》
CAS
CSCD
北大核心
2018年第6期784-789,共6页
-
基金
国家自然科学基金项目(81660640)
贵州省科技计划项目(黔科合LH[2016]7132号)
贵州省教育厅国内一流学科建设项目(GNYL[2017]008)~~
-
文摘
利用植物DNA条形码候选序列mat K、psb A-trn H、psb K-psb I和rbc L对蜘蛛抱蛋属(Aspidistra)植物的19种104批样品进行扩增和测序,并采用相似性搜索算法(BLAST)对各序列的鉴定效率进行评价,得出蜘蛛抱蛋属物种鉴定的最佳序列。结果显示,psb K-psb I的物种鉴定成功率为88.7%,在单一序列中成功率最高。通过多序列组合鉴定效率的比较,发现组合序列的鉴定成功率明显高于单一序列,其中mat K+(psb K-psb I)组合的鉴定成功率高达100%,基于该序列组合构建蜘蛛抱蛋属植物的系统发育树,结果显示同一物种的样品聚集度较好,多表现为单系。研究结果表明mat K+(psb K-psb I)序列组合可作为蜘蛛抱蛋植物种鉴定的最佳条形码序列。
-
关键词
蜘蛛抱蛋属
DNA条形码
相似性搜索算法
鉴定
-
Keywords
Aspidistra
DNA barcoding
BLAST
Identification
-
分类号
Q943.2
[生物学—植物学]
-