-
题名基于广义超曲面树的相似性搜索算法
被引量:2
- 1
-
-
作者
张兆功
李建中
-
机构
哈尔滨工业大学计算机科学与技术学院
黑龙江大学
-
出处
《软件学报》
EI
CSCD
北大核心
2002年第10期1969-1976,共8页
-
基金
国家自然科学基金资助项目(69873014)
国家高技术研究发展计划资助项目(2001AA415410)
+2 种基金
国家重点基础研究发展规划973资助项目(G1999032704)
国家教育部博士点基金资助项目(2000021303)
黑龙江省自然科学基金资助项目(F00-11)~
-
文摘
相似性搜索是数据挖掘的主要领域之一.它在数据库中检索出相似的数据,发现数据间的相似性.它可以应用于图像数据库、空间数据库和时间序列分析.对于欧氏空间(一种特殊的度量空间),相似性搜索算法中基于R-tree的方法,在低维时是高效的,当维数增加时,R-tree的方法将退化为线性扫描.该现象被称为维数灾难(dimensionality curse),主要原因是存在数据重复.当数据量很大且维数很高时,距离计算和I/O操作将非常费时.提出了度量空间上新的空间分割方法和索引结构rgh-tree,利用数据库的数据对象与很少几个固定参考对象的距离信息进行数据分割和分布,产生一个各节点没有数据重复的平衡树.另外,在rgh-tree的基础上提出了相应的相似性搜索算法,该算法具有较小的I/O代价和距离计算次数,平均复杂性近似为o(n0.58).解决了目前算法存在的一些问题.
-
关键词
广义超曲面树
相似性搜索算法
数据库
数据挖掘
数据查询
-
Keywords
algorithm
similarity search query
metric space
database
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名中国蜘蛛抱蛋属植物DNA条形码研究
被引量:2
- 2
-
-
作者
吕定豪
刘安莉
徐文芬
何顺志
-
机构
遵义市第四人民医院
贵阳中医学院第二附属医院
贵阳中医学院
-
出处
《植物科学学报》
CAS
CSCD
北大核心
2018年第6期784-789,共6页
-
基金
国家自然科学基金项目(81660640)
贵州省科技计划项目(黔科合LH[2016]7132号)
贵州省教育厅国内一流学科建设项目(GNYL[2017]008)~~
-
文摘
利用植物DNA条形码候选序列mat K、psb A-trn H、psb K-psb I和rbc L对蜘蛛抱蛋属(Aspidistra)植物的19种104批样品进行扩增和测序,并采用相似性搜索算法(BLAST)对各序列的鉴定效率进行评价,得出蜘蛛抱蛋属物种鉴定的最佳序列。结果显示,psb K-psb I的物种鉴定成功率为88.7%,在单一序列中成功率最高。通过多序列组合鉴定效率的比较,发现组合序列的鉴定成功率明显高于单一序列,其中mat K+(psb K-psb I)组合的鉴定成功率高达100%,基于该序列组合构建蜘蛛抱蛋属植物的系统发育树,结果显示同一物种的样品聚集度较好,多表现为单系。研究结果表明mat K+(psb K-psb I)序列组合可作为蜘蛛抱蛋植物种鉴定的最佳条形码序列。
-
关键词
蜘蛛抱蛋属
DNA条形码
相似性搜索算法
鉴定
-
Keywords
Aspidistra
DNA barcoding
BLAST
Identification
-
分类号
Q943.2
[生物学—植物学]
-