-
题名基于频繁子树挖掘的DNA重复序列识别方法
被引量:2
- 1
-
-
作者
周溜溜
业宁
徐昇
严敏利
-
机构
南京林业大学信息技术学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2011年第9期193-196,201,共5页
-
基金
国家自然科学基金项目(30671639)
江苏省自然科学基金项目(BK2009393)
江苏省青蓝工程学术带头人项目
-
文摘
提出了一种基于频繁子树挖掘策略说我DNA重复序列识别方法.绕开了传统的序列比对方式,将序列按照后缀树结构方式进行组织,再对后缀树形式做了约减改进,使其更加适合子树挖掘操作,最后利用频繁子树挖掘的方法对其进行学习.算法可以直接识别出满足设定阈值的重复序列,避免了由短重复体拼接所造成的时间浪费,设计的"二次识别技术"使得算法对模糊重复体也有着很好的识别效果,提高了识别完整度.实验证明:算法在识别效率性能方面较升,尤其当识别较长重复体时,优势体现的更为明显,同时在识别完整度方面也高度可比.
-
关键词
DNA序列
重复体识别
频繁子树挖掘
-
Keywords
DNA sequences
repeat sequence identification
frequent-subtree mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于分而治之策略的稀疏张量多层次数据挖掘
- 2
-
-
作者
周溜溜
业宁
徐昇
严敏利
孙伟
-
机构
南京林业大学信息技术学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2011年第10期204-208,共5页
-
基金
江苏省自然基金项目(BK2009393)
国家自然基金(30671639)
江苏省青蓝工程学术带头人项目
-
文摘
分析了MET算法的局限性以及out-of-core方法的特点,融合了两种算法的思想提出一种基于分而治之策略的多层次数据挖掘算法(DRMET),避免了计算过程中可能造成的维数灾难问题,克服了MET算法执行效率不高的缺陷,同时继承了MET内存开销小的优点;实验结果表明:新算法在不增加存储空间的前提下大大约减了MET的时间开销,其效率大约是MET的1.86~15.85倍.
-
关键词
分而治之
多层次数据挖掘
DRMET
时间开销
-
Keywords
dividing and ruling
multi-aspect data mining
DRMET
time cost
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-