基于相邻模式段组合的生物序列模式挖掘算法被引量：1

Joined pattern segment-based sequential patternmining algorithm for biological datasets

下载PDF

导出

摘要传统的序列模式挖掘算法应用在生物序列上有其局限性,根据生物序列的特点,提出了基于相邻频繁模式段的模式挖掘算法-JPS。首先产生相邻频繁模式段,然后对这些频繁模式段进行组合,产生新的频繁模式。通过实验分析,该方法在相似性很强的序列数据库中比传统的PrefixSpan算法效率高。通过对真实的蛋白质序列家族库的处理,证明该算法能有效处理生物序列数据。 Traditional algorithms for sequential pattern mining have limits when dealing with biological datasets.Biology sequence has its own characters.Based on these characters,the author develops Joined frequent Pattern Segment approach,JPS,for mining biological sequences.First,the joined frequent pattern segments are produced.Then,longer frequent patterns can be obtained by combining the above segments.The experiment shows JPS has better performance than PrefixSpan.Through dealing with the real protein family database,it is proved that the algorithm can deal with biology sequence data efficiently.

作者王淼尚学群薛贺

机构地区西北工业大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2008年第2期190-193,共4页 Computer Engineering and Applications

基金西北工业大学研究生创新实验室资助(No.06044)。

关键词前缀频繁集相邻频繁模式段模式组合 prefix frequent set joined frequent pattern segment pattern combination

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1Gibbs A J,McIntyre G A.The diagram:a method for comparing sequence[J].Eur J Biochem,1970,16:1-11.
2Needleman S B,Wunsch C D.A general method applicable to the search for similarities in the amino acid sequence of two proteins[J].Journal of Molecular Biology,1970,48:443-453.
3Smith T F,Waterman M S.Identification of common molecular subsequences[J].J Mol Bio,1981,147:195-197.
4Lipman D J,Pearson W R.Rapid and sensitive protein similarity searches[J].Science,1985,227:1435-1441.
5Lipman D J,Pearson W R.Improved tools for biological sequence comparison[J].Proc Narl Acad Sci,1988:2444-2448.
6Altschul S F,Gish W,Miller W,et al.Basic local alignment search tool[J].Journal of Molecular Biology,1990,215:403-410.
7Agrawal R,Srikant R.Mining sequential patterns:generalizations and performance improvements[C]//LNCS:Proc 5th Int Conf Extending Database Technology(EDBT),Avignon,1996:3-17.
8Zaki M J.Fast mining of sequential pattern in very large data bases,668[R].1997-11.
9Han J,Pei J,Yin Y.Mining frequent patterns without candidate generation[C]//Proc 2000 ACM-SIGMOD Int'l Conf Management of Dta(SIGMOD'00).Dallas:TX ACM Press,2000:1-12.
10Han J,Pei J,Mortazavi-Asl B,et al,FreeSpan:frequent patternprojected sequential pattern mining[C]//Proc 2000 ACM SIGKDD Int'l Conf Knowledge Discovery in Databases(KDD '00),2000:355-359.

同被引文献4

1Pei J,Han JW,Mortazavi AB,Pinto H.PrefixSpan:Mining sequential patterns efficiently by prefix2projected pattemgrowth.In:Proc.of the 17th International Conference onData Engineering,Heidelberg,Germany,2001.215-226.
2纪元,陈未如,张雪.并发关系模式合成数据源生成方法[J].山东大学学报（理学版）,2007,42(9):84-87. 被引量：2
3肖仁财,薛安荣.一种挖掘多维序列模式的有效方法[J].计算机工程与应用,2008,44(6):187-190. 被引量：3
4冯林,于孝航,孙焘,沈骁,潘晓雯.基于最长公共子序列距离的主旨模式挖掘算法[J].计算机工程,2008,34(14):47-48. 被引量：5

引证文献1

1王翠青,陈未如,张静.数据源特性对序列模式挖掘结果的影响[J].计算机系统应用,2010,19(5):191-193.

1常磊玲,朱春鹤.一种新的生物序列模式挖掘算法[J].电脑知识与技术,2010,6(7):5140-5142.
2丁智斌,石浩磊.关系数据库设计与规范化[J].计算机与数字工程,2005,33(2):114-116. 被引量：30
3王淼,尚学群,薛贺.基于相邻频繁模式段的闭合序列模式挖掘算法[J].计算机工程与应用,2008,44(11):148-151.
4杨丽华.Oracle9i Report输出数据至EXCEL[J].电脑迷,2016(3).
5陈雄峰.一种序列家族Profile HMM寻优的PSO[J].昆明理工大学学报（理工版）,2007,32(1):50-53.
6封玮,邱秀芹.Java平台的打印功能研究[J].计算机系统应用,2004,13(5):72-75. 被引量：1
7李梦飞,高琪娟,徐舒,丁仁源.基于MVC模式的电子商务平台设计[J].信息系统工程,2008,21(10):66-67.
8金建刚,包晓安.自适应软件设计模式探讨[J].乐山师范学院学报,2014,29(5):28-32. 被引量：1
9吴艾,陶宏才.用JSP技术实现XML方案[J].电脑开发与应用,2002,15(4):33-35. 被引量：1
10姜淑娟,王令赛,薛猛,张艳梅,于巧,姚慧冉.基于模式组合的粒子群优化测试用例生成方法[J].软件学报,2016,27(4):785-801. 被引量：20

计算机工程与应用

2008年第2期

浏览历史

内容加载中请稍等...

基于相邻模式段组合的生物序列模式挖掘算法被引量：1

参考文献12

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于相邻模式段组合的生物序列模式挖掘算法 被引量：1

参考文献12

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于相邻模式段组合的生物序列模式挖掘算法被引量：1