基于密度约束和间隙约束的对比模式挖掘被引量：1

Distinguishing Sequence Patterns Mining Based on Density and Gap Constraints

下载PDF

导出

摘要对比模式挖掘是序列模式挖掘的一个重要分支,带有密度约束的对比模式有助于生物学家发现生物序列中的特殊因子的分布情况。为此,文中提出了MPDG(Mining distinguishing sequence Patterns based on Density and Gap constraint)算法,该算法应用网树结构挖掘满足密度约束和间隙约束的对比模式,在仅需扫描一遍序列库的情况下,该算法可计算当前模式的所有超模式的支持度,从而提高挖掘效率。最后,在真实蛋白质数据集上进行实验,实验结果验证了MPDG算法的有效性。 Distinguishing patterns mining is an important branch of sequence patterns mining,and distinguishing patterns with density constraint can help biologists to find the distribution of special factors on biological sequences.This paper proposed an algorithm,named MPDG(Mining distinguishing sequence Patterns based on Density and Gap constraint),which employs Nettree data structure to mine the distinguishing patterns satisfying the density and gap constraints.The algorithm is efficient since it calculates all super-patterns’supports of current pattern with one-way scanning the sequence database.Experimental results on real protein datasets verify the effectiveness of MPDG.

作者魏芹双武优西刘靖宇朱怀忠 WEI Qin-shuang;WU You-xi　;LIU Jing-yu;ZHU Huai-zhong(School of Computer Science and Engineering,Hebei University of Technology,Tianjin 300401,China;Hebei Province Key Laboratory of Big Data Calculation,Tianjin 300401,China)

机构地区河北工业大学计算机科学与软件学院河北省大数据重点实验室

出处《计算机科学》 CSCD 北大核心 2018年第4期252-256,共5页 Computer Science

基金国家自然科学基金(61673159) 河北省自然科学基金(F2016202145) 黑龙江省自然科学基金(F2017019) 河北省科技计划项目(15210325) 河北省教育厅青年基金(QN2014192)资助

关键词模式挖掘对比模式密度约束网树 Pattern mining Distinguishing pattern Density constraint Nettree

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1方炜炜,谢伟,黄宏博,夏红科.基于隐私保护的序列模式挖掘[J].计算机科学,2016,43(12):195-199. 被引量：4
2杨皓,段磊,胡斌,邓松,王文韬,秦攀.带间隔约束的Top-k对比序列模式挖掘[J].软件学报,2015,26(11):2994-3009. 被引量：22
3王慧锋,段磊,左劼,王文韬,李钟麒,唐常杰.免预设间隔约束的对比序列模式高效挖掘[J].计算机学报,2016,39(10):1979-1991. 被引量：15
4武优西,吴信东,江贺,闵帆.一种求解MPMGOOC问题的启发式算法[J].计算机学报,2011,34(8):1452-1462. 被引量：21

二级参考文献63

1Lunteren J V. High-performance pattern-matching for intrusion detection//Proceedings of the 25th IEEE International Conference on Computer Communications ( INFOCOM 2006). Barcelona, Spain, 2006:1-13.
2Califf M E, Mooney R J. Bottom up relational learning of pattern matching rules for information extraction. Journal of Machine Learning Research, 2003, 4(6): 177-210.
3Cole R, Gottlieb L A, Lewenstein M. Dictionary matching and indexing with errors and don't cares//Proceedings of the 36th ACM Symposium on the Theory of Computing. New York, USA, 2004:91-100.
4Cole J R, Chai B, Farris R J, Wang Q, Kulam S A, McGartell D M, Garrity G M, Tiedje J M. The ribosomal database project (RDP-II) : Sequences and tools for high-throughput rRNA analysis. Nucleic Acids Research, 2005, 33(Sup. 1): 294-296.
5Zhang M, Kao B, Cheung D, Yip K. Mining periodic patterns with gap requirement from sequences//Proceedings of the ACM SIGMOD International Conference on Management of Data. Maryland, USA, 2005:623-633.
6Han J, Cheng H, Xin D, Yan X. Frequent pattern mining.. Current status and future directions. Data Mining and Knowledge Discovery, 2007, 15(1) : 55-86.
7Ji X, Bailey J, Dong G. Mining minimal distinguishing subsequence patterns with gap constraints. Knowledge and Information Systems, 2007, 11(3): 259- 286.
8He Y, Wu X, Zhu X, Arslan A N. Mining frequent patterns with wildcards from biological sequences//Proceedings of the 2007 IEEE International Conference on Information Reuse and Integration(IRI-07). Las Vegas, USA, 2007: 329-334.
9Fischer M J, Paterson M S. String matching and other products//Proeeedings of the 7th SIAM AMS Complexity of Computation. Cambridge, USA, 1974:113-125.
10Manber U, Baeza-Yates R. An algorithm for string matching with a sequence of don't cares. Information Processing Letters, 1991, 37(3): 133 -136.

共引文献52

1赵静,李俊,龙春,万巍,杨帆.基于频繁项集挖掘的长周期异常行为检测[J].计算机应用研究,2020,37(S02):221-223. 被引量：2
2李艳,孙乐,朱怀忠,武优西.网树求解有向无环图中具有长度约束的简单路径和最长路径问题[J].计算机学报,2012,35(10):2194-2203. 被引量：7
3侯宝剑,谢飞,胡学钢,刘应玲,王海平.基于后缀树的带有通配符的模式匹配研究[J].计算机科学,2012,39(12):177-180. 被引量：7
4王海平,胡学钢,谢飞,郭丹,吴信东.模式特征对带有通配符和长度约束的模式匹配问题的影响[J].模式识别与人工智能,2012,25(6):1013-1021. 被引量：8
5黄国林,郭丹,胡学钢.求解近似模式匹配的启发式算法[J].计算机科学与探索,2013,7(1):83-91.
6武优西,刘亚伟,郭磊,吴信东.子网树求解一般间隙和长度约束严格模式匹配[J].软件学报,2013,24(5):915-932. 被引量：14
7张浩,侯宝剑,叶明全.求解PMWOC问题的算法[J].安徽师范大学学报（自然科学版）,2014,37(3):242-246.
8项泰宁,郭丹,王海平,胡学钢.带通配符的模式匹配问题及其解空间特征分析[J].计算机科学,2014,41(9):269-273. 被引量：1
9强继朋,谢飞,高隽,胡学钢,吴信东.带任意长度通配符的模式匹配[J].自动化学报,2014,40(11):2499-2511. 被引量：5
10田芳.带可变长度空位和一次性条件的模式匹配[J].合肥学院学报（自然科学版）,2014,24(4):50-56.

同被引文献4

1王虎,丁世飞.序列模式挖掘研究与发展[J].计算机科学,2009,36(12):14-17. 被引量：33
2杨皓,段磊,胡斌,邓松,王文韬,秦攀.带间隔约束的Top-k对比序列模式挖掘[J].软件学报,2015,26(11):2994-3009. 被引量：22
3王慧锋,段磊,左劼,王文韬,李钟麒,唐常杰.免预设间隔约束的对比序列模式高效挖掘[J].计算机学报,2016,39(10):1979-1991. 被引量：15
4毛国君,胡殿军,谢松燕.基于分布式数据流的大数据分类模型和算法[J].计算机学报,2017,40(1):161-175. 被引量：54

引证文献1

1柴欣,高一寒,武优西,刘靖宇.基于密度约束的对比模式挖掘[J].计算机科学,2019,46(12):26-30. 被引量：2

二级引证文献2

1张帅.频繁模式压缩综述[J].科技风,2020(20):79-79.
2吴军,魏丹丹.面向课程教学数据的差异模式挖掘与讨论[J].计算机应用文摘,2023,39(7):115-117.

1王虹胜.基于ACO的多序列间最长公共子序列查询[J].现代计算机,2018,24(2):11-14.
2李云龙,王士祺,赵青川,季刚,李纪鹏.胃肠道肿瘤患者围手术期精准营养治疗[J].肿瘤代谢与营养电子杂志,2017,4(4):468-471. 被引量：3
3朱一波,鲍培明,吉根林.一种用户频繁移动模式并行挖掘算法[J].中国科学技术大学学报,2018,48(1):57-64. 被引量：1
4陈丽娟,谢伙生.带负项值的on-shelf效用项集并行挖掘算法[J].计算机与现代化,2018(4):13-16.
5王玲,李树林,徐培培,孟建瑶,彭开香.基于频繁项集树的时态关联规则挖掘算法[J].控制与决策,2018,33(4):591-599. 被引量：12
6刘云,黄亚飞.可替代封闭模式对生产数据的优化分析[J].西北大学学报（自然科学版）,2018,48(2):191-198.
7尚道文.成人中专化学教学点滴谈[J].农村成人教育,1996(5).
8明确任务　坚定信心　确保“两基”顺利实施──河南省副省长张世英在全省“两基”工作会议上的讲话[J].农村成人教育,1996(6):2-4.
9胡耀炜,段磊,李岭,韩超.基于密度感知模式的生物序列分类算法[J].计算机应用,2018,38(2):427-432.
10赤宇.成人中专《写作》课教法初探[J].农村成人教育,1996(6).

计算机科学

2018年第4期

浏览历史

内容加载中请稍等...

基于密度约束和间隙约束的对比模式挖掘被引量：1

参考文献4

二级参考文献63

共引文献52

同被引文献4

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于密度约束和间隙约束的对比模式挖掘 被引量：1

参考文献4

二级参考文献63

共引文献52

同被引文献4

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于密度约束和间隙约束的对比模式挖掘被引量：1