期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于正则表达式构建学习的网页信息抽取方法 被引量:9
1
作者 朱文琰 郑肖雄 《计算机应用与软件》 2017年第2期14-19,79,共7页
正则表达式作为信息抽取领域中的一种常用方法已经被广泛应用多年。然而构建高质量并且复杂度较高的正则表达式通常需要耗费大量人工成本,为此,提出一种基于正则表达式状态转换的算法来学习复杂正则表达式的构建过程。该算法需要给定输... 正则表达式作为信息抽取领域中的一种常用方法已经被广泛应用多年。然而构建高质量并且复杂度较高的正则表达式通常需要耗费大量人工成本,为此,提出一种基于正则表达式状态转换的算法来学习复杂正则表达式的构建过程。该算法需要给定输入初始正则以及正反例样本,初始正则表达式在经过析取分离与合并交叉两大类正则表达式状态转换之后,得到候选正则表达式集合,利用F值评估候选项的信息抽取效果,通过贪心的启发式策略选择一个最优正则表达式作为输出。在多种数据集上对算法进行测评。实验表明,该算法性能与准确度均优于常规的机器学习方法。尤其在较小规模训练集和跨数据集上依然有较好的效果。 展开更多
关键词 正则表达式构建 状态转换 WEB信息抽取
下载PDF
基于异质网络的长非编码RNA和蛋白质相互作用的预测算法研究 被引量:1
2
作者 郑肖雄 朱文琰 《计算机应用与软件》 2017年第3期227-232,共6页
长非编码RNA在生物过程中扮演着非常重要的角色,长非编码RNA可以与多种蛋白质结合发挥其生物功能,预测长非编码RNA和蛋白质的相互作用也成为了研究长非编码RNA功能的途径之一。由于长非编码RNA的低保守性,通过提取特征和用机器学习算法... 长非编码RNA在生物过程中扮演着非常重要的角色,长非编码RNA可以与多种蛋白质结合发挥其生物功能,预测长非编码RNA和蛋白质的相互作用也成为了研究长非编码RNA功能的途径之一。由于长非编码RNA的低保守性,通过提取特征和用机器学习算法预测它和蛋白质之间的相互作用将会不太合适。LPHeteSim算法是一种基于对称路径随机游走的方法,它可以衡量异质长非编码RNA和蛋白质相互作用网络中两者的相关性。在导质网络中,LPHeteSim算法可以有效地预测两者的相互作用,实验结果验证了算法的有效性。 展开更多
关键词 长非编码RNA和蛋白质相互作用 随机游走 异质网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部