期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于正则表达式构建学习的网页信息抽取方法
被引量:
9
1
作者
朱文琰
郑肖雄
《计算机应用与软件》
2017年第2期14-19,79,共7页
正则表达式作为信息抽取领域中的一种常用方法已经被广泛应用多年。然而构建高质量并且复杂度较高的正则表达式通常需要耗费大量人工成本,为此,提出一种基于正则表达式状态转换的算法来学习复杂正则表达式的构建过程。该算法需要给定输...
正则表达式作为信息抽取领域中的一种常用方法已经被广泛应用多年。然而构建高质量并且复杂度较高的正则表达式通常需要耗费大量人工成本,为此,提出一种基于正则表达式状态转换的算法来学习复杂正则表达式的构建过程。该算法需要给定输入初始正则以及正反例样本,初始正则表达式在经过析取分离与合并交叉两大类正则表达式状态转换之后,得到候选正则表达式集合,利用F值评估候选项的信息抽取效果,通过贪心的启发式策略选择一个最优正则表达式作为输出。在多种数据集上对算法进行测评。实验表明,该算法性能与准确度均优于常规的机器学习方法。尤其在较小规模训练集和跨数据集上依然有较好的效果。
展开更多
关键词
正则表达式构建
状态转换
WEB信息抽取
下载PDF
职称材料
基于异质网络的长非编码RNA和蛋白质相互作用的预测算法研究
被引量:
1
2
作者
郑肖雄
朱文琰
《计算机应用与软件》
2017年第3期227-232,共6页
长非编码RNA在生物过程中扮演着非常重要的角色,长非编码RNA可以与多种蛋白质结合发挥其生物功能,预测长非编码RNA和蛋白质的相互作用也成为了研究长非编码RNA功能的途径之一。由于长非编码RNA的低保守性,通过提取特征和用机器学习算法...
长非编码RNA在生物过程中扮演着非常重要的角色,长非编码RNA可以与多种蛋白质结合发挥其生物功能,预测长非编码RNA和蛋白质的相互作用也成为了研究长非编码RNA功能的途径之一。由于长非编码RNA的低保守性,通过提取特征和用机器学习算法预测它和蛋白质之间的相互作用将会不太合适。LPHeteSim算法是一种基于对称路径随机游走的方法,它可以衡量异质长非编码RNA和蛋白质相互作用网络中两者的相关性。在导质网络中,LPHeteSim算法可以有效地预测两者的相互作用,实验结果验证了算法的有效性。
展开更多
关键词
长非编码RNA和蛋白质相互作用
随机游走
异质网络
下载PDF
职称材料
题名
基于正则表达式构建学习的网页信息抽取方法
被引量:
9
1
作者
朱文琰
郑肖雄
机构
复旦大学计算机科学技术学院智能信息处理重点实验室
出处
《计算机应用与软件》
2017年第2期14-19,79,共7页
文摘
正则表达式作为信息抽取领域中的一种常用方法已经被广泛应用多年。然而构建高质量并且复杂度较高的正则表达式通常需要耗费大量人工成本,为此,提出一种基于正则表达式状态转换的算法来学习复杂正则表达式的构建过程。该算法需要给定输入初始正则以及正反例样本,初始正则表达式在经过析取分离与合并交叉两大类正则表达式状态转换之后,得到候选正则表达式集合,利用F值评估候选项的信息抽取效果,通过贪心的启发式策略选择一个最优正则表达式作为输出。在多种数据集上对算法进行测评。实验表明,该算法性能与准确度均优于常规的机器学习方法。尤其在较小规模训练集和跨数据集上依然有较好的效果。
关键词
正则表达式构建
状态转换
WEB信息抽取
Keywords
RegEx construction
State transition
Web information extraction
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
基于异质网络的长非编码RNA和蛋白质相互作用的预测算法研究
被引量:
1
2
作者
郑肖雄
朱文琰
机构
复旦大学计算机科学技术学院智能信息处理重点实验室
出处
《计算机应用与软件》
2017年第3期227-232,共6页
文摘
长非编码RNA在生物过程中扮演着非常重要的角色,长非编码RNA可以与多种蛋白质结合发挥其生物功能,预测长非编码RNA和蛋白质的相互作用也成为了研究长非编码RNA功能的途径之一。由于长非编码RNA的低保守性,通过提取特征和用机器学习算法预测它和蛋白质之间的相互作用将会不太合适。LPHeteSim算法是一种基于对称路径随机游走的方法,它可以衡量异质长非编码RNA和蛋白质相互作用网络中两者的相关性。在导质网络中,LPHeteSim算法可以有效地预测两者的相互作用,实验结果验证了算法的有效性。
关键词
长非编码RNA和蛋白质相互作用
随机游走
异质网络
Keywords
LncRNA-protein interaction Randow walk Heterogeneous network
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于正则表达式构建学习的网页信息抽取方法
朱文琰
郑肖雄
《计算机应用与软件》
2017
9
下载PDF
职称材料
2
基于异质网络的长非编码RNA和蛋白质相互作用的预测算法研究
郑肖雄
朱文琰
《计算机应用与软件》
2017
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部