期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于支持向量机的蛋白质命名实体识别的研究
1
作者 龚乐君 付亚星 +2 位作者 孙啸 谢建明 于双鑫 《计算生物学》 2011年第2期5-10,共6页
发展一种利用支持向量机识别蛋白质命名实体的方法,选择四组特征对蛋白质语料进行识别实验。实验表明,与基线系统相比,上下文特征有较小的增幅,而当前词的词性及词形的组合特征获得了最好的性能,达到78.43%的准确率。这一研究结果显示... 发展一种利用支持向量机识别蛋白质命名实体的方法,选择四组特征对蛋白质语料进行识别实验。实验表明,与基线系统相比,上下文特征有较小的增幅,而当前词的词性及词形的组合特征获得了最好的性能,达到78.43%的准确率。这一研究结果显示词性及词形特征在蛋白质实体识别中起着重要的作用。 展开更多
关键词 支持向量机 蛋白质实体识别 特征选择
下载PDF
基于最大期望算法的蛋白质交互关系识别
2
作者 蔡松成 牛耘 《计算机技术与发展》 2018年第8期48-52,共5页
针对基于远监督的方法中训练数据存在噪音的问题,采用了一种基于最大期望(EM)算法的多实例多标记的方法来进行蛋白质关系的抽取。首先通过对大规模生物医学文本的自动搜索建立目标蛋白质对的签名档,提取出签名档中的词法和语法等特征,... 针对基于远监督的方法中训练数据存在噪音的问题,采用了一种基于最大期望(EM)算法的多实例多标记的方法来进行蛋白质关系的抽取。首先通过对大规模生物医学文本的自动搜索建立目标蛋白质对的签名档,提取出签名档中的词法和语法等特征,作为蛋白质对签名档的向量空间模型(VSM);然后引入隐变量,将蛋白质对的签名档及其标签构建为多实例多标记学习模型,利用最大期望算法来迭代消除训练数据中的噪音;最后通过有监督的方法来预测未知蛋白质对的交互关系。针对蛋白质对描述中还存在的其他蛋白质名称会对交互关系的判断产生影响,改进了蛋白质对的特征表示。实验结果表明,该方法较原始的最大期望算法取得了更高且均衡的精确度和召回率。 展开更多
关键词 蛋白质交互 最大期望算法 多实例多标记 蛋白质实体识别
下载PDF
生物医学文献中的蛋白质关系抽取研究 被引量:6
3
作者 赵哲焕 杨志豪 +1 位作者 孙聪 林鸿飞 《中文信息学报》 CSCD 北大核心 2018年第7期82-90,共9页
蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,... 蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,关系词,蛋白质2"),但是召回率较低。针对以上问题,该文提出了一种混合机器学习和规则方法的蛋白质关系抽取框架。该框架先利用机器学习方法完成命名实体识别和二元关系抽取,然后利用基于句法模板和词典匹配的方法抽取表示当前两个蛋白质间关系类型的关系词。该方法在AImed语料上取得了40.18%的F值,远高于基于规则的Stanford Open IE方法。 展开更多
关键词 关系词抽取 蛋白质实体识别 蛋白质关系抽取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部