期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
地球物理测井反问题机器学习数据集的构建方法研究 被引量:2
1
作者 邵蓉波 史燕青 +3 位作者 周军 肖立志 廖广志 侯圣峦 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2023年第7期3086-3101,共16页
基于数据驱动机器学习的智能地球物理测井有望显著提高测井资料处理与解释的效率,具有广阔的应用前景.但是,数据驱动的测井反演如储层参数预测面临小样本、少标签和可解释性差等困难.通常,人工解释实测数据集是测井机器学习标签的主要来... 基于数据驱动机器学习的智能地球物理测井有望显著提高测井资料处理与解释的效率,具有广阔的应用前景.但是,数据驱动的测井反演如储层参数预测面临小样本、少标签和可解释性差等困难.通常,人工解释实测数据集是测井机器学习标签的主要来源.由于井下油气储层复杂多样,测井反演具有多解性,且地层具有非均质性,实测数据集构建的标签体系不仅量少,可靠性也存疑.本文提出基于地质领域知识和岩石物理机理模型,通过正演模拟构建测井反问题机器学习数据集的方法.从地质约束出发,综合考虑井眼环境、测井仪器、地层模型及流体分布等影响,由测井领域知识正演生成测井数据以弥补实测数据集的不足,以此实现机理模型与数据驱动的融合.数值实验结果表明,正演生成的测井数据集有效扩充了样本和标签数量,其参与储层参数预测及储层划分深度神经网络训练,对发展数据驱动及数据与机理混合驱动的方法、提升测井储层评价参数预测模型效果,成效显著. 展开更多
关键词 地球物理测井 反问题 机器学习 数据集 正演模拟 机理模型
下载PDF
基于语义文法的网络舆情精准分析方法研究 被引量:3
2
作者 侯圣峦 刘磊 曹存根 《计算机科学》 CSCD 北大核心 2014年第10期225-231,237,共8页
传统的基于关键词统计分析的网络舆情分析方法由于缺少对舆情文本必要的语义处理,往往导致分析结果不准确。提出一种基于语义文法的网络舆情精准分析新方法。该方法包括两部分:首先是可执行的网络舆情精准分析语言Eipoaal,它可根据实际... 传统的基于关键词统计分析的网络舆情分析方法由于缺少对舆情文本必要的语义处理,往往导致分析结果不准确。提出一种基于语义文法的网络舆情精准分析新方法。该方法包括两部分:首先是可执行的网络舆情精准分析语言Eipoaal,它可根据实际舆情分析需求设计Eipoaal程序,具有一定的通用性;二是网络舆情精准分析系统Ipoaas,它为Eipoaal提供运行平台。目前,已经实现了该系统,并应用到贪腐主题的网络舆情分析中,实验结果证明了方法的有效性。 展开更多
关键词 网络舆情分析 语义文法 舆情本体 多主体
下载PDF
文本摘要常用数据集和方法研究综述 被引量:20
3
作者 侯圣峦 张书涵 费超群 《中文信息学报》 CSCD 北大核心 2019年第5期1-16,共16页
成为人们从互联网上海量文本信息中便捷获取知识的重要手段。现有方法都是在特定数据集上进行训练和效果评价,包括一些公用数据集和作者自建数据集。已有综述文献对现有方法进行全面细致的总结,但大多都是对方法进行总结,而缺少对数据... 成为人们从互联网上海量文本信息中便捷获取知识的重要手段。现有方法都是在特定数据集上进行训练和效果评价,包括一些公用数据集和作者自建数据集。已有综述文献对现有方法进行全面细致的总结,但大多都是对方法进行总结,而缺少对数据集的详细描述。该文从调研数据集的角度出发,对文本摘要常用数据集及在该数据集上的经典和最新方法进行综述。对公用数据集的综述包括数据来源、语言及获取方式等,对自建数据集的总结包括数据规模、获取和标注方式等。对于每一种公用数据集,给出了文本摘要问题的形式化定义。同时,对经典和最新方法在特定数据集上的实验效果进行了分析。最后,总结了已有常用数据集和方法的现状,并指出存在的一些问题。 展开更多
关键词 文本摘要 自然语言处理 机器学习 人工智能
下载PDF
面向中文的修辞结构关系分类体系及无歧义标注方法 被引量:3
4
作者 侯圣峦 费超群 张书涵 《中文信息学报》 CSCD 北大核心 2019年第7期20-30,共11页
修辞结构理论是一种重要的篇章结构理论,其核心是修辞结构关系。该文基于修辞结构理论,结合中文文本特点,提出面向中文的层次化修辞结构关系分类体系及多元定义。同时,针对标注者遇到的歧义问题,提出了无歧义标注方法。为了便于标注,设... 修辞结构理论是一种重要的篇章结构理论,其核心是修辞结构关系。该文基于修辞结构理论,结合中文文本特点,提出面向中文的层次化修辞结构关系分类体系及多元定义。同时,针对标注者遇到的歧义问题,提出了无歧义标注方法。为了便于标注,设计并实现了基于Java图形界面的标注工具RSTTagger,该工具以句子的主谓结构关键词构成的元组作为基本标注单位,自底向上逐级标注,最终标注成一棵完整的修辞结构关系树。为验证标注结果的一致性,选取160篇中文外贸领域语料进行标注,不同标注者同时标注其中50篇,标注一致性达到76.63%。该标注框架可以应用到其他领域语料标注中,已标注的160篇语料可以作为篇章结构理论研究的基础语料库。 展开更多
关键词 自然语言处理 修辞结构理论 修辞结构关系 篇章结构分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部