-
题名基于自适应隐马尔可夫模型的石油领域文档分词
被引量:9
- 1
-
-
作者
宫法明
朱朋海
-
机构
中国石油大学(华东)计算机与通信工程学院
-
出处
《计算机科学》
CSCD
北大核心
2018年第B06期97-100,共4页
-
基金
科技部创新方法工作:大数据环境下的油气开采创新方法研究与应用示范(2015IM010300)资助
-
文摘
中文分词技术是把没有分割标志的汉字串转换为符合语言应用特点的词串的过程,是构建石油领域本体的第一步。石油领域的文档有其独有的特点,分词更加困难,目前仍然没有有效的分词算法。通过引入术语集,在隐马尔可夫分词模型的基础上,提出了一种基于自适应隐马尔可夫模型的分词算法。该算法以自适应隐马尔可夫模型为基础,结合领域词典和互信息,以语义约束和词义约束校准分词,实现对石油领域专业术语和组合词的精确识别。通过与中科院的NLPIR汉语分词系统进行对比,证明了所提算法进行分词时的准确率和召回率有显著提高。
-
关键词
中文分词
隐马尔可夫模型
组合词
石油
-
Keywords
Chinese word segmentation
Hidden Markov model
Combined character
Petroleum
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进词向量的石油文档语义关系识别
- 2
-
-
作者
宫法明
朱朋海
-
机构
中国石油大学(华东)计算机与通信工程学院
-
出处
《计算机系统应用》
2018年第8期153-158,共6页
-
基金
科技部创新方法工作专项(2015IM01030)~~
-
文摘
语义关系识别是对文档进行处理识别出包含的语义关系的过程,是构建本体重要组成部分之一.在石油领域本体的构建过程中,由于石油领域的文档具有组合词多的特点,语义关系识别更加困难.目前使用的语义识别算法主要是基于关联规则的识别算法,但此类算法没有领域针对性.通过分析石油文档的特点,提出一种基于改进词向量的石油文档语义关系识别算法,以连续词袋(Continuous Bag-Of-Words,CBOW)模型为基础,对石油专业术语进行扩展训练,引入负采样和二次采样技术提高训练准确率和效率,利用向量特征训练支持向量机(Support Vector Mechine,SVM)分类器进行语义关系识别.实验结果表明,该方法训练的词向量能够准确识别石油领域的语义关系,在石油领域具有明显的优势.
-
关键词
词向量
语义关系识别
SVM
-
Keywords
word vector
semantic relationship recognition
Support Vector Mechine (SVM)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于像素轮廓追踪方法的测井曲线提取
被引量:1
- 3
-
-
作者
朱朋海
宋超
陈华
-
机构
中国石油大学华东理学院
-
出处
《电脑知识与技术》
2015年第4期225-227,共3页
-
基金
中国石油大学(华东)国家级大学生创新实验项目(No.201310425065),中国石油大学(华东)教改项目(JY-B201455)
-
文摘
测井曲线的数字化与可视化有助于测井数据的信息化。利用曲线的轮廓特征,提取出曲线中的轮廓,利用次轮廓特征还原出原曲线。实验表明,还原出来的曲线和原曲线基本一致,包含的信息没有丢失,可以应用于提取图纸中测井曲线,并加以推广到一般图之中曲线的提取。
-
关键词
图像处理
扫描
像素追踪
曲线数字化
灰度值
-
Keywords
image processing
scanning
contour tracing
digitization of the curve
the value of grayscale
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于多核并行的非线性方程蒙特卡洛计算方法
被引量:3
- 4
-
-
作者
薛小超
王克
朱朋海
-
机构
中国石油大学(华东)理学院
-
出处
《电脑知识与技术》
2014年第7X期5115-5119,共5页
-
基金
国家级大学生创新创业训练计划(No.201310425065)
-
文摘
随着社会生产生活的发展,对计算机的依赖越来越大,要解决庞大计算量的实际问题就需要高性能的计算机以及高速的计算方法。在应用蒙特卡洛方法求解非线性方程组时,利用多线程技术,串行改并行,使用WinAPI、OpenMP、MPI三种并行模式得出三种最优的并行计算方法。根据数值试验分析了各种计算模式的优缺点,发现MPI并行模式计算速度最快,最终得以结论并行计算模式可以推广到各种数值计算问题。
-
关键词
并行计算
多线程
WinAPI
OPENMP
MPI
-
Keywords
parallel computing
multi thread
WinAPI
OpenMP
MPI
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名非线性方程的多核并行蒙特卡洛求解方法
被引量:2
- 5
-
-
作者
王克
薛小超
朱朋海
-
机构
中国石油大学(华东)理学院计算数学系
中国石油大学(华东)理学院应用数学系
-
出处
《现代计算机(中旬刊)》
2014年第7期38-44,共7页
-
基金
国家级大学生创新创业训练计划(No.201310425065)
-
文摘
采用多核技术,通过使用Win32API、OpenMP、MPI三种并行模式将求解非线性方程的蒙特卡洛方法的串行方法并行化,得到5种并行化方法。根据数值试验结果,对各种并行方法进行比较,发现Win32API并行模式计算速度最快,最终将结论加以推广。
-
关键词
多核
并行计算
WIN32API
OPENMP
MPI
-
Keywords
Multi-Core
Parallel Computation
Win32API
OpenMP
MPI
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-