期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
领域本体概念实例、属性和属性值的抽取及关系预测 被引量:32
1
作者 郭剑毅 李真 +1 位作者 余正涛 张志坤 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期383-389,共7页
研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转... 研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转化为命名实体识别问题,利用条件随机场建模进行命名实体识别;在此基础上定义实体间对应关系,对概念实例、属性及属性值三者的对应关系做预测,把概念实例、属性与属性值三者之间存在关系的向量标记为1,否则标记为0,利用支持向量机建模进行关系的预测.且以云南旅游景点概念实例、属性及属性值进行六组相关的实验.实验表明,在开放测试中协作分类器精确度达到84.4%、召回率达到82.7%及F值达到为83.6%,相比于词语共现F值提高了20个百分点. 展开更多
关键词 领域本体 概念实例抽取 属性抽取 属性值抽取 条件随机场 支持向量机
下载PDF
基于多核融合的中文领域实体关系抽取 被引量:19
2
作者 郭剑毅 陈鹏 +3 位作者 余正涛 线岩团 毛存礼 赵君 《中文信息学报》 CSCD 北大核心 2016年第1期24-29,共6页
针对传统径向基核函数的训练矩阵中所有元素都十分接近零而不利于分类的问题,该文提出了一种融合了改进的径向基核函数及其他核函数的多核融合中文领域实体关系抽取方法。利用径向基核函数的数学特性,提出一种改进的训练矩阵,使训练矩... 针对传统径向基核函数的训练矩阵中所有元素都十分接近零而不利于分类的问题,该文提出了一种融合了改进的径向基核函数及其他核函数的多核融合中文领域实体关系抽取方法。利用径向基核函数的数学特性,提出一种改进的训练矩阵,使训练矩阵中的向量离散化,并以此改进的径向基核函数融合多项式核函数及卷积树核函数,通过枚举的方式寻找最优的复合核函数参数,并以上述多核融合方法与支持向量机结合进行中文领域实体关系抽取。在旅游领域的语料上测试,相对于单一核方法及传统多核融合方法,关系抽取性能得到提高。 展开更多
关键词 关系抽取 径向基核函数 卷积核函数 多核融合
下载PDF
基于主动学习的最小二乘支持向量机稀疏化 被引量:9
3
作者 余正涛 邹俊杰 +2 位作者 赵兴 苏磊 毛存礼 《南京理工大学学报》 EI CAS CSCD 北大核心 2012年第1期12-17,共6页
针对最小二乘支持向量机(LSSVM)稀疏化问题,提出一种基于主动学习的LSSVM数据稀疏化学习算法。首先基于核聚类的方法选取初始样本,并利用LSSVM构建一个最小分类器,然后计算样本在分类器作用下的分布,选择最接近分类面的样本进行标记,最... 针对最小二乘支持向量机(LSSVM)稀疏化问题,提出一种基于主动学习的LSSVM数据稀疏化学习算法。首先基于核聚类的方法选取初始样本,并利用LSSVM构建一个最小分类器,然后计算样本在分类器作用下的分布,选择最接近分类面的样本进行标记,最后将该标记样本加入训练集建立新的分类器,重复上述过程直到模型精度满足要求,以此建立部分样本的LSSVM稀疏化模型。利用加利福尼亚大学欧文分校(UCI)提供的6种数据集进行实验,结果表明,提出的方法使LSSVM的稀疏性提高了46%以上,减少了标注样本带来的成本。 展开更多
关键词 最小二乘支持向量机 稀疏化 主动学习 分类
下载PDF
融合领域知识短语树核函数的中文领域实体关系抽取 被引量:9
4
作者 陈鹏 郭剑毅 +3 位作者 余正涛 严馨 张志坤 高盛祥 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第1期181-186,共6页
针对在核函数方法中,传统短语树只包含通用领域信息难以训练出适应特定领域关系抽取模型的问题,本文提出一种融入领域知识短语树的中文领域实体关系抽取方法.基于Web上中文特定领域网站的信息结构特点,构建出能反映特定领域实体语义关... 针对在核函数方法中,传统短语树只包含通用领域信息难以训练出适应特定领域关系抽取模型的问题,本文提出一种融入领域知识短语树的中文领域实体关系抽取方法.基于Web上中文特定领域网站的信息结构特点,构建出能反映特定领域实体语义关系的领域知识树,并将其融合到实例句的句法树中,得到特定领域实体语义树.然后通过支持向量机训练,得到实体关系的分类模型,对特定领域实体关系进行抽取.在收集的600篇旅游领域语料上进行关系抽取实验,结果表明:本文所提出的方法优于不融入领域信息的方法,F值提高了3.4%. 展开更多
关键词 领域知识树 核函数 隐式关系抽取 支持向量机
下载PDF
泰语人名、地名、机构名实体识别研究 被引量:6
5
作者 王红斌 郜洪奎 +1 位作者 沈强 线岩团 《系统仿真学报》 CAS CSCD 北大核心 2019年第5期1010-1018,共9页
泰语命名实体识别是把泰语文本中的人名、地名、机构名等识别出来。由于泰语构词方法和语法规则复杂,针对这一问题,将泰语命名实体识别任务转化为对泰语句子中的词汇序列进行标记。结合泰语语言特点,选择合适的泰语上下文特征,分别使用... 泰语命名实体识别是把泰语文本中的人名、地名、机构名等识别出来。由于泰语构词方法和语法规则复杂,针对这一问题,将泰语命名实体识别任务转化为对泰语句子中的词汇序列进行标记。结合泰语语言特点,选择合适的泰语上下文特征,分别使用隐马尔科夫模型和条件随机场模型在泰语实体识别训练语料上进行了模型构建,并在测试语料上对所构建的序列标注模型进行了实验验证。实验结果表明使用隐马尔科夫模型和条件随机场模型进行泰语人名、地名、机构名实体识别是可行的,并取得了较好的效果。 展开更多
关键词 命名实体识别 隐马尔科夫统计模型 条件随机场统计模型 序列标注
下载PDF
基于Listwise的深度学习专家排序方法 被引量:7
6
作者 李贤慧 余正涛 +2 位作者 魏斯超 高盛祥 王立人 《模式识别与人工智能》 EI CSCD 北大核心 2015年第11期976-982,共7页
针对传统专家列表排序方法易陷入局部最小和训练时间过长、不能较好逼近排序函数的问题,结合深度神经网络与Listwise的专家排序方法,提出基于Listwise的深度学习专家排序方法.该方法首先提出深度学习专家排序模型,通过无监督的自训练得... 针对传统专家列表排序方法易陷入局部最小和训练时间过长、不能较好逼近排序函数的问题,结合深度神经网络与Listwise的专家排序方法,提出基于Listwise的深度学习专家排序方法.该方法首先提出深度学习专家排序模型,通过无监督的自训练得到较优参数逐层初始化权重.再将查询对应的专家文档形成的训练实例输入到受限玻尔兹曼机中进行训练,通过余弦值取代矩阵相减计算权重,完成权重整体更新,构建深度学习专家排序模型.对比实验表明文中方法具有较好效果,引入深度学习能有效提升排序精度. 展开更多
关键词 专家排序 Listwise 深度学习 受限玻尔兹曼机(RBM)
下载PDF
基于多分类器加权投票法的越南语组合歧义消歧 被引量:5
7
作者 李佳 郭剑毅 +3 位作者 刘艳超 余正涛 线岩团 阮氏青娥 《计算机科学》 CSCD 北大核心 2018年第1期167-172,共6页
组合歧义消解是分词中的关键问题之一,直接影响到分词的准确率。为了解决越南语组合歧义对分词的影响问题,结合越南语组合型词的特点,提出了一种基于集成学习的越南语组合歧义消解方法。该方法首先通过人工选取越南语组合歧义词,构建出... 组合歧义消解是分词中的关键问题之一,直接影响到分词的准确率。为了解决越南语组合歧义对分词的影响问题,结合越南语组合型词的特点,提出了一种基于集成学习的越南语组合歧义消解方法。该方法首先通过人工选取越南语组合歧义词,构建出越南语组合歧义字段库,对越南语语料与越南语组合词词典进行匹配,抽取出越南语组合歧义字段;其次,采用三类分类器引入越南语词频特征和上下文信息,构建三类分类器消解模型,得到三类分类器消解结果;最后,计算出各分类器权值,通过阈值对越南语组合歧义进行最终分类。实验表明,所提方法的正确率达到了83.32%,与消歧结果最好的单个分类器相比准确率提高了5.81%。 展开更多
关键词 组合词词典 组合歧义消解 越南语 集成学习 加权投票法
下载PDF
融合越南语语言特征与改进PCFG的越南语短语树库构建 被引量:4
8
作者 李英 郭剑毅 +2 位作者 余正涛 线岩团 陈玮 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第2期357-367,共11页
短语树库是自然语言处理的研究和实际应用的重要资源,就越南语而言目前也缺乏这类树库资源,不利于汉越双语信息处理工作.提出一种融合越南语语法特征与改进PCFG(概率上下文无关文法)的越南语短语树库构建方法,能够自动分析出越南语的短... 短语树库是自然语言处理的研究和实际应用的重要资源,就越南语而言目前也缺乏这类树库资源,不利于汉越双语信息处理工作.提出一种融合越南语语法特征与改进PCFG(概率上下文无关文法)的越南语短语树库构建方法,能够自动分析出越南语的短语结构树,从而可解决了越南语短语树库的自动构建问题.首先通过分析越南语的语言特征,制定出越南语的语言特征集;然后利用Inside-Outside算法从人工标注的少量越南语短语树获取PCFG模型中的语法规则集;最后将语法特征集作为语法规则集的补充融入PCFG模型,用得到的新模型最终完成越南语短语树库的构建.实验结果表明,新的PCFG模型针对越南语短语树库构建的准确率达到了81.14%,相比传统PCFG模型以及基于最大熵的树库构建方法准确率明显提高了2%~3%. 展开更多
关键词 越南语 短语结构树 概率上下文无关文法 语法规则集 树库
下载PDF
基于WordNet的中泰文跨语言文本相似度计算 被引量:12
9
作者 石杰 周兰江 +1 位作者 线岩团 余正涛 《中文信息学报》 CSCD 北大核心 2016年第4期65-70,共6页
文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该... 文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该文提出一种基于WordNet的中泰文跨语言文本相似度的计算方法。首先对中泰文本进行预处理和特征选择,然后利用语义词典WordNet将中泰文本转换成中间层语言,最后在中间层上计算中泰文本的相似度。实验结果表明,该方法准确率达到82%。 展开更多
关键词 WORDNET 中间层语言 跨语言文本相似度
下载PDF
基于凸组合核函数的中文领域实体关系抽取 被引量:7
10
作者 陈鹏 郭剑毅 +3 位作者 余正涛 线岩团 严馨 魏斯超 《中文信息学报》 CSCD 北大核心 2013年第5期144-148,155,共6页
针对在采用支持核函数的机器学习算法进行基于特征的中文领域实体关系抽取中,不同核函数对不同中文领域关系抽取在效果上存在差异性的问题,该文提出一种基于凸组合核函数的中文领域实体关系抽取方法。首先,选取实体上下文的词、词性等信... 针对在采用支持核函数的机器学习算法进行基于特征的中文领域实体关系抽取中,不同核函数对不同中文领域关系抽取在效果上存在差异性的问题,该文提出一种基于凸组合核函数的中文领域实体关系抽取方法。首先,选取实体上下文的词、词性等信息,短语句法树信息及依存信息作为特征,然后通过以径向基核函数,Sigmoid核函数及多项式核函数组成的不同组合比例的凸组合核函数将特征矩阵映射成为不同的高维矩阵,利用支持向量机训练这些高维矩阵构建不同分类模型后测试抽取性能,以确定最优组合比例的凸组合核函数。在收集600篇旅游领域语料上进行关系抽取,实验结果表明最优凸组合核函数能增加实体关系抽取效果,F值达到62.9。 展开更多
关键词 关系抽取 凸组合核函数 支持向量机
下载PDF
越南语短语树到依存树的转换研究 被引量:4
11
作者 李英 郭剑毅 +2 位作者 余正涛 毛存礼 线岩团 《计算机科学与探索》 CSCD 北大核心 2017年第4期599-607,共9页
依存句法分析是自然语言处理的一个关键环节,目前对于越南语短语结构树的研究比较多,而依存结构树的研究就显得十分薄弱。提出了一种新的方法,尝试结合越南语的语言特点和语法特征,利用中心子节点过滤表的思想与统计的方法将越南语的短... 依存句法分析是自然语言处理的一个关键环节,目前对于越南语短语结构树的研究比较多,而依存结构树的研究就显得十分薄弱。提出了一种新的方法,尝试结合越南语的语言特点和语法特征,利用中心子节点过滤表的思想与统计的方法将越南语的短语结构树转换成依存结构树。首先依据中文依存关系标注体系与越南语的语法规则,制定出依存关系列表;然后结合越南语的语言特点,制定出中心子节点过滤表,利用中心子节点过滤表的思想进行初步转化;最后使用依存关系标注器来进行依存关系标注。基于转换后得到的依存结构树,利用MSTParser工具进一步训练得到更多的越南语依存结构树。对实验结果进行了抽样评估,树库转换的准确率达到了89.4%,较好地解决了越南语由短语树到依存树的转换问题。 展开更多
关键词 句法分析 中心子节点过滤表 短语结构 依存结构 树库
下载PDF
基于通用背景-联合估计(UB-JE)的说话人识别方法 被引量:5
12
作者 汪海彬 郭剑毅 +1 位作者 毛存礼 余正涛 《自动化学报》 EI CSCD 北大核心 2018年第10期1888-1895,共8页
在说话人识别中,有效的识别方法是核心.近年来,基于总变化因子分析(i-vector)方法成为了说话人识别领域的主流,其中总变化因子空间的估计是整个算法的关键.本文结合常规的因子分析方法提出一种新的总变化因子空间估计算法,即通用背景–... 在说话人识别中,有效的识别方法是核心.近年来,基于总变化因子分析(i-vector)方法成为了说话人识别领域的主流,其中总变化因子空间的估计是整个算法的关键.本文结合常规的因子分析方法提出一种新的总变化因子空间估计算法,即通用背景–联合估计(Universal background-joint estimation algorithm, UB-JE)算法.首先,根据高斯混合–通用背景模型(Gaussian mixture model-universal background model, GMM-UBM)思想提出总变化矩阵通用背景(UB)算法;其次,根据因子分析理论结合相关文献提出了一种总变化矩阵联合估计(JE)算法;最后,将两种算法相结合得到通用背景–联合估计(UB-JE)算法.采用TIMIT和MDSVC语音数据库,结合i-vector方法将所提的算法与传统算法进行对比实验.结果显示,等错误率(Equal error rate, EER)和最小检测代价函数(Minimum detection cost function, MinDCF)分别提升了8.3%与6.9%,所提方法能够提升i-vector方法的性能. 展开更多
关键词 总变化因子分析 总变化因子空间 通用背景–联合估计算法 说话人识别
下载PDF
SMFCC:一种新的语音信号特征提取方法 被引量:4
13
作者 汪海彬 余正涛 +1 位作者 毛存礼 郭剑毅 《计算机应用》 CSCD 北大核心 2016年第6期1735-1740,共6页
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD... 针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征.采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验.SMFCC特征的等错误率(EER)和最小检测代价(Min DCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法 LMFCC,比MFCC的EER和Min DCF08分别下降了3.6%与17.9%.实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率. 展开更多
关键词 S变换 奇异值分解 基于S变换的美尔倒谱系数 高斯混合模型-通用背景模型 说话人识别
下载PDF
基于双语LDA的跨语言文本相似度计算方法研究 被引量:7
14
作者 程蔚 线岩团 +2 位作者 周兰江 余正涛 王红斌 《计算机工程与科学》 CSCD 北大核心 2017年第5期978-983,共6页
基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相... 基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相似度方法计算新语料集双语文档的相似度,使用从类别间和类别内的主题分布离散度的角度改进的主题频率-逆文档频率方法计算特征主题权重。实验表明,改进后的权重计算对于基于双语LDA相似度算法的召回率有较大提高,算法对类别不受限且有较好的可靠性。 展开更多
关键词 双语LDA 跨语言文本相似度 余弦相似度 主题频率-逆文档频率
下载PDF
融合实体特性识别越南语复杂命名实体的混合方法 被引量:3
15
作者 刘艳超 郭剑毅 +3 位作者 余正涛 周兰江 严馨 陈秀琴 《智能系统学报》 CSCD 北大核心 2016年第4期503-512,共10页
命名实体识别是自然语言处理过程中的基础任务。本文针对越南语的复杂命名实体难识别及F值不够高的问题,提出了一种结合实体库的越南语命名实体识别混合方法。首先,本文根据越南语的语言和实体特点,选取有效的局部特征和全局特征,应用... 命名实体识别是自然语言处理过程中的基础任务。本文针对越南语的复杂命名实体难识别及F值不够高的问题,提出了一种结合实体库的越南语命名实体识别混合方法。首先,本文根据越南语的语言和实体特点,选取有效的局部特征和全局特征,应用最大熵模型进行越南语命名实体识别;其次,根据本文制定的命名实体的规则进行越南语命名实体识别;然后,结合两者的识别结果,以规则为主,统计为辅原则;最后经过人工校对,把获取到的正确标记的实体加入到实体库,动态扩增实体库,为规则制定和特征选取提供丰富的语料和依据。实验表明,该方法能够有效地结合规则与统计的方法优点,互相弥补不足,明显提高了识别的正确率、召回率和F值。 展开更多
关键词 越南语 实体库构建 实体识别 最大熵 规则 实体特点 全局特征 局部特征
下载PDF
融合特征约束模型的纳西-汉语双语词语对齐算法 被引量:2
16
作者 张涛 余正涛 +1 位作者 郭剑毅 曹先彬 《西安交通大学学报》 EI CAS CSCD 北大核心 2011年第10期48-53,共6页
针对纳西语、汉语因句法结构差异较大而导致双语词语自动对齐较为困难的问题,提出一种融合特征约束模型的纳西-汉语双语词语对齐算法.首先在语料中统计纳西-汉语词语区间扭曲和位置转换特性,并由此建立2个双语词语对齐的特征约束模型;... 针对纳西语、汉语因句法结构差异较大而导致双语词语自动对齐较为困难的问题,提出一种融合特征约束模型的纳西-汉语双语词语对齐算法.首先在语料中统计纳西-汉语词语区间扭曲和位置转换特性,并由此建立2个双语词语对齐的特征约束模型;然后将提出的特征约束模型融入词语对齐的对数线性模型框架,并结合最小错误率算法训练模型参数;最终搜索出最佳的词语对齐结果.实验以IBM Model3为词语对齐比较模型,结果表明,该双语词语对齐算法可以使纳西-汉语词语的对齐准确率提升21.9%. 展开更多
关键词 词语对齐 纳西 汉语 特征约束模型
下载PDF
融合领域命名实体识别的查询扩展方法研究 被引量:1
17
作者 邹俊杰 余正涛 +2 位作者 刘跃红 宗焕云 苏磊 《计算机工程与设计》 CSCD 北大核心 2012年第3期1229-1233,1250,共6页
针对领域知识特点和当前基本查询扩展方法的局限性,提出了在特定领域问答系统中将命名实体识别与基本查询扩展方法相结合对答案文本检索进行查询扩展的方法。该方法标注旅游领域18个类别的命名实体,并使用条件随机场理论建立实体识别模... 针对领域知识特点和当前基本查询扩展方法的局限性,提出了在特定领域问答系统中将命名实体识别与基本查询扩展方法相结合对答案文本检索进行查询扩展的方法。该方法标注旅游领域18个类别的命名实体,并使用条件随机场理论建立实体识别模型,将识别模型以线性插值方式分别融合到本文选用的基于TF-IDF、互信息和局部上下文分析3种基本查询扩展方法中,再选取出扩展词进行查询。在旅游领域数据集上的实验结果表明,该方法在3种基本查询扩展方法基础上使准确度提高15.8%以上,其中结合领域命名实体识别和局部上下文分析的查询扩展方法的准确度提高了21.4%。 展开更多
关键词 特定领域 查询扩展 命名实体识别 局部上下文分析 文本检索
下载PDF
基于跨语言语料的汉泰词分布表示 被引量:2
18
作者 张金鹏 周兰江 +2 位作者 线岩团 余正涛 何思兰 《计算机工程与科学》 CSCD 北大核心 2015年第12期2358-2365,共8页
词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习... 词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习扩展等方式在中文语料中嵌入泰语的互译词、同类词、上义词等,学习出泰语词在汉泰跨语言环境下的分布。实验基于学习到的跨语言词汇分布表示应用于双语文本相似度计算和汉泰混合语料集文本分类,均取得较好效果。 展开更多
关键词 弱监督学习扩展 跨语言语料 跨语言词汇分布表示 神经概率语言模型
下载PDF
触发词扩展、神经网络及依存分析相结合的事件研究 被引量:2
19
作者 王红斌 郜洪奎 《软件导刊》 2018年第1期19-21,40,共4页
事件抽取包括两大任务:识别事件和事件要素抽取。对于事件抽取的传统方法是模式匹配和机器学习。模式匹配包含规则有限,机器学习需要大量语料和众多特征。针对传统方法的不足,提出了结合触发词扩展、神经网络及依存分析相结合的方法。... 事件抽取包括两大任务:识别事件和事件要素抽取。对于事件抽取的传统方法是模式匹配和机器学习。模式匹配包含规则有限,机器学习需要大量语料和众多特征。针对传统方法的不足,提出了结合触发词扩展、神经网络及依存分析相结合的方法。该方法利用触发词扩展增加触发词数量,利用神经网络选择特征进行事件分类,利用依存分析挖掘词之间关系。实验证明该方法可行,在事件识别和事件要素抽取方面得到了较好结果。 展开更多
关键词 机器学习 事件识别 事件要素抽取 依存分析 神经网络
下载PDF
基于事件句关联的新闻主题模型构建方法
20
作者 洪旭东 余正涛 严梅 《微型电脑应用》 2017年第1期50-53,80,共5页
考虑新闻事件句关联信息对新闻主题构建的重要指导作用,提出了基于事件分析的新闻主题模型构建方法。利用新闻文本中事件句中包含的事件元素,判断事件句之间的关联,并将这一关联信息作为LDA建模过程中主题分配的指导信息。从而获得不同... 考虑新闻事件句关联信息对新闻主题构建的重要指导作用,提出了基于事件分析的新闻主题模型构建方法。利用新闻文本中事件句中包含的事件元素,判断事件句之间的关联,并将这一关联信息作为LDA建模过程中主题分配的指导信息。从而获得不同新闻文档在主题空间上更加准确的概率分布。实验结果表明,提出的新闻主题模型(E-LDA)比LDA主题模型对新闻文本有更好的表达效果。 展开更多
关键词 事件句关联 LDA 新闻主题模型 E—LDA
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部