期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于条件随机域模型的中文实体关系抽取 被引量:2
1
作者 周晶 《计算机工程》 CAS CSCD 北大核心 2010年第24期192-194,共3页
针对信息抽取领域中存在的抽取结果难以满足需要的问题,给出基于条件随机域模型的方法,以解决组块标注和实体关系抽取问题。通过定义中文组块和实体关系的标注方式,选择比较通用的《人民日报》语料,训练出效率较高的二阶模板来抽取文本... 针对信息抽取领域中存在的抽取结果难以满足需要的问题,给出基于条件随机域模型的方法,以解决组块标注和实体关系抽取问题。通过定义中文组块和实体关系的标注方式,选择比较通用的《人民日报》语料,训练出效率较高的二阶模板来抽取文本中的实体关系。实验结果表明,该方法可以获得更好的抽取效果。 展开更多
关键词 信息抽取 组块标注 实体关系抽取 条件随机域模型
下载PDF
应用粒子群优化-条件随机域的文本生物实体识别 被引量:2
2
作者 豆增发 高琳 《西安交通大学学报》 EI CAS CSCD 北大核心 2010年第12期38-42,124,共6页
针对生物医学文本中传统生物实体识别算法的精确度不高的问题,提出了一种新的基于粒子群优化-条件随机域的生物实体识别算法.新算法利用改进的粒子群优化算法训练条件随机域模型,并将训练后的条件随机域模型应用到生物实体的识别上.改... 针对生物医学文本中传统生物实体识别算法的精确度不高的问题,提出了一种新的基于粒子群优化-条件随机域的生物实体识别算法.新算法利用改进的粒子群优化算法训练条件随机域模型,并将训练后的条件随机域模型应用到生物实体的识别上.改进的粒子群优化算法引入粒子群聚集度来防止粒子群过早地陷入局部收敛,用迭代间对数似然相对变化率来控制算法的收敛,用线性变化的惯性因子和学习因子来控制搜索范围.实验结果表明,基于改进粒子群优化的条件随机域模型较隐马尔科夫模型、最大熵马尔科夫模型、支持向量机以及传统条件随机域模型等方法具有更高的精确率和召回率. 展开更多
关键词 条件随机域模型 粒子群优化 粒子群聚集度 对数似然相对变化率 生物实体识别
下载PDF
基于分词提取重复串的未登录词遗漏量化模型 被引量:5
3
作者 张海军 史树敏 +1 位作者 丁溪源 黄河燕 《中文信息学报》 CSCD 北大核心 2011年第2期122-128,共7页
基于重复串构造候选词集合是未登录词识别(UWI)的重要方法,目前有两种策略用于重复串提取:基于字符和基于分词。该文针对这两种策略实施了大量对比研究,并提出了基于分词提取重复串的未登录词遗漏量化模型,用以评估未登录词漏召问题。... 基于重复串构造候选词集合是未登录词识别(UWI)的重要方法,目前有两种策略用于重复串提取:基于字符和基于分词。该文针对这两种策略实施了大量对比研究,并提出了基于分词提取重复串的未登录词遗漏量化模型,用以评估未登录词漏召问题。分析表明,该量化模型与实验数据之间具有良好的交互验证关系。根据对量化模型的讨论,该文得出了应用不同策略进行未登录词识别的可靠结论,该结论对后续研究具有一定的参考价值。 展开更多
关键词 未登录词识别 重复串 条件随机域模型 中文分词
下载PDF
基于半CRF模型的百科全书文本段落划分 被引量:2
4
作者 许勇 宋柔 《北京工业大学学报》 CAS CSCD 北大核心 2008年第2期204-210,共7页
介绍了基于半条件随机域(semi-Markov conditional random fields,简称semi-CRFs)模型的百科全书文本段落划分方法.为了克服单纯的HMM模型和CRF模型的段落类型重复问题,以经过整理的HMM模型状态的后验分布为基本依据,使用了基于词汇语... 介绍了基于半条件随机域(semi-Markov conditional random fields,简称semi-CRFs)模型的百科全书文本段落划分方法.为了克服单纯的HMM模型和CRF模型的段落类型重复问题,以经过整理的HMM模型状态的后验分布为基本依据,使用了基于词汇语义本体知识库的段落开始特征以及针对特定段落类型的提示性特征来进一步适应目标文本的特点.实验结果表明,该划分方法可以综合利用各种不同类型的信息,比较适合百科全书文本的段落结构,可以取得比单纯的HMM模型和CRF模型更好的性能. 展开更多
关键词 自然语言处理 机器学习 隐马尔科夫模型 文本段落划分 半条件随机域模型
下载PDF
一种应用组合特征的中文未登录词词性猜测研究 被引量:4
5
作者 张海军 冯冲 +1 位作者 史树敏 黄河燕 《小型微型计算机系统》 CSCD 北大核心 2010年第7期1402-1406,共5页
未登录词词性猜测是未登录词识别的重要步骤.论文中应用条件随机域模型,使用词的外部和内部特征(组合特征),进行中文未登录词的词性猜测.文中提出增加一种新颖的内部特征--汉字偏旁,来提高词性猜测效果.试验表明,使用组合特征的词性猜... 未登录词词性猜测是未登录词识别的重要步骤.论文中应用条件随机域模型,使用词的外部和内部特征(组合特征),进行中文未登录词的词性猜测.文中提出增加一种新颖的内部特征--汉字偏旁,来提高词性猜测效果.试验表明,使用组合特征的词性猜测方法是有效的,汉字偏旁的加入能显著提高词性猜测的准确性,开放试验的准确率达到94.67%.实验还初步证明,将汉字偏旁作为内部特征,在词法分析方面,具有一定的实用价值. 展开更多
关键词 中文分词 未登录词 条件随机域模型 词性猜测
下载PDF
藏语句法功能组块的边界识别 被引量:10
6
作者 李琳 龙从军 江荻 《中文信息学报》 CSCD 北大核心 2013年第6期165-168,共4页
藏语句法功能组块能够很好地描述藏语句子的基本骨架,是连接句法结构与语义描述的重要桥梁。根据藏语句法特点,该文作者提出五种句法功能组块及功能组块边界识别策略。首先描述了藏语句法功能组块的基本特点和标注体系,然后在此基础上... 藏语句法功能组块能够很好地描述藏语句子的基本骨架,是连接句法结构与语义描述的重要桥梁。根据藏语句法特点,该文作者提出五种句法功能组块及功能组块边界识别策略。首先描述了藏语句法功能组块的基本特点和标注体系,然后在此基础上提出了一种基于条件随机域(CRFs)模型的功能组块边界识别算法。小规模训练语料的实验结果表明,该方法可以有效的识别出功能组块边界,值得进一步研究。 展开更多
关键词 藏语句法功能组块 组块边界识别 条件随机域模型
下载PDF
基于多层协同纠错的中文层次句法分析 被引量:3
7
作者 蒋志鹏 关毅 董喜双 《中文信息学报》 CSCD 北大核心 2014年第4期29-36,共8页
层次句法分析是一种简单快速的完全句法分析方法,该方法将句法分析分解为词性标注、组块分析和构建句法树三个阶段。该文将其中的组块分析细分为基本块分析和复杂块分析,利用条件随机域模型代替最大熵模型进行序列化标注。由于层次句分... 层次句法分析是一种简单快速的完全句法分析方法,该方法将句法分析分解为词性标注、组块分析和构建句法树三个阶段。该文将其中的组块分析细分为基本块分析和复杂块分析,利用条件随机域模型代替最大熵模型进行序列化标注。由于层次句分析中错误累积问题尤为严重,该文提出了一种简单可行的错误预判及协同纠错算法,跟踪本层预判的错误标注结果进入下一层,利用两层预测分数相结合的方式协同纠错。实验结果表明,加入纠错方法后,层次句法分析在保证解析速度的同时,获得了与主流中文句法分析器相当的解析精度。 展开更多
关键词 层次句法分析 条件随机域模型 组块分析 多层协同纠错
下载PDF
CRFs融合语义信息的英语功能名词短语识别 被引量:2
8
作者 马建军 裴家欢 黄德根 《中文信息学报》 CSCD 北大核心 2016年第6期59-66,共8页
名词短语识别在句法分析中有着重要的作用,而英汉机器翻译的瓶颈之一就是名词短语的歧义消解问题。研究英语功能名词短语的自动识别,则将名词短语的结构消歧问题转化成名词短语的识别问题。基于名词短语在小句中的语法功能来确定名词短... 名词短语识别在句法分析中有着重要的作用,而英汉机器翻译的瓶颈之一就是名词短语的歧义消解问题。研究英语功能名词短语的自动识别,则将名词短语的结构消歧问题转化成名词短语的识别问题。基于名词短语在小句中的语法功能来确定名词短语的边界,选择商务领域语料,采用了细化词性标注集和条件随机域模型结合语义信息的方法,识别了名词短语的边界和句法功能。在预处理基于宾州树库细化了词性标注集,条件随机域模型中加入语义特征主要用来识别状语类的名词短语。实验结果表明,结合金标准词性实验的F值达到了89.04%,改进词性标注集有助于提高名词短语的识别,比使用宾州树库标注集提高了2.21%。将功能名词短语识别信息应用到NiuTrans统计机器翻译系统,英汉翻译质量略有提高。 展开更多
关键词 功能名词短语 名词短语识别 条件随机域模型 语义信息
下载PDF
基于CRF的百科全书文本段落划分 被引量:3
9
作者 许勇 宋柔 《计算机工程》 CAS CSCD 北大核心 2007年第10期16-18,共3页
CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将其应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法... CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将其应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法更好的结果。 展开更多
关键词 文本段落划分 条件随机域模型 隐马尔科夫模型
下载PDF
中国的通货膨胀及其不确定性 被引量:2
10
作者 饶晓辉 《统计与信息论坛》 CSSCI 2012年第1期49-54,共6页
采用1990年1月以来居民消费价格指数(CPI)的月度数据,运用随机域回归模型、系列随机域的非线性检验方法和贝叶斯估计方法,对中国通货膨胀率与通货膨胀不确定性的关系进行了实证分析。研究发现:通货膨胀率与通货膨胀之间具有双向关系。... 采用1990年1月以来居民消费价格指数(CPI)的月度数据,运用随机域回归模型、系列随机域的非线性检验方法和贝叶斯估计方法,对中国通货膨胀率与通货膨胀不确定性的关系进行了实证分析。研究发现:通货膨胀率与通货膨胀之间具有双向关系。通货膨胀率引起了通货膨胀不确定性,两者呈现U型关系;较高的通货膨胀不确定性引起通货膨胀率先升后降,呈现倒U曲线关系。 展开更多
关键词 通货膨胀 通货膨胀不确定性 随机域模型 贝叶斯估计
下载PDF
基于混合方法的中文人名识别研究 被引量:4
11
作者 王祖兴 吕钊 顾君忠 《计算机工程与应用》 CSCD 北大核心 2015年第8期211-217,共7页
当前中文人名识别的研究主要针对中国人名,而对日本人名及音译人名的专门研究相对较少,识别效果也亟待提高。提出利用CRRM方法进行中、日及音译人名同步识别。该方法基于CRF(Conditional Random Fields)并结合了上下文规则及人名可信度... 当前中文人名识别的研究主要针对中国人名,而对日本人名及音译人名的专门研究相对较少,识别效果也亟待提高。提出利用CRRM方法进行中、日及音译人名同步识别。该方法基于CRF(Conditional Random Fields)并结合了上下文规则及人名可信度模型。此外,利用局部统计算法对边界识别错误的人名进行修正,并利用扩散操作召回未被识别的人名。实验结果表明,中、日、音译人名识别的F值均高于90%,提出的方法可以取得较好的识别效果。 展开更多
关键词 中文人名识别 条件随机(CRF)模型 人名可信度模型 上下文规则 边缘概率
下载PDF
THE STOCHASTIC ESTIMATION OF SATELLITE CLOCK CORRECTION INFORMATION IN WADGPS
12
作者 Hseyin Bki Iz GE Maorong Esmond Mok 《Geo-Spatial Information Science》 2000年第1期66-69,共4页
Using autocorrelation information of the pseudorange errors generated by se- lective availability (SA) frequency dithering, we have constructed a simple first order stochas- tic model for SA effects. This model has be... Using autocorrelation information of the pseudorange errors generated by se- lective availability (SA) frequency dithering, we have constructed a simple first order stochas- tic model for SA effects. This model has been used in a Kalman filter to account for the stochastic behavior of SA dithering in estimating satellite clock information in wide area dif- ferential GPS. We have obtained fifteen percent improvement in the user positioning using the correlation information on the satellite clock information in a Kalman filter, when comparing the results obtained using a regular least square estimation. 展开更多
关键词 stochastic model wide area differential GPS(WADGPS) selective availability
下载PDF
中国通货膨胀率与其不确定性之间的非线性动态关系 被引量:2
13
作者 陈体标 饶晓辉 《上海经济研究》 CSSCI 北大核心 2011年第11期16-24,共9页
通货膨胀率和通货膨胀不确定性之间相互影响,二者之间的内在关系对政府运用货币政策具有重要的现实意义。本文采用1990年1月以来居民消费价格指数(CPI)的月度数据,结合随机域回归模型、系列随机域的非线性检验方法、最大似然估计及贝叶... 通货膨胀率和通货膨胀不确定性之间相互影响,二者之间的内在关系对政府运用货币政策具有重要的现实意义。本文采用1990年1月以来居民消费价格指数(CPI)的月度数据,结合随机域回归模型、系列随机域的非线性检验方法、最大似然估计及贝叶斯估计方法,对我国通货膨胀率与通货膨胀不确定性的关系进行了实证分析。实证研究发现,通货膨胀率引起了通货膨胀不确定性,两者呈现非线性的U型关系,支持了Friedman假说;大的通货膨胀不确性引起通货膨胀率先升后降,呈现非线性倒U曲线关系,Cukierman-Meltzer假说在U型左侧范围内成立,于U型右侧Holland结论成立。 展开更多
关键词 通货膨胀率 通货膨胀不确定性 随机域模型 贝叶斯估计
原文传递
一种基于人类视觉的DCT数字水印算法
14
作者 马兰 《信息安全与通信保密》 2005年第2期156-158,共3页
本文介绍了一种新颖的基于人类视觉系统的DCT数字水印算法,该算法不像大多数的水印嵌入算法所描述的那样将水印图像看作是噪声,而是在嵌入时利用人类视觉的特性考虑到了图像本身的所有信息,计算出每个像素点可改变的信息量,及可嵌入的... 本文介绍了一种新颖的基于人类视觉系统的DCT数字水印算法,该算法不像大多数的水印嵌入算法所描述的那样将水印图像看作是噪声,而是在嵌入时利用人类视觉的特性考虑到了图像本身的所有信息,计算出每个像素点可改变的信息量,及可嵌入的信息量,使水印图像的强壮性达到最大。 展开更多
关键词 人类视觉 DCT 数字水印算法 马尔可夫随机域模型
原文传递
Random walk models for top-N recommendation task 被引量:2
15
作者 Yin ZHANG Jiang-qin WU Yue-ting ZHUANG 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2009年第7期927-936,共10页
Recently there has been an increasing interest in applying random walk based methods to recommender systems. We employ a Gaussian random field to model the top-N recommendation task as a semi-supervised learning probl... Recently there has been an increasing interest in applying random walk based methods to recommender systems. We employ a Gaussian random field to model the top-N recommendation task as a semi-supervised learning problem, taking into account the degree of each node on the user-item bipartite graph, and induce an effective absorbing random walk (ARW) algorithm for the top-N recommendation task. Our random walk approach directly generates the top-N recommendations for individuals, rather than predicting the ratings of the recommendations. Experimental results on the two real data sets show that our random walk algorithm significantly outperforms the state-of-the-art random walk based personalized ranking algorithm as well as the popular item-based collaborative filtering method. 展开更多
关键词 Random walk Bipartite graph Top-N recommendation Semi-supervised learning
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部