期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于最大熵马尔可夫模型的地址信息抽取 被引量:8
1
作者 王胜 朱明 《计算机工程与应用》 CSCD 北大核心 2005年第21期192-194,共3页
互联网的迅速发展,以及人们对于信息需求的提高,使得网络信息的自动处理和挖掘成为了研究热点。在与网络文本相关的信息抽取任务中,观察值序列都是给定的,所以不需要考虑得到观察值的概率,而只需要关注观察值引起的状态转移的概率。最... 互联网的迅速发展,以及人们对于信息需求的提高,使得网络信息的自动处理和挖掘成为了研究热点。在与网络文本相关的信息抽取任务中,观察值序列都是给定的,所以不需要考虑得到观察值的概率,而只需要关注观察值引起的状态转移的概率。最大熵马尔可夫通过改变概率转移函数,使得状态的转移与输入值以及前一状态相联系,很好地体现了序列的上下文信息。通过最大熵马尔科夫模型进行地址信息抽取,精确度和召回率都得到了很大的改进。 展开更多
关键词 最大熵马尔可夫模型 信息抽取 地址信息
下载PDF
基于混合条件模型的Web信息抽取 被引量:2
2
作者 肖基毅 朱道辉 邹腊梅 《郑州大学学报(理学版)》 CAS 2008年第3期52-55,共4页
针对传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际训练中极易得到局部最优模型参数,提出了一种最大熵和最大熵马尔可夫模型相结合的条件模型.该方法对输入的Web页面进行解析并构建HTML树,通过计算HTML子树结点的熵定位数据域... 针对传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际训练中极易得到局部最优模型参数,提出了一种最大熵和最大熵马尔可夫模型相结合的条件模型.该方法对输入的Web页面进行解析并构建HTML树,通过计算HTML子树结点的熵定位数据域,允许观察值表示任意重叠特征(像词、大写、HTML标记、语义)和定义状态序列给予观察序列的条件概率实现了Web信息抽取.实验结果表明,新的方法在精确度和召回率指标上比传统隐马尔可夫模型和最大熵马尔可夫模型具有更好的性能. 展开更多
关键词 WEB信息抽取 最大熵马尔可夫模型 条件模型 最大熵 马尔可夫模型
下载PDF
统计与规则相结合的古文对联应对模型 被引量:4
3
作者 张开旭 孙茂松 《中文信息学报》 CSCD 北大核心 2009年第1期100-105,共6页
该文将古文对联规则区分为硬规则与软规则,将软规则区分为字相对与上下文相对。并在软规则指导下建立对联应对的有向概率图模型,使用EM(Expectation-Maximization)算法估计模型参数,在求解的搜索过程中加入硬规则,从而给出了一种完整的... 该文将古文对联规则区分为硬规则与软规则,将软规则区分为字相对与上下文相对。并在软规则指导下建立对联应对的有向概率图模型,使用EM(Expectation-Maximization)算法估计模型参数,在求解的搜索过程中加入硬规则,从而给出了一种完整的对联自动应对方法。实验结果表明参数学习后的候选字列表由于一定程度上不考虑上下文相对的影响,比仅用频次统计的候选字列表更为合理。该方法还能够对训练语料库中工整与不工整的对联区分学习。基于该方法所实现的古文对联应对程序达到了一定水平。 展开更多
关键词 计算机应用 中文信息处理 对联应对 最大熵马尔可夫模型
下载PDF
利用动态部位变化的步态识别 被引量:6
4
作者 张二虎 赵永伟 《中国图象图形学报》 CSCD 北大核心 2009年第9期1756-1763,共8页
为了解决人的衣着变化和携带物品对步态识别的影响,提出了一种基于动态部位变化的步态识别方法。首先应用背景差分和阴影消除获得人体步态轮廓,并对获取的轮廓进行位置中心化和大小归一化;然后通过步态能量图和阈值分割的方法划分出每... 为了解决人的衣着变化和携带物品对步态识别的影响,提出了一种基于动态部位变化的步态识别方法。首先应用背景差分和阴影消除获得人体步态轮廓,并对获取的轮廓进行位置中心化和大小归一化;然后通过步态能量图和阈值分割的方法划分出每一帧的动态部位,并使用扇形区域距离变换的方法对动态部位进行特征提取;最后使用最大熵马尔可夫模型对各个人的步态进行建模,完成了基于概率图的识别。该方法在CASIA步态数据库上进行了实验,取得了较高的正确识别率,实验结果表明该方法对人的衣着变化和携带物品情况下的步态识别具有较强的鲁棒性。 展开更多
关键词 步态识别 动态部位 扇形区域距离变换 最大熵马尔可夫模型
下载PDF
基于序列标注的全词消歧方法
5
作者 周云 王挺 +2 位作者 易绵竹 张禄彭 王之元 《中文信息学报》 CSCD 北大核心 2012年第2期28-34,共7页
全词消歧(All-Words Word Sense Disambiguation)可以看作一个序列标注问题,该文提出了两种基于序列标注的全词消歧方法,它们分别基于隐马尔可夫模型(Hidden Markov Model,HMM)和最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM... 全词消歧(All-Words Word Sense Disambiguation)可以看作一个序列标注问题,该文提出了两种基于序列标注的全词消歧方法,它们分别基于隐马尔可夫模型(Hidden Markov Model,HMM)和最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM)。首先,我们用HMM对全词消歧进行建模。然后,针对HMM只能利用词形观察值的缺点,我们将上述HMM模型推广为MEMM模型,将大量上下文特征集成到模型中。对于全词消歧这类超大状态问题,在HMM和MEMM模型中均存在数据稀疏和时间复杂度过高的问题,我们通过柱状搜索Viterbi算法和平滑策略来解决。最后,我们在Senseval-2和Senseval-3的数据集上进行了评测,该文提出的MEMM方法的F1值为0.654,超过了该评测上所有的基于序列标注的方法。 展开更多
关键词 全词消歧 马尔可夫模型 最大熵马尔可夫模型 超大状态问题
下载PDF
基于序列标注算法比较的医学文献风险事件抽取研究 被引量:6
6
作者 喻鑫 张矩 +1 位作者 邱武松 王飞 《计算机应用与软件》 2017年第12期58-63,共6页
医学文献快速增长,如何从医学文献文本大数据中挖掘出有价值的知识是一种巨大挑战。聚焦医学文献中定量风险语句的风险事件抽取,构建智能临床决策支持系统医学风险知识库。运用序列标注算法中重要的隐马尔可夫模型、最大熵马尔可夫模型... 医学文献快速增长,如何从医学文献文本大数据中挖掘出有价值的知识是一种巨大挑战。聚焦医学文献中定量风险语句的风险事件抽取,构建智能临床决策支持系统医学风险知识库。运用序列标注算法中重要的隐马尔可夫模型、最大熵马尔可夫模型和条件随机场三种模型分别对医学文献非结构化全文文本中风险事件信息进行抽取,并对算法进行比较。从三个模型平均F1测度值来看,条件随机场效果最好,其次为最大熵马尔可夫模型,然后是隐马尔可夫模型,但是每个模型都有自己对某些风险事件抽取的准确率或者召回率的优势。 展开更多
关键词 医学文献 风险事件 马尔可夫模型 最大熵马尔可夫模型 条件随机场
下载PDF
基于命名实体识别的恶性肿瘤诊断文本信息提取研究 被引量:2
7
作者 杨丽静 唐俊 +3 位作者 沈伟富 陈擎炜 徐煌 莫丽 《医院管理论坛》 2020年第8期74-77,共4页
本文提出了基于命名实体识别的住院费用预测算法。该算法通过MEMM与CRF(最大熵马尔可夫模型与条件随机场)的命名实体识别方法在部分恶性肿瘤医疗文本数据描述中提取命名实体。实验结果表明在命名实体识别阶段所用测试集的平均准确率较... 本文提出了基于命名实体识别的住院费用预测算法。该算法通过MEMM与CRF(最大熵马尔可夫模型与条件随机场)的命名实体识别方法在部分恶性肿瘤医疗文本数据描述中提取命名实体。实验结果表明在命名实体识别阶段所用测试集的平均准确率较为一般(56%~60%),单样本的最好准确率较高(84%~90%)。 展开更多
关键词 恶性肿瘤 信息提取 命名实体识别 最大熵马尔可夫模型 条件随机场 卷积神经网络
下载PDF
RESEARCH OF PINYIN-TO-CHARACTER CONVERSION BASED ON MAXIMUM ENTROPY MODEL 被引量:1
8
作者 Zhao Yan Wang Xiaolong Liu Bingquan Guan Yi 《Journal of Electronics(China)》 2006年第6期864-869,共6页
This paper applied Maximum Entropy (ME) model to Pinyin-To-Character (PTC) conversion in-stead of Hidden Markov Model (HMM) that could not include complicated and long-distance lexical informa-tion. Two ME models were... This paper applied Maximum Entropy (ME) model to Pinyin-To-Character (PTC) conversion in-stead of Hidden Markov Model (HMM) that could not include complicated and long-distance lexical informa-tion. Two ME models were built based on simple and complex templates respectively, and the complex one gave better conversion result. Furthermore, conversion trigger pair of y A → y B cBwas proposed to extract the long-distance constrain feature from the corpus; and then Average Mutual Information (AMI) was used to se-lect conversion trigger pair features which were added to the ME model. The experiment shows that conver-sion error of the ME with conversion trigger pairs is reduced by 4% on a small training corpus, comparing with HMM smoothed by absolute smoothing. 展开更多
关键词 Pinyin-To-Character (PTC) conversion Maximum Entropy (ME) model Hidden Markov Model(HMM) Conversion trigger pair Average Mutual Information (AMI)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部