期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
采用上下文特征匹配的中文机构名简称识别 被引量:4
1
作者 郝娟 杨静 《小型微型计算机系统》 CSCD 北大核心 2015年第7期1432-1437,共6页
现有识别机构名简称的方法多依赖全称,也依赖简称的组成形式.针对这两个问题,提出一种采用上下文特征匹配的机构名简称识别方法.本文提出的上下文特征分为机构名独有特征和干扰词与机构名相交特征,每一个特征赋予一个错误率权重,在不同... 现有识别机构名简称的方法多依赖全称,也依赖简称的组成形式.针对这两个问题,提出一种采用上下文特征匹配的机构名简称识别方法.本文提出的上下文特征分为机构名独有特征和干扰词与机构名相交特征,每一个特征赋予一个错误率权重,在不同错误率范围内,采用上下文特征匹配算法识别机构名简称.还通过建立干扰词表和扩展操作,进一步提高了识别的准确率与召回率.实验中,本文方法在封闭数据集上的F值达到92.23%.利用封闭数据集训练的特征和干扰词,在开放测试集上的F值取得70.28%.最后,与依赖全称生成简称的识别方法进行对比,本文方法识别出有匹配全称的简称和无匹配全称的简称,比依赖全称的识别方法有更好的效果. 展开更多
关键词 机构名简称 上下文特征 相交特征 独有特征 特征匹配算法 干扰词
下载PDF
基于网页信息和分词的中文机构名全称和简称提取方法 被引量:3
2
作者 张俊玲 耿光刚 +1 位作者 延志伟 李晓东 《计算机应用研究》 CSCD 北大核心 2017年第4期972-976,共5页
搜索引擎在处理全称和简称的对应关系时,以往只能通过人工添加,造成简称遗漏、搜索结果召回率低等问题。为此,提出了一种自动获取机构全称和简称的方法。根据域名地址获取机构网站首页源代码,从中提取相应机构全称,再结合机构名上下文... 搜索引擎在处理全称和简称的对应关系时,以往只能通过人工添加,造成简称遗漏、搜索结果召回率低等问题。为此,提出了一种自动获取机构全称和简称的方法。根据域名地址获取机构网站首页源代码,从中提取相应机构全称,再结合机构名上下文特征词集合从中提取候选简称,最后计算候选简称与全称的相似度确定最终简称。通过对1 287个组织机构网站的实验,全称提取正确率达93.9%,简称召回率和正确率分别达85.3%和90.8%,实验表明该方法效果良好。 展开更多
关键词 机构名简称提取 机构全称提取 网页分析 简称相似度计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部