期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
利用高频词和互信息面向特定领域提取多字词表达 被引量:4
1
作者 刘荣 王丽娟 +1 位作者 张志平 赵小兵 《太原理工大学学报》 CAS 北大核心 2009年第3期210-214,共5页
在阐述了多字词表达定义的基础上,对面向特定领域的多字词表达提取的技术路线进行了详细说明。以大规模的真实文本为研究对象,利用领域高频词和互信息统计量提取多字词表达,确定了多字词表达的最大提取长度,并通过停用词表法对候选多字... 在阐述了多字词表达定义的基础上,对面向特定领域的多字词表达提取的技术路线进行了详细说明。以大规模的真实文本为研究对象,利用领域高频词和互信息统计量提取多字词表达,确定了多字词表达的最大提取长度,并通过停用词表法对候选多字词表达进行噪声处理。实验结果表明:笔者提出的方法在处理对象规模、效率等方面均有所提高。 展开更多
关键词 多字词表达 特定领域 高频词 互信息
下载PDF
问答社区问句中多字词表达提取
2
作者 吴瑞红 吕学强 +1 位作者 李卓 舒燕 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2014年第6期1230-1238,共9页
基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句... 基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句中抽取候选多字词表达的基础上,将候选多字词表达分为正确串、残缺串、冗余串和错误串4类,借助搜索引擎对查询串的优化和候选多字词表达在互联网上的检索结果,设计候选多字词表达校正方法,实现对多字词表达的提取.以新浪爱问知识人问题库中的问句进行实验,结果表明,多字词表达抽取的准确率、召回率和F值分别达到84%,52%和0.64,验证了该方法的有效性. 展开更多
关键词 多字词表达 问句理解 互信息 搜索引擎
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部