期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
利用高频词和互信息面向特定领域提取多字词表达
被引量:
4
1
作者
刘荣
王丽娟
+1 位作者
张志平
赵小兵
《太原理工大学学报》
CAS
北大核心
2009年第3期210-214,共5页
在阐述了多字词表达定义的基础上,对面向特定领域的多字词表达提取的技术路线进行了详细说明。以大规模的真实文本为研究对象,利用领域高频词和互信息统计量提取多字词表达,确定了多字词表达的最大提取长度,并通过停用词表法对候选多字...
在阐述了多字词表达定义的基础上,对面向特定领域的多字词表达提取的技术路线进行了详细说明。以大规模的真实文本为研究对象,利用领域高频词和互信息统计量提取多字词表达,确定了多字词表达的最大提取长度,并通过停用词表法对候选多字词表达进行噪声处理。实验结果表明:笔者提出的方法在处理对象规模、效率等方面均有所提高。
展开更多
关键词
多字词表达
特定领域
高频词
互信息
下载PDF
职称材料
问答社区问句中多字词表达提取
2
作者
吴瑞红
吕学强
+1 位作者
李卓
舒燕
《吉林大学学报(理学版)》
CAS
CSCD
北大核心
2014年第6期1230-1238,共9页
基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句...
基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句中抽取候选多字词表达的基础上,将候选多字词表达分为正确串、残缺串、冗余串和错误串4类,借助搜索引擎对查询串的优化和候选多字词表达在互联网上的检索结果,设计候选多字词表达校正方法,实现对多字词表达的提取.以新浪爱问知识人问题库中的问句进行实验,结果表明,多字词表达抽取的准确率、召回率和F值分别达到84%,52%和0.64,验证了该方法的有效性.
展开更多
关键词
多字词表达
问句理解
互信息
搜索引擎
下载PDF
职称材料
题名
利用高频词和互信息面向特定领域提取多字词表达
被引量:
4
1
作者
刘荣
王丽娟
张志平
赵小兵
机构
北京语言大学应用语言学研究所
太原理工大学文法学院外语系
太原理工大学计算机与软件学院
中央民族大学
出处
《太原理工大学学报》
CAS
北大核心
2009年第3期210-214,共5页
基金
国家自然科学基金资助项目(60663008)
文摘
在阐述了多字词表达定义的基础上,对面向特定领域的多字词表达提取的技术路线进行了详细说明。以大规模的真实文本为研究对象,利用领域高频词和互信息统计量提取多字词表达,确定了多字词表达的最大提取长度,并通过停用词表法对候选多字词表达进行噪声处理。实验结果表明:笔者提出的方法在处理对象规模、效率等方面均有所提高。
关键词
多字词表达
特定领域
高频词
互信息
Keywords
multiword expressions
specific field
high frequency words
mutual information
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
问答社区问句中多字词表达提取
2
作者
吴瑞红
吕学强
李卓
舒燕
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京拓尔思信息技术股份有限公司
出处
《吉林大学学报(理学版)》
CAS
CSCD
北大核心
2014年第6期1230-1238,共9页
基金
国家自然科学基金(批准号:61171159
61271304)
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(批准号:KZ201311232037)
文摘
基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句中抽取候选多字词表达的基础上,将候选多字词表达分为正确串、残缺串、冗余串和错误串4类,借助搜索引擎对查询串的优化和候选多字词表达在互联网上的检索结果,设计候选多字词表达校正方法,实现对多字词表达的提取.以新浪爱问知识人问题库中的问句进行实验,结果表明,多字词表达抽取的准确率、召回率和F值分别达到84%,52%和0.64,验证了该方法的有效性.
关键词
多字词表达
问句理解
互信息
搜索引擎
Keywords
multiword expressions
question interpretation
mutual information
search engine
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
利用高频词和互信息面向特定领域提取多字词表达
刘荣
王丽娟
张志平
赵小兵
《太原理工大学学报》
CAS
北大核心
2009
4
下载PDF
职称材料
2
问答社区问句中多字词表达提取
吴瑞红
吕学强
李卓
舒燕
《吉林大学学报(理学版)》
CAS
CSCD
北大核心
2014
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部