期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
用于聊天词汇的权重计算方法CDTF*IDF
1
作者
高鹏
曹先彬
《计算机仿真》
CSCD
2007年第12期332-335,共4页
随着聊天室的广泛使用,对聊天内容监控也变成亟待解决的问题。在聊天室监控中,为衡量聊天数据中词汇对聊天内容的描述能力,现在一般直接采用文本词汇的权重计算方法;然而,这种方法忽视了聊天数据与静态文本结构上的差异,导致计算出的权...
随着聊天室的广泛使用,对聊天内容监控也变成亟待解决的问题。在聊天室监控中,为衡量聊天数据中词汇对聊天内容的描述能力,现在一般直接采用文本词汇的权重计算方法;然而,这种方法忽视了聊天数据与静态文本结构上的差异,导致计算出的权重并不能准确反应词汇描述聊天内容的能力。针对聊天数据的固有特点,提出了一种专门针对聊天数据的词汇权重计算方法CDTF*IDF。该方法通过分别计算词汇在不同数据源中的权值并汇总、并对重点词汇提高权重等方式来计算聊天数据的词汇权重。基于IRC聊天室内容监控的实验表明:该方法能较好地衡量聊天词汇的权重,同时基于该方法的监控系统能够准确地识别出聊天数据中的话题。
展开更多
关键词
聊天室监控
词汇权重
话题识别
下载PDF
职称材料
基于多词汇特征增强的中文事件检测方法
2
作者
缪梓敬
梅欣
《计算机与现代化》
2022年第9期13-18,共6页
事件检测主要研究从非结构化文本中自动识别事件触发词,实现所属事件类型的正确分类。与英文相比,中文需要经过分词才能利用词汇信息,还存在“分词-触发词”不匹配问题。针对中文语言特性与事件检测任务的特点,本文提出一种基于多词汇...
事件检测主要研究从非结构化文本中自动识别事件触发词,实现所属事件类型的正确分类。与英文相比,中文需要经过分词才能利用词汇信息,还存在“分词-触发词”不匹配问题。针对中文语言特性与事件检测任务的特点,本文提出一种基于多词汇特征增强的中文事件检测模型,通过外部词典为字级别模型引入包含多词汇信息的词汇集,以利用多种分词结果的词汇信息。同时采用静态文本词频统计与自动分词工具协同决策词汇集中词汇的权重,获取更加精确的词汇语义。在ACE2005中文数据集上与现有模型进行实验对比分析,结果表明本文方法取得了最好的性能,验证了该方法在中文事件检测上的有效性。
展开更多
关键词
中文事件检测
特征增强
多
词汇
特征
词汇权重
决策
下载PDF
职称材料
多社区网络上的命名博弈
3
作者
郭东伟
孟翔燕
+1 位作者
刘淼
侯彩芳
《计算机研究与发展》
EI
CSCD
北大核心
2015年第2期487-498,共12页
为了模仿人类对新物体认知和命名的过程,提出了一种新型的命名博弈模型,它通过词汇的权重表示个体的认知程度,低权重词汇被删除模拟个体有限记忆的过程.实验发现,在单社区网络上,所有个体的词汇最终能够统一,通过总词汇数、不同词汇数...
为了模仿人类对新物体认知和命名的过程,提出了一种新型的命名博弈模型,它通过词汇的权重表示个体的认知程度,低权重词汇被删除模拟个体有限记忆的过程.实验发现,在单社区网络上,所有个体的词汇最终能够统一,通过总词汇数、不同词汇数和平均协议成功率的分析解释了新个体命名的演化过程.衰减因子和删除阈值的取值对于演化速度影响较大,当它们之间存在线性关系时演化收敛较快.通过将该模型应用到多社区网络模型上,发现收敛词汇数可能不唯一,会与社区数相同,且收敛词汇数的稳定性与网络社区化强度和社区内节点的平均度有关,而与社区内节点数无关.最后,使用微分动力学的方法对这种情况进行了定量分析.
展开更多
关键词
多社区网络
命名博弈
词汇权重
演化
收敛
词汇
下载PDF
职称材料
基于RDF语义标注的领域文档主题描述方法研究
4
作者
沙丽华
《电子技术与软件工程》
2015年第13期196-197,共2页
为了更准确、直观的表达Web文档的主题,本文提出了一种基于RDF语义标注的领域文档主题描述方法。该方法为RDF文件中的每个领域词汇定义一个权重值,利用领域本体中定义的词汇之间的相互影响关系更新每个词汇的权重,并依此扩充描述文档主...
为了更准确、直观的表达Web文档的主题,本文提出了一种基于RDF语义标注的领域文档主题描述方法。该方法为RDF文件中的每个领域词汇定义一个权重值,利用领域本体中定义的词汇之间的相互影响关系更新每个词汇的权重,并依此扩充描述文档主题的词汇集,最终依据按权值排序的词汇集来表达文档主题。实验结果表明,该方法能够较好的描述领域文档的主题。
展开更多
关键词
文档主题
领域本体
词汇权重
下载PDF
职称材料
词汇与中心词的距离信息对问句相似度匹配的影响
被引量:
8
5
作者
闫宏飞
陈翀
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2005年第S1期1873-1877,共5页
在问答式信息检索中引入基于frequen tly askedquestions(FAQ)的辅助模块满足常见问题的回答是一种有效的手段,其中关键问题是用户提出的问句与FAQ中问句的相似度比较,找出FAQ中最相近的问句,并返回对应的答案,作为对用户问题的解答。...
在问答式信息检索中引入基于frequen tly askedquestions(FAQ)的辅助模块满足常见问题的回答是一种有效的手段,其中关键问题是用户提出的问句与FAQ中问句的相似度比较,找出FAQ中最相近的问句,并返回对应的答案,作为对用户问题的解答。该文设计实现了一种FAQ辅助模块,并试图发现词汇与中心词的距离信息对于问句相似度匹配的词汇权重的影响。使用两组不同的测试集进行评测,实验表明,采用词汇与中心词的距离信息计算问句相似度,其影响能力弱于文档频率的作用,但是在相似度阈值0.5的情况下,两种方法均没有错误判断。
展开更多
关键词
词汇权重
问句相似度匹配
问答式信息检索
距离信息
原文传递
题名
用于聊天词汇的权重计算方法CDTF*IDF
1
作者
高鹏
曹先彬
机构
中国科学技术大学计算机科学技术系
出处
《计算机仿真》
CSCD
2007年第12期332-335,共4页
基金
国家自然科学基金(60204009)
973课题(2004CB318109)
中科院复杂系统与智能科学重点实验室开放基金(20040104)
文摘
随着聊天室的广泛使用,对聊天内容监控也变成亟待解决的问题。在聊天室监控中,为衡量聊天数据中词汇对聊天内容的描述能力,现在一般直接采用文本词汇的权重计算方法;然而,这种方法忽视了聊天数据与静态文本结构上的差异,导致计算出的权重并不能准确反应词汇描述聊天内容的能力。针对聊天数据的固有特点,提出了一种专门针对聊天数据的词汇权重计算方法CDTF*IDF。该方法通过分别计算词汇在不同数据源中的权值并汇总、并对重点词汇提高权重等方式来计算聊天数据的词汇权重。基于IRC聊天室内容监控的实验表明:该方法能较好地衡量聊天词汇的权重,同时基于该方法的监控系统能够准确地识别出聊天数据中的话题。
关键词
聊天室监控
词汇权重
话题识别
Keywords
Chat data monitoring
Term weight
Topic detection
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于多词汇特征增强的中文事件检测方法
2
作者
缪梓敬
梅欣
机构
华南师范大学计算机学院
出处
《计算机与现代化》
2022年第9期13-18,共6页
基金
广东省重点领域研发计划项目(2019B111101001)。
文摘
事件检测主要研究从非结构化文本中自动识别事件触发词,实现所属事件类型的正确分类。与英文相比,中文需要经过分词才能利用词汇信息,还存在“分词-触发词”不匹配问题。针对中文语言特性与事件检测任务的特点,本文提出一种基于多词汇特征增强的中文事件检测模型,通过外部词典为字级别模型引入包含多词汇信息的词汇集,以利用多种分词结果的词汇信息。同时采用静态文本词频统计与自动分词工具协同决策词汇集中词汇的权重,获取更加精确的词汇语义。在ACE2005中文数据集上与现有模型进行实验对比分析,结果表明本文方法取得了最好的性能,验证了该方法在中文事件检测上的有效性。
关键词
中文事件检测
特征增强
多
词汇
特征
词汇权重
决策
Keywords
Chinese event detection
feature augmentation
multiple lexicon feature
lexicon weight determination
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
多社区网络上的命名博弈
3
作者
郭东伟
孟翔燕
刘淼
侯彩芳
机构
吉林大学计算机科学与技术学院
符号计算与知识工程教育部重点实验室(吉林大学)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第2期487-498,共12页
基金
吉林省科技发展计划基金项目(20130101047JC)
文摘
为了模仿人类对新物体认知和命名的过程,提出了一种新型的命名博弈模型,它通过词汇的权重表示个体的认知程度,低权重词汇被删除模拟个体有限记忆的过程.实验发现,在单社区网络上,所有个体的词汇最终能够统一,通过总词汇数、不同词汇数和平均协议成功率的分析解释了新个体命名的演化过程.衰减因子和删除阈值的取值对于演化速度影响较大,当它们之间存在线性关系时演化收敛较快.通过将该模型应用到多社区网络模型上,发现收敛词汇数可能不唯一,会与社区数相同,且收敛词汇数的稳定性与网络社区化强度和社区内节点的平均度有关,而与社区内节点数无关.最后,使用微分动力学的方法对这种情况进行了定量分析.
关键词
多社区网络
命名博弈
词汇权重
演化
收敛
词汇
Keywords
multi-community network
naming game
name weight
evolution
convergence names
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于RDF语义标注的领域文档主题描述方法研究
4
作者
沙丽华
机构
中国民用航空局清算中心
出处
《电子技术与软件工程》
2015年第13期196-197,共2页
文摘
为了更准确、直观的表达Web文档的主题,本文提出了一种基于RDF语义标注的领域文档主题描述方法。该方法为RDF文件中的每个领域词汇定义一个权重值,利用领域本体中定义的词汇之间的相互影响关系更新每个词汇的权重,并依此扩充描述文档主题的词汇集,最终依据按权值排序的词汇集来表达文档主题。实验结果表明,该方法能够较好的描述领域文档的主题。
关键词
文档主题
领域本体
词汇权重
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
词汇与中心词的距离信息对问句相似度匹配的影响
被引量:
8
5
作者
闫宏飞
陈翀
机构
北京大学信息科学技术学院
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2005年第S1期1873-1877,共5页
基金
国家自然科学重点基金项目(60435020)
教育部博士点基金项目(20030001076)
文摘
在问答式信息检索中引入基于frequen tly askedquestions(FAQ)的辅助模块满足常见问题的回答是一种有效的手段,其中关键问题是用户提出的问句与FAQ中问句的相似度比较,找出FAQ中最相近的问句,并返回对应的答案,作为对用户问题的解答。该文设计实现了一种FAQ辅助模块,并试图发现词汇与中心词的距离信息对于问句相似度匹配的词汇权重的影响。使用两组不同的测试集进行评测,实验表明,采用词汇与中心词的距离信息计算问句相似度,其影响能力弱于文档频率的作用,但是在相似度阈值0.5的情况下,两种方法均没有错误判断。
关键词
词汇权重
问句相似度匹配
问答式信息检索
距离信息
Keywords
term weight
similar question matching
question and answer QA information retrieval
distance information
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
用于聊天词汇的权重计算方法CDTF*IDF
高鹏
曹先彬
《计算机仿真》
CSCD
2007
0
下载PDF
职称材料
2
基于多词汇特征增强的中文事件检测方法
缪梓敬
梅欣
《计算机与现代化》
2022
0
下载PDF
职称材料
3
多社区网络上的命名博弈
郭东伟
孟翔燕
刘淼
侯彩芳
《计算机研究与发展》
EI
CSCD
北大核心
2015
0
下载PDF
职称材料
4
基于RDF语义标注的领域文档主题描述方法研究
沙丽华
《电子技术与软件工程》
2015
0
下载PDF
职称材料
5
词汇与中心词的距离信息对问句相似度匹配的影响
闫宏飞
陈翀
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2005
8
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部