期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
BERT-Single:半监督的话题检测与追踪方法
被引量:
1
1
作者
侯博元
崔喆
谢欣冉
《计算机应用》
CSCD
北大核心
2022年第S01期21-27,共7页
针对无监督聚类方法在应用于话题检测与追踪任务时难以学习到深层语义特征及任务相关特征,K均值聚类、潜在狄利克雷分布(LDA)等方法无法用于增量式聚类的问题,提出基于预训练语言模型的BERT-Single半监督算法。首先使用小规模有标注数...
针对无监督聚类方法在应用于话题检测与追踪任务时难以学习到深层语义特征及任务相关特征,K均值聚类、潜在狄利克雷分布(LDA)等方法无法用于增量式聚类的问题,提出基于预训练语言模型的BERT-Single半监督算法。首先使用小规模有标注数据训练预训练语言模型BERT,使BERT模型学习到任务特定的先验知识,生成能够适应话题检测与追踪任务且包含深层语义特征的文本向量;然后利用改进的Single-Pass聚类算法将预训练语言模型学习到的有标签样本信息泛化到无标签数据上,提升模型在话题检测与追踪任务上性能。在构建的数据集上进行实验,结果显示,相较于对比模型,BERT-Single模型精确率至少提升了3个百分点、召回率至少提升了1个百分点、F1值至少提升了3个百分点。BERT-Single模型对于解决话题检测与追踪问题具有较好效果,并能够很好地适应增量式聚类任务。
展开更多
关键词
聚类
半监督学习
话题检测与追踪
预训练语言模型
新闻
话题
下载PDF
职称材料
基于增量主题模型的微博在线事件分析
被引量:
5
2
作者
马慧芳
王博
《计算机工程》
CAS
CSCD
2013年第3期191-196,共6页
为更好地利用微博结构化社会网络方面的信息,提出一种基于增量主题模型的微博在线事件分析算法。通过设计增量过程,保留已有的训练信息,采用自适应非对称学习算法融入新微博内容与用户关系。实验结果表明,该算法可在短暂的时间内建模,...
为更好地利用微博结构化社会网络方面的信息,提出一种基于增量主题模型的微博在线事件分析算法。通过设计增量过程,保留已有的训练信息,采用自适应非对称学习算法融入新微博内容与用户关系。实验结果表明,该算法可在短暂的时间内建模,并有效提高事件分析的性能。
展开更多
关键词
用户关系
话题检测与追踪
主题模型
自适应
增量概率
增量算法
下载PDF
职称材料
新闻专题阶段性摘要的生成研究
3
作者
尤建清
张仰森
《计算机应用研究》
CSCD
北大核心
2016年第4期973-978,996,共7页
新闻专题的阶段性摘要对了解专题的动态演化、勾勒专题的发展轮廓等都能提供较高的参考价值,一定程度上弥补了专题内容太多而不便阅读的缺憾。以"马航MH370航班失联"专题为研究对象,探讨了新闻专题阶段性摘要的生成算法。首...
新闻专题的阶段性摘要对了解专题的动态演化、勾勒专题的发展轮廓等都能提供较高的参考价值,一定程度上弥补了专题内容太多而不便阅读的缺憾。以"马航MH370航班失联"专题为研究对象,探讨了新闻专题阶段性摘要的生成算法。首先利用主题抽取技术对各新闻文档进行主题抽取,完成文档集到主题集的转换;然后借助话题检测与追踪技术对主题集进行基于时间流的双向聚类和正逆向结果交集的再聚类;最终根据话题聚类的结果选择对应文档的主题生成新闻专题的阶段性摘要。实验证明,该方法能够取得较好的Rouge召回率。
展开更多
关键词
新闻专题
话题检测与追踪
二次聚类
阶段性摘要
下载PDF
职称材料
题名
BERT-Single:半监督的话题检测与追踪方法
被引量:
1
1
作者
侯博元
崔喆
谢欣冉
机构
中国科学院成都计算机应用研究所
中国科学院大学计算机科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2022年第S01期21-27,共7页
基金
四川省科技计划项目(2020YFG0009)
四川省重大科技专项(2019ZDZX0005)。
文摘
针对无监督聚类方法在应用于话题检测与追踪任务时难以学习到深层语义特征及任务相关特征,K均值聚类、潜在狄利克雷分布(LDA)等方法无法用于增量式聚类的问题,提出基于预训练语言模型的BERT-Single半监督算法。首先使用小规模有标注数据训练预训练语言模型BERT,使BERT模型学习到任务特定的先验知识,生成能够适应话题检测与追踪任务且包含深层语义特征的文本向量;然后利用改进的Single-Pass聚类算法将预训练语言模型学习到的有标签样本信息泛化到无标签数据上,提升模型在话题检测与追踪任务上性能。在构建的数据集上进行实验,结果显示,相较于对比模型,BERT-Single模型精确率至少提升了3个百分点、召回率至少提升了1个百分点、F1值至少提升了3个百分点。BERT-Single模型对于解决话题检测与追踪问题具有较好效果,并能够很好地适应增量式聚类任务。
关键词
聚类
半监督学习
话题检测与追踪
预训练语言模型
新闻
话题
Keywords
clustering
semi-supervised learning
Topic Detection and Tracking(TDT)
pre-training language model
news topic
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于增量主题模型的微博在线事件分析
被引量:
5
2
作者
马慧芳
王博
机构
西北师范大学计算机科学与工程学院
解放军南京政治学院上海校区军事信息管理系
出处
《计算机工程》
CAS
CSCD
2013年第3期191-196,共6页
基金
国家自然科学基金资助项目(61163039)
西北师范大学青年教师科研能力提升计划骨干基金资助项目(NWNU-LKQN-10-1)
文摘
为更好地利用微博结构化社会网络方面的信息,提出一种基于增量主题模型的微博在线事件分析算法。通过设计增量过程,保留已有的训练信息,采用自适应非对称学习算法融入新微博内容与用户关系。实验结果表明,该算法可在短暂的时间内建模,并有效提高事件分析的性能。
关键词
用户关系
话题检测与追踪
主题模型
自适应
增量概率
增量算法
Keywords
user relationship
Topic Detection and Tracking(TDT)
topic model
adaptive
incremental probability
incremental algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
新闻专题阶段性摘要的生成研究
3
作者
尤建清
张仰森
机构
北京信息科技大学智能信息处理研究所
北京信息科技大学计算中心
出处
《计算机应用研究》
CSCD
北大核心
2016年第4期973-978,996,共7页
基金
国家自然科学基金资助项目(61070119
61370139)
+3 种基金
北京市属高等学校创新团队建设与教师职业发展计划资助项目(IDHT20130519)
北京市教委专项基金资助项目(PXM2013_014224_000042
PXM2014_014224_000067)
北京信息科技大学校基金资助项目(5221410935)
文摘
新闻专题的阶段性摘要对了解专题的动态演化、勾勒专题的发展轮廓等都能提供较高的参考价值,一定程度上弥补了专题内容太多而不便阅读的缺憾。以"马航MH370航班失联"专题为研究对象,探讨了新闻专题阶段性摘要的生成算法。首先利用主题抽取技术对各新闻文档进行主题抽取,完成文档集到主题集的转换;然后借助话题检测与追踪技术对主题集进行基于时间流的双向聚类和正逆向结果交集的再聚类;最终根据话题聚类的结果选择对应文档的主题生成新闻专题的阶段性摘要。实验证明,该方法能够取得较好的Rouge召回率。
关键词
新闻专题
话题检测与追踪
二次聚类
阶段性摘要
Keywords
news special topic
topic detection and tracking
quadratic cluster
stage summarization
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
BERT-Single:半监督的话题检测与追踪方法
侯博元
崔喆
谢欣冉
《计算机应用》
CSCD
北大核心
2022
1
下载PDF
职称材料
2
基于增量主题模型的微博在线事件分析
马慧芳
王博
《计算机工程》
CAS
CSCD
2013
5
下载PDF
职称材料
3
新闻专题阶段性摘要的生成研究
尤建清
张仰森
《计算机应用研究》
CSCD
北大核心
2016
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部