期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于ETM模型的中亚国家“一带一路”网络舆情热点检测 被引量:3
1
作者 席耀一 高鑫 +1 位作者 王小明 云建飞 《情报杂志》 CSSCI 北大核心 2020年第11期82-89,共8页
[目的/意义]及时准确地检测中亚国家“一带一路”网络舆情热点,对于推进“一带一路”建设具有积极意义。[方法/过程]首先利用ETM(Embedded Topic Model)模型对文档建模得到候选热点主题;然后借助YAKE关键词抽取算法综合考虑候选热点主... [目的/意义]及时准确地检测中亚国家“一带一路”网络舆情热点,对于推进“一带一路”建设具有积极意义。[方法/过程]首先利用ETM(Embedded Topic Model)模型对文档建模得到候选热点主题;然后借助YAKE关键词抽取算法综合考虑候选热点主题的一致性、独立性和媒体关注度,确定热点主题;最后抽取每一主题的代表性文档以增强热点主题的可理解性。[结果/结论]在构建的中亚国家“一带一路”网络舆情数据集上的实验表明,该方法取得了较好效果。 展开更多
关键词 网络舆情 热点检测 热度评分 嵌入式主题模型 “一带一路” 中亚
下载PDF
中亚语种通用语料库构建研究 被引量:1
2
作者 席耀一 王小明 +1 位作者 云建飞 高鑫 《信息工程大学学报》 2020年第6期741-746,751,共7页
面向中亚国家“一带一路”网络舆情分析这一应用目标,探讨如何构建中亚国家通用语料库。首先利用爬虫完成新闻语料采集,其次在语料预处理的基础上,对其进行唯一编码并利用关系数据库完成语料的结构化组织和持久存储,并采用人机结合的标... 面向中亚国家“一带一路”网络舆情分析这一应用目标,探讨如何构建中亚国家通用语料库。首先利用爬虫完成新闻语料采集,其次在语料预处理的基础上,对其进行唯一编码并利用关系数据库完成语料的结构化组织和持久存储,并采用人机结合的标注方式对语料内容按照主题进行分类,最后研究语料库的信息服务方式以最大化其价值。目前,语料库词语容量已达到1.5亿,且还在持续更新,但仍然属于生语料,后续需根据具体应用领域完成相应标注工作。以文章构建的语料库为基础,不仅为分析中亚国家“一带一路”网络舆情提供可依托的语料库,还可用于中亚国家语言的研究学习和教学科研等相关场景。 展开更多
关键词 语料库 中亚国家 一带一路
下载PDF
语料库驱动下的吉尔吉斯斯坦主流新闻网站中的kerek用法分析
3
作者 云建飞 孙冬阳 《和田师范专科学校学报》 2017年第6期72-78,共7页
吉尔吉斯语中kerek一词表达"应该"、"需要"的意义。kerek在吉尔吉斯语中使用相对频繁,用法也比较复杂。本文通过借助语料库手段通过对语料库中kerek的使用情况进行分析解读,进一步了了解其在语篇中的搭配模式,帮助... 吉尔吉斯语中kerek一词表达"应该"、"需要"的意义。kerek在吉尔吉斯语中使用相对频繁,用法也比较复杂。本文通过借助语料库手段通过对语料库中kerek的使用情况进行分析解读,进一步了了解其在语篇中的搭配模式,帮助教师在教学过程中能够准确合理利用语料库,清楚明确的对其意义和用法进行解读分析,同时也可以帮助学习者进一步领会其意义及用法。 展开更多
关键词 语料库 吉尔吉斯语 kerek用法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部