-
题名基于图聚类的用户生成文本突发话题检测方法
- 1
-
-
作者
赵丽
刘欣然
张鸿
李焱
-
机构
国家计算机网络应急技术处理协调中心
北京航空航天大学计算机学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2015年第8期1717-1722,共6页
-
基金
国家"九七三"重点基础研究发展计划项目(2011CB302605)资助
-
文摘
提出一种基于图聚类的突发话题检测方法(G-BTD).该方法用有向加权图表示包含突发热点话题的文本集,顶点为突发词,有向边表示突发词之间非对称的相关性,边的权重表示相关的程度.由于相同话题的重要话题词以双向高权重的边相连,形成强连通子图,因此本文采用提取强连通子图的方法进行话题检测.实验表明,G-BTD方法在英文Live Journal博客和中文新浪微博两个文本集中的突发话题检测效果优于概率话题模型LDA和基于突发特征的EGF的方法.
-
关键词
突发话题检测
图论
用户生成文本
-
Keywords
bursty topic detection
graph theory
user-generated text
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于用户生成文本的图书标签关联规则识别方法
被引量:4
- 2
-
-
作者
张劲松
-
机构
山东管理学院图书馆
-
出处
《情报杂志》
CSSCI
北大核心
2021年第11期182-189,共8页
-
文摘
[研究目的]用户生成文本包含丰富的需求信息与情感倾向,基于用户生成文本的关联规则识别,对量化用户情感需求、提升图书推荐的语义关联度具有重要的研究意义。[研究方法]通过融合读者标签的主题特征与情感评分,把模糊形式概念分析引入图书标签关联规则识别方法中,提出了一种基于用户生成文本的模糊关联规则识别方法(RFAR),该方法首先通过识别用户文本的主题特征,计算目标用户群的主题相似度,再利用文本情感分析确定用户与标签的情感依赖关系。最终,通过构建标签模糊概念格,实现模糊关联规则的在线识别。[研究结论]通过网络社区的用户数据验证了该方法的有效性,结果表明该方法能够实现用户需求的精准定位。
-
关键词
用户生成文本
图书标签
模糊关联规则
主题聚类
情感分析
相似度计算
-
Keywords
user generated content
book labels
fuzzy association rules
topic clustering
sentiment analysis
similarity calculation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于线性链条件随机场的用户生成文本标点标注
- 3
-
-
作者
苏晓宝
刘臣
唐莉
-
机构
上海理工大学管理学院
-
出处
《软件》
2019年第4期145-149,共5页
-
文摘
标点符号的正确性对于用户生成文本的词性标注,命名实体识别,依存句法分析等有着重要的作用,正确的标点标注可以使用户生成文本的语法结构准确完整。线性链条件随机场模型可以容纳任意的非独立的特征信息,本文通过选取标点符号所在位置左右词性对作为模型的观测序列,使用条件随机场进行标点符号的标注。实验的测试语料采用京东在线产品评论,结果表明基于线性链条件随机场的用户生成文本标点标注效率较高。
-
关键词
线性链条件随机场
用户生成文本
词性
特征模板
标点符号标注
-
Keywords
Linear chain conditional random field
User generated text
Part-of-speech
Feature template
Punctuation labelling
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-