-
题名动态文本流中的话题线索检测算法
- 1
-
-
作者
曹月芹
-
机构
温州职业技术学院计算机系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第24期45-49,共5页
-
基金
浙江省教育厅基金资助项目(Y200909362)
-
文摘
针对动态文本流中的话题线索检测问题,提出一种基于语义相关度模型的话题线索检测算法。利用改进的语义相关度模型计算消息文本与话题线索之间的语义相关度,将消息划分至相应的话题线索。在真实数据集上的实验结果表明,与现有算法相比,该算法的F1测度值较高。
-
关键词
动态文本流
话题线索检测
语义相关度
消息划分
即时通信工具
-
Keywords
dynamic text flow
topic thread detection
semantic relevance degree
message division
Instant Messaging(IM) tool
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名网络舆情信息提取技术研究与实现
被引量:4
- 2
-
-
作者
刘华春
王星捷
-
机构
成都理工大学工程技术学院
-
出处
《计算机技术与发展》
2016年第9期8-11,共4页
-
基金
四川省自然科学重点项目(A22012003)
四川省乐山市科技局重点项目(14GZD050)
-
文摘
网络舆情信息提取是舆情分析系统中最为关键的部分,是实现舆情分析、舆情统计的数据基础。为此,设计和实现了一个基于话题线索的舆情信息提取方案。该方案将舆情页面以话题为线索进行逻辑划分;采用基于DOM树的广度优先搜索方法,设计了舆情信息提取算法;通过设置最低重复话题阈值θ,用户定制提取格式,信息去重去噪措施,实现了舆情信息的有效提取。通过对多个论坛舆情信息的提取实验,结果表明,所设计的方案有很好的提取性能,召回率、正确率、F指数都较高,能够很好地提取出论坛、评论等舆情信息。
-
关键词
舆情信息
WEB信息提取
话题线索
DOC树
-
Keywords
public opinion information
Web information extraction
topic clues
DOC tree
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语日常会话的对话行为分析标注研究
被引量:4
- 3
-
-
作者
周强
-
机构
清华大学信息技术研究院语音语言技术中心清华信息科学与技术国家实验室
-
出处
《中文信息学报》
CSCD
北大核心
2017年第6期75-82,共8页
-
基金
国家自然科学基金(61433018
61373075)
-
文摘
对话行为分析是进行更深入的对话理解模型探索的合适切入点。该文综合前人研究成果,设计了一套针对汉语日常会话的对话行为标注体系。引入主客观阐述和正反向反应子类,加强对话行为依存对和连贯修辞对的结构描述,同时引入话题线索分析机制,有效组织会话中的话题变化趋势。基于500个日常会话片段进行的对话行为标注实验中显示出了90%左右的双人独立标注宏一致率,表明目前的对话行为标记集设计具有良好的可操作性,可以适应汉语日常会话的行为功能模式描述需求。
-
关键词
会话分析
对话行为标注
话题线索
-
Keywords
conversation analysis
dialog act annotation
topic thread
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-