期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
面向舆情事件的子话题标签生成模型ET-TAG 被引量:19
1
作者 周楠 杜攀 +2 位作者 靳小龙 刘悦 程学旗 《计算机学报》 EI CSCD 北大核心 2018年第7期1490-1503,共14页
关于舆情事件的新闻数据是纷繁复杂的.即便是关于同一舆情事件的新闻数据,往往包含有不同的子话题(事件的不同侧面).因此,如何生成能够准确描述事件子话题含义的标签对深入分析舆情事件(包括掌握事件热点、监测发展走向等)具有重要意义... 关于舆情事件的新闻数据是纷繁复杂的.即便是关于同一舆情事件的新闻数据,往往包含有不同的子话题(事件的不同侧面).因此,如何生成能够准确描述事件子话题含义的标签对深入分析舆情事件(包括掌握事件热点、监测发展走向等)具有重要意义.事件子话题标签的生成通常包括两个关键步骤:首先发现子话题,然后依据每个子话题的关键词或文档内容生成描述该子话题的有效标签.传统方法在发现话题时多采用聚类或分类的方法,它们将同一个话题的文档整合到一个簇中.然而,由于隶属同一事件的文档具有很强的相似性,现有方法难以度量他们之间的距离,因此无法应用于发现事件子话题这一任务.此外,在为子话题生成标签时,传统的方法通常通过抽取来实现.此类方法所生成标签的准确性无法保证.为此,该文提出了一种基于PLSA with Background Language并结合关键词聚类发现事件内部子话题,进而基于维基百科等知识库生成事件子话题标签的模型ET-TAG.在多类舆情事件数据集上的实验结果表明,ET-TAG算法相比K-means和LDA等已有子话题发现方法具有更好的性能;从子话题标签生成角度而言,ET-TAG生成的标签相对于传统方法也具有更好的准确性和概括性.该文最后将ET-TAG算法生成的子话题标签用于事件的对比和追踪,结果表明通过子话题标签可以发现事件共性,并反映事件子话题热度的变化趋势. 展开更多
关键词 子话题发现 PLSA with BACKGROUND LANGUAGE 关键词聚类 子话题标签生成
下载PDF
网络舆情话题情感演化研究 被引量:36
2
作者 黄卫东 陈凌云 吴美蓉 《情报杂志》 CSSCI 北大核心 2014年第1期102-107,共6页
针对现有的关于网络舆情内容进行情感分析的研究不能满足舆情情感深度挖掘的需求,提出一种基于概率潜在语义分析(PLSA)的网络舆情话题情感分析方法,利用PLSA模型对不同时间段上的网络舆情话题进行子话题提取和情感词表构建,综合考虑修... 针对现有的关于网络舆情内容进行情感分析的研究不能满足舆情情感深度挖掘的需求,提出一种基于概率潜在语义分析(PLSA)的网络舆情话题情感分析方法,利用PLSA模型对不同时间段上的网络舆情话题进行子话题提取和情感词表构建,综合考虑修饰词对情感词的影响以及情感词对子话题的贡献程度,最终得到一个时间序列上各个子话题的情感倾向值以及整个话题的情感变化趋势。实验结果证明该方法不仅可以描述同一个子话题随时间的情感演化过程,还可以描述话题情感随子话题维度和内容的演变情况。 展开更多
关键词 网络舆情 PLSA模型 情感演化 子话题抽取 情感分析 情感词表
下载PDF
多文档文摘中句子优化选择方法研究 被引量:13
3
作者 秦兵 刘挺 +1 位作者 陈尚林 李生 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期1129-1134,共6页
在多文档文摘子主题划分的基础上,提出了一种在子主题之间对文摘句优化选择的方法·首先在句子相似度计算的基础上,形成多文档集合的子主题,通过对各子主题打分,确定子主题的抽取顺序·以文摘中有效词的覆盖率作为优化指标,在... 在多文档文摘子主题划分的基础上,提出了一种在子主题之间对文摘句优化选择的方法·首先在句子相似度计算的基础上,形成多文档集合的子主题,通过对各子主题打分,确定子主题的抽取顺序·以文摘中有效词的覆盖率作为优化指标,在各个子主题中选择文摘句·从减少子主题之间及子主题内部的信息的冗余性两个角度选择文摘句,使文摘的信息覆盖率得到很大提高·实验表明,生成的文摘是令人满意的· 展开更多
关键词 多文档文摘 子主题 句子优化选择
下载PDF
多主题文本摘要抽取的研究与实现 被引量:5
4
作者 廖涛 刘宗田 王利 《计算机工程》 CAS CSCD 北大核心 2011年第6期21-23,共3页
研究自动摘要技术,结合统计与文本关系图并基于复杂网络中的社区划分算法,提出一种多主题文本摘要抽取方法。抽取文本中权重较高的句子,通过句子的相似度计算建立文本关系图,利用社区划分算法解决子主题划分的问题。实验结果表明,该方... 研究自动摘要技术,结合统计与文本关系图并基于复杂网络中的社区划分算法,提出一种多主题文本摘要抽取方法。抽取文本中权重较高的句子,通过句子的相似度计算建立文本关系图,利用社区划分算法解决子主题划分的问题。实验结果表明,该方法对多主题文本摘要的抽取质量较好,能抽取出较多的子主题。 展开更多
关键词 多主题文本 自动摘要 统计模型 文本关系图 子主题社区划分
下载PDF
基于GA的文本子主题切分中的参数优化研究 被引量:2
5
作者 钟彬彬 刘远超 徐志明 《计算机工程与应用》 CSCD 北大核心 2005年第21期97-99,共3页
如何正确有效地确定文档的子主题边界对于自动文摘、问答系统等自然语言处理应用是非常重要的。然而多数文档中子主题之间没有明确的标记(如小标题),这给子主题的提取带来一定的困难。文章首先分析了利用TextTiling算法进行隐式章节划... 如何正确有效地确定文档的子主题边界对于自动文摘、问答系统等自然语言处理应用是非常重要的。然而多数文档中子主题之间没有明确的标记(如小标题),这给子主题的提取带来一定的困难。文章首先分析了利用TextTiling算法进行隐式章节划分的基本原理。同时考虑到算法中人工定义参数可能会对系统的指标产生影响,利用遗传算法对其进行了优化,自动获取的参数值使系统准确率提高了7.1%。实验表明遗传算法是一种非常简单有效的参数优化方法。通过该文方法获取的参数更加适合中文文档的隐式章节划分。 展开更多
关键词 隐式章节划分 TextTiling算法 遗传算法 参数优化
下载PDF
基于子主题区域划分的多文档自动文摘方法 被引量:1
6
作者 王萌 徐超 +1 位作者 李春贵 何婷婷 《计算机工程》 CAS CSCD 北大核心 2011年第12期158-160,163,共4页
为解决词频矩阵的词频维数过大和矩阵过于稀疏的问题,提出一种子主题区域划分的多文档自动文摘方法。使用知网进行概念获取,建立概念向量空间模型,代替传统的词频向量空间模型。在概念向量空间模型的基础上,利用一种改进的层次分割法对... 为解决词频矩阵的词频维数过大和矩阵过于稀疏的问题,提出一种子主题区域划分的多文档自动文摘方法。使用知网进行概念获取,建立概念向量空间模型,代替传统的词频向量空间模型。在概念向量空间模型的基础上,利用一种改进的层次分割法对文档集合进行子主题划分,从各个子主题中抽取出满足一定数量的句子作为文摘。实验结果验证了该方法的有效性。 展开更多
关键词 子主题区域 自动文摘 知网 概念向量空间模型
下载PDF
基于主题子空间的文本模糊C均值聚类方法 被引量:2
7
作者 吉翔华 陈超 +1 位作者 邵正荣 俞能海 《小型微型计算机系统》 CSCD 北大核心 2007年第12期2225-2228,共4页
模糊C均值聚类作为聚类的一种有效方法在数据挖掘和信息检索等领域得到广泛的应用,初始中心和初始隶属度矩阵的建立是决定模糊C均值聚类效果的关键.本文提出一种基于文本主题空间的模糊C均值聚类算法TS2FCM(Topic Sub-Space based Fuzzy... 模糊C均值聚类作为聚类的一种有效方法在数据挖掘和信息检索等领域得到广泛的应用,初始中心和初始隶属度矩阵的建立是决定模糊C均值聚类效果的关键.本文提出一种基于文本主题空间的模糊C均值聚类算法TS2FCM(Topic Sub-Space based Fuzzy C-Means),通过对能够代表文本主题的关键短语(salient phrase)的提取来建立主题子空间,利用主题子空间中的文本向量来提取初始中心和初始隶属度矩阵.实验表明,TS2FCM取得了较好的聚类效果. 展开更多
关键词 TS2FCM 主题子空间 模糊C均值聚类 文本聚类
下载PDF
基于全局/局部共现词对分布的汉越双语新闻事件线索分析 被引量:1
8
作者 高盛祥 余正涛 +2 位作者 龙文旭 丁硙 闫春婷 《中文信息学报》 CSCD 北大核心 2015年第6期90-97,共8页
针对汉越双语新闻事件线索分析,提出了基于全局/局部共现词对分布的汉越双语事件线索生成方法。该方法首先将新闻话题词语分布作为全局词语表征全局事件,然后用一定时间粒度下新闻片段特有的时间、人物、地点等事件元素作为局部词语,分... 针对汉越双语新闻事件线索分析,提出了基于全局/局部共现词对分布的汉越双语事件线索生成方法。该方法首先将新闻话题词语分布作为全局词语表征全局事件,然后用一定时间粒度下新闻片段特有的时间、人物、地点等事件元素作为局部词语,分析新闻片段中全局词语和局部词语的共现关系,将全局/局部词语的共现规律作为监督信息,结合RCRP算法和汉越双语新闻的对齐语料,构建有监督话题生成主题模型,获得相应时间跨度下代表事件发展进程的子话题分布,通过子话题的分布反映事件发展的线索,从而构建出在线汉越双语事件线索生成模型。实验在汉越混合新闻数据集上进行,事件线索生成对比实验结果证明了提出的方法的有效性。 展开更多
关键词 汉语-越南语 新闻事件线索 全局/局部共现词对 子话题分布 双语主题模型
下载PDF
基于子主题和用户查询的多文档摘要系统 被引量:5
9
作者 徐晓丹 《计算机系统应用》 2011年第3期112-115,共4页
文章描述了一种基于子主题划分和查询相结合的多文档自动摘要系统的设计:首先利用同义词词林计算句子语义相似度,通过对句子的聚类得到子主题,然后根据用户的查询对子主题进行重要度排序,在此基础上,采用一种动态的句子打分策略从各个... 文章描述了一种基于子主题划分和查询相结合的多文档自动摘要系统的设计:首先利用同义词词林计算句子语义相似度,通过对句子的聚类得到子主题,然后根据用户的查询对子主题进行重要度排序,在此基础上,采用一种动态的句子打分策略从各个主题中抽取句子生成摘要。实验结果表明生成的摘要冗余少,信息全面。 展开更多
关键词 多文档自动文摘 子主题 句子相似度 用户查询
下载PDF
汉语受事主语句的句法语义再分析 被引量:3
10
作者 马志刚 《华文教学与研究》 CSSCI 2014年第4期79-86,共8页
传统语法中受事主语句的定义有失精细,而将"那封信写好了"分析为受事话题句的观点值得商榷,因为句首的"那封信"的题元角色更应该是客事(THEME),毕竟整个句子表达非宾格性的状态义。文章认为,"黄蓉写好了那封信... 传统语法中受事主语句的定义有失精细,而将"那封信写好了"分析为受事话题句的观点值得商榷,因为句首的"那封信"的题元角色更应该是客事(THEME),毕竟整个句子表达非宾格性的状态义。文章认为,"黄蓉写好了那封信"兼具施事-受事义和致事-客事义,而其宾语论元的话题化操作会因语义角色的不同分别形成受事次话题句和客事主话题句。文章的启示在于,借鉴生成语法理论研究汉语语法时应该顾及汉语的构词手段及其句法实现的个性特征。 展开更多
关键词 受事主语句 非宾格化 题元角色交替 客事话题句 次话题化
下载PDF
计算思维类课程以MOOC为中心的教学设计与实践 被引量:1
11
作者 徐奕奕 唐培和 +1 位作者 秦福利 刘永娟 《高教学刊》 2016年第17期50-52,共3页
计算思维改革目前进入了教育界普遍认可的新常态。计算思维类课程作为大学生接触的第一层次的计算机教育课程,在教学目标、教学模式、教学内容上都面临着全面革新。文章提出的具体做法是"以MOOC形式引导课堂教学、以翻转课堂激励... 计算思维改革目前进入了教育界普遍认可的新常态。计算思维类课程作为大学生接触的第一层次的计算机教育课程,在教学目标、教学模式、教学内容上都面临着全面革新。文章提出的具体做法是"以MOOC形式引导课堂教学、以翻转课堂激励学生自主学习、以作品检验实践能力"为理念,来构建基于Mooc为中心的教学方案。经过三年的实践检验,取得了明显成效。这一实践与探索对于高校进一步深化计算思维教学具有重要的借鉴和推广价值。 展开更多
关键词 计算思维 MOOC 教学方案
下载PDF
高眼压下球筋膜囊下麻醉联合表面麻醉在白内障合并原发性闭角型青光眼患者手术中的麻醉效果观察 被引量:5
12
作者 瞿琬林 陈峰 《实用医院临床杂志》 2021年第5期141-144,共4页
目的探讨高眼压下球筋膜囊下麻醉联合表面麻醉在白内障合并原发性闭角型青光眼(PACG)患者手术中的麻醉效果。方法选取我院白内障合并PACG患者82例,采用信封法随机分为联合组(43例43眼)和对照组(39例39眼),均接受白内障囊外摘除术+晶状... 目的探讨高眼压下球筋膜囊下麻醉联合表面麻醉在白内障合并原发性闭角型青光眼(PACG)患者手术中的麻醉效果。方法选取我院白内障合并PACG患者82例,采用信封法随机分为联合组(43例43眼)和对照组(39例39眼),均接受白内障囊外摘除术+晶状体植入术+小梁切除术。对照组采取表面麻醉,联合组采取球筋膜囊下麻醉联合表面麻醉。比较两组不同时间点的镇痛效果、术中制动效果、术眼配合度、患者麻醉满意度、术中麻醉并发症。结果术中10、20 min及术毕,联合组疼痛程度均轻于对照组(P<0.05)。联合组术中眼球运动、眼睑挤压的制动效果均优于对照组;配合率及麻醉满意率均高于对照组;麻醉并发症发生率低于对照组(P<0.05)。结论球筋膜囊下麻醉联合表面麻醉能获得更好的镇痛效果,并减少结膜出血、眶压升高等手术并发症,适用于白内障合并PACG手术。 展开更多
关键词 白内障 原发性闭角型青光眼 球筋膜囊下麻醉 表面麻醉
下载PDF
基于子主题概念的Web主题挖掘 被引量:1
13
作者 熊朝松 甘岚 《计算机与现代化》 2006年第4期63-65,68,共4页
为了帮助用户在Web上查找和编辑具体主题知识,本文给出一种基于子主题概念的挖掘算法。基本思想是:给定一个主题,通过搜索引擎返回的页面集合找出主题的子主题或核心概念,得到包含具体主题及子主题概念的页面,使用户无需浏览所有页面就... 为了帮助用户在Web上查找和编辑具体主题知识,本文给出一种基于子主题概念的挖掘算法。基本思想是:给定一个主题,通过搜索引擎返回的页面集合找出主题的子主题或核心概念,得到包含具体主题及子主题概念的页面,使用户无需浏览所有页面就能获取查询主题系统的、全面的知识。 展开更多
关键词 WEB内容挖掘 定义挖掘 子主题
下载PDF
基于半监督学习的中文多文档子主题划分 被引量:1
14
作者 徐晓丹 《浙江师范大学学报(自然科学版)》 CAS 2011年第3期302-305,共4页
为了能在多文档自动摘要过程中更好地划分子主题,提出了一种基于半监督学习的子主题划分方法:首先计算句子的语义相似度;然后通过层次聚类对可信度高的句子进行主题类别标记,生成少量已标记主题类别的句子集,在此基础上对所有句子进行co... 为了能在多文档自动摘要过程中更好地划分子主题,提出了一种基于半监督学习的子主题划分方法:首先计算句子的语义相似度;然后通过层次聚类对可信度高的句子进行主题类别标记,生成少量已标记主题类别的句子集,在此基础上对所有句子进行constrained-k-means聚类,通过交叉验证的方法确定子主题的数目k;最后使用k-means聚类获得多文档的各个子主题.实验结果表明,该方法有效地提高了子主题的识别率. 展开更多
关键词 多文档文摘 子主题 半监督学习 K-MEANS聚类
下载PDF
基于最大树法的多文档文摘子主题划分 被引量:1
15
作者 云晓燕 王春英 《辽宁科技大学学报》 CAS 2009年第6期575-580,共6页
提出一种基于最大树法的生成多文档文摘子主题划分方法。对多文档集合中的句子进行基于语义词典的相似度计算,形成相似度矩阵。提出了将相同或相似的句子通过模糊聚类的方法归并成一类,每一类代表一个子主题,通过抱团结构分析划分出子... 提出一种基于最大树法的生成多文档文摘子主题划分方法。对多文档集合中的句子进行基于语义词典的相似度计算,形成相似度矩阵。提出了将相同或相似的句子通过模糊聚类的方法归并成一类,每一类代表一个子主题,通过抱团结构分析划分出子主题。实验结果表明,生成的多文档文摘覆盖性强,冗余信息少,具有一定实用价值。 展开更多
关键词 多文档文摘 子主题划分 最大树算法
下载PDF
试论和话题有关的几个概念 被引量:1
16
作者 付琨 《衡水学院学报》 2008年第5期54-57,共4页
"话题"(Topic)是和"述题"(Comment)相对的话语层面的概念,语义上的"有关性"(Aboutness)是话题和述题之间的基本关系属性。从词性上看,体词性或谓词性的句法成分都可以充当话题;从数量上看,话题可以不止... "话题"(Topic)是和"述题"(Comment)相对的话语层面的概念,语义上的"有关性"(Aboutness)是话题和述题之间的基本关系属性。从词性上看,体词性或谓词性的句法成分都可以充当话题;从数量上看,话题可以不止一个。话题是"准话题"(Further-topic)的现实表现。"话题"和"焦点"(Focus)是从不同的语用层面进行的分类,两者可以在信息新旧度上建立起一个由旧到新的连续统。 展开更多
关键词 主话题 次话题 有关性 述题 焦点
下载PDF
基于多重文本关系图中clique子团聚类的主题识别方法研究 被引量:4
17
作者 郭红梅 孔贝贝 张智雄 《情报学报》 CSSCI CSCD 北大核心 2017年第5期433-442,共10页
在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈... 在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈现文本资源中的核心主题,辅助科研人员对文本集中的重要关联信息进行聚焦,提高科研效率,一直是文本挖掘研究中的一个重要问题。在对现有有益研究成果借鉴的基础上,结合文本中术语和术语关系的特点,论文提出将文本中的术语和术语间的共现、句法和语义关系利用图结构进行表示,识别文本关系图中的紧密关联子团,基于所得到的紧密关联子团聚类来揭示文本子主题的整体研究思路。开展了两个方面的研究:①将文本集中的术语和术语间各种关系属性进行叠加归并,构建多重文本关系叠加模型;②基于clique子团间相似性距离和语义标识,进行聚类识别文本集中所包含的重要子主题。论文采用"migraine disorders"主题中近五年的文献构建文本集,对提出的方法开展了2个有效性实验。实验1与文本中领域专家所给出的标引词按语义类型分组结果对比,结果表明论文提出的方法与领域专家给出的标引词语义类型分组结果具有一致性;实验2与目前广泛使用的LDA方法结果进行对比,在准确率和召回率上都较LDA方法有所提高。2个实验均证明了文中方法的有效性。 展开更多
关键词 clique子团 多重文本关系 文本主题识别
下载PDF
社区教育研究的原创性与子课题的研究工作(二)
18
作者 李继星 《职业技术教育》 北大核心 2003年第1期48-51,共4页
四、如何提升子课题研究工作的原创性 (一)要树立科学精神 子课题研究工作是否具有原创性,主要取决于两大要素:一是科学精神,二是科学方法.所谓科学精神,主要包含下列一些内容:
关键词 研究工作 子课题 原创性 教育研究 社区 科学精神 科学方法
下载PDF
基于事件指导的多文档生成式摘要方法 被引量:6
19
作者 王振超 孙锐 姬东鸿 《计算机应用研究》 CSCD 北大核心 2017年第2期343-346,356,共5页
建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指... 建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指导多语句压缩生成自然语句构建摘要。通过在DUC标准数据集上进行评测,最终的ROUGE得分媲美目前主流的生成式方法,从而说明事件能够很好地承载篇章的主干信息,同时有效地指导多语句压缩过程中冗余信息的去除和自然语言的生成。 展开更多
关键词 事件 生成式 组合语义 子主题 多语句压缩 多文档摘要
下载PDF
一种微博热点事件子话题的可视分析方法 被引量:3
20
作者 李依霖 朱嘉奇 +1 位作者 吴云坤 王宏安 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第1期48-56,共9页
如何从海量微博数据中挖掘出有意义的信息,理解热点事件发生的全过程,并发现其中的拐点事件,显得越来越重要.传统的单一依靠词频的方法缺乏对子话题的抽象描述,因此存在一定的局限性.为此结合主题提取和词频统计的技术,提出了一种交互... 如何从海量微博数据中挖掘出有意义的信息,理解热点事件发生的全过程,并发现其中的拐点事件,显得越来越重要.传统的单一依靠词频的方法缺乏对子话题的抽象描述,因此存在一定的局限性.为此结合主题提取和词频统计的技术,提出了一种交互式可视分析方法,对热点事件子话题的演化过程进行不同粒度的展示;再通过比较相邻时间区间子话题词分布的变化,发现关于某些子话题的拐点事件,进而利用词项共现图在微博原文中找到具体信息.这里,用户可以在交互过程中发现最优的参数配置,从而更加有效地分析拐点事件,并理解热点事件发生的全过程.在真实的数据集上进行了实验,并与传统的基于词频的方法和基于主题变化趋势的方法做比较,结果验证了该方法的有效性. 展开更多
关键词 子事件检测 微博 可视分析 主题模型
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部