期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
知识生产、文本流变与阐释的陷阱--以《望夫云》传说为中心的考察
1
作者 杨文辉 《原生态民族文化学刊》 北大核心 2024年第1期118-130,156,共14页
有关《望夫云》的知识生产经历了一个较长时间的历史过程,是洱海区域的地方性知识与中原传统知识资源有机交融的结果。基于文献记录的梳理表明,《望夫云》不是产生于南诏时期,而是在明代见于载录的多种知识资源基础上,由知识精英于清初... 有关《望夫云》的知识生产经历了一个较长时间的历史过程,是洱海区域的地方性知识与中原传统知识资源有机交融的结果。基于文献记录的梳理表明,《望夫云》不是产生于南诏时期,而是在明代见于载录的多种知识资源基础上,由知识精英于清初重新书写而正式产生。文本所反映的,是明末清初洱海区域的社会情境;当下对《望夫云》的主流认知,则肇始于徐嘉瑞先生对《望夫云》的重新建构与阐释。 展开更多
关键词 知识生产 文本流 民间传说 望夫云
下载PDF
杨六郎故事的文本流变及其文化意蕴
2
作者 杨沫南 《天中学刊》 2024年第1期75-83,共9页
杨六郎故事在杨家将故事中占据重要地位。从宋代的史书、话本,到元代的杂剧,再到明清的传奇、小说以及戏曲,杨六郎故事经历了一系列变化。运用中国叙事文化学的研究方法,对杨六郎故事的历代文本演变形态进行梳理,可以探讨其文本背后蕴... 杨六郎故事在杨家将故事中占据重要地位。从宋代的史书、话本,到元代的杂剧,再到明清的传奇、小说以及戏曲,杨六郎故事经历了一系列变化。运用中国叙事文化学的研究方法,对杨六郎故事的历代文本演变形态进行梳理,可以探讨其文本背后蕴涵的文化意旨。 展开更多
关键词 杨六郎 文本流 文化意蕴
下载PDF
基于情节记忆的高效短文本流聚类算法
3
作者 刘子健 王勇 +1 位作者 刘媛妮 周由胜 《计算机工程》 CAS CSCD 北大核心 2023年第10期145-153,共9页
现有基于相似度的短文本流聚类算法多数需要手动设置相似度阈值,且难以处理文本稀疏性问题。针对短文本流的特点和传统流聚类算法的局限性,提出基于情节记忆的短文本流聚类算法。将情节记忆思想融入流聚类算法,通过稀疏经验重放增强聚... 现有基于相似度的短文本流聚类算法多数需要手动设置相似度阈值,且难以处理文本稀疏性问题。针对短文本流的特点和传统流聚类算法的局限性,提出基于情节记忆的短文本流聚类算法。将情节记忆思想融入流聚类算法,通过稀疏经验重放增强聚类的特征表示,并使用反向索引提高聚类效率。在线阶段通过新的相似度计算公式以及动态计算相似度阈值,将当前文本分配到现有集群或新集群,并且不断更新聚类特征。离线阶段通过聚类增强、语义再分配以及删除过时聚类,提高整体算法性能。基于公开和合成数据集的实验结果表明,相较于基准流聚类算法,所提算法在各项评价指标上均取得了较好的实验结果,并且对于文本数量较大的数据集,运行时间能减少1~3个数量级。 展开更多
关键词 文本流聚类 文本流 情节记忆 主题演化 文本特征
下载PDF
“画中女”故事文本流变及意涵阐释
4
作者 郭倩倩 李扬 《贵州民族大学学报(哲学社会科学版)》 2023年第3期179-192,共14页
“画中女”故事是以人类男子与画中女子产生恋爱、婚姻等情感活动为主要内容的故事,在“AT分类法”中作“400B画中女”。中国“画中女”故事自魏晋南北朝产生以来呈现出较为复杂的面貌,在搜集故事文本的基础上梳理“画中女”故事的流变... “画中女”故事是以人类男子与画中女子产生恋爱、婚姻等情感活动为主要内容的故事,在“AT分类法”中作“400B画中女”。中国“画中女”故事自魏晋南北朝产生以来呈现出较为复杂的面貌,在搜集故事文本的基础上梳理“画中女”故事的流变,能够揭示故事在不同时代的呈现特点,探寻古今“画中女”故事文本在语言与程式、主旨与情感方面的明显差异。“画中女”故事在本文结构与人物角色、民俗事象背后,隐附丰富的叙事与文化意涵:叙事层面,关乎性别、身份与伦理的二元对立结构在叙事中完成关系的调和;文化层面,“画中女”角色与呼名、食饮等民俗事象映射原始思维与多重文化意蕴。 展开更多
关键词 “画中女”故事 文本流 古今载录 深层结构 文化阐释
下载PDF
一种面向微博客文本流的噪音判别与内容相似性双重检测的过滤方法 被引量:14
5
作者 王琳 冯时 +3 位作者 徐伟丽 杨卓 王大玲 张一飞 《计算机应用与软件》 CSCD 北大核心 2012年第8期25-29,94,共6页
微博客作为一种新的用户信息传播载体,在网络舆情发起和传播中起着重要作用。由于用户有意(上传广告)、无意(转发)操作所带来的大量噪音微博和相似微博,对网络舆情分析和用户浏览造成极为不利的影响。检测这些噪音微博和相似微博,对微... 微博客作为一种新的用户信息传播载体,在网络舆情发起和传播中起着重要作用。由于用户有意(上传广告)、无意(转发)操作所带来的大量噪音微博和相似微博,对网络舆情分析和用户浏览造成极为不利的影响。检测这些噪音微博和相似微博,对微博数据进行提纯,成为一个亟待解决的问题。基于统计数据分析了噪音微博和相似微博的特点,提出一种面向微博文本流的噪音判别和内容相似性双重检测的过滤方法:通过URL链接、字符率、高频词等特征判别,过滤噪音微博;通过分段过滤和索引过滤的双重内容过滤,检测和剔除相似微博。实验表明该方法能有效地对微博数据进行提纯,高效准确地过滤掉相似微博和噪音微博。 展开更多
关键词 微博客 噪音微博 相似微博 文本流 过滤
下载PDF
基于流信息距离的多文本流热点挖掘 被引量:5
6
作者 杨宁 唐常杰 +3 位作者 王悦 陈瑜 郑皎凌 李红军 《软件学报》 EI CSCD 北大核心 2011年第8期1761-1770,共10页
把文本流中的热点区分为局部热点和全局热点,分析了二者的相关性,并将Kolmogorov复杂度应用于多文本流中的热点挖掘.首先,定义了基于Kolmogorov复杂度的冗余信息的概念,并论证了文本流存在局部热点的必要条件是冗余信息超过某个阈值;其... 把文本流中的热点区分为局部热点和全局热点,分析了二者的相关性,并将Kolmogorov复杂度应用于多文本流中的热点挖掘.首先,定义了基于Kolmogorov复杂度的冗余信息的概念,并论证了文本流存在局部热点的必要条件是冗余信息超过某个阈值;其次,基于条件Kolmogorov复杂度提出了一个相似性度量指标——流信息距离(stream information distance,简称SID),以衡量不同文本流之间的相似度;并借鉴计算生物学领域中的种系发生树的思想,提出了一种基于层次聚类的多文本流全局热点挖掘启发式算法.在合成和真实数据集的实验,验证了算法的收敛性、有效性和规模可伸缩性. 展开更多
关键词 热点挖掘 文本流 信息距离 冗余信息 Kolmogorov复杂度
下载PDF
基于AC-Trie的在线社交网络文本流热点短语挖掘 被引量:3
7
作者 黄九鸣 吴泉源 +3 位作者 张圣栋 贾焰 刘东 周斌 《电子学报》 EI CAS CSCD 北大核心 2016年第10期2466-2470,共5页
在线社交网络文本流中的热点短语能反映文本流中隐含的热点话题和突发事件.本文提出了一种无需分词并能支持多种热度度量函数的热点短语挖掘技术.首先用文本流的某个典型时段采样得到候选短语,构建ACTrie前缀树.然后,基于该前缀树,单遍... 在线社交网络文本流中的热点短语能反映文本流中隐含的热点话题和突发事件.本文提出了一种无需分词并能支持多种热度度量函数的热点短语挖掘技术.首先用文本流的某个典型时段采样得到候选短语,构建ACTrie前缀树.然后,基于该前缀树,单遍扫描后续的文本流,将候选短语的历史出现频率记录在Trie相应节点上,从而支持多种基于历史频率的热度计算方法.此外,为及时发现新的热点短语并减少AC-Trie的构建次数,本文通过分析Trie树各节点上的遗漏短语频率,动态确定候选短语的更新时机.新浪微博数据集上的实验验证了本文方法的有效性(准确率达89%)和高效性(时空开销仅为基准算法的2%). 展开更多
关键词 文本流 热点短语 AC-Trie 文本挖掘 在线社交网络
下载PDF
基于特征本体的文本流主题演化 被引量:3
8
作者 陈千 桂志国 +1 位作者 郭鑫 向阳 《计算机应用》 CSCD 北大核心 2015年第2期456-460,465,共6页
针对网络大数据时代文本流的主题演化研究大多基于经典概率主题模型,以词袋假设为前提导致主题的语义缺失问题和批处理问题,提出一种在线增量的基于特征本体的主题演化算法。首先,基于词共现和通用本体库Word Net构建特征本体,用特征本... 针对网络大数据时代文本流的主题演化研究大多基于经典概率主题模型,以词袋假设为前提导致主题的语义缺失问题和批处理问题,提出一种在线增量的基于特征本体的主题演化算法。首先,基于词共现和通用本体库Word Net构建特征本体,用特征本体对文本流主题进行建模;其次,提出一种文本流主题矩阵构建算法,实现在线增量主题演化分析;最后,依据该矩阵提出文本流主题本体演化图构建算法,利用特征本体的子图相似度计算主题相似度,从而获得文本流中主题随时间的演化模式。在科技文献上的实验上,满意度同传统在线潜在狄利克雷分配模型(LDA)不相上下,但时间复杂度降低到O(n K+N)。所提出的方法引入了本体,加入了语义关系标注,可图形化展现主题的语义特征,并在此基础上在线增量地实现了主题演化图的构建,在语义解释性和主题可视化方面更具有优势。 展开更多
关键词 文本流 主题建模 特征本体 主题演化 词共现
下载PDF
面向微博文本流的负面情感突发话题检测 被引量:5
9
作者 李艳红 赵宏伟 +1 位作者 王素格 李德玉 《计算机应用》 CSCD 北大核心 2020年第12期3458-3464,共7页
如何从海量、嘈杂的微博文本流中及时发现负面情感突发话题对于突发事件的应急响应和处置至关重要,而传统的突发话题检测方法往往忽略了负面情感突发话题与非负面情感突发话题之间的区别,为此提出了一种面向微博文本流的负面情感突发话... 如何从海量、嘈杂的微博文本流中及时发现负面情感突发话题对于突发事件的应急响应和处置至关重要,而传统的突发话题检测方法往往忽略了负面情感突发话题与非负面情感突发话题之间的区别,为此提出了一种面向微博文本流的负面情感突发话题检测(NE-BTD)算法。首先,将微博中的主题词对的加速度和负面情感强度变化率作为负面情感突发话题的判定依据;然后,利用突发词对的速度确定负面情感突发话题的窗口范围;最后,使用一种基于吉布斯采样的狄利克雷多项式混合模型(GSDMM)聚类算法得到窗口中负面情感突发话题的主题结构。在实验中将所提出的NE-BTD算法与已有的一种基于情感方法的话题检测(EBM-TD)算法进行对比,结果表明所提出的NE-BTD算法相较EBM-TD算法准确率和召回率至少提高了20%,并且可以至少提前40 min检出负面情感突发话题。 展开更多
关键词 微博 文本流 突发话题 负面情感 狄利克雷多项式混合模型
下载PDF
文本流多粒度主题结构建模研究 被引量:2
10
作者 陈千 郭鑫 +1 位作者 王素格 张虎 《中文信息学报》 CSCD 北大核心 2015年第1期118-125,共8页
主题检测近年来在文本挖掘和自然语言处理领域得到了广泛的应用,对主题进行结构建模是主题检测的基础。为了对文本流中的多粒度主题进行建模,提出一种基于语义层次树的主题结构模型。该模型利用领域本体的特点,将主题同本体作一一映射,... 主题检测近年来在文本挖掘和自然语言处理领域得到了广泛的应用,对主题进行结构建模是主题检测的基础。为了对文本流中的多粒度主题进行建模,提出一种基于语义层次树的主题结构模型。该模型利用领域本体的特点,将主题同本体作一一映射,结合概率理论,将概念集里的概念用主题树的叶子节点表示,每一层中的节点均是下一层节点的多项分布,使之更适合描述文本流中多粒度的主题结构。为了便于构建主题的空间结构,提出主题的相似度和事件相关度计算方法。该文结尾设计了实验构造真实新闻文本流数据上的主题树。实验结果表明,该结构模型能够体现主题丰富的多粒度空间语义特征。 展开更多
关键词 主题检测 多粒度主题建模 文本流
下载PDF
适于垃圾文本流过滤的条件概率集成方法 被引量:2
11
作者 刘伍颖 王挺 《计算机科学与探索》 CSCD 2010年第5期445-454,共10页
通过用于垃圾文本流过滤的在线文本分类研究,提出了一种新的条件概率集成方法。采用语汇序列表示文本,使用索引结构存储分类知识,设计实现了分类模型的在线训练算法和在线分类算法。抽取电子邮件和手机短信的多种文本特征,分别在TREC07... 通过用于垃圾文本流过滤的在线文本分类研究,提出了一种新的条件概率集成方法。采用语汇序列表示文本,使用索引结构存储分类知识,设计实现了分类模型的在线训练算法和在线分类算法。抽取电子邮件和手机短信的多种文本特征,分别在TREC07P电子邮件语料和真实中文手机短信语料上进行了垃圾信息过滤实验。实验结果表明,提出的方法能够获得很好的垃圾信息过滤效果。 展开更多
关键词 垃圾过滤 文本流 集成条件概率 语汇序列 索引
下载PDF
从“西北来”到“东南飞”——《艳歌何尝行》、《孔雀东南飞》的文本流变与文化意蕴 被引量:2
12
作者 孙少华 《中南民族大学学报(人文社会科学版)》 CSSCI 北大核心 2016年第3期161-166,共6页
先秦两汉时期,出现了"西北"、"东南"这对方位词的记载。从文化思想角度而言,"西北"作为一个方位词,首先应该属于西北昆仑神仙系统,而后又被佛教文本所接受。"东南"被后世的道教神仙系统所接受... 先秦两汉时期,出现了"西北"、"东南"这对方位词的记载。从文化思想角度而言,"西北"作为一个方位词,首先应该属于西北昆仑神仙系统,而后又被佛教文本所接受。"东南"被后世的道教神仙系统所接受与强化。"西北—东南"进入文学文本,逐渐成为一对非常重要的方位词和叙事题材。东汉以后,尤其是南朝文学文本中,出现了大量近似的"西北来"、"东南飞"这对表述,反映了文学传播过程中文本书写的发散性特征。 展开更多
关键词 西北来 东南飞 《艳歌何尝行》 《孔雀东南飞》 文学文本 文本流
下载PDF
从史传与传说中走出的文学——论古代发迹变泰故事的文本流变 被引量:3
13
作者 李健秋 《黑龙江社会科学》 2006年第2期112-115,共4页
我国古代白话小说中的发迹变泰故事,经历了一个从史传到文人笔记再到民间说话的演变过程,在这一过程中,随着叙事主体的变化,故事的文本也不断发生着变化,具体可归纳为故事趣味迎合市井、叙事角度贴近平民、创作手法趋向自觉三方面。发... 我国古代白话小说中的发迹变泰故事,经历了一个从史传到文人笔记再到民间说话的演变过程,在这一过程中,随着叙事主体的变化,故事的文本也不断发生着变化,具体可归纳为故事趣味迎合市井、叙事角度贴近平民、创作手法趋向自觉三方面。发迹故事的这一发展方向,从一个侧面反映出明代之前我国叙事文学的总体走向,具有相当的典型意义。 展开更多
关键词 发迹变泰故事 文本流 故事趣味 叙事角度 创作手法
下载PDF
伍子胥故事的文本流变和中国古代的价值观 被引量:1
14
作者 杨华 冯闻文 《长江学术》 2013年第3期143-152,共10页
本文对《左传》、《史记》、《越绝书》、《吴越春秋》、《新列国志》、《伍子胥》等有关"伍尚决死"的文本进行比较,这些文本对于伍子胥兄弟避吴和决死的不同选择做出了不同的评价。历史文本与文学文本之间的差异、官方文本... 本文对《左传》、《史记》、《越绝书》、《吴越春秋》、《新列国志》、《伍子胥》等有关"伍尚决死"的文本进行比较,这些文本对于伍子胥兄弟避吴和决死的不同选择做出了不同的评价。历史文本与文学文本之间的差异、官方文本与民间传说的差异、故事的精神内核与时代价值观念的变异造成了文本的流变。 展开更多
关键词 伍子胥 文本流 复仇 《左传》 《越绝书》
下载PDF
基于特征本体的文本流主题检测研究
15
作者 郭鑫 陈千 向阳 《计算机应用研究》 CSCD 北大核心 2016年第2期396-399,共4页
传统的主题检测方法以统计理论为基础,忽略了数据本身蕴涵的语义,带来了偏差严重、与样本数据高度相关等缺点。针对以上缺点,面向文本流数据,提出一种基于特征本体的主题检测方法。首先构建文本特征本体;其次,将较为复杂的文本特征本体... 传统的主题检测方法以统计理论为基础,忽略了数据本身蕴涵的语义,带来了偏差严重、与样本数据高度相关等缺点。针对以上缺点,面向文本流数据,提出一种基于特征本体的主题检测方法。首先构建文本特征本体;其次,将较为复杂的文本特征本体看做是由若干主题组成的连通图,然后将主题连通图分解成单边图集合;再次,将主题相似度计算问题转换为单边图贡献度和图相似度的计算问题;最后,对每一批新文本集检测是否有新主题,从而使得主题的个数随着时间的推移而增加。在科技文献和新闻语料上进行实证研究,结果发现阈值δ参数决定文本流中新主题出现的频率,且实验结果同经典主题模型基本保持一致。除此之外,同传统的方法相比,提出的方法能更好地支持主题的语义表示,且适用于流数据,能增量实现主题检测,在应用上具有更大的优势。 展开更多
关键词 特征本体 主题检测 文本流
下载PDF
冰心《谈生命》的文本流变 被引量:1
16
作者 熊飞宇 《重庆广播电视大学学报》 2013年第5期64-70,共7页
1999年3月4日的《文汇报》,曾发表陈子善的《生命的璀璨瑰丽》,文章将刊于1947年《京沪周刊》第1卷第27期的《谈生命》,视为冰心的佚作。此一说法,在中学语文教育界影响既广且深。然其底本,则是《寄小读者(通讯四)》(载1944年12月25日... 1999年3月4日的《文汇报》,曾发表陈子善的《生命的璀璨瑰丽》,文章将刊于1947年《京沪周刊》第1卷第27期的《谈生命》,视为冰心的佚作。此一说法,在中学语文教育界影响既广且深。然其底本,则是《寄小读者(通讯四)》(载1944年12月25日重庆《大公报》)。1945年1月30日,《新评论》第11卷第1号,即以《谈生命》为题,重刊通讯的主干部分。该文收入《冰心全集》后,又更名为《再寄小读者·通讯四》。四种文本段落、文字和标点多有出入。 展开更多
关键词 冰心 《谈生命》 文本流 生命意识
下载PDF
一种新的演化文本流聚类算法
17
作者 邓维维 彭宏 《计算机科学》 CSCD 北大核心 2007年第9期125-127,162,共4页
数据流的聚类作为聚类的一个分支,已经成为了数据挖掘的研究热点。虽然已经有不少数据流算法出现,但是大部分都是针对低维的数值型数据,很少有高维文本流的研究。本文在传统的数据流聚类框架基础上,提出了一种新的文本微聚类结构体,它... 数据流的聚类作为聚类的一个分支,已经成为了数据挖掘的研究热点。虽然已经有不少数据流算法出现,但是大部分都是针对低维的数值型数据,很少有高维文本流的研究。本文在传统的数据流聚类框架基础上,提出了一种新的文本微聚类结构体,它更适合文本聚类,同时还将在线微聚类分为潜在微聚类和异常微聚类,提高了对孤立点的适应能力。实验表明该算法相对于其他文本流聚类算法更有效。 展开更多
关键词 聚类 数据 文本流
下载PDF
动态文本流中的话题线索检测算法
18
作者 曹月芹 《计算机工程》 CAS CSCD 北大核心 2011年第24期45-49,共5页
针对动态文本流中的话题线索检测问题,提出一种基于语义相关度模型的话题线索检测算法。利用改进的语义相关度模型计算消息文本与话题线索之间的语义相关度,将消息划分至相应的话题线索。在真实数据集上的实验结果表明,与现有算法相比,... 针对动态文本流中的话题线索检测问题,提出一种基于语义相关度模型的话题线索检测算法。利用改进的语义相关度模型计算消息文本与话题线索之间的语义相关度,将消息划分至相应的话题线索。在真实数据集上的实验结果表明,与现有算法相比,该算法的F1测度值较高。 展开更多
关键词 动态文本流 话题线索检测 语义相关度 消息划分 即时通信工具
下载PDF
Delphi中利用文本流来实现测试对象文字的生成
19
作者 韦伟 《电子商务》 2010年第11期57-57,共1页
打字软件的设计制作过程中,一个基础而又重要的过程就是测试对象的生成,在此,我们讲具体介绍如何利用文本流来实现这一过程。
关键词 测试对象 文本流
下载PDF
基于主题本体树的文本流层次主题检测技术 被引量:2
20
作者 张琪 陈千 郭鑫 《微电子学与计算机》 CSCD 北大核心 2013年第7期60-63,共4页
本文首先提出主题本体树层次结构的主题结构模型,并研究了基于主题本体树的层次主题检测技术.在真实新闻数据上的仿真实验表明,该方法能从文本流中有效检测层次主题,实验表明三种测度中混合对称测度效果更好.
关键词 文本流 层次主题检测 主题本体树
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部