期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
跨语言信息检索中的双语主题相关模型 被引量:8
1
作者 罗远胜 王明文 +1 位作者 勒中坚 张华伟 《小型微型计算机系统》 CSCD 北大核心 2013年第12期2758-2763,共6页
如何通过双语平行语料库提取语言之间的语义对信息,对改善跨语言信息检索的性能有着十分重要的意义.双语平行文档拥有相同的主题,这些双语主题在具体模型上可体现为语义相关.本文首先将双语平行文档看作同一语义内容的两种语言表示,从... 如何通过双语平行语料库提取语言之间的语义对信息,对改善跨语言信息检索的性能有着十分重要的意义.双语平行文档拥有相同的主题,这些双语主题在具体模型上可体现为语义相关.本文首先将双语平行文档看作同一语义内容的两种语言表示,从双语平行语料库构造每种语言的潜在语义空间,从而提出一种新的双语主题模型,即双语偏最小二乘主题相关模型.新模型克服了跨语言潜在语义索引模型没有充分考虑双语语义联系的不足.在中英双语新闻语料集上实验结果显示,新模型的文档配对搜索和伪查询跨语言检索性能明显优于跨语言潜在语义索引模型;在使用Google翻译得到的TREC-9双语平行语料库上,新模型也获得了较好的检索性能. 展开更多
关键词 跨语言信息检索 双语平行文档 主题模型 双语偏最小二乘主题相关模型
下载PDF
双语潜在语义对应分析及在跨语言文本分类中的应用研究 被引量:2
2
作者 罗远胜 王明文 +1 位作者 勒中坚 陆旭 《情报学报》 CSSCI 北大核心 2013年第1期86-96,共11页
双语文本对应分析在处理多语言文本数据、克服语言障碍等方面有着重要的作用,基于语料库技术的跨语言潜在语义索引方法没有充分考虑双语的语义相关性。本文将双语平行文档看作同一语义内容的两种语言表达,运用偏最小二乘方法构建双语... 双语文本对应分析在处理多语言文本数据、克服语言障碍等方面有着重要的作用,基于语料库技术的跨语言潜在语义索引方法没有充分考虑双语的语义相关性。本文将双语平行文档看作同一语义内容的两种语言表达,运用偏最小二乘方法构建双语文本的语义相关性,为每种语言建立单独的潜在语义空间,并在这两个空间上实现跨语言的分类任务。在香港政府网中英双语新闻的实验结果显示,本文方法构造的双语潜在语义空间上完成的跨语言和单语言文本分类性能接近或优于原始特征空间的单语言分类,并具有良好的稳健性。 展开更多
关键词 双语文本对应分析 双语潜在语义空间 偏最小二乘 跨语言文本分类
下载PDF
基于团模型的文档重排算法研究 被引量:2
3
作者 付剑波 王明文 +1 位作者 罗远胜 张华伟 《中文信息学报》 CSCD 北大核心 2009年第1期71-78,共8页
为了满足用户对信息检索结果准确不断提高的需求,尽可能应用那些与查询及检索结果有关的信息进行查询结果优化是一种有效的手段。查询扩展和结果重排就是利用附加信息进行检索结果优化的方法。该文提出了基于文档团的文档重排模型(DCRM... 为了满足用户对信息检索结果准确不断提高的需求,尽可能应用那些与查询及检索结果有关的信息进行查询结果优化是一种有效的手段。查询扩展和结果重排就是利用附加信息进行检索结果优化的方法。该文提出了基于文档团的文档重排模型(DCRM模型),此模型通过对文档集的学习,构造文档与文档关系的Markov网络,提取出文档Markov网络中的"文档团",应用文档团信息进行文档重排。在adi、cacm、med、cisi和cran五个数据集上的实验结果表明,本文提出的基于文档团的文档重排模型较BM25模型性能得到有效提高。 展开更多
关键词 计算机应用 中文信息处理 MARKOV网络 文档团 文档重排
下载PDF
基于频率共现熵的跨语言网页自动分类研究 被引量:3
4
作者 柯丽 王明文 +2 位作者 何世柱 黎佳 罗远胜 《江西师范大学学报(自然科学版)》 CAS 北大核心 2011年第3期240-245,共6页
研究了基于频率共现熵的跨语言网页自动分类问题,使用翻译软件将所有中文网页翻译为英文,计算中文和英文网页的共现特征频率共现熵值,确定中文和英文网页的共现知识,并与英文网页相结合训练中文分类模型.实验结果表明,该方法与贝叶斯分... 研究了基于频率共现熵的跨语言网页自动分类问题,使用翻译软件将所有中文网页翻译为英文,计算中文和英文网页的共现特征频率共现熵值,确定中文和英文网页的共现知识,并与英文网页相结合训练中文分类模型.实验结果表明,该方法与贝叶斯分类模型、向量空间分类模型和信息瓶颈模型相比体现出良好的性能. 展开更多
关键词 跨语言 网页分类 频率共现熵 贝叶斯分类 自适应贝叶斯分类
下载PDF
融合多元用户特征和内容特征的微博谣言实时检测模型 被引量:7
5
作者 黄学坚 王根生 +3 位作者 罗远胜 闵潞 吴小芳 李志鹏 《小型微型计算机系统》 CSCD 北大核心 2022年第12期2518-2527,共10页
针对目前基于单文本语义特征深度学习的微博谣言实时检测模型泛化能力不足的问题,提出一种融合多元用户特征和内容特征的实时检测模型.首先,在传统用户基本特征和内容统计特征的基础上,利用用户的历史行为数据,挖掘用户理性值和用户专... 针对目前基于单文本语义特征深度学习的微博谣言实时检测模型泛化能力不足的问题,提出一种融合多元用户特征和内容特征的实时检测模型.首先,在传统用户基本特征和内容统计特征的基础上,利用用户的历史行为数据,挖掘用户理性值和用户专业度两个深层次特征;然后,基于词向量和带有注意力机制的双向GRU神经网络构建文本语义特征学习模型;最后,采用分层特征级联和全连接的方式进行特征融合,把融合特征输入分类模型进行训练.实验结果表明,该模型的检测准确率达到了91.74%,相比其他只关注文本语义特征的深度学习实时检测模型具有更好的识别效果,相比于其他改进型的实时检测模型F1-Measure值也提高了2.19%. 展开更多
关键词 微博谣言 实时检测 特征融合 深层特征 深度学习
下载PDF
一种基于簇相合性的文本增量聚类算法 被引量:2
6
作者 陶舒怡 王明文 +2 位作者 万剑怡 罗远胜 左家莉 《计算机工程》 CAS CSCD 2014年第6期195-200,共6页
传统文本聚类方法只适合处理静态样本,且时间复杂度较高。针对该问题,提出一种基于簇相合性的文本增量聚类算法。采用基于词项语义相似度的文本表示模型,利用词项之间的语义信息,通过计算新增文本与已有簇之间的相合性实现对文本的增量... 传统文本聚类方法只适合处理静态样本,且时间复杂度较高。针对该问题,提出一种基于簇相合性的文本增量聚类算法。采用基于词项语义相似度的文本表示模型,利用词项之间的语义信息,通过计算新增文本与已有簇之间的相合性实现对文本的增量聚类。增量处理完部分文本后,对其中错分可能性较大的文本重新指派类别,以进一步提高聚类性能。该算法可在对象数据不断增长或更新的情况下,避免大量重复计算,提高聚类性能。在20 Newsgroups数据集上进行实验,结果表明,与k-means算法和SHC算法相比,该算法可减少聚类时间,提高聚类性能。 展开更多
关键词 文本聚类 增量聚类 语义相似度 簇相合性 文本再分配
下载PDF
基于局部有限搜索的无向图近似最大团快速求解算法 被引量:3
7
作者 钟茂生 江超 +2 位作者 陶兰 何雄 罗远胜 《计算机科学》 CSCD 北大核心 2020年第1期72-78,共7页
无向图最大团求解是一个著名的NP-完全问题,解决该问题的经典算法基本上都采用完全精确搜索策略。鉴于NP-完全问题本身所固有的复杂性,这些算法或许仅适用于某些特殊的小规模图,对于具有大规模顶点和边的复杂图还是显得无力,难以适用。... 无向图最大团求解是一个著名的NP-完全问题,解决该问题的经典算法基本上都采用完全精确搜索策略。鉴于NP-完全问题本身所固有的复杂性,这些算法或许仅适用于某些特殊的小规模图,对于具有大规模顶点和边的复杂图还是显得无力,难以适用。针对完全精确搜索策略下的无向图最大团求解算法的大部分时间都用于对图进行额外而无效的查找的问题,采用分划递归技术将图划分为邻接子图和悬挂子图,然后对邻接子图进行递归求解,而对悬挂子图则通过设置搜索范围控制函数进行局部有限搜索。在DIMACS数据集上将所提算法与当前主要的最大团求解算法进行对比实验,结果表明,文中提出的局部有限搜索求解策略能在75%的基准数据上获得最大团,剩下不能得到最大团的数据实际上也可以获得接近于最大团的近似最大团,但算法的平均求解时间仅为目前最大团精确求解算法的20%左右。因此,在很多最大团非精确要求的场景中,所提算法具有极高的应用价值。 展开更多
关键词 近似最大团 求解算法 邻接子图 悬挂子图 局部有限搜索
下载PDF
基于情感分析的“真假美猴王”存疑研究 被引量:1
8
作者 张辰麟 王明文 +3 位作者 谭亦鸣 陈志明 左家莉 罗远胜 《中文信息学报》 CSCD 北大核心 2019年第3期118-125,135,共9页
《西游记》是我国四大名著之一。"真假美猴王"事件作为《西游记》的高潮部分,留下了不少伏笔,也引发了多种解读。该文通过运用情感分析的方法,对"真假美猴王"事件前后孙悟空与其他角色的对话进行分析。通过比较孙... 《西游记》是我国四大名著之一。"真假美猴王"事件作为《西游记》的高潮部分,留下了不少伏笔,也引发了多种解读。该文通过运用情感分析的方法,对"真假美猴王"事件前后孙悟空与其他角色的对话进行分析。通过比较孙悟空在"真假美猴王"事件前后,对其他角色情感值的变化,得到了"孙悟空并没有被如来打死,‘真假美猴王’事件消灭的‘心魔’是孙悟空的反抗精神。事件之后,孙悟空选择屈服于神权"的结论。初步探索了情感分析技术对文学研究的可行性。 展开更多
关键词 情感分析 文学情感分析 情感词典 《西游记》 真假美猴王
下载PDF
关于案例教学法在初中政治教学中的运用分析
9
作者 罗远胜 《东西南北(教育)》 2020年第5期291-291,共1页
初中政治教学的宗旨就是对学生的自身进行教育,促进学生身心的健康发展,养成良好的行为习惯,帮助学生更好的处理青春期中出现的种种状况。案例教学法作为一种优秀的教学方式,在实践的过程中也会出现一系列的难题,同时导致初中政治教学... 初中政治教学的宗旨就是对学生的自身进行教育,促进学生身心的健康发展,养成良好的行为习惯,帮助学生更好的处理青春期中出现的种种状况。案例教学法作为一种优秀的教学方式,在实践的过程中也会出现一系列的难题,同时导致初中政治教学活动的进行,本文将围绕初中政治教学中的案例教学法进行讨论分析,使其更好地运用在当代的的教学实践中,使学生受到良好的政治道德教育。 展开更多
关键词 案例教学法 初中 政治教学 运用
下载PDF
农村《科学》课外实践活动之我见
10
作者 胡顺霞 罗远胜 《贵州教育》 2006年第14期47-47,共1页
关键词 课外实践活动 学生 农村小学 科学 水土流失 情感教育 自然水域 新课程 小河流 酒厂
下载PDF
基于核方法的潜在语义文本分类模型 被引量:4
11
作者 罗远胜 王明文 曾雪强 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第S1期1853-1856,共4页
在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳。而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高。为了提高分类性能,通过引入核函数,给出... 在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳。而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高。为了提高分类性能,通过引入核函数,给出了一种非线性的潜在语义文本分类模型。该模型比LSC模型能更好地表示文档空间的潜在语义结构信息。在R eu ter-21578文档集上的实验结果表明,潜在语义文本分类模型有很好的分类性能。 展开更多
关键词 文本分类 核方法 潜在语义索引 偏最小二乘分析 核偏最小二乘分析
原文传递
基于协同聚类的两阶段文本聚类方法 被引量:5
12
作者 王明文 付剑波 +1 位作者 罗远胜 陆旭 《模式识别与人工智能》 EI CSCD 北大核心 2009年第6期848-853,共6页
为了将语义信息用于文本聚类和有效地进行特征选择,文中提出一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系.然后利用此关系来相互调整彼此的聚类结果.实验结果表明,利用... 为了将语义信息用于文本聚类和有效地进行特征选择,文中提出一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系.然后利用此关系来相互调整彼此的聚类结果.实验结果表明,利用特征与主题之间的语义关联关系能有效提高聚类效果. 展开更多
关键词 文本聚类 协同聚类 特征选择
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部