期刊文献+
共找到1,659篇文章
< 1 2 83 >
每页显示 20 50 100
图书情报领域中外学者研究方法使用差异分析——跨语言文本分类的视角 被引量:1
1
作者 章成志 储新龙 +1 位作者 田亮 储荷婷 《情报理论与实践》 CSSCI 北大核心 2024年第9期45-58,共14页
[目的/意义]对学科研究方法的自省式分析对于理解学科发展和建立学科自主知识体系至关重要。通过研究国内外学者在研究方法上的使用差异,可以更全面地了解不同地区和文化背景下的研究者在应对不同研究问题所采用的策略和方法,从而促进... [目的/意义]对学科研究方法的自省式分析对于理解学科发展和建立学科自主知识体系至关重要。通过研究国内外学者在研究方法上的使用差异,可以更全面地了解不同地区和文化背景下的研究者在应对不同研究问题所采用的策略和方法,从而促进学术交流和跨国合作,并进一步推动学科的发展与学科知识体系的完善。[方法/过程]以图书情报领域5种高影响力中英文期刊中1990-2021年共30余年的学术论文为研究对象,采用跨语言文本分类方法对这些论文中的研究方法进行自动分类。然后从研究方法的使用频率与演化差异以及适用主题多样性差异两个角度,进行中外比较研究。[结果/结论]国外学者越来越倾向于使用定性方法,而对定量方法的使用正在减少。同时,国内外大多数研究方法的适用主题多样性都在增加。这项研究对于理解图书情报学科的发展、促进学术交流与合作以及提高国内学者的国际影响力具有重要意义。 展开更多
关键词 自动分类模型 研究方法分类 语言文本分类 研究方法使用
下载PDF
用于小样本跨语言文本分类的元对比学习框架
2
作者 郭建铭 赵彧然 刘功申 《网络与信息安全学报》 2024年第3期107-116,共10页
众多的安全风控问题均为文本分类问题,国际场景下的舆情分析等风控问题涉及多种语言,是一大难点。先前的研究表明,通过跨语言语义知识迁移可以显著提高小样本文本分类任务的性能。然而,跨语言文本分类的发展仍面临着一系列挑战。获得语... 众多的安全风控问题均为文本分类问题,国际场景下的舆情分析等风控问题涉及多种语言,是一大难点。先前的研究表明,通过跨语言语义知识迁移可以显著提高小样本文本分类任务的性能。然而,跨语言文本分类的发展仍面临着一系列挑战。获得语义无关的文本表征是一项困难的任务。不同语言之间的语法结构和句法规则引起文本表征的差异,因此提取通用的语义信息较为困难。此外,跨语言文本分类的标签数据十分稀缺。在很多现实场景中,只能获得少量的标记数据,这严重降低了许多方法的性能。因此需要有效的方式能够在小样本情况下准确地迁移知识,提高分类模型的泛化能力。为应对这些挑战,提出了集成对比学习和元学习的框架,该框架集成了对比学习和元学习的优势,利用对比学习来提取与语言无关的通用语义信息,同时利用元学习快速泛化的优势来改善小样本场景中的知识迁移。此外,提出了基于任务的数据增强方法,以进一步提高所提框架在小样本跨语言文本分类中的性能。通过在两个广泛使用的多语言文本分类数据集上进行大量实验,证实了所提方法能够有效提升文本分类的准确性,可有效应用于风控安全领域。 展开更多
关键词 语言文本分类 元学习 对比学习 小样本
下载PDF
基于语言特征集成学习的大语言模型生成文本检测
3
作者 项慧 薛鋆豪 郝玲昕 《信息网络安全》 CSCD 北大核心 2024年第7期1098-1109,共12页
大语言模型的快速发展为日常生活和工作提供了极大的便利,但也为个人和社会带来了挑战。因此,迫切需要能够检测大语言模型生成文本的检测器。为了兼具良好的检测性能和泛化能力,文章提出了一种基于语言特征集成学习的大语言模型生成文... 大语言模型的快速发展为日常生活和工作提供了极大的便利,但也为个人和社会带来了挑战。因此,迫切需要能够检测大语言模型生成文本的检测器。为了兼具良好的检测性能和泛化能力,文章提出了一种基于语言特征集成学习的大语言模型生成文本检测方法EBF Detection。EBF Detection融合了微调预训练语言模型和高阶自然语言统计特征,利用判决机制,实现了大语言模型生成文本检测。实验结果显示,EBF Detection不仅在域内数据上平均的检测准确率达到了98.72%,而且在域外数据上的平均检测准确率达到了96.79%。 展开更多
关键词 语言模型 语言模型生成文本检测 集成学习 语言特征
下载PDF
王家卫电影文本语言风格探析
4
作者 颜胤盛 黄思洋 《湖南工业大学学报(社会科学版)》 2024年第5期90-97,共8页
王家卫电影的文本语言独树一帜,尤其注重表现主人公的情感流向,在诗意化叙事场景中具有独特的地位。其运用抽象的文字符号进行表意,使得数字与时空、意象与记忆、独白与情感产生互联;运用错位的技法进行编码,使得文本语言与外部声响、... 王家卫电影的文本语言独树一帜,尤其注重表现主人公的情感流向,在诗意化叙事场景中具有独特的地位。其运用抽象的文字符号进行表意,使得数字与时空、意象与记忆、独白与情感产生互联;运用错位的技法进行编码,使得文本语言与外部声响、人物行为和镜头场景之间呈现出矛盾的表意结构,在冲突中增强了情感表现;运用诗性语言解蔽真善美,使得文本语言中潜在的“情景合一”“理性超脱”“把握此在”内涵在叙事空间中得以充分显现,带给观众丰赡的人生启示。 展开更多
关键词 王家卫电影 文本语言 文字符号 语言结构 文本内涵
下载PDF
高中语文文言文教学中文本语言解读探究
5
作者 黎霞 《名师在线(中英文)》 2024年第30期79-81,共3页
文言文教学一直是高中语文教学的重点。然而,教师在文言文文本语言解读教学方面还存在一些问题,如逐字逐句翻译、强行套用语法、缺乏文本语言风格赏析等。针对这些问题,作者认为文言文教学和考试不应拘泥于非典型词语的理解与考查,而更... 文言文教学一直是高中语文教学的重点。然而,教师在文言文文本语言解读教学方面还存在一些问题,如逐字逐句翻译、强行套用语法、缺乏文本语言风格赏析等。针对这些问题,作者认为文言文教学和考试不应拘泥于非典型词语的理解与考查,而更应注重典型词义语法的探究,教师要锻炼学生根据字形和文本语言环境准确把握词语语义的能力,并通过对比赏析让学生感知不同文言文文本的语言风格。 展开更多
关键词 高中语文 文言文教学 文本语言
下载PDF
简论基于语言和文本对比的翻译忠实观
6
作者 黄振定 《外国语文研究》 2015年第1期72-77,共6页
翻译忠实观在中西方至今大体经历了两个阶段:"基于语言和文本对比的忠实观"与"着重文化和人的要素的忠实观"。在第一个阶段,虽然中西方译论史各自的理论特点和历史演变有所不同,不过它们的忠实原则有着共同的基础:... 翻译忠实观在中西方至今大体经历了两个阶段:"基于语言和文本对比的忠实观"与"着重文化和人的要素的忠实观"。在第一个阶段,虽然中西方译论史各自的理论特点和历史演变有所不同,不过它们的忠实原则有着共同的基础:原文和译文之间语言和文本各层面的异同分析对比,这构成它们忠实原则的出发点和归宿;其中当然不可避免地会涉及第二个阶段"着重文化和人的要素的忠实观"的萌发和迭现。 展开更多
关键词 中国译论史 西方译论史 翻译忠实观 语言文本对比
下载PDF
一种检测多语言文本相似重复记录的综合方法 被引量:26
7
作者 俞荣华 田增平 周傲英 《计算机科学》 CSCD 北大核心 2002年第1期118-121,共4页
1.前言随着信息技术的广泛应用,如何有效利用不断激增的数据成为企业的迫切问题.数据仓库和数据挖掘技术为企业从浩瀚的数据海洋中获取有用的知识提供了一种有效的手段.然而,现实世界中的数据往往存在着大量的质量问题,从简单的数据输... 1.前言随着信息技术的广泛应用,如何有效利用不断激增的数据成为企业的迫切问题.数据仓库和数据挖掘技术为企业从浩瀚的数据海洋中获取有用的知识提供了一种有效的手段.然而,现实世界中的数据往往存在着大量的质量问题,从简单的数据输入错误到相对较复杂的数据间的语义不一致性.如果数据的质量达不到要求,那么数据挖掘这类技术产生的结果也不会理想,甚至产生错误的分析结果,从而误导决策.可见提高数据质量的重要性. 展开更多
关键词 数据仓库 数据挖掘 数据库 信息重复 语言文本相似重复记录方法 检测
下载PDF
面向中朝跨语言文本分类的双语主题词嵌入模型的研究 被引量:5
8
作者 王琪 田明杰 +1 位作者 崔荣一 赵亚慧 《中文信息学报》 CSCD 北大核心 2020年第12期39-47,共9页
针对日渐丰富的少数民族语言资源进行管理、研究和使用有着重要的应用价值。为了解决语言差异引起的语言鸿沟,针对中朝两种语言环境下的跨语言文本分类任务,提出了双语主题词嵌入模型。该文将词嵌入模型与主题模型扩展到双语环境,并将... 针对日渐丰富的少数民族语言资源进行管理、研究和使用有着重要的应用价值。为了解决语言差异引起的语言鸿沟,针对中朝两种语言环境下的跨语言文本分类任务,提出了双语主题词嵌入模型。该文将词嵌入模型与主题模型扩展到双语环境,并将两种模型相结合,解决了歧义性对跨语言文本分类精度带来的影响。首先,在大规模单词级别对齐平行句对中训练中朝单词的词嵌入向量;其次,利用主题模型对中朝分类语料进行表示,并获得中朝单词的含有主题信息的词嵌入向量;最后,将中朝单词的主题词嵌入向量输入至文本分类器,进行模型的训练与分类预测。实验结果表明,中朝跨语言文本分类任务的准确率达到了91.76%,已达到实际应用的水平,同时该文提出的模型可以对一词多义单词的多个词义有很好的表示。 展开更多
关键词 语言文本分类 双语词嵌入模型 主题模型 一词多义
下载PDF
基于双语LDA的跨语言文本相似度计算方法研究 被引量:7
9
作者 程蔚 线岩团 +2 位作者 周兰江 余正涛 王红斌 《计算机工程与科学》 CSCD 北大核心 2017年第5期978-983,共6页
基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相... 基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相似度方法计算新语料集双语文档的相似度,使用从类别间和类别内的主题分布离散度的角度改进的主题频率-逆文档频率方法计算特征主题权重。实验表明,改进后的权重计算对于基于双语LDA相似度算法的召回率有较大提高,算法对类别不受限且有较好的可靠性。 展开更多
关键词 双语LDA 语言文本相似度 余弦相似度 主题频率-逆文档频率
下载PDF
跨语言文本分类技术研究进展 被引量:5
10
作者 高影繁 王惠临 徐红姣 《情报理论与实践》 CSSCI 北大核心 2010年第11期126-128,104,共4页
本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求;从关键技术出发,了解该项技术的核心问题及解决方案;从已有研究成果得到的结论揭示了该项技术的发展状况,作为一种重... 本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求;从关键技术出发,了解该项技术的核心问题及解决方案;从已有研究成果得到的结论揭示了该项技术的发展状况,作为一种重要的多语信息组织手段,跨语言文本分类技术发展前景广阔。 展开更多
关键词 语言文本分类 特征提取 算法
下载PDF
基于WordNet的中泰文跨语言文本相似度计算 被引量:12
11
作者 石杰 周兰江 +1 位作者 线岩团 余正涛 《中文信息学报》 CSCD 北大核心 2016年第4期65-70,共6页
文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该... 文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该文提出一种基于WordNet的中泰文跨语言文本相似度的计算方法。首先对中泰文本进行预处理和特征选择,然后利用语义词典WordNet将中泰文本转换成中间层语言,最后在中间层上计算中泰文本的相似度。实验结果表明,该方法准确率达到82%。 展开更多
关键词 WORDNET 中间层语言 语言文本相似度
下载PDF
双语潜在语义对应分析及在跨语言文本分类中的应用研究 被引量:2
12
作者 罗远胜 王明文 +1 位作者 勒中坚 陆旭 《情报学报》 CSSCI 北大核心 2013年第1期86-96,共11页
双语文本对应分析在处理多语言文本数据、克服语言障碍等方面有着重要的作用,基于语料库技术的跨语言潜在语义索引方法没有充分考虑双语的语义相关性。本文将双语平行文档看作同一语义内容的两种语言表达,运用偏最小二乘方法构建双语... 双语文本对应分析在处理多语言文本数据、克服语言障碍等方面有着重要的作用,基于语料库技术的跨语言潜在语义索引方法没有充分考虑双语的语义相关性。本文将双语平行文档看作同一语义内容的两种语言表达,运用偏最小二乘方法构建双语文本的语义相关性,为每种语言建立单独的潜在语义空间,并在这两个空间上实现跨语言的分类任务。在香港政府网中英双语新闻的实验结果显示,本文方法构造的双语潜在语义空间上完成的跨语言和单语言文本分类性能接近或优于原始特征空间的单语言分类,并具有良好的稳健性。 展开更多
关键词 双语文本对应分析 双语潜在语义空间 偏最小二乘 语言文本分类
下载PDF
面向跨语言文本分类与标签推荐的带标签双语主题模型的研究 被引量:4
13
作者 田明杰 崔荣一 《计算机应用研究》 CSCD 北大核心 2019年第10期2911-2915,共5页
针对日渐丰富的跨语言的文字信息资源与新闻报道及科技文献中的多标签数据,为了挖掘跨语言间的相关性及数据属性间的关联性,提出了带标签双语主题模型,应用于跨语言文本分类与标签的推荐。首先,假设科技文献中的关键词与摘要部分有着内... 针对日渐丰富的跨语言的文字信息资源与新闻报道及科技文献中的多标签数据,为了挖掘跨语言间的相关性及数据属性间的关联性,提出了带标签双语主题模型,应用于跨语言文本分类与标签的推荐。首先,假设科技文献中的关键词与摘要部分有着内容上的相关性,对关键词进行提取,并进行标签化,进而把标签对应于主题模型中的主题,实例化“潜在”的主题;其次,利用带标签双语主题模型对摘要部分进行了训练迭代;最后,对新加入的文档进行跨语言文本分类及标签的推荐。实验结果表明,跨语言文本分类任务中micro-F1达到94.81%,推荐的标签也能较好地体现出语义上的相关性。 展开更多
关键词 主题模型 标签 语言文本分类 标签推荐 潜在主题
下载PDF
基于统计词典和特征加强的多语言文本分类 被引量:3
14
作者 龚静 李英杰 黄欣阳 《西南师范大学学报(自然科学版)》 CAS 北大核心 2018年第9期45-50,共6页
在统计双语词典的基础上,提出一种特征加强的多语言文本分类方法.在执行文本分类时,考虑到其他语言的训练文本,使得多种语言的文本集合中均存在训练文本,放松了MLTC的要求.特征加强是一种交叉检查过程,即获取两种语言所有特征的卡方统计... 在统计双语词典的基础上,提出一种特征加强的多语言文本分类方法.在执行文本分类时,考虑到其他语言的训练文本,使得多种语言的文本集合中均存在训练文本,放松了MLTC的要求.特征加强是一种交叉检查过程,即获取两种语言所有特征的卡方统计后,通过语言中相关特征的辨识力,再次对语言的特征辨识力进行评估,以提高分类的可信度.实验选择汉语或英语作为目标语言.实验结果表明:提出的方法具有更高的分类精度,且对训练集规格的敏感度更低. 展开更多
关键词 语言文本分类 双语词典 特征加强 交叉检查 敏感度
下载PDF
预训练模型下融合注意力机制的多语言文本情感分析方法 被引量:4
15
作者 胡德敏 褚成伟 +1 位作者 胡晨 胡钰媛 《小型微型计算机系统》 CSCD 北大核心 2020年第2期278-284,共7页
多语言文本的情感分析是情感分析领域的重要问题之一,而现有的情感分析方法着重于对单语言文本的研究.本文针对中英混合文本提出了一种细粒度情感分析模型,通过基于大规模语料的预训练语言模型得到上下文语义相关的词向量,将词向量输入... 多语言文本的情感分析是情感分析领域的重要问题之一,而现有的情感分析方法着重于对单语言文本的研究.本文针对中英混合文本提出了一种细粒度情感分析模型,通过基于大规模语料的预训练语言模型得到上下文语义相关的词向量,将词向量输入双向LSTM网络学习文本的情感表征,使用多语言注意力机制分别针对单语和双语文本提取关键情感表征,最终通过并行融合的方式提升情感分类效果.本文使用NLPCC2018多语言文本情绪分析任务数据集进行细粒度情感分析,对比评测任务中的最好结果,本文模型得到的宏平均F1值提高至0. 581,表明了本文方法的有效性. 展开更多
关键词 情感分析 语言文本 预训练 注意力机制
下载PDF
自然语言文本语义接受度的在线系统评价研究 被引量:1
16
作者 杜家利 于屏方 《计算机工程与应用》 CSCD 北大核心 2008年第26期141-143,157,共4页
语义接受度(SAS)是衡量自然语言文本可理解程度的标尺。通过结合自动文摘系统评价方法和文体学分析方法,提出了可用于在线分析英语文学文本SAS的系统评价公式,并通过诺贝尔文学获奖作品《老人与海》的语料分析验证了公式的可适用性:不... 语义接受度(SAS)是衡量自然语言文本可理解程度的标尺。通过结合自动文摘系统评价方法和文体学分析方法,提出了可用于在线分析英语文学文本SAS的系统评价公式,并通过诺贝尔文学获奖作品《老人与海》的语料分析验证了公式的可适用性:不同的抽取率不会引起评价值的显著差异。尽管存在域的有限性、域的单一性和在线评价相对性等不足,此公式为文学评论者借助网络进行英语文本SAS在线评价提供了便利。 展开更多
关键词 自然语言文本 语义接受度 系统评价 自动文摘系统 文体
下载PDF
复杂产品协同设计流程的多视图自然语言文本生成 被引量:4
17
作者 周长红 原桂远 +1 位作者 曾庆田 段华 《计算机集成制造系统》 EI CSCD 北大核心 2018年第7期1838-1849,共12页
为了业务人员更好地理解复杂产品设计过程的业务流程建模标注(BPMN)模型,以便与系统分析人员进行有效沟通,提出一种基于BPMN模型的复杂产品设计过程多视图自然语言文本生成方法。该方法能够根据业务人员的不同需求对流程模型进行结构投... 为了业务人员更好地理解复杂产品设计过程的业务流程建模标注(BPMN)模型,以便与系统分析人员进行有效沟通,提出一种基于BPMN模型的复杂产品设计过程多视图自然语言文本生成方法。该方法能够根据业务人员的不同需求对流程模型进行结构投影,进而使用句法分析和语义角色标注解析BPMN流程模型的文本信息,并使用流程结构树(RPST)算法解析BPMN流程模型的结构,从而将流程模型划分成具有层次的子流程片断得到流程结构树。解析的文本信息与不同视图下的流程结构树合并,形成带注释的多视图流程结构树,然后使用语法树由带注释的流程结构树自动生成自然语言文本,最终生成多视图下的自然语言文本。所提方法已在系统中实现,并通过测试集进行实验验证了所提方法的有效性。 展开更多
关键词 协同设计 业务流程建模标注 多视图 自然语言文本生成
下载PDF
语言转译:从文本语言到教学语言 被引量:2
18
作者 欧阳芬 郭龙飞 《语文建设》 北大核心 2017年第8期18-21,共4页
语言渗透在人类生活、工作、学习的各个领域,是人类进行沟通交流和文化传承的重要手段。自然,教育也离不开语言。许多优秀的中小学语文教师之所以能够吸引学生,主要是因为他们通过教学语言的使用,激发学生学习语文的兴趣,使学生充... 语言渗透在人类生活、工作、学习的各个领域,是人类进行沟通交流和文化传承的重要手段。自然,教育也离不开语言。许多优秀的中小学语文教师之所以能够吸引学生,主要是因为他们通过教学语言的使用,激发学生学习语文的兴趣,使学生充分感受语文的魅力。 展开更多
关键词 教学语言 文本语言 转译 语文教师 人类生活 语言渗透 文化传承 沟通交流
下载PDF
文本语言的多媒体化:路径选择、实践模式和技术支撑——关于研制思想政治理论课多媒体课件的思考 被引量:7
19
作者 李梁 《思想理论教育》 CSSCI 2008年第3期55-59,共5页
研制思想政治理论课多媒体课件的基本思路是文本语言的多媒体化,其基本路径有:透视思想、理论,聚焦时事、新闻,链接方针、政策,见证历史、现实,创设情境、氛围,示范态度、行为等六个方面。实践模式有四种:课件作为教学内容的辅助,课件... 研制思想政治理论课多媒体课件的基本思路是文本语言的多媒体化,其基本路径有:透视思想、理论,聚焦时事、新闻,链接方针、政策,见证历史、现实,创设情境、氛围,示范态度、行为等六个方面。实践模式有四种:课件作为教学内容的辅助,课件作为教学内容和手段的有机组成部分,课件和教学内容的有效整合,通过课件配置课堂教学过程设计的结构。从课程特性和教师的特点来看,用PowerPoint软件来制作多媒体课件比较合适,可以为文本语言多媒体化提供强有力的技术支撑。 展开更多
关键词 思想政治理论课 多媒体课件 文本语言多媒体化
下载PDF
旅游景区语言文本建设现状的调查及思考 被引量:4
20
作者 章彩云 《信阳师范学院学报(哲学社会科学版)》 2010年第2期106-110,共5页
目前我国很多景区普遍忽视语言文本建设,导致旅游景区语言文本不正确、不规范、不标准等诸多缺憾。抽样调查结果显示,不规范文本分为"不规范标识文本"和"不规范述介文本"两类。两类出错的根本原因在于语言建设中文... 目前我国很多景区普遍忽视语言文本建设,导致旅游景区语言文本不正确、不规范、不标准等诸多缺憾。抽样调查结果显示,不规范文本分为"不规范标识文本"和"不规范述介文本"两类。两类出错的根本原因在于语言建设中文化因素的干扰,因此基于文化差异的景区文本标准化建设应是解决问题的基础性途径。 展开更多
关键词 旅游景区 语言文本 调查 思考
下载PDF
上一页 1 2 83 下一页 到第
使用帮助 返回顶部