期刊文献+
共找到180篇文章
< 1 2 9 >
每页显示 20 50 100
Language clustering with word co-occurrence networks based on parallel texts 被引量:6
1
作者 LIU HaiTao CONG Jin 《Chinese Science Bulletin》 SCIE EI CAS 2013年第10期1139-1144,共6页
This study investigates the feasibility of applying complex networks to fine-grained language classification and of employing word co-occurrence networks based on parallel texts as a substitute for syntactic dependenc... This study investigates the feasibility of applying complex networks to fine-grained language classification and of employing word co-occurrence networks based on parallel texts as a substitute for syntactic dependency networks in complex-network-based language classification.14 word co-occurrence networks were constructed based on parallel texts of 12 Slavic languages and 2 non-Slavic languages,respectively.With appropriate combinations of major parameters of these networks,cluster analysis was able to distinguish the Slavic languages from the non-Slavic and correctly group the Slavic languages into their respective sub-branches.Moreover,the clustering could also capture the genetic relationships of some of these Slavic languages within their sub-branches.The results have shown that word co-occurrence networks based on parallel texts are applicable to fine-grained language classification and they constitute a more convenient substitute for syntactic dependency networks in complex-network-based language classification. 展开更多
关键词 网络构建 文本聚类 语言 平行 共生 聚类分析 遗传关系 复杂网络
原文传递
集约投资行为与排比文本建构
2
作者 吴礼权 《阜阳师范大学学报(社会科学版)》 2024年第2期36-43,共8页
在生产性经营与商业性经营活动中,都广泛存在着一种集约投资行为,它可以极大地提升生产性经营或商业性经营的经济效益。在语言活动中,也有类似于经济活动中的集约化投资行为,如以排比修辞手法建构排比文本,从经济学的视角看,虽然有超量... 在生产性经营与商业性经营活动中,都广泛存在着一种集约投资行为,它可以极大地提升生产性经营或商业性经营的经济效益。在语言活动中,也有类似于经济活动中的集约化投资行为,如以排比修辞手法建构排比文本,从经济学的视角看,虽然有超量配置语言资源之嫌,似乎不符合“成本最小化”的经济原则,但就终极修辞效果来看,则符合“收益最大化”的经济原则。因为排比文本的建构,从接受效果上看,既实现了表意功能的最大化,又在表意功能之外别添了审美价值,可谓实现了“增殖效益”与“成本效益”最大化的完美统一。 展开更多
关键词 集约投资 排比文本 资源配置 成本效益 增殖效益
下载PDF
生态翻译学视域下《红高粱家族》方言汉语文本和英译解构
3
作者 孙润 李新 《连云港职业技术学院学报》 2024年第1期38-43,共6页
依靠生态翻译学理论,基于英汉双语平行语料,研究《红高粱家族》方言中的粗话、俗语与谚语的汉语文本特征与英译策略。研究发现,俗语和谚语文本数量远大于粗话文本数量,说明原文具有浓厚的地域文化。译文与原文保持生态平衡的文本数量比... 依靠生态翻译学理论,基于英汉双语平行语料,研究《红高粱家族》方言中的粗话、俗语与谚语的汉语文本特征与英译策略。研究发现,俗语和谚语文本数量远大于粗话文本数量,说明原文具有浓厚的地域文化。译文与原文保持生态平衡的文本数量比重较高,表明译文大多情况忠实于原文。译者在文化维度成功转换表现最好,而语言维度的成功转换表现最差。如果原文和译文保持生态平衡,三个维度需要全部保留。当原文和译文生态不平衡,三个维度全部转换失败的比例最高。就翻译策略而言,综合法使用的频率最高。 展开更多
关键词 《红高粱家族》 方言 英汉平行语料 生态翻译学
下载PDF
基于SimCSE框架融合预训练模型层级特征的文本匹配
4
作者 盛成城 陈进东 张健 《计算机系统应用》 2024年第7期103-111,共9页
SimCSE框架仅使用分类令牌[CLS]token作为文本向量,同时忽略基座模型内层级信息,导致对基座模型输出语义特征提取不充分.本文基于SimCSE框架提出一种融合预训练模型层级特征方法SimCSE-HFF(SimCSE with hierarchical feature fusion,Sim... SimCSE框架仅使用分类令牌[CLS]token作为文本向量,同时忽略基座模型内层级信息,导致对基座模型输出语义特征提取不充分.本文基于SimCSE框架提出一种融合预训练模型层级特征方法SimCSE-HFF(SimCSE with hierarchical feature fusion,SimCSE-HFF).SimCSE-HFF基于双路并行网络,使用短路径和长路径强化特征学习,短路径使用卷积神经网络学习文本局部特征并进行降维,长路径使用双向门控循环神经网络学习深度语义信息,同时在长路径中利用自编码器融合基座模型内部其他层特征,解决模型对输出特征提取不充分的问题.在STS-B的中文与英文数据集上,SimCSE-HFF方法效果在语义相似度Spearman和Pearson相关性指标上优于传统方法,在不同预训练模型上均得到提升;在下游任务检索问答上也优于SimCSE框架,具有更优秀的通用性. 展开更多
关键词 文本匹配 SimCSE 特征融合 自编码器 并行网络
下载PDF
Feature Selection Method by Applying Parallel Collaborative Evolutionary Genetic Algorithm 被引量:1
5
作者 Hao-Dong Zhu Hong-Chan Li +1 位作者 Xiang-Hui Zhao Yong Zhong 《Journal of Electronic Science and Technology》 CAS 2010年第2期108-113,共6页
Feature selection is one of the important topics in text classification. However, most of existing feature selection methods are serial and inefficient to be applied to massive text data sets. In this case, a feature ... Feature selection is one of the important topics in text classification. However, most of existing feature selection methods are serial and inefficient to be applied to massive text data sets. In this case, a feature selection method based on parallel collaborative evolutionary genetic algorithm is presented. The presented method uses genetic algorithm to select feature subsets and takes advantage of parallel collaborative evolution to enhance time efficiency, so it can quickly acquire the feature subsets which are more representative. The experimental results show that, for accuracy ratio and recall ratio, the presented method is better than information gain, x2 statistics, and mutual information methods; the consumed time of the presented method with only one CPU is inferior to that of these three methods, but the presented method is supe rior after using the parallel strategy. 展开更多
关键词 Index Terms-Feature selection genetic algorithm parallel collaborative evolutionary text mining.
下载PDF
用典与骈文的文本形态
6
作者 李金松 《文艺理论研究》 北大核心 2023年第2期56-65,共10页
骈文文本的建构,很大程度上取决于用典。骈文用典通过对前文本的剪裁、拼贴,不仅参与新文本的营构,而且还进行意义的生产,从而使骈文文本呈现出互文性样态。在某种意义上,骈文文本是被改写过的不同的前文本片段的聚合,是前文本片段、骈... 骈文文本的建构,很大程度上取决于用典。骈文用典通过对前文本的剪裁、拼贴,不仅参与新文本的营构,而且还进行意义的生产,从而使骈文文本呈现出互文性样态。在某种意义上,骈文文本是被改写过的不同的前文本片段的聚合,是前文本片段、骈文创构者、读者交互对话而产生新的文学空间。由于用典对前文本片段进行了解构与重构,这使骈文文本中典面与典义在意义上存在不同程度的差异,从而衍生了文本张力。而这种文本张力,也会因文本中用典文句与不用典文句思维形式的差异而呈现出来。因此,对偶、声律、藻饰这三大修辞手段不过构建了骈文文本外在的形式特征,而用典则营构了骈文文本内在的形式特征及其文本形态。 展开更多
关键词 互文 用典 文本 骈文 张力
下载PDF
基于平行文本比较模式的准技术词汇翻译探讨
7
作者 吉晓霞 《金陵科技学院学报(社会科学版)》 2023年第3期48-53,共6页
科技文本的英语词汇分为普通词汇、专业词汇和准技术词汇三类,其中,准技术词汇是各学科通用的基本词汇,也是高频跨学科词汇,在相应语篇中具有特定意义。在科技文献翻译中,准技术词汇常常成为翻译的难点,利用平行文本则可以以新的视角来... 科技文本的英语词汇分为普通词汇、专业词汇和准技术词汇三类,其中,准技术词汇是各学科通用的基本词汇,也是高频跨学科词汇,在相应语篇中具有特定意义。在科技文献翻译中,准技术词汇常常成为翻译的难点,利用平行文本则可以以新的视角来解决准技术词汇翻译的症结。结合具体实例,利用平行文本的翻译原则与方法对准技术词汇进行释义,从而达到既能准确地传递原文信息又能在尽量保持原文风格的同时生动表达的目的,帮助译者更好地完成翻译工作。 展开更多
关键词 平行文本 原始文本 准技术词汇 一词多义
下载PDF
融合流注意力机制的中文摘要生成方法
8
作者 崔少国 王奥迪 杜兴 《小型微型计算机系统》 CSCD 北大核心 2023年第12期2685-2691,共7页
针对现有文本摘要生成方法对源文全局语义信息提取不充分问题,提出了一种融合流注意力机制的并行编码器摘要生成算法模型.首先使用单颗粒的分词方法对源文进行分词;然后在编码阶段引入多头流注意力机制,从而更全面地提取源文的全局语义... 针对现有文本摘要生成方法对源文全局语义信息提取不充分问题,提出了一种融合流注意力机制的并行编码器摘要生成算法模型.首先使用单颗粒的分词方法对源文进行分词;然后在编码阶段引入多头流注意力机制,从而更全面地提取源文的全局语义信息;其次运用并行编码器训练模型,使得输入序列中语义信息获得更大权重;最后将编码得到的全局语义信息送入到融合指针的解码器中,通过指针复制源文词汇,减少生成摘要中未登录词的出现,从而使得解码过程中生成的摘要更加全面准确地匹配源文语义.模型在CLTS和NLPCC两个数据集上进行实验,使用ROUGE-1、ROUGE-2和ROUGE-L作为评价指标.实验结果显示,与基准模型相比在CLTS数据集上分别有2.62%、1.44%和0.87%的提升,在NLPCC数据集上分别有2.82%、1.84%和1.64%的提升,表明所提算法模型在中文摘要生成任务上更加有效. 展开更多
关键词 中文文本 摘要生成 流注意力机制 并行编码器 指针网络
下载PDF
宋四六代言书写的互动性:基于文本生成过程的考察
9
作者 戴路 《中国文学研究》 北大核心 2023年第3期73-81,共9页
宋四六的代言书写是指宋代文人为皇帝、宰执、地方官等代撰制、诰、表、启等应用性文章,其互动性贯穿于文本生成的四个阶段。在意图融合阶段,言意的二元结构集中体现为代言之笔与他人之意的关系,宋人通过日常的沟通协商,既塑造适合人际... 宋四六的代言书写是指宋代文人为皇帝、宰执、地方官等代撰制、诰、表、启等应用性文章,其互动性贯穿于文本生成的四个阶段。在意图融合阶段,言意的二元结构集中体现为代言之笔与他人之意的关系,宋人通过日常的沟通协商,既塑造适合人际交往的“公意”,又妥善阐发蕴含作者喜怒爱憎的“私意”。在文章构思阶段,即时性的骈语问答体现出以群体智慧弥补个人才思困境的努力,让敏捷成为有径可循的境界。在文本修改阶段,代言者与立言者以稿本为物质载体,以点窜四字散语和剪裁四六隔对为主要形式,在相互商榷中优化表达效果。在篇章结撰阶段,多个代言者以同题共撰和旧题重撰的方式实现段落的拼合与改写,呈现出竞争与合作并存的关系。 展开更多
关键词 宋四六 代言书写 互动性 文本生成
下载PDF
基于Spark的大规模文本k-means并行聚类算法 被引量:14
10
作者 刘鹏 滕家雨 +1 位作者 丁恩杰 孟磊 《中文信息学报》 CSCD 北大核心 2017年第4期145-153,共9页
互联网文本数据量的激增使得对其作聚类运算的处理时间显著加长,虽有研究者利用Hadoop架构进行了k-means并行化研究,但由于很难有效满足k-means需要频繁迭代的特点,因此执行效率仍然不能让人满意。该文研究提出了基于新一代并行计算系统... 互联网文本数据量的激增使得对其作聚类运算的处理时间显著加长,虽有研究者利用Hadoop架构进行了k-means并行化研究,但由于很难有效满足k-means需要频繁迭代的特点,因此执行效率仍然不能让人满意。该文研究提出了基于新一代并行计算系统Spark的k-means文本聚类并行化算法,利用RDD编程模型充分满足了kmeans频繁迭代运算的需求。实验结果表明,针对同一聚类文本大数据集和同样的计算环境,基于Spark的kmeans文本聚类并行算法在加速比、扩展性等主要性能指标上明显优于基于Hadoop的实现,因此能更好地满足大规模文本数据挖掘算法的需求。 展开更多
关键词 K-MEANS 并行化 文本聚类 SPARK RDD Hadoop MAPREDUCE
下载PDF
一种高速精确单模式串匹配算法 被引量:14
11
作者 范洪博 姚念民 《计算机研究与发展》 EI CSCD 北大核心 2009年第8期1341-1348,共8页
串匹配问题是计算机科学的基础问题之一,是网络安全、信息检索与过滤、计算生物学等众多领域的核心问题,其中,高速精确单模式匹配算法设计又是各种串匹配问题的基础.基于SBNDM2,通过修改位掩码有效位到无符号整数的高位,将BNDM算法核心... 串匹配问题是计算机科学的基础问题之一,是网络安全、信息检索与过滤、计算生物学等众多领域的核心问题,其中,高速精确单模式匹配算法设计又是各种串匹配问题的基础.基于SBNDM2,通过修改位掩码有效位到无符号整数的高位,将BNDM算法核心循环化简至最简形式(5指令/字符),并引入越界保护机制,提出S2BNDM系列精确单模式匹配算法.实验结果显示,S2BNDM系列算法在任何情况下都快于SBNDM2,对于英文语料(m<32)和DNA序列(m<8),S2BNDM系列算法为现有已知最快算法. 展开更多
关键词 串匹配 精确单模式 算法设计 位并行 文本搜索
下载PDF
一种K-means改进算法的并行化实现与应用 被引量:49
12
作者 李晓瑜 俞丽颖 +1 位作者 雷航 唐雪飞 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因... 随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。 展开更多
关键词 canopy算法 HADOOP MAPREDUCE 并行K—means 文本聚类
下载PDF
基于Hadoop平台的海量文本分类的并行化 被引量:35
13
作者 向小军 高阳 +1 位作者 商琳 杨育彬 《计算机科学》 CSCD 北大核心 2011年第10期184-188,共5页
文本分类是信息检索与数据挖掘的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。近来年随着文本数据呈指数增长,要有效地管理这些数据,就必须在分布式环境下用有效的算法来处理这些数据。在Ha-doop分布式平台下实现了一简单... 文本分类是信息检索与数据挖掘的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。近来年随着文本数据呈指数增长,要有效地管理这些数据,就必须在分布式环境下用有效的算法来处理这些数据。在Ha-doop分布式平台下实现了一简单有效的文本分类算法——TFIDF分类算法,即一种基于向量空间模型的分类算法,它用余弦相似度得到分类结果。在两个数据集上做了实验,结果表明,这一并行化算法在大数据集上很有效并可以在实际领域中得到良好的应用。 展开更多
关键词 文本分类 并行化 海量数据 HADOOP
下载PDF
数字图书馆中文本信息检索技术的研究与实现 被引量:3
14
作者 阚忠良 李建中 杨艳 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第7期1007-1010,共4页
介绍了一个并行数字图书馆原型系统PDL,和用于该系统的针对文本信息检索的一些数据结构,包括倒排索引,结构索引,RANK索引和词典等,并在此结构的基础上设计实现了基于内容和结构的查询算法.这些算法以计算机机群并行环境为基础.实验表明... 介绍了一个并行数字图书馆原型系统PDL,和用于该系统的针对文本信息检索的一些数据结构,包括倒排索引,结构索引,RANK索引和词典等,并在此结构的基础上设计实现了基于内容和结构的查询算法.这些算法以计算机机群并行环境为基础.实验表明并行数据查询具有良好的性能. 展开更多
关键词 元数据模式 倒排索引 并行文本处理 基于内容和结构查询
下载PDF
高校英文网页的翻译失误探析——以福建重点本科院校为例 被引量:14
15
作者 陈隽 黄玉虹 《福建农林大学学报(哲学社会科学版)》 2012年第6期109-112,共4页
翻译失误是影响高校网页外宣效果的因素之一。以目的论为指导,以主流英语国家4所高校的"学校概况"作为平行文本,分析福建7所重点本科院校英文网页"学校概况"的翻译失误,归纳其中存在的语用性、文化性和语言性等3种... 翻译失误是影响高校网页外宣效果的因素之一。以目的论为指导,以主流英语国家4所高校的"学校概况"作为平行文本,分析福建7所重点本科院校英文网页"学校概况"的翻译失误,归纳其中存在的语用性、文化性和语言性等3种类型的翻译失误,指出译者在翻译高校"学校概况"时应积极查阅平行文本,采用符合国外受众阅读习惯的表达方式,避免翻译失误,以取得高校对外宣传的正效益。 展开更多
关键词 学校概况 平行文本 翻译失误 翻译纲要
下载PDF
福建重点高校“学校概况”的语用性翻译失误探析 被引量:8
16
作者 陈隽 黄玉虹 《重庆邮电大学学报(社会科学版)》 2013年第1期124-128,共5页
随着对外交流的进一步拓展,如今国内大多数高校普遍采取双语的方式建设网站。高校英文网页的"学校概况"部分是高校信息展示的门户,更是体现学校实力,吸引海外学者,从而达到合作办学目的的重要媒介。翻译失误的多少是评价翻译... 随着对外交流的进一步拓展,如今国内大多数高校普遍采取双语的方式建设网站。高校英文网页的"学校概况"部分是高校信息展示的门户,更是体现学校实力,吸引海外学者,从而达到合作办学目的的重要媒介。翻译失误的多少是评价翻译质量的重要参数,也是影响高校网页外宣效果的因素之一。高校英文网页中存在的翻译失误必然影响译文预期功能的实现,进而损害学校的形象。以功能翻译论中的"翻译失误"理论作为指导,探讨福建省重点本科高校网页"学校概况"英译的"翻译纲要",参照平行文本,分析其中存在的三种语用性翻译失误,并提出了针对性的译文改进意见,以期达到提高福建各重点高校办学知名度的目的。 展开更多
关键词 “学校概况”英译 平行文本 语用性翻译失误 翻译纲要
下载PDF
GPU平台上大规模文本分类的研究 被引量:2
17
作者 刘勇 王志亮 黄玉龙 《计算机工程与应用》 CSCD 2012年第8期141-143,206,共4页
为满足大规模文本快速分类的需求,在传统文本分类方案基础上,利用GPU强大的并行吞吐量,提出了一种大规模并行文本分类方案。为验证该方案的有效性,在多个平台上进行充分的实验分析。结果表明,该方案比传统的分类方案具有10倍以上的加速比。
关键词 图形处理器 统一计算设备架构 朴素贝叶斯 并行文本分类
下载PDF
平行文本在非文学翻译中的应用 被引量:10
18
作者 周学恒 邓晓明 《河北北方学院学报(社会科学版)》 2011年第4期42-46,50,共6页
通过考察平行文本概念及其相关性,在探讨平行文本与翻译实践关系的基础上,佐以具体的非文学翻译实例,提出在非文学翻译实践中平行文本的应用一定程度上能够弥补译者专业知识的缺乏,能够有效地改善译文的表达与文体风格,能够显性地提高... 通过考察平行文本概念及其相关性,在探讨平行文本与翻译实践关系的基础上,佐以具体的非文学翻译实例,提出在非文学翻译实践中平行文本的应用一定程度上能够弥补译者专业知识的缺乏,能够有效地改善译文的表达与文体风格,能够显性地提高译文质量。 展开更多
关键词 平行文本 非文学翻译 专业知识 文体风格
下载PDF
排比的篇章特点 被引量:13
19
作者 李胜梅 《南昌大学学报(人文社会科学版)》 北大核心 2005年第5期121-127,共7页
排比各项所构成的一个整体可称为“排比块”,这样的言语板块是语篇中特别醒目的言语片段。处于散句中的排比块是说写者表达用力、表义突出、用情最深的部分,也是听读者感受特别鲜明之处。排比块与上下文有其联系类型、造句功能、谋篇功... 排比各项所构成的一个整体可称为“排比块”,这样的言语板块是语篇中特别醒目的言语片段。处于散句中的排比块是说写者表达用力、表义突出、用情最深的部分,也是听读者感受特别鲜明之处。排比块与上下文有其联系类型、造句功能、谋篇功能、语篇位置、连用情况、表义传情效果等。将排比作为一个整体放在语篇中来考察的思路和视角使我们对排比获得了更为全面、更富有新意的认识。 展开更多
关键词 排比 排比块 排比项 语篇 上下文 造句功能 谋篇功能
下载PDF
从“目的论”看“平行文本”分析在应用翻译中的作用 被引量:12
20
作者 范勇 《阅江学刊》 2009年第4期138-142,共5页
"平行文本"指不同语言中话题、体裁和功能相同或相近的本土文本。在德国功能主义翻译理论(翻译目的论)的框架内,系统探讨"平行文本"分析在应用翻译,特别是汉英应用翻译中的作用,并列举例证分别阐述在翻译过程、译... "平行文本"指不同语言中话题、体裁和功能相同或相近的本土文本。在德国功能主义翻译理论(翻译目的论)的框架内,系统探讨"平行文本"分析在应用翻译,特别是汉英应用翻译中的作用,并列举例证分别阐述在翻译过程、译文评价和翻译教学/培训中如何有效地利用"平行文本",发挥"平行文本"的参照指导作用,可以使译文实现设定的功能,使译文评价客观而有说服力并且使应用翻译教学卓有成效。 展开更多
关键词 “平行文本” 应用翻译 “目的论” 功能
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部