期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
关于语言资源开发与应用的若干思考——山东省语言资源开发与应用重点实验室建设 被引量:3
1
作者 亢世勇 《人文天下》 2015年第19期8-16,共9页
随着现代信息技术的发展,人们越来越清楚地认识到语言是一种重要的资源,可以对其进行开发、保护和利用。随着语言资源的不断开发及语言产业、语言职业的发展壮大,语言资源以及相关技术也会不断交换,势必形成以语言资源开发与利用为... 随着现代信息技术的发展,人们越来越清楚地认识到语言是一种重要的资源,可以对其进行开发、保护和利用。随着语言资源的不断开发及语言产业、语言职业的发展壮大,语言资源以及相关技术也会不断交换,势必形成以语言资源开发与利用为基础的语言经济。 展开更多
关键词 资源开发 实验室建设 语言 山东省 应用 现代信息技术 利用
下载PDF
同源语料增强的低资源神经机器翻译
2
作者 王琳 刘伍颖 《中文信息学报》 CSCD 北大核心 2024年第2期54-60,共7页
缺少平行句对的低资源机器翻译面临跨语言语义转述科学问题。该文围绕具体的低资源印尼语-汉语机器翻译问题,探索了基于同源语料的数据增广方法,并混合同源语料训练出更优的神经机器翻译模型。这种混合语料模型在印尼语-汉语机器翻译实... 缺少平行句对的低资源机器翻译面临跨语言语义转述科学问题。该文围绕具体的低资源印尼语-汉语机器翻译问题,探索了基于同源语料的数据增广方法,并混合同源语料训练出更优的神经机器翻译模型。这种混合语料模型在印尼语-汉语机器翻译实验中提升了3个多点的BLEU4评分。实验结果证明,同源语料能够有效增强低资源神经机器翻译性能,而这种有效性主要是源于同源语言之间的形态相似性和语义等价性。 展开更多
关键词 同源语料 数据增广 低资源机器翻译 印尼语 马来语
下载PDF
基于复杂网络视角的《现代汉语词典》与《国语辞典》常用动词释义元语言研究 被引量:2
3
作者 徐德宽 何保荣 邱立坤 《外国语文研究》 2016年第2期2-13,共12页
词典释义元语言作为一种特殊语言形式,具有重要的研究价值。本文以HSK汉语水平考试大纲中的动词为母本,选取《现代汉语词典》(第六版)和《国语辞典》(修订版)中共有的608个词条,以其在各自词典中的释义作为语料,构建字同现网络,以复杂... 词典释义元语言作为一种特殊语言形式,具有重要的研究价值。本文以HSK汉语水平考试大纲中的动词为母本,选取《现代汉语词典》(第六版)和《国语辞典》(修订版)中共有的608个词条,以其在各自词典中的释义作为语料,构建字同现网络,以复杂网络的视角对其进行了多方位的研究,解释了其在小世界性、无标度性、居间中心性、层次性和匹配度等方面的特点,揭示了词典释义元语言字同现网络独特的复杂网络性质,拓宽了语言网络研究的领域和范围。 展开更多
关键词 动词 释义元语言 字同现网络 复杂网络
下载PDF
基于词汇迁移的跨语言形态复用
4
作者 刘伍颖 王琳 《中文信息学报》 CSCD 北大核心 2023年第8期18-24,共7页
良好结构化语言资源的稀缺导致一些自然语言处理算法无法在低资源语言上获得更高的性能。据此,针对两种语言之间的形态复用科学问题,该文提出一种形态迁移率评估指标用以评估迁移效果,并验证了形态复用在低资源语言的语言资源建设和语... 良好结构化语言资源的稀缺导致一些自然语言处理算法无法在低资源语言上获得更高的性能。据此,针对两种语言之间的形态复用科学问题,该文提出一种形态迁移率评估指标用以评估迁移效果,并验证了形态复用在低资源语言的语言资源建设和语义转述应用任务中的有效性。在语言资源建设实验中,该文从马来语语料库提取印尼语多词表示,并从印尼语语料库提取马来语多词表示。在语义转述应用实验中,该文通过马来语资源增强的印尼语-汉语平行句库训练出印尼语-汉语神经机器翻译模型,并通过印尼语资源增强的马来语-汉语平行句库训练出马来语-汉语神经机器翻译模型。实验结果证明,由于同语族的形态同源性和相似性,同语族跨语言形态复用具有很强的可迁移性和可计算性。 展开更多
关键词 形态复用 形态迁移率 低资源语言 多词表示提取 神经机器翻译
下载PDF
文本特征和图结点混合增强的图卷积网络文本分类 被引量:1
5
作者 杨晓奇 刘伍颖 《新疆大学学报(自然科学版)(中英文)》 CAS 2024年第1期69-77,109,共10页
在BertGCN模型的基础上改进其结构,同时结合文本特征和图结点混合增强的方法,使用新的边权重计算算法BM25+构造图的边.使用R8、R52、Ohsumed和MR这4个常用的公开数据集来验证所提方法的有效性.结果表明:与BertGCN模型及其它基线模型相比... 在BertGCN模型的基础上改进其结构,同时结合文本特征和图结点混合增强的方法,使用新的边权重计算算法BM25+构造图的边.使用R8、R52、Ohsumed和MR这4个常用的公开数据集来验证所提方法的有效性.结果表明:与BertGCN模型及其它基线模型相比,该方法在4个文本分类数据集上的准确率评价指标均有不同程度的提升. 展开更多
关键词 BM25+ 文本特征增强 图结点增强 预训练模型 图卷积网络 文本分类
下载PDF
汉语复合名词语义信息标注词库:基于生成词库理论 被引量:15
6
作者 宋作艳 赵青青 亢世勇 《中文信息学报》 CSCD 北大核心 2015年第3期27-33,43,共8页
复合名词分析一直是语言研究和自然语言信息处理中的一个重要问题,涉及未登录词的识别、自动释义以及词典编纂等。生成词库理论是目前较新的一种语义学理论,我们拟利用该理论对汉语复合名词进行语义信息标注,建立一个词库。该文首先介... 复合名词分析一直是语言研究和自然语言信息处理中的一个重要问题,涉及未登录词的识别、自动释义以及词典编纂等。生成词库理论是目前较新的一种语义学理论,我们拟利用该理论对汉语复合名词进行语义信息标注,建立一个词库。该文首先介绍了这一词库的标注框架,然后通过对"纸"、"石"构成的复合词的对比分析,展示了这一词库在复合名词构词、语义研究中的应用。研究结果显示,物性角色、自然类和人造类是非常重要的语义信息,能揭示复合名词构词和语义的一些模式和规律。 展开更多
关键词 语义信息标注词库 复合名词 生成词库理论 物性结构 语义类型
下载PDF
基于依存语法构建多视图汉语树库 被引量:10
7
作者 邱立坤 金澎 王厚峰 《中文信息学报》 CSCD 北大核心 2015年第3期9-15,共7页
树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的... 树库是自然语言处理中一项重要的基础资源,现有树库基本上都是单视图树,支持短语结构语法或者依存语法。该文提出一套基于依存语法的多视图汉语树库标注体系,仅需标注中心语和语法角色两类信息,之后可以自动地推导出描述句法结构所需的短语结构功能和层次信息,从而可以在不增加标注工作量的前提下获得更多语法信息。基于该体系,构建了北京大学多视图汉语树库(PMT)1.0版,含有64 000句、140万词,支持短语结构语法和依存语法两个视图。 展开更多
关键词 多视图树库 依存语法 短语结构语法
下载PDF
大陆台湾同义异形词语造词理据分析 被引量:4
8
作者 亢世勇 《中国科技术语》 2015年第5期15-19,共5页
对比分析大陆、台湾同义异形词语,总结出两岸造词理据的差异,表现在七个方面:(1)描述事物特征的角度不同;(2)关注点不同;(3)选择不同的同义语素(词)造词;(4)传统与现代、书面语与口语、方言与普通话的差别;(5)缩略与原形的不同;(6)语序... 对比分析大陆、台湾同义异形词语,总结出两岸造词理据的差异,表现在七个方面:(1)描述事物特征的角度不同;(2)关注点不同;(3)选择不同的同义语素(词)造词;(4)传统与现代、书面语与口语、方言与普通话的差别;(5)缩略与原形的不同;(6)语序颠倒;(7)翻译的差别。两岸造词理据差异范围较广,涉及词语的各个层面。其中,选择不同的同义语素、关注点不同是两岸造词理据差异最大的。 展开更多
关键词 同义异形词语 造词理据 认知心理 文化差异
下载PDF
现代汉语常用动词释义对比研究--以《现代汉语词典》(第六版)和《重編國語辭典修訂本》为例 被引量:1
9
作者 刘珺 徐德宽 +1 位作者 马梦佳 陈淑梅 《中文信息学报》 CSCD 北大核心 2014年第1期94-99,共6页
动词在语言中的地位十分重要,而汉语更是一种动词性语言。了解动词的释义,是研究动词的一个重要途径。该文采用《现代汉语词典》(第六版)和《重編國語辭典修訂本》为对比研究的材料,参考新汉语水平考试大纲,选取三者共有的动词词条进行... 动词在语言中的地位十分重要,而汉语更是一种动词性语言。了解动词的释义,是研究动词的一个重要途径。该文采用《现代汉语词典》(第六版)和《重編國語辭典修訂本》为对比研究的材料,参考新汉语水平考试大纲,选取三者共有的动词词条进行研究,着重对比两本词典对动词的释义,找出普通话和台湾地区所用标准语两者在动词方面的差异,减少两岸交流中因词义不同所产生的误会,更好地促进两岸交流。 展开更多
关键词 常用动词 释义对比 释义差异
下载PDF
基于车牌识别的停车场智能收费系统
10
作者 唐文静 姜琳 马治波 《人工智能与机器人研究》 2022年第2期184-191,共8页
为了缓解传统的人工管理停车场方式带来的停车场的管理成本高、效率低,且停车场出入口拥堵这些现象,本文研究并实现了基于车牌识别的停车场智能收费系统。该系统采用SVM算法实现了对进出车库车辆的车牌自动识别,并将相关车辆信息记入数... 为了缓解传统的人工管理停车场方式带来的停车场的管理成本高、效率低,且停车场出入口拥堵这些现象,本文研究并实现了基于车牌识别的停车场智能收费系统。该系统采用SVM算法实现了对进出车库车辆的车牌自动识别,并将相关车辆信息记入数据库,同时显示当前车库的剩余车位。另外,出库时根据查询数据库中的车牌号确定当前车辆是否为VIP用户,进而确定该车辆出库时需要缴纳的费用。本系统的使用很大程度上会减少停车场管理的成本,提高停车场的使用效率。 展开更多
关键词 车牌识别 停车场 智能收费
下载PDF
“符号三元论”视域下的品牌传播研究——以瑞幸咖啡为例 被引量:3
11
作者 韩鸣晓 刘伍颖 《新闻世界》 2023年第9期37-40,共4页
作为一家主打“快咖啡”的新兴品牌,瑞幸自2017年上市以来,迅速打开了咖啡市场,且其消费市场占比正逐年增加。在这样的背景下,皮尔斯的“符号三元论”再次被人们所关注,其理论与咖啡消费场景相结合为多种消费领域带来启发。瑞幸咖啡的... 作为一家主打“快咖啡”的新兴品牌,瑞幸自2017年上市以来,迅速打开了咖啡市场,且其消费市场占比正逐年增加。在这样的背景下,皮尔斯的“符号三元论”再次被人们所关注,其理论与咖啡消费场景相结合为多种消费领域带来启发。瑞幸咖啡的品牌营销和传播的成功,与其在符号消费视域下的品牌建设和传播策略同样密不可分。因此,本文从皮尔斯的符号学视角出发,以瑞幸咖啡为研究案例,探索其在“快咖啡”消费场景中的符号建构机制和表意规律,以为其他品牌的构建与传播提供借鉴。 展开更多
关键词 品牌传播 皮尔斯 符号三元论 快咖啡 瑞幸咖啡
下载PDF
元宇宙背景下乙女游戏的沉浸式传播研究 被引量:1
12
作者 范怡萱 刘伍颖 《新闻传播》 2023年第21期38-40,44,共4页
乙女游戏是互联网时代游戏行业以女性用户为主要玩家,以攻略游戏角色为主要方式,以玩家获得恋爱体验为主要内容,基于大数据和计算机通信技术开发出的女性向游戏。在元宇宙环境下的乙女游戏中,原本2D的虚拟男主将会转化为3D的虚拟数字人... 乙女游戏是互联网时代游戏行业以女性用户为主要玩家,以攻略游戏角色为主要方式,以玩家获得恋爱体验为主要内容,基于大数据和计算机通信技术开发出的女性向游戏。在元宇宙环境下的乙女游戏中,原本2D的虚拟男主将会转化为3D的虚拟数字人,玩家会以虚拟身份在虚拟空间中与游戏男主展开沉浸式互动,从感官沉浸、场景沉浸、情感沉浸三个维度获得身心的全方位体验。与此同时,这种数字交往也渗透着现实生活,元宇宙中的沉浸式传播也会对玩家的客观世界产生影响。 展开更多
关键词 元宇宙 乙女游戏 沉浸式传播
下载PDF
国际社交媒体中烟台城市形象传播效果研究——以推特账号@DiscoverYantai为例
13
作者 刘伍颖 相征 叶未新 《山东工商学院学报》 2023年第6期43-51,共9页
城市形象是城市软实力的重要组成部分,提升城市传播影响力对于塑造城市形象具有重要意义。本研究以烟台人民政府2021年创立的推特账号@DiscoverYantai为研究对象,通过自然语言处理、LDA主题模型和数据分析等方法,研究了该账号的推文文... 城市形象是城市软实力的重要组成部分,提升城市传播影响力对于塑造城市形象具有重要意义。本研究以烟台人民政府2021年创立的推特账号@DiscoverYantai为研究对象,通过自然语言处理、LDA主题模型和数据分析等方法,研究了该账号的推文文本数据,分析该账号的传播内容和传播效果。研究结果显示,烟台在城市形象传播方面存在潜力未充分发挥、形象塑造不够丰满等问题。基于此,本研究提出了利用国际社交媒体提升烟台城市传播影响力的建议。 展开更多
关键词 社交媒体 城市形象 国际传播 烟台 数据分析
下载PDF
新媒体话语表达的逆回——群体社交退缩现象分析
14
作者 韩鸣晓 刘伍颖 《东南传播》 2023年第9期138-140,共3页
新媒体时代,公众将视野聚焦于社交媒体舆论的效能之上,新媒体的即时性、便捷性、个性化特点使媒体评价呈现出乐观态势,而统一的话术背后却藏匿着鲜为人知的异化,甚至是抵抗行为。基于新媒体生态中营造的“沉默螺旋式”舆论环境,使得用... 新媒体时代,公众将视野聚焦于社交媒体舆论的效能之上,新媒体的即时性、便捷性、个性化特点使媒体评价呈现出乐观态势,而统一的话术背后却藏匿着鲜为人知的异化,甚至是抵抗行为。基于新媒体生态中营造的“沉默螺旋式”舆论环境,使得用户个体的观点和言论逐渐消弭,虚假的舆论一体化取而代之,如此背景下,新媒体功用的颠覆成为其舆情发展过程中亟须解决的重要问题。因此本文将借助相关案例研究梳理新媒体在舆论事件中的群体意见与用户个体观点之间的交织演变过程,并将舆情与用户言行进行对比分析,归纳其产生原因并反思该现象以缓和新媒体舆情与用户表达权之间的矛盾。 展开更多
关键词 新媒体 舆情 群体意见 社交退缩
下载PDF
智媒时代配音行业发展路径探析
15
作者 范怡萱 刘伍颖 《记者摇篮》 2023年第11期42-44,共3页
在当前听觉文化兴起的智媒时代,许多配音演员再次走进观众的视野,抓住了“耳朵经济”市场的发展契机。伴随着智能媒体技术的全面成熟,配音行业的业务领域逐渐拓宽,无论是配音演员还是配音工作室,都探索出其在智媒时代下的发展路径,为配... 在当前听觉文化兴起的智媒时代,许多配音演员再次走进观众的视野,抓住了“耳朵经济”市场的发展契机。伴随着智能媒体技术的全面成熟,配音行业的业务领域逐渐拓宽,无论是配音演员还是配音工作室,都探索出其在智媒时代下的发展路径,为配音行业在“耳朵经济”环境下的健康发展作出了具有可实践性的创新。 展开更多
关键词 配音演员 耳朵经济 智媒时代
下载PDF
科技期刊论文英文标题抽象名词短语结构分析与应用 被引量:22
16
作者 李平 曹雁 《中国科技期刊研究》 CSSCI 北大核心 2012年第2期322-324,共3页
本文旨在发现与归纳科技期刊英文标题中"名词+of+名词"结构的语言特点。运用语料库语言学研究方法对理科类科技期刊英文标题进行了大样本统计分析。结果显示,84.5%的英文标题是名词短语形式,以"中心名词+介词短语"... 本文旨在发现与归纳科技期刊英文标题中"名词+of+名词"结构的语言特点。运用语料库语言学研究方法对理科类科技期刊英文标题进行了大样本统计分析。结果显示,84.5%的英文标题是名词短语形式,以"中心名词+介词短语"的形式最为典型。中心名词主要表现为五类抽象名词。结论表明以抽象名词为中心名词的短语结构因其结构简洁、信息载荷量大而成为科技期刊英文标题的主要表达手段。 展开更多
关键词 英文标题 名词短语结构 抽象名词
原文传递
两阶段域适应神经机器翻译方法
17
作者 刘伍颖 金凯 《厦门大学学报(自然科学版)》 CAS 2024年第6期1033-1041,共9页
[目的]为了提升神经机器翻译模型的迁移学习效果,以语言数据为中心开展域适应方法探索.[方法]根据KL散度和最大均差两种域适应量度的定量分析结果,提出一种针对拥有大规模平行句子和小规模域文本场景的两阶段减量学习框架.第1阶段域过滤... [目的]为了提升神经机器翻译模型的迁移学习效果,以语言数据为中心开展域适应方法探索.[方法]根据KL散度和最大均差两种域适应量度的定量分析结果,提出一种针对拥有大规模平行句子和小规模域文本场景的两阶段减量学习框架.第1阶段域过滤,利用域文本过滤平行句子,得到域平行句子,再利用得到的域平行句子训练出域神经机器翻译模型.第2阶段质量过滤,利用训练出的域神经机器翻译模型将第1阶段过滤出的域平行句子翻译一遍,比较机器译文与人工译文的质量,删除低质量平行句子以获得高质量域平行句子.最后利用得到的高质量域平行句子训练出优化的域神经机器翻译模型.[结果]在适应法律域英汉神经机器翻译上的实验结果显示新提出的两阶段算法只需原来训练步的四分之一左右,就反而可以提高2个多的BLEU分数.[结论]实验结论证明减量学习框架能够在大大减少训练时空开销的前提下获得最优的性能,最终实现神经机器翻译模型的快速域迁移. 展开更多
关键词 域适应 域适应量度 减量学习 神经机器翻译 法律域
下载PDF
混合BERT和宽度学习的低时间复杂度短文本分类
18
作者 陈晓江 杨晓奇 +1 位作者 陈广豪 刘伍颖 《山东大学学报(工学版)》 CAS CSCD 北大核心 2024年第4期51-58,66,共9页
针对短文本分类任务效率低下和精度不高的问题,提出混合基于Transformer的双向编码器表示和宽度学习分类器(hybrid bidirectional encoder representations from transformer and broad learning, BERT-BL)的高效率和高精度文本分类模... 针对短文本分类任务效率低下和精度不高的问题,提出混合基于Transformer的双向编码器表示和宽度学习分类器(hybrid bidirectional encoder representations from transformer and broad learning, BERT-BL)的高效率和高精度文本分类模型。对基于Transformer的双向编码器表示(bidirectional encoder representation from transformer, BERT)进行微调以更新BERT的参数。使用微调好的BERT将短文本映射成对应的词向量矩阵,将词向量矩阵输入宽度学习(broad learning, BL)分类器中以完成分类任务。试验结果显示,BERT-BL模型在3个公共数据集上的准确率均达到最优;所需要的时间仅为基线模型支持向量机(support vector machine, SVM)、长短期记忆网络(long short-term memory, LSTM)、最小p范数宽度学习(minimum p-norm broad learning,p-BL)和BERT的几十分之一,而且训练过程不需要高性能显卡的参与。通过对比分析,BERT-BL模型不仅在短文本任务中具有良好的性能,而且能节省大量训练时间成本。 展开更多
关键词 短文本分类 BERT-BL BERT 宽度学习 高精度
原文传递
中外作者科技论文英文摘要多维度分析模型 被引量:11
19
作者 曹雁 肖忠华 《外语教学》 CSSCI 北大核心 2015年第6期5-9,共5页
本文基于涵盖12个理科学科的中外英文摘要可比语料库,利用多维度分析方法考察中外英文摘要的语篇交际功能差异。我们首次将"类联接"概念纳入多维度分析法,对163个语法、语义和类联接语言特征的频率进行因子分析,对英文摘要建... 本文基于涵盖12个理科学科的中外英文摘要可比语料库,利用多维度分析方法考察中外英文摘要的语篇交际功能差异。我们首次将"类联接"概念纳入多维度分析法,对163个语法、语义和类联接语言特征的频率进行因子分析,对英文摘要建立了5个维度的分析模型,用来阐释深层的语篇交际功能差异。在此基础上对比了中外英文摘要的总体以及学科差异。结果显示,两类摘要在其中的4个维度存在显著性差异。本族语作者更善于运用各类副词强化语气,鲜明地表明自己的立场和态度;他们更倾向于使用第一人称,采用互动的写作风格。相比之下,中国作者过多的使用前置性修饰语和被动语态,无形中增加了阅读困难,偏离了当今国际学术界直接简洁的写作风格。 展开更多
关键词 多维度分析法 科技论文摘要 学术写作 对比分析
原文传递
从语篇交际功能看科技期刊英文摘要存在的问题--基于语料库的对比与分析 被引量:10
20
作者 曹雁 肖忠华 《编辑学报》 CSSCI 北大核心 2015年第2期130-133,共4页
基于涵盖12个理工科学科的科技期刊英文摘要语料库,利用语料库方法对163个语言特征的频率进行因子分析,系统比较了中外科技期刊英文摘要的差异。结果显示,2类摘要在副词、第一人称代词、前置性修饰语以及被动语态的使用上存在显著的功... 基于涵盖12个理工科学科的科技期刊英文摘要语料库,利用语料库方法对163个语言特征的频率进行因子分析,系统比较了中外科技期刊英文摘要的差异。结果显示,2类摘要在副词、第一人称代词、前置性修饰语以及被动语态的使用上存在显著的功能性差异。国内英文摘要多数不善于使用副词加强语气,有意规避第一人称代词,缺少与读者的交互,而过多的前置性修饰语和被动语态无形中增加了阅读困难,与国际学术界提倡的直接简洁的写作风格仍有偏差。我们分析了造成这些差异的可能原因,并对国内科技期刊英文摘要写作提出建议。 展开更多
关键词 科技期刊 英文摘要 语料库方法 语篇交际功能
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部