期刊文献+
共找到299篇文章
< 1 2 15 >
每页显示 20 50 100
Classification of Conversational Sentences Using an Ensemble Pre-Trained Language Model with the Fine-Tuned Parameter
1
作者 R.Sujatha K.Nimala 《Computers, Materials & Continua》 SCIE EI 2024年第2期1669-1686,共18页
Sentence classification is the process of categorizing a sentence based on the context of the sentence.Sentence categorization requires more semantic highlights than other tasks,such as dependence parsing,which requir... Sentence classification is the process of categorizing a sentence based on the context of the sentence.Sentence categorization requires more semantic highlights than other tasks,such as dependence parsing,which requires more syntactic elements.Most existing strategies focus on the general semantics of a conversation without involving the context of the sentence,recognizing the progress and comparing impacts.An ensemble pre-trained language model was taken up here to classify the conversation sentences from the conversation corpus.The conversational sentences are classified into four categories:information,question,directive,and commission.These classification label sequences are for analyzing the conversation progress and predicting the pecking order of the conversation.Ensemble of Bidirectional Encoder for Representation of Transformer(BERT),Robustly Optimized BERT pretraining Approach(RoBERTa),Generative Pre-Trained Transformer(GPT),DistilBERT and Generalized Autoregressive Pretraining for Language Understanding(XLNet)models are trained on conversation corpus with hyperparameters.Hyperparameter tuning approach is carried out for better performance on sentence classification.This Ensemble of Pre-trained Language Models with a Hyperparameter Tuning(EPLM-HT)system is trained on an annotated conversation dataset.The proposed approach outperformed compared to the base BERT,GPT,DistilBERT and XLNet transformer models.The proposed ensemble model with the fine-tuned parameters achieved an F1_score of 0.88. 展开更多
关键词 Bidirectional encoder for representation of transformer conversation ensemble model fine-tuning generalized autoregressive pretraining for language understanding generative pre-trained transformer hyperparameter tuning natural language processing robustly optimized BERT pretraining approach sentence classification transformer models
下载PDF
A conditional random fields approach to Chinese pinyin-to-character conversion 被引量:1
2
作者 LI Lu WANG Xuan WANG Xiao-long YU Yan-bing 《通讯和计算机(中英文版)》 2009年第4期25-31,共7页
关键词 随机场 汉语拼音 字符转换 特征空间
下载PDF
Incorporating Linguistic Rules in Statistical Chinese Language Model for Pinyin-to-character Conversion 被引量:2
3
作者 刘秉权 Wang +2 位作者 Xiaolong Wang Yuying 《High Technology Letters》 EI CAS 2001年第2期8-13,共6页
An N-gram Chinese language model incorporating linguistic rules is presented. By constructing elements lattice, rules information is incorporated in statistical frame. To facilitate the hybrid modeling, novel methods ... An N-gram Chinese language model incorporating linguistic rules is presented. By constructing elements lattice, rules information is incorporated in statistical frame. To facilitate the hybrid modeling, novel methods such as MI-based rule evaluating, weighted rule quantification and element-based n-gram probability approximation are presented. Dynamic Viterbi algorithm is adopted to search the best path in lattice. To strengthen the model, transformation-based error-driven rules learning is adopted. Applying proposed model to Chinese Pinyin-to-character conversion, high performance has been achieved in accuracy, flexibility and robustness simultaneously. Tests show correct rate achieves 94.81% instead of 90.53% using bi-gram Markov model alone. Many long-distance dependency and recursion in language can be processed effectively. 展开更多
关键词 Chinese Pinyin-to-character conversion Rule-based language model N-gram language model Hybrid language model Element lattice Transformation-based error-driven learning
下载PDF
19世纪朝鲜半岛汉语会话书俗字变异解析
4
作者 张黎 敏春芳 《国际汉学》 CSSCI 2024年第1期114-123,154,共11页
19世纪朝鲜半岛汉语会话书是朝鲜王朝后期流行于民间的一批私人手抄汉语会话类教科书。这批反映中朝边境贸易往来的抄本文献保留了大量的汉文俗字,不仅真实记录了朝鲜民间的书写习惯,也是研究朝鲜半岛汉字的丰富宝库。本文以传统“六书... 19世纪朝鲜半岛汉语会话书是朝鲜王朝后期流行于民间的一批私人手抄汉语会话类教科书。这批反映中朝边境贸易往来的抄本文献保留了大量的汉文俗字,不仅真实记录了朝鲜民间的书写习惯,也是研究朝鲜半岛汉字的丰富宝库。本文以传统“六书”与汉字构形学为理论指导,考察抄本俗字与正体字在笔画、构件和整字三个层级的变异类型,其简省与增繁、同化与异化、改换与易位等用字现象,充分反映了汉字在朝鲜半岛的传承和变异特征。笔画和构件的简化是抄本俗字变异中最基础、最直接的表现形式;构件形体的类推性,是维持会话书抄本文字系统的有效手段;新造六书俗字、记号俗字和新增音义俗字等体现了朝鲜编写者在继承汉字系统的前提下,对构形单位进行了部分改变和局部创新。 展开更多
关键词 朝鲜半岛 汉语会话书 俗字 变异类型
下载PDF
基于相对特征的音乐哼唱多句检索算法 被引量:4
5
作者 王小凤 耿国华 +1 位作者 刘晓宁 孙霞 《计算机应用研究》 CSCD 北大核心 2011年第3期918-920,共3页
面对海量音乐数据,如何在基于内容检索时对其建立索引以提高检索速度是一个非常重要的研究内容。以句为单位对音乐内容提取特征并建立索引时,库中保存的是音乐旋律的相对特征,但用户在哼唱检索时,有时会哼唱一段包含多句的音乐来检索,... 面对海量音乐数据,如何在基于内容检索时对其建立索引以提高检索速度是一个非常重要的研究内容。以句为单位对音乐内容提取特征并建立索引时,库中保存的是音乐旋律的相对特征,但用户在哼唱检索时,有时会哼唱一段包含多句的音乐来检索,这就需要生成多句特征。对此提出单句特征和多句转换及匹配问题的解决方案并应用于检索系统中,获得了较好的检索效果,相关成果也可应用于具有相似结构的时间序列数据的检索系统中。 展开更多
关键词 索引 多句检索 特征转换
下载PDF
基于增强字向量的微博观点句情感极性分类方法 被引量:5
6
作者 廖健 王素格 +1 位作者 李德玉 王杰 《郑州大学学报(理学版)》 CAS 北大核心 2017年第1期39-44,共6页
针对微博观点句识别及情感极性分类任务,提出了基于增强字向量的微博观点句情感极性分类方法.使用单字作为句子表示的基本单元,同时在单字中嵌入了该字所在的词信息以及该词的词性信息,以此训练得到字向量替代传统的词向量融合的句子表... 针对微博观点句识别及情感极性分类任务,提出了基于增强字向量的微博观点句情感极性分类方法.使用单字作为句子表示的基本单元,同时在单字中嵌入了该字所在的词信息以及该词的词性信息,以此训练得到字向量替代传统的词向量融合的句子表示方法.使用基于K-means的方法对向量化的句子进行情感判别,仅需要对文本进行分词和词性标注,无需额外的语言学资源.在COAE2015任务2的微博句子数据集上进行测试,取得了较好的结果. 展开更多
关键词 增强字向量 观点句分类 深度学习
下载PDF
一种评价能源利用方式的新方法 被引量:34
7
作者 薛志峰 刘晓华 +1 位作者 付林 江亿 《太阳能学报》 EI CAS CSCD 北大核心 2006年第4期349-355,共7页
基于热力学第二定律的分析方法,按照能质系数的概念确定了电、天然气、煤、蒸汽、热水等各种形式的建筑用能及建筑物耗冷量、耗热量的能源品位高低;提出了一种评价能源利用方式的新方法。该方法利用能量转换系数(ecc/ECC)指标,可对包括... 基于热力学第二定律的分析方法,按照能质系数的概念确定了电、天然气、煤、蒸汽、热水等各种形式的建筑用能及建筑物耗冷量、耗热量的能源品位高低;提出了一种评价能源利用方式的新方法。该方法利用能量转换系数(ecc/ECC)指标,可对包括园区热电冷联供系统、建筑物制冷供热系统、能量输配系统及末端用能设备在内的一系列用能环节的能源利用效率进行评价,作为确定建筑物用能方式的决策依据。 展开更多
关键词 建筑用能 能质系数 能量转换效率(ecc/ECC) 能源利用方式评价
下载PDF
满文罗马转写与圈点满文转换算法的实现 被引量:3
8
作者 张广渊 李晶皎 张俐 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第12期1157-1160,共4页
通过研究满文文字的特征,在给出圈点满文和满文罗马转写单词定义BNF范式的基础上,按照总结出的圈点满文与其拉丁化方案之间相互转换的规则,构建了满文罗马转写与圈点满文之间的相互转换算法,并着重解决了圈点满文向罗马转写转换过程中... 通过研究满文文字的特征,在给出圈点满文和满文罗马转写单词定义BNF范式的基础上,按照总结出的圈点满文与其拉丁化方案之间相互转换的规则,构建了满文罗马转写与圈点满文之间的相互转换算法,并着重解决了圈点满文向罗马转写转换过程中的编码冲突问题,对不符合规则的文字编码提出了解决方案,从而实现罗马转写文本和圈点满文之间的双向一一对应转换·通过对测试文本的转换试验,表明了所提出的转换算法的有效性· 展开更多
关键词 满文 搭配字母 字符 转换 拉丁化
下载PDF
一种多知识源汉语语言模型的研究与实现 被引量:8
9
作者 刘秉权 王晓龙 王宇颖 《计算机研究与发展》 EI CSCD 北大核心 2002年第2期231-235,共5页
针对汉语语言模型中知识获取不足的问题 ,提出了一种统计与多种形式规则信息结合的机制 ,将规则的表示量化 ,提出语法语义规则矩阵的概念 ,通过扩充词网格、对基于最大可能性的 n元概率值合理调整 ,将短语构成规则、二元语法语义规则、... 针对汉语语言模型中知识获取不足的问题 ,提出了一种统计与多种形式规则信息结合的机制 ,将规则的表示量化 ,提出语法语义规则矩阵的概念 ,通过扩充词网格、对基于最大可能性的 n元概率值合理调整 ,将短语构成规则、二元语法语义规则、最少分词原则等融入统计模型框架 ,构成多知识源语言模型 ,模型应用于智能拼音汉字转换系统 ,明显提高了音字转换正确率 。 展开更多
关键词 N-gram音字转换 自然语言处理 规则矩阵 多知识源 汉语语言模型 计算机
下载PDF
基于Android的智能中文输入法 被引量:5
10
作者 刘峰 王晔晗 +2 位作者 汤步洲 王晓龙 王轩 《计算机工程》 CAS CSCD 北大核心 2011年第7期225-227,共3页
介绍语句级汉字拼音输入技术的基本原理,讨论在移动设备上面临的问题和解决方案,并实现基于Android操作系统的语句级汉字拼音输入法。将该输入法应用于多普达A3288手机,运行状态良好,汉字输入流畅,音字转换准确率为86.92%。随着用户对... 介绍语句级汉字拼音输入技术的基本原理,讨论在移动设备上面临的问题和解决方案,并实现基于Android操作系统的语句级汉字拼音输入法。将该输入法应用于多普达A3288手机,运行状态良好,汉字输入流畅,音字转换准确率为86.92%。随着用户对输入法和输入习惯的适应,准确率还会有一定的提高。 展开更多
关键词 输入法 ANDROID操作系统 音字转换 自然语言处理
下载PDF
环境因子对蟹味菇农艺性状的影响 被引量:4
11
作者 黄亮 杨丽维 +3 位作者 班立桐 王玉 郑建龙 陈启永 《北方园艺》 CAS 北大核心 2014年第2期141-143,共3页
以蟹味菇为试材,在同一菇房内,选用环境条件(温度、湿度、光照强度、CO2浓度)有差异的第1、3、6层菇架进行出菇比较。结果表明:第6层菇架上的蟹味菇生长状况最好,单瓶产量达168.85g,生物转化率为65.96%;控制精确的环境因子,即温度为15.... 以蟹味菇为试材,在同一菇房内,选用环境条件(温度、湿度、光照强度、CO2浓度)有差异的第1、3、6层菇架进行出菇比较。结果表明:第6层菇架上的蟹味菇生长状况最好,单瓶产量达168.85g,生物转化率为65.96%;控制精确的环境因子,即温度为15.3℃、相对湿度为89.5%、光照强度为870lx、CO2浓度为2 029mg/kg时,可显著提高蟹味菇的生物学转化率。 展开更多
关键词 蟹味菇 农艺性状 生物学转化率 工厂化栽培
下载PDF
对话翻译与小说人物形象的再现——兼评《傲慢与偏见》的三个中译本 被引量:15
12
作者 纪晓斌 申迎丽 《解放军外国语学院学报》 北大核心 2007年第5期83-87,共5页
塑造人物形象是小说写作的中心任务,而对话是塑造人物形象的有效途径。对话所揭示出的人物情绪、性格、背景等信息对于小说人物形象的生成起着重要的作用,翻译时理应予以足够的重视。本文通过分析比较《傲慢与偏见》的3个中译本对原文... 塑造人物形象是小说写作的中心任务,而对话是塑造人物形象的有效途径。对话所揭示出的人物情绪、性格、背景等信息对于小说人物形象的生成起着重要的作用,翻译时理应予以足够的重视。本文通过分析比较《傲慢与偏见》的3个中译本对原文对话部分的不同处理,探讨对话翻译对于再现原文人物形象的重要意义及翻译时应当注意的问题。 展开更多
关键词 对话翻译 人物形象 傲慢与偏见
下载PDF
基于细胞性质分析不同有机溶剂对简单节杆菌C1,2脱氢反应的影响 被引量:6
13
作者 骆健美 宋妍 +4 位作者 王建锋 宁静 成永新 郑宇 申雁冰 《化学与生物工程》 CAS 2012年第5期49-53,共5页
通过对简单节杆菌细胞性质的研究,探讨了不同有机溶剂(乙醇、DMF、DMSO、甲醇)加入后醋酸可的松生物转化反应效率产生差异的原因。采用底物转化法检测生物转化率,采用平板活菌计数法计算细胞存活率,通过糖代谢活力保留值表征细胞的生理... 通过对简单节杆菌细胞性质的研究,探讨了不同有机溶剂(乙醇、DMF、DMSO、甲醇)加入后醋酸可的松生物转化反应效率产生差异的原因。采用底物转化法检测生物转化率,采用平板活菌计数法计算细胞存活率,通过糖代谢活力保留值表征细胞的生理代谢活力,用原子力显微镜观察细胞超显微结构,以FDA法表征细胞膜通透性。在体积分数为4%的条件下,4种有机溶剂均能提高简单节杆菌生物转化醋酸可的松的初始转化速率和最终转化率,转化率从高到低依次为乙醇>DMSO>甲醇>DMF;4种溶剂对简单节杆菌存活率和糖代谢活力保留值的影响趋势基本一致,其中DMF最大,DMSO次之,乙醇和甲醇较小;4种溶剂中,甲醇对简单节杆菌细胞完整性的影响最大,乙醇次之,DMF和DMSO差别不明显;4种有机溶剂对简单节杆菌细胞膜通透性的影响大小依次为甲醇>乙醇>DMSO>DMF。上述结果表明,细胞生理代谢活力和细胞膜通透性的差异是造成转化率水平不同的重要原因。其中,细胞膜通透性的增强有利于底物分子更容易进入细胞与生物酶接触,进而提高转化率。 展开更多
关键词 有机溶剂 简单节杆菌 细胞性质 脱氢反应 转化效率
下载PDF
光纤声传感器特性的实验研究 被引量:3
14
作者 缪长宗 徐海英 +2 位作者 林长圣 刘小廷 刘英 《传感技术学报》 EI CAS CSCD 北大核心 2006年第3期818-820,827,共4页
光纤传声器是一种由探头和光纤组合成的Y型声传感器,这种传感器在完成声光转换的同时对声频信号进行了滤波处理,可用在强电磁干扰等一些特殊的环境中。本文对研制的实验型光纤声传感器系统的响应特性进行了测试。当固定光源为50mA,输入... 光纤传声器是一种由探头和光纤组合成的Y型声传感器,这种传感器在完成声光转换的同时对声频信号进行了滤波处理,可用在强电磁干扰等一些特殊的环境中。本文对研制的实验型光纤声传感器系统的响应特性进行了测试。当固定光源为50mA,输入信号200mV的正弦波,频率为1kHz时,探测到的信号波形与输入信号波形完全吻合;然后,保持输入信号的电压幅值不变,频率从1kHz开始分别测量传声器的高频响应和低频响应,发现传声器响应特性比较好,但低频响应特性不如高频响应特性理想,分析原因并给出设计更好的实验型光纤传声器的解决办法。 展开更多
关键词 光纤传声器 响应特性 声光转换
下载PDF
基于转移的音字转换纠错规则获取技术 被引量:4
15
作者 关毅 王晓龙 张凯 《计算机研究与发展》 EI CSCD 北大核心 1999年第3期268-273,共6页
文中描述了一种在音字转换系统中从规模不限的在线文本中自动获取纠错规则的机器学习技术.该技术从音字转换结果中自动获取误转换结果及其相应的上下文信息,从而生成转移规则集.该转移规则集应用于音字转换的后处理模块,使音字转换... 文中描述了一种在音字转换系统中从规模不限的在线文本中自动获取纠错规则的机器学习技术.该技术从音字转换结果中自动获取误转换结果及其相应的上下文信息,从而生成转移规则集.该转移规则集应用于音字转换的后处理模块,使音字转换系统的转换正确率进一步提高,并使系统具备了很强的灵活性和可扩展性. 展开更多
关键词 音字转换 纠错规则 机器学习 汉字信息处理
下载PDF
医学科技论文中词的增减与词性和句型的转换 被引量:2
16
作者 王征爱 王雪萍 +1 位作者 许瑾 宋建武 《第一军医大学学报》 CSCD 北大核心 2002年第12期1149-1152,共4页
翻译中词的省略和添补是常用技巧,词性的转换和句型的转换也十分常见。本文通过各种例句阐述了在英语医学论文中上述技巧的具体使用原则和方法。
关键词 英语医学科技论文 句型转换 词性转换 翻译技巧
下载PDF
统计与规则相结合的计算机音字相互转换技术 被引量:3
17
作者 王轩 王晓龙 藏晓莉 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1997年第4期1-4,共4页
本文介绍了一种利用马尔克夫统计文法和自然语言理解技术相结合的计算语言模型进行汉语音节到汉字的机器自动相互转换技术。该技术集成了统计文法和句法分析方法各自的优点,可以实用于计算机大规模真实文本的音字相互转换,并且具有处理... 本文介绍了一种利用马尔克夫统计文法和自然语言理解技术相结合的计算语言模型进行汉语音节到汉字的机器自动相互转换技术。该技术集成了统计文法和句法分析方法各自的优点,可以实用于计算机大规模真实文本的音字相互转换,并且具有处理语言深度递归现象和远距离约束关系的能力。通过对从两千万语料随机抽取的一百六十万平衡语料的测试表明,音字转换正确率为带声调94.77%,无声调89.05%,字音转换正确率为99%。此项技术已被应用到大词表非特定人孤立词语音识别系统和中文WINDOWS95、WINDOS NT的智能语句输入法上。 展开更多
关键词 音字相互转换 语言模型 语音识别 统计 规则
下载PDF
一个基于语境框架的文本特征提取算法 被引量:15
18
作者 晋耀红 苗传江 《计算机研究与发展》 EI CSCD 北大核心 2004年第4期582-586,共5页
介绍了一种新的文本语义形式化模型———语境框架 语境框架是一个三维的语义描述 ,它把文本内容抽象成领域(静态范畴 )、情景 (动态描述 )、背景 (褒贬、参照等 ) 3个框架 在语境框架的基础上 ,设计实现了文本特征提取算法 算法从语... 介绍了一种新的文本语义形式化模型———语境框架 语境框架是一个三维的语义描述 ,它把文本内容抽象成领域(静态范畴 )、情景 (动态描述 )、背景 (褒贬、参照等 ) 3个框架 在语境框架的基础上 ,设计实现了文本特征提取算法 算法从语义入手 ,实现了 4元组表示的领域提取算法、以领域句类为核心的情景提取算法和以对象语义立场网络图为基础的褒贬判断 算法可以有效地处理语言中的褒贬倾向、同义、多义等现象 。 展开更多
关键词 文本特征提取 语境框架模型 领域 情景 背景 领域句类 对象语义立场网络 褒贬
下载PDF
语句级汉字输入系统中语义规则研究 被引量:7
19
作者 高升 王晓龙 《计算机工程与应用》 CSCD 北大核心 2003年第4期80-82,共3页
提高音字转换的正确率是新一代汉字输入技术-语句输入技术的核心问题,而基于语料库统计模式和基于语法规则相结合是提高音字转换正确率的一种有效途径。建立规则的核心问题就是要研究和解决适合于音字转换的短语搭配问题。文章依据自然... 提高音字转换的正确率是新一代汉字输入技术-语句输入技术的核心问题,而基于语料库统计模式和基于语法规则相结合是提高音字转换正确率的一种有效途径。建立规则的核心问题就是要研究和解决适合于音字转换的短语搭配问题。文章依据自然语言理解和计算语言学理论,就规则在音字转换中的作用和建立方法进行了研究。 展开更多
关键词 语句级汉字输入系统 语义规则 音字转换 语料库 自然语言理解
下载PDF
基于支持向量机的音字转换模型 被引量:6
20
作者 姜维 关毅 +1 位作者 王晓龙 刘秉权 《中文信息学报》 CSCD 北大核心 2007年第2期100-105,共6页
针对N-gram在音字转换中不易融合更多特征,本文提出了一种基于支持向量机(SVM)的音字转换模型,有效提供可以融合多种知识源的音字转换框架。同时,SVM优越的泛化能力减轻了传统模型易于过度拟合的问题,而通过软间隔分类又在一定程度上克... 针对N-gram在音字转换中不易融合更多特征,本文提出了一种基于支持向量机(SVM)的音字转换模型,有效提供可以融合多种知识源的音字转换框架。同时,SVM优越的泛化能力减轻了传统模型易于过度拟合的问题,而通过软间隔分类又在一定程度上克服小样本中噪声问题。此外,本文利用粗糙集理论提取复杂特征以及长距离特征,并将其融合于SVM模型中,克服了传统模型难于实现远距离约束的问题。实验结果表明,基于SVM音字转换模型比传统采用绝对平滑算法的Trigram模型精度提高了1.2%;增加远距离特征的SVM模型精度提高1.6%。 展开更多
关键词 人工智能 自然语言处理 支持向量机 音字转换 粗糙集理论 远距离特征
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部