期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于深度学习的英语口语自动评分研究
1
作者 苏琴 付瑞吉 《信息技术》 2023年第2期97-101,共5页
为提高英语口语学习效率,在研究了深度神经网络、声学模型、自动语音评分基础上,设计了一种基于深度学习的端到端自动英语评分系统。在输入层,将词汇表示为一个序列张量,其中每个位置对应于来自预先训练的词汇向量,并采用双向LSTM网络... 为提高英语口语学习效率,在研究了深度神经网络、声学模型、自动语音评分基础上,设计了一种基于深度学习的端到端自动英语评分系统。在输入层,将词汇表示为一个序列张量,其中每个位置对应于来自预先训练的词汇向量,并采用双向LSTM网络得到高层信息。在声学模型层,文中将注意力机制模型融入网络,从而提高系统运行效率。在输出层,将词汇的表示方式与口语表达连接起来,并利用softmax函数对成绩进行预测。通过仿真分析,结果表明所提方法较传统LSTM、GRU方法性能有所提升。仿真结果进一步验证了所提系统的有效性。 展开更多
关键词 英语口语 自动评分 长短时记忆网络 注意机制
下载PDF
基于铁路客运知识库的意图识别模型训练及应用研究
2
作者 杨立鹏 陈华龙 +3 位作者 张睿 王勃 孟庆晔 李强 《计算机应用文摘》 2023年第21期49-54,共6页
自2018年以来,铁路客服中心开始引入人工智能技术,并在语音机器人场景进行系统试用,然而试用过程中发现存在知识检索精度低以及知识构建和维护效率低等问题。为了解决上述问题,文章主要研究了基于铁路客运客服知识库的意图识别模型训练... 自2018年以来,铁路客服中心开始引入人工智能技术,并在语音机器人场景进行系统试用,然而试用过程中发现存在知识检索精度低以及知识构建和维护效率低等问题。为了解决上述问题,文章主要研究了基于铁路客运客服知识库的意图识别模型训练及应用技术,从以下三个方面展开探讨:首先,介绍了多预训练模型融合蒸馏的意图识别模型训练技术,包括模型预训练、模型融合和模型蒸馏等关键技术;其次,研究了基于意图识别的信息检索技术,该技术在传统基于关键字的信息检索技术的基础上,结合了检索意图识别,从而提高了知识检索的精度;最后,介绍了基于规则与模型结合的非结构化知识自动采编技术,通过设计规则抽取和意图识别模型抽取两种方法,实现了从海量非结构化文本中自动抽取和采编结构化知识的功能,从而解决了知识构建及维护效率低的问题。 展开更多
关键词 铁路客服 自然语言处理 意图识别 信息检索 非结构化知识采编
下载PDF
基于人工智能的病案首页智能编码技术研究与应用 被引量:3
3
作者 李强 尤心心 +4 位作者 周佳雯 杨雪 崔好胜 刘喜恩 吴及 《中国数字医学》 2022年第10期59-63,共5页
目的:设计病案首页智能辅助编码系统,实现该系统与病案管理系统的对接,提高编码效率和编码准确率。方法:构建两个阶段的编码技术框架,先通过TF-IDF、编辑距离等文本计算方法进行快速的粗编码,以获得疾病诊断的多个候选码,再通过张量图... 目的:设计病案首页智能辅助编码系统,实现该系统与病案管理系统的对接,提高编码效率和编码准确率。方法:构建两个阶段的编码技术框架,先通过TF-IDF、编辑距离等文本计算方法进行快速的粗编码,以获得疾病诊断的多个候选码,再通过张量图神经网络方法关联更加详细的信息进行精编码,最终获得最优编码推荐。结果:相比于人工编码,病案首页智能辅助编码系统能够在保证编码准确性的同时,提高病案室专业编码人员的编码效率。结论:利用人工智能技术,通过人机耦合的方式能够有效提高住院病案首页的编码效率和编码准确率,进而提高住院病案首页的填写质量。 展开更多
关键词 住院病案首页 智能编码 张量图构建 图内卷积 图间卷积
下载PDF
基于人工智能的病案首页诊断漏写检查技术应用研究 被引量:4
4
作者 李强 周佳雯 +4 位作者 崔好胜 周开银 刘少辉 刘喜恩 吴及 《中国数字医学》 2022年第6期56-61,共6页
目的:解决住院病案首页诊断漏写的问题,提高病案首页诊断填写质量。方法:基于自然语言处理技术及知识库构建技术设计诊断漏写检查系统,通过解析全病历内容,对病历中出现过的诊断是否确实漏写进行判断。结果:通过实际应用发现,该系统相... 目的:解决住院病案首页诊断漏写的问题,提高病案首页诊断填写质量。方法:基于自然语言处理技术及知识库构建技术设计诊断漏写检查系统,通过解析全病历内容,对病历中出现过的诊断是否确实漏写进行判断。结果:通过实际应用发现,该系统相比于人工审查,能够找出更多可能漏写的疾病,并且保证较高的准确率。结论:利用人工智能技术,通过人机耦合的方式能够有效提高住院病案首页诊断漏写检查效率,进而提高住院病案首页填写质量。 展开更多
关键词 自然语言处理 住院病案首页 诊断漏写
下载PDF
面向作文自动评分的优美句识别 被引量:15
5
作者 付瑞吉 王栋 +2 位作者 王士进 胡国平 刘挺 《中文信息学报》 CSCD 北大核心 2018年第6期88-97,共10页
语言优美是学生写作能力中重要的一部分。该文提出一个面向作文自动评分的作文优美句识别任务,主要识别中学生中文作文中的优美句。相比传统文本分类任务,优美句识别更加难以用特征工程的方式解决。因此,该文提出一种基于卷积神经网络(C... 语言优美是学生写作能力中重要的一部分。该文提出一个面向作文自动评分的作文优美句识别任务,主要识别中学生中文作文中的优美句。相比传统文本分类任务,优美句识别更加难以用特征工程的方式解决。因此,该文提出一种基于卷积神经网络(CNN)和双向长短时记忆(BiLSTM)网络的混合神经网络结构进行优美句识别,并和CNN、BiLSTM网络进行了对比。实验证明,混合神经网络的准确率最高,达到89.23%,F1值与BiLSTM相当,达到75.39%。此外,该文将优美句子特征用于作文自动评分任务,可使计算机评分和人工评分的大分差比例下降21.41%。 展开更多
关键词 优美句识别 深度神经网络 作文自动评分
下载PDF
面向学科题目的文本分析方法与应用研究综述
6
作者 黄振亚 刘淇 +4 位作者 陈恩红 林鑫 何理扬 刘嘉聿 王士进 《中文信息学报》 CSCD 北大核心 2022年第10期1-16,共16页
分析学科题目含义、模拟人类解决问题,是当前“人工智能+教育”融合研究的重要方向之一。近年来,智能教育系统的快速发展积累了大量学科题目资源,为相关研究提供了数据支撑。为此,利用大数据分析与自然语言处理相关的技术,研究者提出了... 分析学科题目含义、模拟人类解决问题,是当前“人工智能+教育”融合研究的重要方向之一。近年来,智能教育系统的快速发展积累了大量学科题目资源,为相关研究提供了数据支撑。为此,利用大数据分析与自然语言处理相关的技术,研究者提出了大量面向学科题目的文本分析方法,开展了许多重要的智能应用任务,对探索人类知识学习等认知能力具有重要意义。该文围绕智能教育与自然语言处理交叉领域,介绍了若干代表性研究任务,包括题目质量分析、机器阅读理解、数学题问答、文章自主评分等,并对相应研究进展进行阐述和总结;此外,对相关数据集和开源工具包进行了总结和介绍;最后,展望了多个未来研究方向。 展开更多
关键词 学科题目 题目质量分析 机器阅读理解 数学题问答 文章自主评分
下载PDF
深度学习建模下的自动句子填空技术
7
作者 陈志刚 华磊 +3 位作者 刘权 尹坤 魏思 胡国平 《中文信息学报》 CSCD 北大核心 2019年第8期101-110,共10页
该文提出了一种结合依存句法分析和深度神经网络的自动句子填空技术。首先,提出了一种依存句法信息展开的序列建模方案,可以在引入句法信息的同时兼顾效率,并在此基础上利用排序学习思想,训练候选答案排序模型;其次,针对整体序列建模的... 该文提出了一种结合依存句法分析和深度神经网络的自动句子填空技术。首先,提出了一种依存句法信息展开的序列建模方案,可以在引入句法信息的同时兼顾效率,并在此基础上利用排序学习思想,训练候选答案排序模型;其次,针对整体序列建模的细节建模失准问题,提出了一种基于语言模型多状态信息融合的自动句子填空模型;最后,设计了一种结合序列表示、依存句法信息、多状态信息的多源信息融合模型。该文还构建出一个英文答题数据集并据此进行了实验。实验结果表明,依存句法展开模型相对于常用的序列建模方案,准确率有11%的绝对提升;语言模型状态排序模型相对于基线模型,准确率有9.3%的绝对提升;最终的多源信息融合模型,在测试集上获得最高76.9%的准确率。 展开更多
关键词 句子填空 句法分析 序列建模 深度学习
下载PDF
少数民族文字文本分析与识别的研究进展
8
作者 王维兰 胡金水 +8 位作者 魏宏喜 库尔班·吾布力 邵文苑 毕晓君 贺建军 李振江 丁凯 金连文 高良才 《中国图象图形学报》 CSCD 北大核心 2024年第6期1685-1713,共29页
对于少数民族古籍的保护与传承,国家予以高度重视,并强调了对这些不可再生文化资源透彻数字化的重要性。随着文档图像分析与识别技术的不断进步,对少数民族文字的文本分析与识别研究受到广泛关注,并取得显著成就,成为人工智能应用研究... 对于少数民族古籍的保护与传承,国家予以高度重视,并强调了对这些不可再生文化资源透彻数字化的重要性。随着文档图像分析与识别技术的不断进步,对少数民族文字的文本分析与识别研究受到广泛关注,并取得显著成就,成为人工智能应用研究的一个热点领域。然而,由于少数民族文字种类繁多、应用场景多样及数据集的稀缺性等问题,这一研究领域仍面临诸多挑战。本文旨在总结先前的工作,并为未来的研究提供支持,重点讨论了印刷体文本、联机手写、古籍文档及场景文字识别等任务,概述了国内外在少数民族文种识别领域的发展和最新成果。首先阐明了少数民族文字文本分析与识别的重要性及其价值,介绍了特定少数民族文字及其古籍文档的特征。然后,回顾了这一领域的发展历史和现状,分析并总结了传统方法的代表性成果及其应用;详细讨论了研究重点向深度神经网络模型和深度学习方法的全面转移,这一转变使得各文种的识别性能得到了显著提升。最后,基于相关分析,本文指出了在不同文种文档分析与识别中存在的精度和泛化能力等方面的不足,以及与汉文文本分析与识别的差异;面对少数民族文字文本识别领域的主要困难与挑战,展望了未来的研究趋势和技术发展目标。 展开更多
关键词 少数民族文字 文档分析与识别 印刷体文本识别 手写识别 古籍文档识别 场景文字识别
原文传递
Discriminative explicit instance selection for implicit discourse relation classification
9
作者 Wei SONG Hongfei HAN +4 位作者 Xu HAN Miaomiao CHENG Jiefu GONG Shijin WANG Ting LIU 《Frontiers of Computer Science》 SCIE EI CSCD 2024年第4期129-138,共10页
Discourse relation classification is a fundamental task for discourse analysis,which is essential for understanding the structure and connection of texts.Implicit discourse relation classification aims to determine th... Discourse relation classification is a fundamental task for discourse analysis,which is essential for understanding the structure and connection of texts.Implicit discourse relation classification aims to determine the relationship between adjacent sentences and is very challenging because it lacks explicit discourse connectives as linguistic cues and sufficient annotated training data.In this paper,we propose a discriminative instance selection method to construct synthetic implicit discourse relation data from easy-to-collect explicit discourse relations.An expanded instance consists of an argument pair and its sense label.We introduce the argument pair type classification task,which aims to distinguish between implicit and explicit argument pairs and select the explicit argument pairs that are most similar to natural implicit argument pairs for data expansion.We also propose a simple label-smoothing technique to assign robust sense labels for the selected argument pairs.We evaluate our method on PDTB 2.0 and PDTB 3.0.The results show that our method can consistently improve the performance of the baseline model,and achieve competitive results with the state-of-the-art models. 展开更多
关键词 discourse analysis PDTB discourse relation implicit discourse relation classification data expansion
原文传递
Promoting interactions between cognitive science and large language models
10
作者 Youzhi Qu Penghui Du +10 位作者 Wenxin Che Chen Wei Chi Zhang Wanli Ouyang Yatao Bian Feiyang Xu Bin Hu Kai Du Haiyan Wu Jia Liu Quanying Liu 《The Innovation》 EI 2024年第2期9-10,共2页
Large language models(LLMs)have made unprecedented progress,demonstrating human-like language proficiency and an extraordinary ability to encode complex knowledge.The emergence of high-level cognitive capabilities in ... Large language models(LLMs)have made unprecedented progress,demonstrating human-like language proficiency and an extraordinary ability to encode complex knowledge.The emergence of high-level cognitive capabilities in LLMs,such as in-context learning and complex reasoning,suggests a path toward the realization of artificial general intelligence(AGI).However,we lack scientific theories and tools to assess and interpret such an emergence of the advanced intelligence of LLMs.Artificial intelligence(AI)has been extensively applied in various areas of fundamental science to accelerate scientific research. 展开更多
关键词 COGNITIVE SUCH LANGUAGE
原文传递
神经网络分类算法驱动的口译教学语料难度分级系统
11
作者 刘晨璇 王吟颖 +1 位作者 李小喜 戴礼荣 《中国翻译》 北大核心 2023年第3期71-80,190,共11页
教学语料设计是口译教学的重要组成部分。学界对口译教材建设的现状和语料难度影响因素有一定的研究,但影响难度的变量众多且关系复杂,难度划分主要依赖于专家经验,缺乏统一、可靠的分级标准。从机器学习的角度看,教学语料的难度分级可... 教学语料设计是口译教学的重要组成部分。学界对口译教材建设的现状和语料难度影响因素有一定的研究,但影响难度的变量众多且关系复杂,难度划分主要依赖于专家经验,缺乏统一、可靠的分级标准。从机器学习的角度看,教学语料的难度分级可视为一个分类问题。本文使用RoBERTa预训练模型构建神经网络系统,通过对286段语料进行人工标注再使用数据增强和知识蒸馏技术扩充数据集的方法,开发了一套基于机器学习的教学语料难度自动分级系统。该系统可以根据输入的源语语料自动输出其难度分级结果,帮助教师和学习者更好地开展课堂教学和自主学习。 展开更多
关键词 教材 教学语料库 难度 分类算法 RoBERTa 数据增强
原文传递
英语口语自动评测新方法——中国学生英语朗读自动评测系统 被引量:15
12
作者 陈桦 吴奎 李景娜 《外语电化教学》 CSSCI 北大核心 2019年第1期72-77,共6页
自动评测可以弥补人工评测主观性较强、费时费力等不足,但目前仍存在评测项涵盖不够全面、技术层面和语言学层面结合不够紧密等问题。为此,本研究开发了中国学生英语朗读自动评测系统,其特点体现在语音评测项、评分方式、人工专家的作... 自动评测可以弥补人工评测主观性较强、费时费力等不足,但目前仍存在评测项涵盖不够全面、技术层面和语言学层面结合不够紧密等问题。为此,本研究开发了中国学生英语朗读自动评测系统,其特点体现在语音评测项、评分方式、人工专家的作用、技术模型等方面。此外,该系统基于中国英语学习者语音数据库,评测对象更具针对性。本系统的研发与不断优化对语言评测动态体系的构建及口语自动评测技术的发展具有重要的理论和实践意义。 展开更多
关键词 朗读口语 自动评测 动态评测体系
原文传递
Leveraging proficiency and preference for online Karaoke recommendation 被引量:3
13
作者 Ming HE Hao GUO +4 位作者 Guangyi LV Le WU Yong GE Enhong CHEN Haiping MA 《Frontiers of Computer Science》 SCIE EI CSCD 2020年第2期273-290,共18页
Recently,many online Karaoke(KTV)platforms have been released,where music lovers sing songs on these platforms.In the meantime,the system automatically evaluates user proficiency according to their singing behavior.Re... Recently,many online Karaoke(KTV)platforms have been released,where music lovers sing songs on these platforms.In the meantime,the system automatically evaluates user proficiency according to their singing behavior.Recommending approximate songs to users can initialize singers5 participation and improve users,loyalty to these platforms.However,this is not an easy task due to the unique characteristics of these platforms.First,since users may be not achieving high scores evaluated by the system on their favorite songs,how to balance user preferences with user proficiency on singing for song recommendation is still open.Second,the sparsity of the user-song interaction behavior may greatly impact the recommendation task.To solve the above two challenges,in this paper,we propose an informationfused song recommendation model by considering the unique characteristics of the singing data.Specifically,we first devise a pseudo-rating matrix by combing users’singing behavior and the system evaluations,thus users'preferences and proficiency are leveraged.Then we mitigate the data sparsity problem by fusing users*and songs'rich information in the matrix factorization process of the pseudo-rating matrix.Finally,extensive experimental results on a real-world dataset show the effectiveness of our proposed model. 展开更多
关键词 KTV matrix FACTORIZATION RECOMMENDATION system
原文传递
Enriching Context Information for Entity Linking with Web Data
14
作者 Yi-Ting Wang Jie Shen +6 位作者 Zhi-Xu Li Qiang Yang An Liu Peng-Peng Zhao Jia-Jie Xu Lei Zhao Xun-Jie Yang 《Journal of Computer Science & Technology》 SCIE EI CSCD 2020年第4期724-738,共15页
Entity linking(EL)is the task of determining the identity of textual entity mentions given a predefined knowledge base(KB).Plenty of existing efforts have been made on this task using either"local"informatio... Entity linking(EL)is the task of determining the identity of textual entity mentions given a predefined knowledge base(KB).Plenty of existing efforts have been made on this task using either"local"information(contextual information of the mention in the text),or"global"information(relations among candidate entities).However,either local or global information might be insufficient especially when the given text is short.To get richer local and global information for entity linking,we propose to enrich the context information for mentions by getting extra contexts from the web through web search engines(WSE).Based on the intuition above,two novel attempts are made.The first one adds web-searched results into an embedding-based method to expand the mention's local information,where we try two different methods to help generate high-quality web contexts:one is to apply the attention mechanism and the other is to use the abstract extraction method.The second one uses the web contexts to extend the global information,i.e.,finding and utilizing more extra relevant mentions from the web contexts with a graph-based model.Finally,we combine the two models we propose to use both extended local and global information from the extra web contexts.Our empirical study based on six real-world datasets shows that using extra web contexts to extend the local and the global information could effectively improve the F1 score of entity linking. 展开更多
关键词 ENTITY LINKING web search engine (WSE) attention mechanism ABSTRACT extraction
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部