期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
Orthographic,Semantic,and Contextual Influences on Initial Processing and Learning of Novel Words During Reading:Evidence From Eye Movements 被引量:2
1
作者 Wei YI Shiyi LU Robert DEKEYSER 《Chinese Journal of Applied Linguistics》 2022年第2期194-219,316,317,共28页
This study investigates how orthographic,semantic and contextual variables—including word length,concreteness,and contextual support—impact on the processing and learning of new words in a second language(L2)when fi... This study investigates how orthographic,semantic and contextual variables—including word length,concreteness,and contextual support—impact on the processing and learning of new words in a second language(L2)when first encountered during reading.Students learning English as a foreign language(EFL)were recruited to read sentences for comprehension,embedded with unfamiliar L2 words that occurred once.Immediately after this,they received a form recognition test,a meaning recall test,and a meaning recognition test.Eye-movement data showed significant effects of word length on both early and late processing of novel words,along with effects of concreteness only on late-processing eye-tracking measures.Informative contexts were read slower than neutral contexts,yet contextual support did not show any direct influence on the processing of novel words.Interestingly,initial learning of abstract words was better than concrete words in terms of form and meaning recognition.Attentional processing of novel L2 words,operationalized by total reading time,positively predicted L2 learners’recognition of new orthographic forms.Taken together,these results suggest:1)orthographic,semantic and contextual factors play distinct roles for initial processing and learning of novel words;2)online processing of novel words contributes to L2 learners’initial knowledge of unfamiliar lexical items acquired from reading. 展开更多
关键词 word processing/learning wordlength CONCRETENESS contextual support eye tracking
下载PDF
基于NLP技术的知识问答服务系统探索与实践 被引量:1
2
作者 李爽 罗钊航 +2 位作者 田甜 赵珊 康乔 《信息技术》 2024年第3期175-179,187,共6页
针对职工在日常工作环境中遇到各类经验问题、共性问题只能靠经验或问询他人而缺乏一个标准的咨询平台的现状,在详细梳理了问题产生的原因和特点后,结合各类业务场景设计了一种基于自然语言处理技术的FAQ问答系统。通过将现有的经验知... 针对职工在日常工作环境中遇到各类经验问题、共性问题只能靠经验或问询他人而缺乏一个标准的咨询平台的现状,在详细梳理了问题产生的原因和特点后,结合各类业务场景设计了一种基于自然语言处理技术的FAQ问答系统。通过将现有的经验知识、分散在各部门各人员头脑中的隐性知识集合起来,形成标准化的知识文件构建知识库。设计语义问答模型、设计人机交互模型,构建问题语料库和答案库,利用分词技术、句向量训练算法、文本相似度算法分析用户的提问并匹配答案,为科研工作者提供了一个全面、即时的咨询引导平台。 展开更多
关键词 问答系统 知识服务 自然语言处理 分词 相似度计算
下载PDF
基于Word工艺文件的生产系统集成平台研究
3
作者 张炜 《机械与电子》 2005年第12期65-68,共4页
为了复用工艺信息,研究了基于Word工艺文件的生产系统集成平台的体系结构和关键技术.该平台将工艺信息导出至Excel和数据库,以便作业计划人员和检验人员共享工艺信息,从而快速编制各类生产计划和进行现场作业控制.最后,结合具体的实例... 为了复用工艺信息,研究了基于Word工艺文件的生产系统集成平台的体系结构和关键技术.该平台将工艺信息导出至Excel和数据库,以便作业计划人员和检验人员共享工艺信息,从而快速编制各类生产计划和进行现场作业控制.最后,结合具体的实例阐明了该平台的应用过程. 展开更多
关键词 VBA word工艺文件 生产系统集成
下载PDF
NLP题库考试系统的设计与实现
4
作者 宋如昕 莫佳琦 王俊 《信息与电脑》 2023年第2期160-162,共3页
随着自然语言处理(Natural Language Processing,NLP)技术的发展,其对各行各业的发展注入了新的动力,同时在网络教育快速发展的背景下,二者的有机融合也便成为热点。本文提出基于浏览器/服务器(Browser/Server,B/S)模式,通过建立录题模... 随着自然语言处理(Natural Language Processing,NLP)技术的发展,其对各行各业的发展注入了新的动力,同时在网络教育快速发展的背景下,二者的有机融合也便成为热点。本文提出基于浏览器/服务器(Browser/Server,B/S)模式,通过建立录题模板实现对试题的分割和录入,借助Textrank4zh和word2vec模块,建立以TextRank算法为基础的隐马尔可夫模型完成组卷功能,完成以Vue.js框架为前端和Flask框架为后端的题库考试系统的设计与实现。该项目在减轻教师工作量的同时可更好地考察学生知识掌握的程度。 展开更多
关键词 自然语言处理(NLP) 题库考试系统 TextRank 关键词提取 词向量 基于浏览器/服务器(B/S)
下载PDF
书版系统排报纸·机构图·造字 被引量:2
5
作者 潘伟 黄扬铭 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 1997年第5期688-692,共5页
简要分析流行的多种文字处理系统的优缺点.通过大量实例,讨论了如何利用北大方正书版系统实现排报纸,造字和机构图的功能.
关键词 文字处理 排版 机构图 书版系统 报纸 造字
下载PDF
基于K-最近距离的自动文本分类的研究 被引量:13
6
作者 孙健 王伟 钟义信 《北京邮电大学学报》 EI CAS CSCD 北大核心 2001年第1期42-46,共5页
提出并实现了利用统计词频信息和语言信息相结合的方法选择特征 ,计算特征的权重值时不仅考虑词频 ,还利用了特征的集中度、分散度 .经过训练和统计对每一类文本形成特征的权重向量 ,利用 K-最近距离的方法对测试集进行分类 .对英文文... 提出并实现了利用统计词频信息和语言信息相结合的方法选择特征 ,计算特征的权重值时不仅考虑词频 ,还利用了特征的集中度、分散度 .经过训练和统计对每一类文本形成特征的权重向量 ,利用 K-最近距离的方法对测试集进行分类 .对英文文本的测试结果表明 。 展开更多
关键词 自然语言理解 向量空间模型 K-最近距离 自动文本分类
下载PDF
串频统计和词形匹配相结合的汉语自动分词系统 被引量:65
7
作者 刘挺 吴岩 王开铸 《中文信息学报》 CSCD 北大核心 1998年第1期17-25,共9页
本文介绍了一种汉语自动分词软件系统,该系统对原文进行三遍扫描:第一遍,利用切分标记将文本切分成汉字短串的序列;第二遍,根据各短串的每个子串在上下文中的频度计算其权值,权值大的子串视为候选词;第三遍,利用候选词集和一部... 本文介绍了一种汉语自动分词软件系统,该系统对原文进行三遍扫描:第一遍,利用切分标记将文本切分成汉字短串的序列;第二遍,根据各短串的每个子串在上下文中的频度计算其权值,权值大的子串视为候选词;第三遍,利用候选词集和一部常用词词典对汉字短串进行切分。实验表明,该分词系统的分词精度在1.5%左右,能够识别大部分生词。 展开更多
关键词 中文信息处理 自动分词 汉语 串频统计 词形匹配
下载PDF
基于多特征的自适应新词识别 被引量:14
8
作者 罗智勇 宋柔 《北京工业大学学报》 EI CAS CSCD 北大核心 2007年第7期718-725,共8页
为提高自动分词系统对未登录词的识别性能,提出和实现了一种基于多特征的自适应新词识别方法,综合考虑了被处理文本中重复字符串的上下文统计特征(上下文熵)、内部耦合特征(似然比)、背景语料库对比特征(相关频率比值)以及自动分词系统... 为提高自动分词系统对未登录词的识别性能,提出和实现了一种基于多特征的自适应新词识别方法,综合考虑了被处理文本中重复字符串的上下文统计特征(上下文熵)、内部耦合特征(似然比)、背景语料库对比特征(相关频率比值)以及自动分词系统辅助的边界确认信息等,并直接从被抽取文本中自动训练识別模型.同时,新词识别过程在字串PAT-Array数据结构上进行,可以抽取任意长度的新词语.实验结果表明,该方法新词发现速度快、节省存储空间. 展开更多
关键词 自然语言处理系统 计算语言学 词语处理 新词识别 多特征 自适应 自动分词
下载PDF
三字节内码汉字及西夏文字处理系统的设计与实现 被引量:1
9
作者 丁志义 马希荣 《宁夏大学学报(自然科学版)》 CAS 1999年第4期356-358,共3页
详细介绍了一个基于三字节内码汉字及西夏文字处理系统的设计与实现过程,讨论了该系统大字符集的编码方案及多字节字符集的输入、输出技术。
关键词 西夏字 汉字 文字处理系统 三字节内码 设计
下载PDF
过程响应理论及其在湖相碳酸盐岩中的应用——以辽河西部凹陷中北部地区Es_4为例 被引量:5
10
作者 王青春 贺萍 +2 位作者 王对兴 危宇宁 武新民 《中国地质》 CAS CSCD 北大核心 2016年第1期338-348,共11页
过程响应理论是在地球系统科学基础上提出的一种盆地沉积学研究方法,主要包括过程研究和响应研究两个方面,强调盆地演化过程对其沉积过程的控制意义。论文运用过程响应理论对辽河坳陷西部凹陷中北部地区Es4碳酸盐岩进行了研究,取得了很... 过程响应理论是在地球系统科学基础上提出的一种盆地沉积学研究方法,主要包括过程研究和响应研究两个方面,强调盆地演化过程对其沉积过程的控制意义。论文运用过程响应理论对辽河坳陷西部凹陷中北部地区Es4碳酸盐岩进行了研究,取得了很好的效果。研究表明,湖相碳酸盐岩的形成和分布在时间和空间上受湖盆演化过程控制明显,有利的地形和水动力条件、有利的气候和水介质条件、有利的物源和白云岩化条件,这三个关键要素,共同铸就了辽河坳陷西部凹陷中北部地区Es4湖相碳酸盐岩的沉积环境。运用过程响应理论,综合考虑碳酸盐岩沉积作用关键三要素,是建立更具指导作用和更具参考价值的湖相碳酸盐岩综合沉积模式的基础。 展开更多
关键词 地球系统科学 过程响应理论 碳酸盐岩 辽河坳陷 沉积模式
下载PDF
现代汉语通用分词系统中歧义切分的实用技术 被引量:19
11
作者 罗智勇 宋柔 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期1122-1128,共7页
歧义切分技术是中文自动分词系统的关键技术之一·特别是在现代汉语通用分词系统(GPWS)中,允许用户动态创建词库、允许多个用户词库同时参与切分,这给歧义切分技术提出了更高的实用性要求·从大规模的真实语料库中,考察了歧义(... 歧义切分技术是中文自动分词系统的关键技术之一·特别是在现代汉语通用分词系统(GPWS)中,允许用户动态创建词库、允许多个用户词库同时参与切分,这给歧义切分技术提出了更高的实用性要求·从大规模的真实语料库中,考察了歧义(特别是交集型歧义)的分布情况和特征;提出了一种改进的正向最大匹配歧义字段发现算法;并根据GPWS的需求,提出了一种“规则+例外”的实用消歧策略·对1亿字《人民日报》语料(约234MB)中的交集型歧义字段进行了穷尽式的抽取,并随机的对上述策略进行了开放性测试,正确率达99%· 展开更多
关键词 中文信息处理 通用分词系统 歧义切分
下载PDF
基于Jieba分词的医疗设备信息查询一站式服务系统设计 被引量:5
12
作者 王清波 陈青青 王琳斌 《中国医学装备》 2020年第1期131-134,共4页
目的:设计基于Jieba分词的医疗设备信息查询一站式服务微信平台,以方便临床一线人员查询与梳理医疗设备信息相关资料、标准及各种资讯。方法:建立基于Jieba分词的微信平台系统架构,采用Python的Wxpy模块进行系统设计。使用Jieba分词进... 目的:设计基于Jieba分词的医疗设备信息查询一站式服务微信平台,以方便临床一线人员查询与梳理医疗设备信息相关资料、标准及各种资讯。方法:建立基于Jieba分词的微信平台系统架构,采用Python的Wxpy模块进行系统设计。使用Jieba分词进行消息处理,设计基于微信的聊天机器人,利用Python语句进行资料反馈和数据库查询。结果:基于微信的聊天机器人可提供设备管理相关资料的精准查询,能够在临床自然语言要求下,进行同质化答复管理。医疗设备资产库备有1万余条数据集,设定文件大小最大<10 M,查询设备资产的返回时间<2 s。结论:医疗设备信息查询一站式服务微信平台系统的设计,能够针对临床文字需求进行同质化答复,既可方便临床一线人员查询设备信息相关资料,还可有效提高医疗设备的管理效率。 展开更多
关键词 医疗设备信息查询系统 微信 自然语言处理 Jieba分词 数据库 一站式服务
下载PDF
基于双数组Trie树中文分词研究 被引量:16
13
作者 赵欢 朱红权 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第5期77-80,共4页
对双数组Trie树(Double-Array Trie)分词算法进行了优化:在采用Trie树构造双数组Trie树的过程中,优先处理分支节点多的结点,以减少冲突;构造一个空状态序列;将冲突的结点放入Hash表中,不需要重新分配结点.然后,利用这些方法构造了一个... 对双数组Trie树(Double-Array Trie)分词算法进行了优化:在采用Trie树构造双数组Trie树的过程中,优先处理分支节点多的结点,以减少冲突;构造一个空状态序列;将冲突的结点放入Hash表中,不需要重新分配结点.然后,利用这些方法构造了一个中文分词系统,并与其他几种分词方法进行对比,结果表明,优化后的双数组Trie树插入速度和空间利用率得到了很大提高,且分词查询效率也得到了提高. 展开更多
关键词 自然语言处理 双数组 TRIE树 词典 分词
下载PDF
智能文字处理系统的研究
14
作者 高鹏翔 李天恒 《系统工程与电子技术》 EI CSCD 1999年第8期55-56,共2页
针对当前计算机文字处理系统存在的功能缺陷,讨论了计算机文字处理系统的发展方向,提出了新一代智能文字处理系统的功能及实现技术。
关键词 文字处理系统 计算机 智能型 办公自动化
下载PDF
一种网络课程答疑系统分词器的设计 被引量:1
15
作者 李龙 李丽丽 高玲 《河北工程大学学报(自然科学版)》 CAS 2012年第2期68-70,共3页
针对网络课程答疑系统提出了一种新的分词词典和查询算法,借鉴了现有三类分词算法的优点,克服了它们的不足,所设计的分词词典包括专业词典和基础词典两部分,所设计的算法在分词词典中搜索时,先搜索基础词典,后搜索专业词典,如果在基础... 针对网络课程答疑系统提出了一种新的分词词典和查询算法,借鉴了现有三类分词算法的优点,克服了它们的不足,所设计的分词词典包括专业词典和基础词典两部分,所设计的算法在分词词典中搜索时,先搜索基础词典,后搜索专业词典,如果在基础词典中搜索出单词,则不继续搜索专业词典,该算法大大降低了算法的时间复杂度。本文将分词词典设计成由首字和次字构成的二维索引矩阵,和全部词语的有序顺序表组成,将单字的内码作为其在矩阵中的下标,对有序顺序表采用顺序查找,减少了词典搜索次数。 展开更多
关键词 自然语言处理 答疑系统 分词 网络课程
下载PDF
《现代汉语语义分类词典》(TMC)研制中若干问题的思考 被引量:18
16
作者 苏新春 《中文信息学报》 CSCD 北大核心 2008年第5期12-21,共10页
《现代汉语语义分类词典》继承了《同义词词林》概念分类的传统,以反映一个社会的生活全貌及认识观念的概念关系为目的,收录了8万余条现代汉语通用性较高的语文词语,建构出了一个五级语义分类体系,里面包括9个一级类,62个二级类,518个... 《现代汉语语义分类词典》继承了《同义词词林》概念分类的传统,以反映一个社会的生活全貌及认识观念的概念关系为目的,收录了8万余条现代汉语通用性较高的语文词语,建构出了一个五级语义分类体系,里面包括9个一级类,62个二级类,518个三级类,2 076个四级类,12 613个五级类。所建构的义类关系,注重上位语义层对下位语义层有较强控制力,下位语义层对上位语义层的义域能全面覆盖,左右语义类具有互补对应的功能。 展开更多
关键词 计算机应用 中文信息处理 语义分类词典 词汇系统 主题词
下载PDF
抄袭论文识别研究与进展 被引量:36
17
作者 史彦军 滕弘飞 金博 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第1期50-57,共8页
抄袭论文识别研究对于净化学术风气、保护知识产权具有重要意义.国外对于抄袭论文(英文)识别技术与系统的研究已有多年历史,并取得一定进展,而国内发表的相关文献尚少.综述了抄袭论文识别技术,如数字指纹和词频统计等技术;介绍了相关识... 抄袭论文识别研究对于净化学术风气、保护知识产权具有重要意义.国外对于抄袭论文(英文)识别技术与系统的研究已有多年历史,并取得一定进展,而国内发表的相关文献尚少.综述了抄袭论文识别技术,如数字指纹和词频统计等技术;介绍了相关识别系统,如siff、COPS、dSCAM、KOALA和Check等;分析了各抄袭识别技术特点及应用范围.最后结合中文学术论文的特点,从应用角度出发,讨论了若干待解决的关键问题及发展趋势. 展开更多
关键词 学术论文 知识产权 识别 数字指纹 词频 论文抄袭行为
下载PDF
一种改进的语音识别词错误率评估算法
18
作者 吴边 兰时勇 刘重庆 《红外与激光工程》 EI CSCD 北大核心 2005年第1期106-109,共4页
在建立语音识别系统的过程中错误率评估起着非常重要的作用,传统的词错误率算法仅仅是基于最小错误率,具有显著的缺陷,因而不能准确评估系统的错误率。提出一种改进的基于最小错误率和时间信息的词错误率评估算法,能够准确评估系统的错... 在建立语音识别系统的过程中错误率评估起着非常重要的作用,传统的词错误率算法仅仅是基于最小错误率,具有显著的缺陷,因而不能准确评估系统的错误率。提出一种改进的基于最小错误率和时间信息的词错误率评估算法,能够准确评估系统的错误率,为声学模型的优化提供指导,同时列举了该评估算法在建立语音识别系统过程中的应用。 展开更多
关键词 模式识别 词错误率 时间信息 语音识另1
下载PDF
基于网络和通用字处理软件的文档协同编著系统
19
作者 马智亮 李勇鹤 李恒 《计算机工程》 EI CAS CSCD 北大核心 2006年第13期254-256,268,共4页
在实际过程中,多人协同编著同一份文档的情况普遍存在。以建设领域为例,各种项目建议书、可行性研究报告等都需要多人协同完成。但是,目前常用的文档编辑软件均未对多人协同编著提供支持。为此,该文在分析相关研究的基础上,提出了一个... 在实际过程中,多人协同编著同一份文档的情况普遍存在。以建设领域为例,各种项目建议书、可行性研究报告等都需要多人协同完成。但是,目前常用的文档编辑软件均未对多人协同编著提供支持。为此,该文在分析相关研究的基础上,提出了一个基于网络和通用字处理软件开发文档协同编著系统模型,并开发了原型系统,为文档协同编著系统的开发提供了一条新途径。 展开更多
关键词 文档 协同系统 文档编辑 字处理
下载PDF
语义透明度和构词频率对汉语动词多词素词识别的影响 被引量:11
20
作者 王娟 张积家 许锦宇 《心理与行为研究》 CSSCI 2014年第6期769-774,共6页
采用重复启动范式,通过两个实验,考察语义透明度和词素构词频率对动词多词素词识别的影响。结果发现:(1)语义透明度影响多词素动词的识别,识别高语义透明度的动词快于识别低语义透明度的动词。(2)词素的构词频率影响低语义透明度动词的... 采用重复启动范式,通过两个实验,考察语义透明度和词素构词频率对动词多词素词识别的影响。结果发现:(1)语义透明度影响多词素动词的识别,识别高语义透明度的动词快于识别低语义透明度的动词。(2)词素的构词频率影响低语义透明度动词的识别,不影响高语义透明度动词的识别。对低语义透明动词,词素的构词频率低的动词的反应时显著短于词素的构词频率高的动词。研究结果支持汉语多词素词的多层次双系统选择加工模型。 展开更多
关键词 动词多词素词 语义透明度 构词频率 多层次双系统选择加工模型
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部