期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
机器学习在汉语关联词语识别中的应用 被引量:7
1
作者 高维君 姚天顺 +2 位作者 黎邦洋 陈伟光 邹嘉彦 《中文信息学报》 CSCD 北大核心 2000年第3期1-8,共8页
关联词语在一些汉语议论文章中占很大的比重 ,因而 ,对于此类汉语文章的分析 ,关联词可以起到非常重要的作用。本文主要讨论如何将机器学习应用于汉语关联词的歧义辨别———原因 ,方法和效果。我们在已经加工完毕的 80篇汉语语料的基础... 关联词语在一些汉语议论文章中占很大的比重 ,因而 ,对于此类汉语文章的分析 ,关联词可以起到非常重要的作用。本文主要讨论如何将机器学习应用于汉语关联词的歧义辨别———原因 ,方法和效果。我们在已经加工完毕的 80篇汉语语料的基础上 ,抽取了用于机器学习的训练集和测试集 ,并使用C4.5进行了测试 ,识别正确率在 80 %以上。在文章的后面 ,我们还从语言学的角度对机器学习的结果进行了解释和分析。 展开更多
关键词 机器学习 关联词语识别 语料库 汉语 歧义问题
下载PDF
基于OVR-SVM及fMRI的词语识别认知状态分类研究 被引量:1
2
作者 何享 张笑非 《计算机与数字工程》 2021年第6期1158-1162,共5页
词语识别是人脑的一种高级认知过程。论文基于OpenfMRI开源数据集,利用脑图Dosenbach进行特征提取,采用OVR-SVM作为分类器对词语识别及相关认知状态进行了分类器的训练,使用分层K折交叉验证和ROC曲线对分类器进行了性能评估。实验结果显... 词语识别是人脑的一种高级认知过程。论文基于OpenfMRI开源数据集,利用脑图Dosenbach进行特征提取,采用OVR-SVM作为分类器对词语识别及相关认知状态进行了分类器的训练,使用分层K折交叉验证和ROC曲线对分类器进行了性能评估。实验结果显示,采用线性核、多项式核、RBF核、以及Sigmoid核的几种OVR-SVM中,RBF核的分类性能在统计上都显著高于其他三种核对应的SVM。实验结果表明,OVR-SVM作为一种计算模型可以有助于对词语识别认知状态的识别。 展开更多
关键词 词语识别 OVR支持向量机 功能磁共振成像 Dosenbach脑图 ROC曲线
下载PDF
词语识别认知过程中的脑功能网络研究
3
作者 何享 张笑非 《软件》 2019年第12期110-114,共5页
词语识别是心理语言学研究领域的一个重要方面,基于脑功能网络连接模式的研究有助于对其神经机制的揭示。本文基于开源词语识别fMRI实验数据,首先利用人脑解剖学模板AAL分别构建真词试验时和辅音字符串试验时的脑功能网络,然后采用图论... 词语识别是心理语言学研究领域的一个重要方面,基于脑功能网络连接模式的研究有助于对其神经机制的揭示。本文基于开源词语识别fMRI实验数据,首先利用人脑解剖学模板AAL分别构建真词试验时和辅音字符串试验时的脑功能网络,然后采用图论分析中的度中心性对AAL中的90个脑区进行活跃度度量,最后使用T检验对两种试验条件下各脑区的活跃度进行了统计对比。实验结果显示,真词试验时脑功能网络中分布在距状裂周围皮层、舌回、枕上回、枕中回、枕下回、顶上回的9个脑区的度中心性显著高于辅音字符串试验时的情况。实验结果表明,人脑在识别具有语义信息的词语时,大脑皮层的各个区域更加趋于协作,显著活跃的脑区能够作为词语识别进一步研究的生物标记。 展开更多
关键词 词语识别 脑功能网络 图论分析 度中心性
下载PDF
视觉词语识别任务下左右脑功能网络局部形态的分化 被引量:1
4
作者 张笑非 杨阳 钟宁 《北京工业大学学报》 CAS CSCD 北大核心 2022年第7期773-782,共10页
为研究任务态下视觉词语识别时左右脑功能网络之间的拓扑形态差异,使用OpenfMRI开放项目“词语与对象处理”的45名被试tfMRI数据,分别构造单词条件和辅音字符串条件下基于解剖学脑图自动解剖标记(automated anatomical labelling, AAL)... 为研究任务态下视觉词语识别时左右脑功能网络之间的拓扑形态差异,使用OpenfMRI开放项目“词语与对象处理”的45名被试tfMRI数据,分别构造单词条件和辅音字符串条件下基于解剖学脑图自动解剖标记(automated anatomical labelling, AAL)的左右脑功能网络,对2个半脑的度中心性、全局效率、聚类系数和局部效率进行统计对比,并考察AAL的兴趣点(region of interest, ROI)与功能脑图Willard-499语言网络的关系. 2种实验条件下左右脑网络指标在稀疏度定义域差异均有统计学意义,其中辅音字符串实验条件下4个指标统计学差异占比分别为0、0、0、0,单词条件下分别为0、5%、0、44%,单词条件下聚类系数与局部效率差异占比存在反差.左右脑功能网络在进行单词识别时存在局部形态的分化. 展开更多
关键词 视觉词语识别 任务诱发功能磁共振成像 脑功能网络 局部形态 视觉词形区 大脑图谱对比
下载PDF
图像语言的词语识别
5
作者 张卫 《美术之友》 2006年第3期20-21,共2页
关键词 图像语言 词语识别 语言特征 绘画艺术 创作思维
下载PDF
噪音背景对第二语言学习者汉语词语识别和句子理解的影响 被引量:5
6
作者 张林军 《世界汉语教学》 CSSCI 北大核心 2013年第3期392-399,共8页
研究考察了噪音背景对第二语言学习者汉语言语理解的影响,发现:汉语水平和信噪比都对学习者噪音背景下的汉语言语理解有重要影响,但对词语识别和句子理解的影响却存在一定程度的差异;无论是在安静环境下还是在噪音背景下,学习者词语识... 研究考察了噪音背景对第二语言学习者汉语言语理解的影响,发现:汉语水平和信噪比都对学习者噪音背景下的汉语言语理解有重要影响,但对词语识别和句子理解的影响却存在一定程度的差异;无论是在安静环境下还是在噪音背景下,学习者词语识别和句子理解的成绩都与其声调感知的辨别力指数之间存在显著的正相关。基于上述发现,我们认为课堂教学应该适当安排类似真实场景的交际活动以及通过更加有效的教学方法提高声调知觉能力,从而改善学习者噪音环境下的言语理解能力。 展开更多
关键词 噪音背景 词语识别 句子理解 第二语言学习者
原文传递
熟词误读:阅读中词语正确识别的影响因素研究
7
作者 李海峰 王炜 《现代中小学教育》 2015年第9期71-76,共6页
采用对比实验的研究方法,将小学六年级38名学生随机分为3组,进行词语识别测验。三组学生的阅读测验方式分别为:"无提示"组、"提示"组和"协作讨论"组。研究结果表明:思维定势显著影响学生词语的正确识别;... 采用对比实验的研究方法,将小学六年级38名学生随机分为3组,进行词语识别测验。三组学生的阅读测验方式分别为:"无提示"组、"提示"组和"协作讨论"组。研究结果表明:思维定势显著影响学生词语的正确识别;外部信息提示能够有效地提高词语认读的准确性;阅读时间长度与词语识别正确率呈现负相关;有效的阅读形式对学生词语识别具有显著的促进作用。 展开更多
关键词 熟词误读 词语识别 思维定势 认知结构 阅读教学
下载PDF
融合直推式学习和语义理解的词语倾向性识别
8
作者 闻彬 饶彬 +2 位作者 赵君喆 焦翠珍 戴文华 《计算机技术与发展》 2016年第1期74-77,共4页
目前词语情感倾向性识别研究主要分为机器学习和语义理解,机器学习不能很好地识别通用领域词语,语义理解又存在准确率和召回率不够高的问题,因此文中提出了一种融合直推式学习和语义理解的词语倾向性识别方法。首先对HowNet知识库体系... 目前词语情感倾向性识别研究主要分为机器学习和语义理解,机器学习不能很好地识别通用领域词语,语义理解又存在准确率和召回率不够高的问题,因此文中提出了一种融合直推式学习和语义理解的词语倾向性识别方法。首先对HowNet知识库体系进行改进,在已有的四种义原的基础上,提出第五义原—情感义原;然后将第五义原手工融入到HowNet知识库中,再在此基础上提出词语情感相似度计算方法计算词语的情感值;最后将该方法融合直推式学习以判定词语情感倾向性。通过实验结果表明,与支持向量机和原语义理解方法相比,该方法在识别情感词上取得了较好的效果。 展开更多
关键词 词语倾向性识别 机器学习 语义理解 意见挖掘 情感义原 HOWNET
下载PDF
基于词内部模式的新词识别 被引量:17
9
作者 林自芳 蒋秀凤 《计算机与现代化》 2010年第11期162-164,167,共4页
提出一种基于词内部模式的新词识别算法,该算法在重复串查找的基础上,结合词内部模式的特征提出改进位置成词概率和首尾单字成词概率的加权,依次判断互信息、邻接类别等统计量,对新词进行识别。通过不同的实验对比发现,该算法在一定程... 提出一种基于词内部模式的新词识别算法,该算法在重复串查找的基础上,结合词内部模式的特征提出改进位置成词概率和首尾单字成词概率的加权,依次判断互信息、邻接类别等统计量,对新词进行识别。通过不同的实验对比发现,该算法在一定程度上能有效提取新词。 展开更多
关键词 词内部模式 词语识别 改进位置成词概率 首尾单字成词概率
下载PDF
不同水平留学生汉语交集型与组合型切分歧义识别实验研究
10
作者 杨万兵 杨峥琳 《语言科学》 CSSCI 北大核心 2016年第3期280-290,共11页
通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显著,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2... 通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显著,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2识别错误率无显著差异,但链长为3时识别错误率显著提高;链长为1时,初级与中级识别错误率相当,链长为2、3时,初级识别错误率高于中级。文章从两类切分歧义特点、汉语水平与链长、动态语境与修改意识等方面分析了造成这些差异的原因,并提出了相应的教学建议。 展开更多
关键词 交集型切分歧义 组合型切分歧义 链长 词语识别 动态语境
下载PDF
外语词语音位表征构建的影响因素与对策 被引量:1
11
作者 姜帆 《佳木斯职业学院学报》 2016年第10期324-325,共2页
启动是词语音位表征构建的认知机制。学习者在听觉识别外语词语上遇到的困难与其利用的启动机制受到外语输入质量和对意义过度关注的双重影响有关。对此,研究者提出了具体的对策以帮助学习者构建正确、牢固的外语词语音位表征以期解决... 启动是词语音位表征构建的认知机制。学习者在听觉识别外语词语上遇到的困难与其利用的启动机制受到外语输入质量和对意义过度关注的双重影响有关。对此,研究者提出了具体的对策以帮助学习者构建正确、牢固的外语词语音位表征以期解决其在外语词语识别上存在的困难。 展开更多
关键词 听觉启动 外语词语 音位表征 词语识别
下载PDF
一种改进的基于《知网》的词语语义相似度计算 被引量:109
12
作者 江敏 肖诗斌 +1 位作者 王弘蔚 施水才 《中文信息学报》 CSCD 北大核心 2008年第5期84-89,共6页
中科院刘群的基于《知网》的词语相似度计算是当前比较有代表性的计算词语相似度的方法之一。在测试中我们发现对一些存在对义或反义的词语与同义、近义词语一样具有较高的相似度,一些明显相似的词反而相似度较低,如"美丽"与&... 中科院刘群的基于《知网》的词语相似度计算是当前比较有代表性的计算词语相似度的方法之一。在测试中我们发现对一些存在对义或反义的词语与同义、近义词语一样具有较高的相似度,一些明显相似的词反而相似度较低,如"美丽"与"贼眉鼠眼"的相似度为0.814 815,与"优雅"的相似度为0.788 360,"深红"与"粉红"的相似度仅为0.074 074,这将不利于进行词语的极性识别。基于文本情感色彩分析的需要,把词语相似度的取值范围规定为[-1,+1],在刘群论文的基础上,进一步考虑了义原的深度信息,并利用《知网》义原间的反义、对义关系和义原的定义信息来计算词语的相似度。在词语极性识别实验中,得到了较好的实验结果:P值为99.07%,R值为99.11%。 展开更多
关键词 计算机应用 中文信息处理 知网 词语相似度 义原 词语极性识别
下载PDF
一个面向辞典的知识获取系统的设计与实现
13
作者 刘亮亮 李志庆 +1 位作者 孙颖 张再跃(导师) 《计算机技术与发展》 2007年第9期99-101,105,共4页
在知识获取中,手工填槽是一件繁琐而又枯燥的工作,效率很低。针对一类词条的处理提出了一个面向辞典的知识获取系统,通过分析辞典中文本的特征,最大可能地实现了填槽的机器自动生成,该系统分为三个子系统:词语识别子系统、规则匹配子系... 在知识获取中,手工填槽是一件繁琐而又枯燥的工作,效率很低。针对一类词条的处理提出了一个面向辞典的知识获取系统,通过分析辞典中文本的特征,最大可能地实现了填槽的机器自动生成,该系统分为三个子系统:词语识别子系统、规则匹配子系统、运行填槽子系统,完成了文本识别、规则匹配和运行填槽功能。 展开更多
关键词 知识获取 词语识别 产生式规则
下载PDF
基于N元的候选词库的建立 被引量:1
14
作者 李群 《渤海大学学报(自然科学版)》 CAS 2005年第2期134-136,共3页
随着internet的发展,网上各种新词语的创建和发展也超过以往任何时候,新词语的自动识别一直是中文信息处理中的一个热点研究课题,研究了网上新词语的自动识别技术,主要研究内容是利用初加工语料,采用分解策略将N元组候选词库的形成分为... 随着internet的发展,网上各种新词语的创建和发展也超过以往任何时候,新词语的自动识别一直是中文信息处理中的一个热点研究课题,研究了网上新词语的自动识别技术,主要研究内容是利用初加工语料,采用分解策略将N元组候选词库的形成分为预处理、二元候选字段,三元候选字段、四元候选字段几个过程,降低了整体处理难度,提出了一种以规则剔除噪声词串和构词相结合的新词语的识别技术。 展开更多
关键词 网络词语 N元组 词语自动识别
下载PDF
Improved hidden Markov model for speech recognition and POS tagging 被引量:4
15
作者 袁里驰 《Journal of Central South University》 SCIE EI CAS 2012年第2期511-516,共6页
In order to overcome defects of the classical hidden Markov model (HMM), Markov family model (MFM), a new statistical model was proposed. Markov family model was applied to speech recognition and natural language proc... In order to overcome defects of the classical hidden Markov model (HMM), Markov family model (MFM), a new statistical model was proposed. Markov family model was applied to speech recognition and natural language processing. The speaker independently continuous speech recognition experiments and the part-of-speech tagging experiments show that Markov family model has higher performance than hidden Markov model. The precision is enhanced from 94.642% to 96.214% in the part-of-speech tagging experiments, and the work rate is reduced by 11.9% in the speech recognition experiments with respect to HMM baseline system. 展开更多
关键词 hidden Markov model Markov family model speech recognition part-of-speech tagging
下载PDF
不同水平留学生汉语切分歧义识别实验研究 被引量:4
16
作者 杨万兵 蒋利平 《语言教学与研究》 CSSCI 北大核心 2012年第3期10-17,共8页
通过初、中级汉语水平留学生切分歧义识别实验研究,我们发现:(1)切分歧义识别时,汉语水平主效应显著,链长主效应显著;(2)初级学生链长为1和2的识别错误率无显著差异,而中级学生链长为1的识别错误率高于链长为2的;(3)初、中级学生各链长... 通过初、中级汉语水平留学生切分歧义识别实验研究,我们发现:(1)切分歧义识别时,汉语水平主效应显著,链长主效应显著;(2)初级学生链长为1和2的识别错误率无显著差异,而中级学生链长为1的识别错误率高于链长为2的;(3)初、中级学生各链长的修改率和修改正确率都呈"链长2>链长1>链长3"的趋势;(4)切分歧义识别时,中级学生利用语境进行调整的意识和能力均更强,且更多采取自上而下的阅读模式。 展开更多
关键词 切分歧义 链长 词语识别 汉语水平
原文传递
母语语音迁移对外语词语听辨和口语产出的影响 被引量:5
17
作者 姜帆 《解放军外国语学院学报》 CSSCI 北大核心 2016年第5期106-112,160,共7页
本研究采用启动范式和朗读任务考察母语语音迁移对外语词语听辨和口语产出的影响。结果发现,被试利用汉语音位/S/同化英语音位/s/和/θ/,用汉语音位/D/同化英语音位/d/和/e/,并利用/S/和/D/对含有/θ/和/e/的外语词语进行词语听辨和口... 本研究采用启动范式和朗读任务考察母语语音迁移对外语词语听辨和口语产出的影响。结果发现,被试利用汉语音位/S/同化英语音位/s/和/θ/,用汉语音位/D/同化英语音位/d/和/e/,并利用/S/和/D/对含有/θ/和/e/的外语词语进行词语听辨和口语产出。研究表明,母语语音迁移干扰外语词语语音的正确表征,使外语学习者利用母语音位进行外语词语听辨和口语产出。研究结果证实了抽象主义模型对词语识别的解释。 展开更多
关键词 语音迁移 外语词语识别 音位替代 语音表征
原文传递
A Case Study on Intermediate CSL Learners' Word Recognition Processes and Strategies in Contextual Reading Settings 被引量:1
18
作者 Shaoqian Luo Xiaohui SUN 《Chinese Journal of Applied Linguistics》 2018年第3期288-305,396,共19页
This study investigates word recognition processes and strategies of intermediate learners of Chinese as a Second Language (CSL) in contextual reading settings. Two intermediate CSL learners were chosen as research ... This study investigates word recognition processes and strategies of intermediate learners of Chinese as a Second Language (CSL) in contextual reading settings. Two intermediate CSL learners were chosen as research participants, and think-aloud methods and retrospective interviews were used to collect data. The data were analyzed by using Moustakas' data analysis procedure, CresweU's three steps and Bogdon and Biklen's data analysis methods. Results indicated that intermediate CSL learners go through different processes of word recognition as it might be automatic, based on context, pronunciation, previous knowledge and the meaning of characters, or, in case of word recognition failure, skipping the words or skipping them but reading them again later; and their word recognition strategies in contextual reading settings mainly include cognitive strategies and self-regulatory strategies. Among these strategies, cognitive strategies consist of direct transformation, translation, interpretation, guessing, inferring and finding key words; and self-regulatory strategies include metacognitive strategies, behavior regulating strategies, emotion regulating strategies and motivation regulating strategies. A model of intermediate CSL learners' word recognition strategies can be constructed based on the results. The present study provides both theoretical and pedagogical implications in the field of CSL vocabulary acquisition and teaching. 展开更多
关键词 intermediate CSL learners' word recognition processes strategies contextual reading settings
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部