期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
对侧使用助听器对人工耳蜗植入儿童句子识别能力的影响 被引量:3
1
作者 杨影 孙喜斌 +3 位作者 王康 崔芳芳 杨会会 王丽燕 《中国听力语言康复科学杂志》 2015年第1期24-26,共3页
目的:探讨安静环境和噪声环境下,人工耳蜗植入儿童在电声双模式(对侧使用助听器)和电模式(对侧不使用助听器)助听下的句子识别率差异。方法在安静环境和噪声环境中,分别对12例人工耳蜗植入儿童进行句子识别率测试,比较两种助听... 目的:探讨安静环境和噪声环境下,人工耳蜗植入儿童在电声双模式(对侧使用助听器)和电模式(对侧不使用助听器)助听下的句子识别率差异。方法在安静环境和噪声环境中,分别对12例人工耳蜗植入儿童进行句子识别率测试,比较两种助听模式之间的识别率差异。结果在安静环境中,电声双模式助听的人工耳蜗植入儿童句子识别率为77.7%±15.0%,电模式助听下的句子识别率为73.0%±17.2%,两者之间差异显著(P〈0.05);在噪声环境中,电声双模式助听下的句子识别率为60.8%±24.5%,电模式助听下的句子识别率为54.8%±19.7%,两者之间差异显著(P〈0.05)。结论在安静环境和噪声环境中,电声双模式助听的句子识别率均高于电模式助听的句子识别率。 展开更多
关键词 听障儿童 人工耳蜗 安静环境 噪声环境 句子识别
下载PDF
基于N-gram超核的中文倾向性句子识别 被引量:3
2
作者 廖祥文 李艺红 《中文信息学报》 CSCD 北大核心 2011年第5期89-93,100,共6页
倾向性句子识别是文本倾向性分析的重要组成部分,其目的是识别文档中具有情感倾向的主观性句子。中文句子的倾向性不仅与倾向词有关,而且还跟句法、语义等因素有关,这使得倾向性句子识别不能简单地从词语的倾向性来统计得到。该文提出... 倾向性句子识别是文本倾向性分析的重要组成部分,其目的是识别文档中具有情感倾向的主观性句子。中文句子的倾向性不仅与倾向词有关,而且还跟句法、语义等因素有关,这使得倾向性句子识别不能简单地从词语的倾向性来统计得到。该文提出了一种基于N-gram超核的中文倾向性句子识别分类算法。该算法基于句子的句法、语义等特征构造N-gram超核函数,并采用基于该超核函数的支持向量机分类器识别中文倾向性句子。实验结果表明,与多项式核、N-gram核等单核函数相比,基于N-gram超核的中文倾向性句子识别算法在一定程度上能有效识别倾向性句子。 展开更多
关键词 倾向性句子识别 N-gram超核函数 倾向性分析
下载PDF
基于主题模型的主观性句子识别
3
作者 吴超荣 廖祥文 《计算机与现代化》 2012年第12期127-130,135,共5页
主观性句子识别旨在发现文本集合中具有观点的句子。本文基于概率主题模型,提出融合主题的主观性句子识别模型。该模型通过考虑主题因素识别句子主观性,同时挖掘文本集合中的潜在主观性主题。提出的模型是一个弱监督生成模型,不需要大... 主观性句子识别旨在发现文本集合中具有观点的句子。本文基于概率主题模型,提出融合主题的主观性句子识别模型。该模型通过考虑主题因素识别句子主观性,同时挖掘文本集合中的潜在主观性主题。提出的模型是一个弱监督生成模型,不需要大量的标记语料进行训练,仅需要一小部分领域独立的主观性词典修改模型的先验。实验证明,提出的模型能有效地提高句子识别召回率和F值,同时抽取的主观性主题具有较强的语义信息。 展开更多
关键词 主观性句子识别 观点挖掘 概率主题模型 弱监督
下载PDF
最大熵和规则相结合的藏文句子边界识别方法 被引量:17
4
作者 李响 才藏太 +2 位作者 姜文斌 吕雅娟 刘群 《中文信息学报》 CSCD 北大核心 2011年第4期39-44,共6页
句子边界识别是藏文信息处理领域中一项重要的基础性工作,该文提出了一种基于最大熵和规则相结合的方法识别藏语句子边界。首先,利用藏语边界词表识别歧义的句子边界,最后采用最大熵模型识别规则无法识别的歧义句子边界。该方法有效利... 句子边界识别是藏文信息处理领域中一项重要的基础性工作,该文提出了一种基于最大熵和规则相结合的方法识别藏语句子边界。首先,利用藏语边界词表识别歧义的句子边界,最后采用最大熵模型识别规则无法识别的歧义句子边界。该方法有效利用藏语句子边界规则减少了最大熵模型因训练语料稀疏或低劣而导致对句子边界的误判。实验表明,该文提出的方法具有较好的性能,F1值可达97.78%。 展开更多
关键词 最大熵 句子边界识别 藏文信息处理
下载PDF
现代藏语助动词结尾句子边界识别方法 被引量:7
5
作者 赵维纳 于新 +3 位作者 刘汇丹 李琳 王磊 吴健 《中文信息学报》 CSCD 北大核心 2013年第1期115-119,共5页
藏语句子边界的正确识别是藏文文本处理首先要解决的问题。而藏语书面语中标点符号的特殊性是造成藏语句子边界识别困难的主要原因。该文主要对现代书面藏语中常见的以藏语助动词结尾的藏语句子边界识别进行研究,结合藏文标点符号的特... 藏语句子边界的正确识别是藏文文本处理首先要解决的问题。而藏语书面语中标点符号的特殊性是造成藏语句子边界识别困难的主要原因。该文主要对现代书面藏语中常见的以藏语助动词结尾的藏语句子边界识别进行研究,结合藏文标点符号的特点提出藏语助动词结尾句子边界识别方法。 展开更多
关键词 藏语分句 藏语句子边界识别 藏语信息处理 中文信息处理
下载PDF
基于前后文词形特征的生物医学文献句子边界识别 被引量:1
6
作者 于中华 张容 +2 位作者 唐常杰 左劼 张天庆 《小型微型计算机系统》 CSCD 北大核心 2006年第1期180-184,共5页
针对生物医学文献的特点及信息抽取的特殊要求,提出了基于前后文词形特征和有教师学习的句子边界识别算法.与针对一般英语书面语设计的句子边界识别算法不同,本文提出的算法不使用特殊的辅助词表和语法层面的特征信息,只使用前后文单词... 针对生物医学文献的特点及信息抽取的特殊要求,提出了基于前后文词形特征和有教师学习的句子边界识别算法.与针对一般英语书面语设计的句子边界识别算法不同,本文提出的算法不使用特殊的辅助词表和语法层面的特征信息,只使用前后文单词的词形信息作为句子边界识别和消歧的依据.利用这些特征设计了最大信息熵识别器和支持向量机识别器,并在Medline摘要上进行了实验,达到了超过99%的正确率.实验结果表明,最大信息熵法和支持向量机法在句子边界消歧问题上具有相近的性能,同时还表明,对生物医学文献句子边界识别,只使用词法层面的特征,不使用辅助词表和词性等语法层面的信息,仍可达到其它算法在一般英语书面语上利用辅助词表和词性信息所达到的性能. 展开更多
关键词 自然语言处理 生物信息抽取 句子边界识别 机器学习
下载PDF
基于最大熵的维吾尔语句子边界识别模型 被引量:7
7
作者 艾山.吾买尔 吐尔根.依步拉音 《计算机工程》 CAS CSCD 北大核心 2010年第6期24-26,38,共4页
采用最大熵模型实现维吾尔语句子边界识别,该模型的训练过程不需要提供手工收集规则、词性标注及形态分析,仅使用较容易获取的单词长度和音节等特征。为确定最佳特征模板,在特征空间上组合出不同特征模板进行测试。实验结果表明,最佳特... 采用最大熵模型实现维吾尔语句子边界识别,该模型的训练过程不需要提供手工收集规则、词性标注及形态分析,仅使用较容易获取的单词长度和音节等特征。为确定最佳特征模板,在特征空间上组合出不同特征模板进行测试。实验结果表明,最佳特征模板具有较强的鲁棒性,召回率可达97.72%。 展开更多
关键词 维吾尔语 句子边界识别 特征选择 最大熵
下载PDF
统计与规则相结合的维吾尔语句子边界识别 被引量:7
8
作者 艾山.吾买尔 吐尔根.依步拉音 《计算机工程与应用》 CSCD 北大核心 2010年第14期162-165,共4页
句子边界识别是词性标注和句法分析等自然语言处理系统的基础问题。提出了一种统计与规则相结合的维吾尔语句子边界识别方法,首先利用歧义段落分类算法分类段落,第二步对无歧义段落进行基于规则的句子边界识别,最后使用最大熵模型对有... 句子边界识别是词性标注和句法分析等自然语言处理系统的基础问题。提出了一种统计与规则相结合的维吾尔语句子边界识别方法,首先利用歧义段落分类算法分类段落,第二步对无歧义段落进行基于规则的句子边界识别,最后使用最大熵模型对有歧义段落进行句子边界识别。该方法有效利用规则弥补最大熵模型因数据稀疏而误判不存在任何歧义情况的不足,使用最大熵模型有效地消除歧义,提高算法的鲁棒性,召回率达到了98.77%。 展开更多
关键词 维吾尔文 句子边界识别 规则 特征选择 最大熵
下载PDF
蒙古语句法结构分析中句子的自动识别和分类 被引量:1
9
作者 包萨仁图雅 达胡白乙拉 《内蒙古民族大学学报(社会科学版)》 2015年第5期102-106,共5页
从真实的语料库中选取句子是蒙古语句子处理层面上第一个问题,它是分析句法结构的最基础性工作之一。本文主要介绍了采用人—机互助方式从词性标注的100万词级的现代蒙古语语料库中选取了所有简单句,并用程序,按句子长度和谓语中心词的... 从真实的语料库中选取句子是蒙古语句子处理层面上第一个问题,它是分析句法结构的最基础性工作之一。本文主要介绍了采用人—机互助方式从词性标注的100万词级的现代蒙古语语料库中选取了所有简单句,并用程序,按句子长度和谓语中心词的词性进行了分类。初次开发的程序在按词数和谓词的词性分类的准确率分别是98.7%和94.1%,实验结果表明程序能比较准确地辨别和分类句子,但在实义词、倒装句等的识别能力仍有待提高。 展开更多
关键词 蒙古语 句法结构分析 句子的自动识别 句子的分类 程序
下载PDF
丰富特征提取的句子语义等价识别研究
10
作者 刘高军 寇婕 +2 位作者 段建勇 霍卫涛 王昊 《小型微型计算机系统》 CSCD 北大核心 2021年第10期2017-2022,共6页
句子语义等价识别任务(SSEI)在问答任务中扮演着至关重要的角色.目前,基于中文的语义等价任务在没有给定场景的前提下直接判断两个问句的语义,仍存在相同的意思也会被错误理解的问题.因此,本文提出了一种丰富特征信息提取的RFEM (richer... 句子语义等价识别任务(SSEI)在问答任务中扮演着至关重要的角色.目前,基于中文的语义等价任务在没有给定场景的前提下直接判断两个问句的语义,仍存在相同的意思也会被错误理解的问题.因此,本文提出了一种丰富特征信息提取的RFEM (richer feature extraction model)模型.首先,在编码层中,使用CNN和LSTM分别提取局部特征、存储历史信息特征,融合后的编码信息经过对齐层中的变体多头注意力机制,更大化地保留了原始信息的完整性;其次,在对齐层中,对融入了残差特征的编码进行优化,避免网络加深引起的梯度消失问题,改进后的模型对于特征提取具备更好的效果.该实验结果在公开中文数据集BQ上达到了82.71%,比目前最好的结果高0.86%,在通过置信区间计算清洗后的BQ数据集上达到了93.2%,比基线结果高5.1%. 展开更多
关键词 句子语义等价识别 特征提取 句子匹配 变体多头注意力机制
下载PDF
基于转换的错误驱动与决策树算法的句子边界自动识别
11
作者 李康熙 李为山 《科技通报》 北大核心 2012年第10期134-136,共3页
结合基于转换的错误驱动算法和决策树算法,并综合考虑句点标记在语料库中的复杂使用情况,生成能够自动划分英语句子边界的程序。实验结果表明,该方法具有较高的准确率,能够为后续语料库加工提供良好的前提基础。
关键词 句子边界识别 基于转换的错误驱动算法 决策树算法
下载PDF
以规则为主的英语句子边界识别方法的C#实现
12
作者 严灿勋 熊建国 《科技信息》 2014年第14期23-24,29,共3页
利用从英汉词典中提取的带点缩略语和从语料库统计筛选出的句首常用词词表,通过C#编程,设计了英语句子边界识别工具RCESBD。采用互相检验的方法发现RCESBD正确率明显高于OpenNlP。
关键词 句子边界识别 C#编程 缩略语 语料库
下载PDF
基于小句复合体的句子边界自动识别研究 被引量:2
13
作者 何晓文 罗智勇 +1 位作者 胡紫娟 王瑞琦 《中文信息学报》 CSCD 北大核心 2021年第5期1-8,共8页
自然语言文本的语法结构层次包括语素、词语、短语、小句、小句复合体、语篇等。其中,语素、词、短语等相关处理技术已经相对成熟,而句子的概念至今未有公认的、适用于语言信息处理的界定。该文重新审视了语言学中句子的定义和自然语言... 自然语言文本的语法结构层次包括语素、词语、短语、小句、小句复合体、语篇等。其中,语素、词、短语等相关处理技术已经相对成熟,而句子的概念至今未有公认的、适用于语言信息处理的界定。该文重新审视了语言学中句子的定义和自然语言处理中句子的切分问题,提出了中文句子切分的任务;基于小句复合体理论将句子定义为最小的话头自足的标点句序列,也就是自足的话题结构,并设计和实现了基于BERT的边界识别模型。实验结果表明,该模型对句子边界自动识别正确率、F_(1)值分别达到88.37%、83.73%,识别效果优于按照不同的标点符号机械分割的效果。 展开更多
关键词 句子 小句复合体 句子边界识别
下载PDF
维吾尔语句子边界识别算法的设计与实现 被引量:10
14
作者 阿比达.吾买尔 吐尔根.依布拉音 《新疆大学学报(自然科学版)》 CAS 2008年第3期360-363,共4页
本文分析维吾尔语的句子结束形式,研究维吾尔语句子边界规则,给出了句子划分思路,并实现了维吾尔语句子边界识别算法及程序.在对大量手工划分句子语料进行统计测试结果表明,该句子边界识别程序准确率超过98.7%.维吾尔语句子边界识别的... 本文分析维吾尔语的句子结束形式,研究维吾尔语句子边界规则,给出了句子划分思路,并实现了维吾尔语句子边界识别算法及程序.在对大量手工划分句子语料进行统计测试结果表明,该句子边界识别程序准确率超过98.7%.维吾尔语句子边界识别的研究对实现维吾尔语词性标注系统、维吾尔语句法分析器、机器翻译等众多领域有着很高的实际意义. 展开更多
关键词 维吾尔语 句子边界识别 规则
下载PDF
基于Kinect的手语识别方法 被引量:11
15
作者 千承辉 邵晶雅 +1 位作者 夏涛 刘怀宾 《传感器与微系统》 CSCD 2019年第6期31-34,38,共5页
为实现基于Kinect的手语识别,提出了一种利用有限状态机及动态时间规整(DTW)的动态手语识别方法。首先,利用Kinect技术得到人体深度图像和骨骼特征信息;然后利用手部分割算法得到手部深度图像,再选取识别正确率高的梯度方向直方图(HOG)... 为实现基于Kinect的手语识别,提出了一种利用有限状态机及动态时间规整(DTW)的动态手语识别方法。首先,利用Kinect技术得到人体深度图像和骨骼特征信息;然后利用手部分割算法得到手部深度图像,再选取识别正确率高的梯度方向直方图(HOG)特征算子来提取手部特征;最后加入有限状态机和DTW算法实现动态手语识别。实验结果表明:该方法能够实现对常用手语单词、句子的识别,识别准确率可达95%。 展开更多
关键词 手语句子识别 KINECT 动态时间规整算法 梯度方向直方图(HOG)特征 有限状态机
下载PDF
“心爱飞扬”中文言语测听平台在儿童人工耳蜗术后言语识别测试中的应用 被引量:3
16
作者 罗琼 黄艳艳 +1 位作者 冯艳梅 时海波 《中国听力语言康复科学杂志》 2016年第4期266-267,共2页
目的:利用计算机辅助的“心爱飞扬”中文言语测听平台评估人工耳蜗植入术后儿童在安静和噪声环境下句子的识别率,探索患儿的言语发展规律,同时探讨测听工具的可行性。方法选择18例植入人工耳蜗1年以上的儿童,在声场下接受助听听阈... 目的:利用计算机辅助的“心爱飞扬”中文言语测听平台评估人工耳蜗植入术后儿童在安静和噪声环境下句子的识别率,探索患儿的言语发展规律,同时探讨测听工具的可行性。方法选择18例植入人工耳蜗1年以上的儿童,在声场下接受助听听阈测试,并应用计算机辅助“心爱飞扬”中文言语测听平台,分别对患儿进行安静及噪声环境中句子识别率测试。结果①被试配戴人工耳蜗后的助听听阈平均为(33±5)dB HL;②安静环境中的句子识别率平均为(71±24)%,其中耳蜗植入1~4年的为(53±25)%,耳蜗植入4年以上为(85±9)%,两者之间差异具有统计学意义(P〈0.01);③噪声环境中的句子识别率平均为(51±28)%,其中耳蜗植入1~4年的为(31±24)%,4年以上的为(68±19)%,两者之间差异具有统计学意义(P〈0.01)。结论人工耳蜗植入后康复时间是影响儿童言语感知能力的重要因素。“心爱飞扬”中文言语测听平台的应用有助于人工耳蜗植入患儿听觉言语康复状况的长时期跟踪评估。 展开更多
关键词 人工耳蜗 听觉康复 句子识别
下载PDF
限定领域的汉语-维吾尔语句子级对齐研究 被引量:1
17
作者 张亚军 贺琛琛 香丽芸 《软件》 2014年第3期62-64,共3页
针对政府文献的汉语维吾尔语语料库特点,充分利用汉语和维吾尔语的句子特性,提出一种汉维句子级别的对齐方法。该方法重点分析政府领域的汉语和维吾尔语的句型,分别对汉语和维吾尔语的语料进行边界识别,避免了复杂句型对汉语-维吾尔语... 针对政府文献的汉语维吾尔语语料库特点,充分利用汉语和维吾尔语的句子特性,提出一种汉维句子级别的对齐方法。该方法重点分析政府领域的汉语和维吾尔语的句型,分别对汉语和维吾尔语的语料进行边界识别,避免了复杂句型对汉语-维吾尔语句子对齐的影响,使得该方法取得句子对齐达到97%与99%之间的正确率。对齐的汉语-维吾尔语句子对可以充实语料库的规模,为汉语-维吾尔语短语对齐以及汉维机器翻译提供翻译语料。 展开更多
关键词 平行语料库 句子对齐 机器翻译 汉语-维吾尔语 句子边界识别
下载PDF
汉语定义语句的抽取方法 被引量:1
18
作者 张寅生 《计算机与数字工程》 2011年第10期45-47,112,共4页
该文介绍了在汉语文本中抽取定义语句的方法。方法的主要特点是:给定被定义的词汇(字符串),应用Bo-yer-Moore算法查找该串在文本中的位置,继而在该句子中查找符合定义特征的谓词。在这个工作基础上,根据谓词字符串的特征排除谓词歧义,... 该文介绍了在汉语文本中抽取定义语句的方法。方法的主要特点是:给定被定义的词汇(字符串),应用Bo-yer-Moore算法查找该串在文本中的位置,继而在该句子中查找符合定义特征的谓词。在这个工作基础上,根据谓词字符串的特征排除谓词歧义,并按照句法分析的结果对定义语句修饰谓词的不同语法单元进行识别,从而实现了基于字符串和语法特征的识别的定义语句抽取。 展开更多
关键词 知识抽取 信息抽取 汉语句子识别 定义语句 BOYER-MOORE算法 自然语言理解
下载PDF
面向华裔留学生的汉字学习文本的获取
19
作者 张榕 《现代语文(下旬.语言研究)》 2016年第1期100-102,共3页
华裔留学生汉语听说能力与汉字读写能力脱节现象给教学带来不少难题。本文提出一种算法简单、实用的,基于大规模真实语料的华裔留学生汉字学习文本的获取方法,将识别出来的句子集作为汉字学习文本,使学习者通过学习最少的句子认识最多... 华裔留学生汉语听说能力与汉字读写能力脱节现象给教学带来不少难题。本文提出一种算法简单、实用的,基于大规模真实语料的华裔留学生汉字学习文本的获取方法,将识别出来的句子集作为汉字学习文本,使学习者通过学习最少的句子认识最多的高频汉字。 展开更多
关键词 华裔留学生 汉字学习文本获取 高频汉字句子 句子识别
下载PDF
基于主动学习的科技论文句子功能识别研究 被引量:11
20
作者 陈果 许天祥 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第8期53-61,共9页
【目的】为降低对人工标注语料的依赖,探索利用主动学习方法,充分结合现成的结构化摘要和有针对性的少量人工标注,以获得具有更好泛化能力的句子功能分类模型,识别文献句子功能类型(如表述研究的目的、方法、结论等)。【方法】以结构化... 【目的】为降低对人工标注语料的依赖,探索利用主动学习方法,充分结合现成的结构化摘要和有针对性的少量人工标注,以获得具有更好泛化能力的句子功能分类模型,识别文献句子功能类型(如表述研究的目的、方法、结论等)。【方法】以结构化摘要功能句为初始语料训练SVM、CNN、Bi-LSTM三种初始分类器,再展开主动学习:对大量无标签普通摘要句子进行功能预测,自动筛选不确定性高的样例提请人工标注,标注结果用于优化初始分类器,迭代进行主动学习,以提高分类器在新任务场景下的泛化性能。【结果】在图书情报学科文献集上实验表明,开展主动学习可取得较好的句子功能分类效果,准确率、召回率、F1值达84.65%、84.49%、84.57%,较主动学习前分别提升3.25%、3.24%、3.25%。【局限】为避免大量的人工语料标注工作,仅做了5次迭代。【结论】主动学习方法善于发现新任务场景下未标注语料与已有现成训练语料的差异,有针对性地降低人工标注成本,以提升基本模型的泛化能力。后续可进一步扩展应用于其他场景下(如引文、全文)的句子功能识别。 展开更多
关键词 结构化摘要 句子功能识别 主动学习 短文本分类
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部