期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
扩充转移网络在自然语言句法处理中的应用——以歧义句和花园幽径句对照分析为例
1
作者 于屏方 杜家利 《计算机工程与应用》 CSCD 2012年第17期23-30,35,共9页
扩充转移网络具有直观定量的特点,其在句法处理中的应用可推动自然语言的程序化研究。歧义现象类似"多车道单向"通行,各车道的认知选择具有非回溯的优先性。花园幽径现象是"单车道"单向通行,前期默认式选择蕴涵后... 扩充转移网络具有直观定量的特点,其在句法处理中的应用可推动自然语言的程序化研究。歧义现象类似"多车道单向"通行,各车道的认知选择具有非回溯的优先性。花园幽径现象是"单车道"单向通行,前期默认式选择蕴涵后期反叛式决定,折返性跨越式解读使其具有心理实验的"啊哈"体验。两种现象的程序化句法研究证实了歧义现象和花园幽径现象具有区别性特征这一论断。 展开更多
关键词 扩充转移网络 花园幽径句 歧义句 回溯 自然语言处理
下载PDF
基于词干提取的维吾尔语事件类时间短语识别 被引量:6
2
作者 邹岳琳 吐尔根.依布拉音 +2 位作者 麦热哈巴.艾力 艾山.吾买尔 帕力旦.吐尔逊 《计算机工程与设计》 CSCD 北大核心 2014年第2期625-630,共6页
针对维吾尔语事件类时间短语没有明显时间词特征词而引起的识别困难和边界定位不准确等问题,提出了一种统计结合词干提取的针对黏着性语言的事件类时间短语的识别方法。根据维吾尔语典型的黏着性语言形态特点,对时间短语构成进行分析和... 针对维吾尔语事件类时间短语没有明显时间词特征词而引起的识别困难和边界定位不准确等问题,提出了一种统计结合词干提取的针对黏着性语言的事件类时间短语的识别方法。根据维吾尔语典型的黏着性语言形态特点,对时间短语构成进行分析和分类,采用机器学习的方法将难于识别的事件类隐性时间短语识别问题转换为基于统计方法的序列标注;通过对维吾尔语事件类时间要素分析及维吾尔语构词的研究,引入黏着语特有的词干特征,选定实验特征集合,对比分析不同的特征集合的自动识别准确率的平均值。实验结果表明,该方法对维吾尔语事件类时间短语识别的F-值达到85.37%。这一结果对其它黏着性语言的研究具有参考意义。 展开更多
关键词 自然语言处理 时间短语 条件随机场 黏着语 事件类时间 特征选择 词干提取
下载PDF
基于测度优化Laplacian SVM的中文指代消解方法 被引量:1
3
作者 周炫余 刘娟 +2 位作者 邵鹏 卢笑 罗飞 《电子学报》 EI CAS CSCD 北大核心 2016年第12期3064-3072,共9页
相比于传统的基于半监督学习的指代消解方法,Laplacian SVM(Support Vector Machine)能有效的挖掘已标注样本和未标注样本的相似性和关联性,更好的推导模型的分类边界.而传统Laplacian SVM采用欧式距离度量样本之间的距离,使得异类样本... 相比于传统的基于半监督学习的指代消解方法,Laplacian SVM(Support Vector Machine)能有效的挖掘已标注样本和未标注样本的相似性和关联性,更好的推导模型的分类边界.而传统Laplacian SVM采用欧式距离度量样本之间的距离,使得异类样本之间的相似性可能过大,不利于样本的准确分类.对此,提出一种基于数据驱动学习最优测度Laplacian SVM算法以解决中文指代消解语料不足的问题.该方法通过优化样本对之间的相似性约束条件和引入Fisher判别项,增大同类样本间的相似性,并突出强判别能力的特征.此外,提出核嵌入的测度优化方法将以上线性测度优化推广到非线性空间,有利于Laplacian SVM利用核函数实现非线性分类.在ACE2005中文语料库上的测评结果表明,所提出测度优化的Laplacian SVM(包括线性和核嵌入两种形式)的方法只需少量标注样本就可以获得与经典的有监督学习模型相当甚至更好的消解性能,同时也优于其他传统的半监督学习方法. 展开更多
关键词 测度优化 LAPLACIAN SVM 中文指代消解 半监督学习 自然语言处理
下载PDF
基于文本挖掘的DNA微阵列表达数据方法研究
4
作者 张薇 崔雷 《中华医学图书情报杂志》 CAS 2010年第5期11-15,共5页
DNA微阵列技术是近年来发展起来的一种功能基因组学研究技术。利用DNA微阵列技术,可以从基因组水平上鉴定出相关的功能基因及其表达调控网络,有助于阐明这些基因的生物学功能及其机理。结合文本挖掘的相关研究结果,探讨了DNA微阵列技术... DNA微阵列技术是近年来发展起来的一种功能基因组学研究技术。利用DNA微阵列技术,可以从基因组水平上鉴定出相关的功能基因及其表达调控网络,有助于阐明这些基因的生物学功能及其机理。结合文本挖掘的相关研究结果,探讨了DNA微阵列技术的原理和特点,数据的分析和解释,基因的聚类方法和基于文献的DNA微阵列分析。通过基于文献的微阵列分析方法,找出隐含的、具有语义关联的生物概念,并进行推理,发现隐性的新知识。具体阐述了基于统计、基于自然语言处理、基于关联规则挖掘,基于模式识别的4种分析方法。基于文本挖掘的DNA微阵列技术,有利于发现基因或蛋白质之间的相互作用关系,自动识别生物学名词,提高数据分析效率等。 展开更多
关键词 DNA微阵列 文本挖掘 聚类分析 文献轮廓 关联规则 自然语言处理 模式识别
下载PDF
基于融合句法特征的翻译方法研究 被引量:1
5
作者 刘晶 《电子设计工程》 2021年第16期153-157,共5页
机器翻译中的英语长句以其单词较多、句型结构复杂等特征成为影响机器翻译质量的主要因素。文中针对机器翻译中英语长句翻译质量差的问题,提出了基于融合句法特征的翻译方法。该方法结合基于语言模板的翻译方法与基于条件随机场的统计... 机器翻译中的英语长句以其单词较多、句型结构复杂等特征成为影响机器翻译质量的主要因素。文中针对机器翻译中英语长句翻译质量差的问题,提出了基于融合句法特征的翻译方法。该方法结合基于语言模板的翻译方法与基于条件随机场的统计学翻译方法,通过句法维度与统计学维度对长句进行切分及处理,进而提升机器翻译质量。实验结果表明,英语语料集长句在经过文中提出的模型训练后,BLEU分值提升了约2.1%,NIST分值提升了约1.1%,证明了文中所提基于融合句法特征的翻译方法对英语长句翻译质量有所提升。 展开更多
关键词 机器翻译 句法特征模型 条件随机场模型 自然语言处理 英语长句翻译
下载PDF
基于自然语言处理技术的快速筛查在中国中老年人群轻度认知障碍中的应用
6
作者 彭敏 张亚明 +5 位作者 樊永梅 张妙媛 石丸雅司 李灿阳 焦莉莉 王如蜜 《中华物理医学与康复杂志》 CAS CSCD 北大核心 2023年第7期592-597,共6页
目的采用自然语言处理(NLP)技术,通过特定语音任务在中国中老年人群中自动、客观、快速检测轻度认知障碍(MCI)。方法以1∶1的男女比例招募了50~80岁中老年人215例,用特定的语音任务和简易精神状态测试-2(MMSE-2)收集受试者的语音数据和... 目的采用自然语言处理(NLP)技术,通过特定语音任务在中国中老年人群中自动、客观、快速检测轻度认知障碍(MCI)。方法以1∶1的男女比例招募了50~80岁中老年人215例,用特定的语音任务和简易精神状态测试-2(MMSE-2)收集受试者的语音数据和认知功能情况,并根据其认知功能进一步分为认知功能正常组和MCI组。根据语音文件提取出说话速度、音节数、音节时间长度、停顿数、停顿时间长度、共振峰频率(F1、F2)的标准偏差、声压变化共7类,合计162个语音特征,依据男性和女性分组进行分析,比较不同性别受试者的语音特征与认知功能的关联,用多元回归分别分析男、女受试者基于语音特征的认知功能预测,并使用灵敏度、特异度和准确度评价模型的预测功能。结果MCI组受试者在发音速度、停顿次数、停顿长度及共振峰变化的50个语音特征量上与正常组比较,差异有统计学意义(P<0.05)。不同性别的分组分析中,单相关分析表明,发音节奏与认知功能显著相关;基于多元回归构建的预测模型中,识别MCI的敏感度、特异度和准确度男性分别为0.54、0.80和0.69,女性分别为0、0.86和0.63。结论MCI组患者的发音节奏发生了显著改变。基于自然语言处理技术的语音分析能快速、客观地筛查出MCI。 展开更多
关键词 阿尔茨海默病 痴呆症 轻度认知障碍 自然语言处理 筛查
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部