期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
Semi-supervised learning based probabilistic latent semantic analysis for automatic image annotation 被引量:1
1
作者 Tian Dongping 《High Technology Letters》 EI CAS 2017年第4期367-374,共8页
In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficie... In recent years,multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas,especially for automatic image annotation,whose purpose is to provide an efficient and effective searching environment for users to query their images more easily. In this paper,a semi-supervised learning based probabilistic latent semantic analysis( PLSA) model for automatic image annotation is presenred. Since it's often hard to obtain or create labeled images in large quantities while unlabeled ones are easier to collect,a transductive support vector machine( TSVM) is exploited to enhance the quality of the training image data. Then,different image features with different magnitudes will result in different performance for automatic image annotation. To this end,a Gaussian normalization method is utilized to normalize different features extracted from effective image regions segmented by the normalized cuts algorithm so as to reserve the intrinsic content of images as complete as possible. Finally,a PLSA model with asymmetric modalities is constructed based on the expectation maximization( EM) algorithm to predict a candidate set of annotations with confidence scores. Extensive experiments on the general-purpose Corel5k dataset demonstrate that the proposed model can significantly improve performance of traditional PLSA for the task of automatic image annotation. 展开更多
关键词 automatic image annotation semi-supervised learning probabilistic latent semantic analysis(PLSA) transductive support vector machine(TSVM) image segmentation image retrieval
下载PDF
基于TTS技术的智能化英语自动翻译系统
2
作者 王渭刚 《信息技术》 2023年第3期117-121,127,共6页
提出基于TTS技术的智能化英语自动翻译系统设计研究。选型并配置文音转换器与语音处理器,以此为基础,引入TTS技术(文本分析、韵律控制与语音合成),结合英语翻译需求,设计系统软件模块,包括连续语音自动切分与标注模块、语音韵律控制模... 提出基于TTS技术的智能化英语自动翻译系统设计研究。选型并配置文音转换器与语音处理器,以此为基础,引入TTS技术(文本分析、韵律控制与语音合成),结合英语翻译需求,设计系统软件模块,包括连续语音自动切分与标注模块、语音韵律控制模块、语音合成模块及语音库裁减模块。通过上述硬件单元与软件模块的设计,实现了智能化英语自动翻译系统的运行。实验数据显示:相较于对比系统,应用设计系统获得的语音韵律控制参数偏差较小,语音自然度因子数值更大,充分表明设计系统英语翻译语音更为精准。 展开更多
关键词 文本分析 英语翻译 语音自动切分标注 语音库裁减 语音韵律控制
下载PDF
吕苏语口语标注语料的自动分词方法研究 被引量:32
3
作者 于重重 操镭 +2 位作者 尹蔚彬 张泽宇 郑雅 《计算机应用研究》 CSCD 北大核心 2017年第5期1325-1328,共4页
濒危语言典藏以抢救和长久保存濒危语言口语中所包含的声学、语言学以及文学、历史、传统文化等内涵的全部信息为目的,吕苏语作为一种无文字文献记录的濒危语言,对其口语语料典藏意义重大。吕苏语口语的汉语标注语料自动分词是后续建立... 濒危语言典藏以抢救和长久保存濒危语言口语中所包含的声学、语言学以及文学、历史、传统文化等内涵的全部信息为目的,吕苏语作为一种无文字文献记录的濒危语言,对其口语语料典藏意义重大。吕苏语口语的汉语标注语料自动分词是后续建立高质量的吕苏语口语语料库和吕苏语典藏系统的基础性工作。目前对于吕苏语标注语料分词的研究几乎为零,对吕苏语特点进行了分析,同时将中文自动分词结巴方法应用到吕苏语汉语标注语料中;并针对结巴分词算法对吕苏语标注语料分词存在的误分词问题,提出了改进结巴算法。经过实验对比,改进结巴的分词方法准确率更高,提高了吕苏语汉语标注语料的分词效果。 展开更多
关键词 吕苏语 汉语标注语料 自动分词 改进结巴算法
下载PDF
基于最长次长匹配的汉语自动分词 被引量:14
4
作者 黄德根 朱和合 +2 位作者 王昆仑 杨元生 钟万勰 《大连理工大学学报》 CAS CSCD 北大核心 1999年第6期831-835,共5页
汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT)、自然语言理解(NLU)、情报检索(IR)等都需以自动分词作为基础. 为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长次长匹... 汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT)、自然语言理解(NLU)、情报检索(IR)等都需以自动分词作为基础. 为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长次长匹配原则的汉语自动分词方法,分词效果较好. 展开更多
关键词 语言处理 自动分词 机器翻译 最长匹配法 汉语
下载PDF
面向语音合成的藏语单音素与三音素自动切分算法研究 被引量:5
5
作者 张金溪 李永宏 +2 位作者 单广荣 李照耀 江静 《计算机应用研究》 CSCD 北大核心 2013年第11期3272-3275,共4页
在构建藏语语料库时要对语音进行音素切分,采用了两种方法,即基于单音素HMM模型的自动切分方法和基于三音素HMM模型的自动切分方法。通过实验分析了这两种HMM模型的自动切分结果的准确率程度,其中单音素、三音素总的平均切分准确度分别... 在构建藏语语料库时要对语音进行音素切分,采用了两种方法,即基于单音素HMM模型的自动切分方法和基于三音素HMM模型的自动切分方法。通过实验分析了这两种HMM模型的自动切分结果的准确率程度,其中单音素、三音素总的平均切分准确度分别为80.69%、88.74%。实验结果表明,三音素HMM模型的自动切分方法的准确率明显高于单音素HMM模型的切分率,提高了语音语料库标注信息的精确度和一致性。 展开更多
关键词 语音合成 藏语语料库 单音素 三音素 自动切分
下载PDF
基于语音识别的汉语发音自动评分系统的设计与实现 被引量:12
6
作者 吕军 曹效英 《计算机工程与设计》 CSCD 北大核心 2007年第5期1232-1235,共4页
语音识别技术的发展使得人与计算机的交互成为可能,针对目前对外汉语中发音教学的不足,在结合了语音识别的相关原理,提出了在对外汉语教学领域中汉语自动发音水平评价系统的设计,详细地描述了系统的结构、功能及流程。介绍了系统实现中... 语音识别技术的发展使得人与计算机的交互成为可能,针对目前对外汉语中发音教学的不足,在结合了语音识别的相关原理,提出了在对外汉语教学领域中汉语自动发音水平评价系统的设计,详细地描述了系统的结构、功能及流程。介绍了系统实现中的关键技术和步骤:动态时间弯折算法、语料库的建立、声韵分割技术以及评价分级标准。通过小范围的试验,表明该系统对留学生汉语发音水平的测试有一定的参考价值。 展开更多
关键词 语音识别 对外汉语 自动评分 动态时间弯折 音素分割
下载PDF
先秦文献《孟子》自动分词方法研究 被引量:18
7
作者 梁社会 陈小荷 《南京师范大学文学院学报》 CSSCI 2013年第3期175-182,共8页
自动分词是中文信息处理重要的基础课题。文章主要探讨了先秦文献《孟子》基于条件随机场统计模型的自动分词方法和利用相关注疏文献的自动分词方法等自动分词技术。自动分词实验结果表明,这两种分词方法效果显著,词语F值和小句F值均达... 自动分词是中文信息处理重要的基础课题。文章主要探讨了先秦文献《孟子》基于条件随机场统计模型的自动分词方法和利用相关注疏文献的自动分词方法等自动分词技术。自动分词实验结果表明,这两种分词方法效果显著,词语F值和小句F值均达到了较高的水平。在用不同的方法对《孟子》进行自动分词时,在词语F值的统计指标外,首次尝试引入了小句F值这一统计指标。 展开更多
关键词 先秦文献《孟子》 自动分词 条件随机场 注疏文献
下载PDF
基于功率谱包络动态分割的鲁棒语音端点检测 被引量:1
8
作者 许春冬 王晶 +3 位作者 战鸽 应冬文 李军锋 颜永红 《北京理工大学学报》 EI CAS CSCD 北大核心 2015年第11期1189-1193,共5页
在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语... 在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语音的频谱包络在时间维度上分割成具有特征同一性的时间块,以分割块为单位计算能量特征,并进行语音/非语音决策,从而达到提高语音端点检测的稳定性目的.实验表明,提出的方法有效提高了语音端点检测的鲁棒性. 展开更多
关键词 语音端点检测 动态分割 聚类 最小描述长度准则
下载PDF
广播新闻语料识别中的自动分段和分类算法 被引量:2
9
作者 吕萍 颜永红 《电子与信息学报》 EI CSCD 北大核心 2006年第12期2292-2295,共4页
该介绍了中文广播新闻语料识别任务中的自动分段和自动分类算法。提出了3阶段自动分段系统。该方法通过粗分段、精细分段和平滑3个阶段,将音频流分割为易于识别的音频段。在精细分段阶段,文中提出两种算法:动态噪声跟踪分段算法和基于... 该介绍了中文广播新闻语料识别任务中的自动分段和自动分类算法。提出了3阶段自动分段系统。该方法通过粗分段、精细分段和平滑3个阶段,将音频流分割为易于识别的音频段。在精细分段阶段,文中提出两种算法:动态噪声跟踪分段算法和基于单音素解码的分段算法。仿效说话人鉴别中的方法,文中提出了基于混合高斯模型的分类算法。该算法较好地解决了音频段的多类判决问题。在“新闻联播”测试数据中的实验结果表明,该文提出的自动分段和分类算法性能与手工分段分类性能几乎相当。 展开更多
关键词 语音识别 自动分段 自动分类
下载PDF
普通话广播语音的多层次标注与检索 被引量:3
10
作者 章森 华绍和 《中文信息学报》 CSCD 北大核心 2007年第4期97-104,共8页
广播语音的自动识别、标注、检索等是涉及到语音技术、自然语言处理、信息检索等多个领域的综合性课题。在介绍了广播语音的自动标注与检索的研究概况并分析了其中涉及的关键技术基础上,提出了面向普通话广播语音的多层次自动标注框架... 广播语音的自动识别、标注、检索等是涉及到语音技术、自然语言处理、信息检索等多个领域的综合性课题。在介绍了广播语音的自动标注与检索的研究概况并分析了其中涉及的关键技术基础上,提出了面向普通话广播语音的多层次自动标注框架以及基于多层次标注的语音检索方案,对文档层、句子层和词语层的标注属性进行了探讨,采用了递归标注方法对属性逐层细化,并讨论了对语音自动标注至关重要的语音识别引擎和语音流分割等问题。基于本文提出的方法,对10小时的普通话广播语音资料进行了标注和检索,得到了比较满意的实验结果。 展开更多
关键词 计算机应用 中文信息处理 广播语音 自动标注 语音检索 声学模型 语言模型
下载PDF
一种新的汉语连续语音统计切分算法 被引量:1
11
作者 顾明亮 代春倩 《徐州师范大学学报(自然科学版)》 CAS 2005年第4期45-49,共5页
在分析最小相位群延迟函数特点的基础上,提出了一种改进的汉语连续语音自动切分算法,该算法利用短时能量和类音节平均统计时长构造的最小相位群延迟函数为切分依据,将连续语音切分成一系列类音节单元.实验结果表明,本算法具有96·4... 在分析最小相位群延迟函数特点的基础上,提出了一种改进的汉语连续语音自动切分算法,该算法利用短时能量和类音节平均统计时长构造的最小相位群延迟函数为切分依据,将连续语音切分成一系列类音节单元.实验结果表明,本算法具有96·4%的切分正确率,比原算法提高5·2%. 展开更多
关键词 最小相位函数 统计平均时长 自动语音切分
下载PDF
信息处理用彝语词法分析研究 被引量:1
12
作者 陈顺强 《西南民族大学学报(自然科学版)》 CAS 2013年第4期639-642,共4页
彝语词法分析是计算机彝文信息处理中一项不可缺少的基础性工作,计算机彝文信息处理只要涉及到信息检索、机器翻译、语法分析、语义分析等方面的应用,就都需要以词为基本的处理单位.简要介绍了彝语语法结构,信息处理用彝语分词的主要任... 彝语词法分析是计算机彝文信息处理中一项不可缺少的基础性工作,计算机彝文信息处理只要涉及到信息检索、机器翻译、语法分析、语义分析等方面的应用,就都需要以词为基本的处理单位.简要介绍了彝语语法结构,信息处理用彝语分词的主要任务,提出一种基于层叠隐马尔科夫模型的彝语词法分析方法. 展开更多
关键词 彝文信息处理 词法分析 自动分词 自动标注
下载PDF
国外言语行为自动标注研究进展 被引量:1
13
作者 孙亚 刘思瑶 陈帅 《北京科技大学学报(社会科学版)》 2017年第5期12-18,共7页
文章采用统计方法考察了近十年在国外期刊上与言语行为自动标注相关的论文,进而呈现国外言语行为自动标注研究的进展。近十年言语行为自动标注以言语行为理论为基础,对文本、音频等言语行为进行标注,热点话题主要为情感识别、文本挖掘... 文章采用统计方法考察了近十年在国外期刊上与言语行为自动标注相关的论文,进而呈现国外言语行为自动标注研究的进展。近十年言语行为自动标注以言语行为理论为基础,对文本、音频等言语行为进行标注,热点话题主要为情感识别、文本挖掘、人机对话、机器翻译等,研究体裁也多集中于医疗对话、商务会议、信函、网络语言等。文章对国内未来言语行为自动标注研究有一定的启示意义。 展开更多
关键词 言语行为 自动标注 标注体系
下载PDF
基于区域相似度的图像自动标注方法 被引量:1
14
作者 徐功文 廖明海 +2 位作者 王晓燕 许春秀 许丽娜 《智能计算机与应用》 2015年第3期4-7,共4页
面对图片的数量与种类的快速增长,如何有效地组织和处理大量的图片信息并从其中检索出用户需要的信息成为一个重要的问题。图像检索技术是解决此类问题的核心技术。为了能够有效地标注和检索图像,提出了一种基于区域匹配的图像自动标注... 面对图片的数量与种类的快速增长,如何有效地组织和处理大量的图片信息并从其中检索出用户需要的信息成为一个重要的问题。图像检索技术是解决此类问题的核心技术。为了能够有效地标注和检索图像,提出了一种基于区域匹配的图像自动标注方法,实验证明,该方法能够有效地对图像进行标注。 展开更多
关键词 图像分割 特征提取 自动标注 相似度
下载PDF
基于PB的汉语电子词典管理系统设计与实现 被引量:1
15
作者 胡顺义 赵晓凡 《安阳师范学院学报》 2010年第5期19-21,共3页
汉语电子词典是汉语自动分词及词性标注系统的重要组成部分,其性能直接影响到分词及词性标注系统的速度和效果。本文介绍了一种通用的基于PB的汉语电子词典管理系统的设计与实现过程,通过该系统能有效地管理汉语电子词典,使得词典具有... 汉语电子词典是汉语自动分词及词性标注系统的重要组成部分,其性能直接影响到分词及词性标注系统的速度和效果。本文介绍了一种通用的基于PB的汉语电子词典管理系统的设计与实现过程,通过该系统能有效地管理汉语电子词典,使得词典具有良好的性能和可扩展性,为汉语自动分词和词性标注等研究工作提供有力的工具支持。 展开更多
关键词 自动分词 词性标注 电子词典 POWERBUILDER
下载PDF
基于HMM的柯尔克孜语词性标注的研究 被引量:1
16
作者 陈莉 古丽拉.阿东别克 《计算机工程与应用》 CSCD 2014年第15期120-124,共5页
柯尔克孜语的语言信息处理研究,对新疆柯尔克孜族是否能跨入信息时代,传承民族文化起着至关重要的作用。采用两级标注法,基于传统的HMM理论,改进了HMM模型参数的计算、数据平滑和未登入词的处理方法,更好地体现了上下文依赖关系。同时,... 柯尔克孜语的语言信息处理研究,对新疆柯尔克孜族是否能跨入信息时代,传承民族文化起着至关重要的作用。采用两级标注法,基于传统的HMM理论,改进了HMM模型参数的计算、数据平滑和未登入词的处理方法,更好地体现了上下文依赖关系。同时,把基于自动分词词典的词干提取算法与规则和统计相结合的方法用于柯尔克孜语的词性标注系统上。相对于传统的HMM,改进后的方法有效提高了准确性。 展开更多
关键词 柯尔克孜语 自动分词词典 隐马尔可夫模型(HMM) 词性标注
下载PDF
结合对象分割的运动行人检测 被引量:1
17
作者 宫法明 吕轩轩 +1 位作者 宫文娟 王晓宁 《计算机系统应用》 2019年第5期232-237,共6页
目标检测大量应用于监控系统的行人检测以及人脸识别,是当前深度学习的研究热点.监督学习利用人工标注大量数据集训练出针对特定场景的行人检测器.但是人工标注方法费时费力,本文针对监督学习需要人工标注数据集的缺点,研究了一种半自... 目标检测大量应用于监控系统的行人检测以及人脸识别,是当前深度学习的研究热点.监督学习利用人工标注大量数据集训练出针对特定场景的行人检测器.但是人工标注方法费时费力,本文针对监督学习需要人工标注数据集的缺点,研究了一种半自动标注行人的方法.针对静止的单目摄像机拍摄的监控视频,利用光流信息提供的初始前景可能性,以及跨越时间的视觉相似性来迭代地更新初始的前景可能性,分割出运动的行人,根据分割的前景对象,提出了一种半自动标注行人的方法.实验结果显示,本文的方法可以为行人检测系统提供大量数据集,且效率上明显优于传统人工标注的方法. 展开更多
关键词 行人检测 光流 视频对象分割 深度学习 半自动数据集标注
下载PDF
中文文语转换引擎SmartTalk研究与实现
18
作者 潘春华 武港山 《计算机应用研究》 CSCD 北大核心 2004年第4期143-145,共3页
随着汉语日益走向世界以及语音技术的发展,让计算机能讲汉语便自然成为了一种需求。介绍了一种汉语文语转换(TTS:Text—To—Speech),引擎SmartTalk的设计与实现。讨论了用于TTS的汉语语音库和汉语词库的设计,以及基于词库的分词算法和... 随着汉语日益走向世界以及语音技术的发展,让计算机能讲汉语便自然成为了一种需求。介绍了一种汉语文语转换(TTS:Text—To—Speech),引擎SmartTalk的设计与实现。讨论了用于TTS的汉语语音库和汉语词库的设计,以及基于词库的分词算法和基于音库的语音合成。 展开更多
关键词 汉语自动分词 文语转换 语音合成 中文信息处理
下载PDF
面向语音合成的藏语音素切分算法研究
19
作者 张金溪 李照耀 +1 位作者 肖俊生 李艾林 《西北民族大学学报(自然科学版)》 2012年第4期27-31,共5页
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩... 文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性. 展开更多
关键词 音素自动切分 藏语 语音合成 语料库
下载PDF
基于短时分形维数的汉语语音自动分段技术研究 被引量:3
20
作者 陈国 胡修林 +1 位作者 张蕴玉 朱耀庭 《通信学报》 EI CSCD 北大核心 2000年第10期6-13,共8页
本文根据汉语语音的构成特点 ,提出了一种新的基于短时分形维数的汉语语音自动分段方法。该方法首先用等差尺度网格维数替代传统盒维数计算方法来快速计算语音信号的分形维数 ,然后在统计、分析汉语男女声 2 1种声母和 3 8种韵母语音信... 本文根据汉语语音的构成特点 ,提出了一种新的基于短时分形维数的汉语语音自动分段方法。该方法首先用等差尺度网格维数替代传统盒维数计算方法来快速计算语音信号的分形维数 ,然后在统计、分析汉语男女声 2 1种声母和 3 8种韵母语音信号的分形特性基础上 ,利用中心偏离限定算法来实现汉语语音信号的自动分段。仿真实验表明 ,该方法不但能正确实现不同语速条件下的语音自动分段 ,而且具有噪声鲁棒性 ,是一种有效的汉语语音自动分段技术。 展开更多
关键词 汉语语音 自动分段 分形维数 语音信号处理
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部