-
题名语句级汉字拼音输入技术评估方法的研究
被引量:3
- 1
-
-
作者
汤步洲
王晓龙
王轩
张强
-
机构
哈尔滨工业大学深圳研究生院计算机科学与技术学科部
-
出处
《中文信息学报》
CSCD
北大核心
2008年第5期51-55,共5页
-
基金
国家863专题目标导向类资助项目(2006AA01Z197)
国家自然科学基金重点资助项目(60435020)
国家自然科学基金面上资助项目(90612005)
-
文摘
该文介绍了语句级汉字拼音输入技术评估方法的研究意义及其重要性。从信息论角度出发,提出了基于损失函数的语句级汉字拼音输入技术的评估方法,它通过损失函数比较经语句级汉字拼音输入系统输出的句子和相应的标准句子,得到描述系统性能的定量指标。该方法对汉字拼音输入技术的音节流自动切分和音字转换两方面进行了较全面的评估。采用手工标注的1996年《人民日报》部分语料,对目前流行的汉字拼音输入技术进行了评估,实验结果表明:拼音输入技术音字转换准确率最高能达到64.3%,音节流自动切分对音字转换的准确率有大约2%的影响。评估结果对今后的拼音输入技术的评估提供了参考价值,对汉字拼音输入技术的持续发展有指导意义。
-
关键词
人工智能
自然语言处理
语句级汉字拼音输入技术
损失函数
音节流自动切分
音字转换
-
Keywords
artificial intelligence
natural language processing
Chinese sentential syllable input method system
loss function
syncopation of Chinese phonetic string
syllable-to-character conversion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向真实环境的问句分析方法
被引量:10
- 2
-
-
作者
范士喜
王晓龙
王轩
张耀允
-
机构
哈尔滨工业大学深圳研究生院计算机科学与技术学科部
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2010年第5期1131-1135,共5页
-
基金
国家863高技术研究发展计划(No.2006AA01Z197)
国家自然科学基金(No.60703015)
-
文摘
面向真实环境的问答系统是近年来研究的热点,针对系统中问句的复杂性,提出问句信息块标注的分析方法——QICA.该方法将问句信息分为五类,通过标注这五类信息,将问句从表层的文字空间映射到结构化的语义空间.结合大间隔马尔可夫模型实现了自动标注系统.将QICA结果应用于问句复述识别问题,验证了该方法的有效性.
-
关键词
问答系统
问句信息块标注
问句复述
大间隔马尔可夫
-
Keywords
Q&A
QICA
question paraphrase
M3Ns
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-
-
题名基于Android的智能中文输入法
被引量:5
- 3
-
-
作者
刘峰
王晔晗
汤步洲
王晓龙
王轩
-
机构
哈尔滨工业大学深圳研究生院计算机科学与技术学科部
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第7期225-227,共3页
-
基金
国家"863"计划基金资助项目"基于手势的拟人化人机交互系统"(2007AA01Z194)
国家自然科学基金资助面上项目"多元网络架构中异构信息的采集与检索技术研究"(90612005)
-
文摘
介绍语句级汉字拼音输入技术的基本原理,讨论在移动设备上面临的问题和解决方案,并实现基于Android操作系统的语句级汉字拼音输入法。将该输入法应用于多普达A3288手机,运行状态良好,汉字输入流畅,音字转换准确率为86.92%。随着用户对输入法和输入习惯的适应,准确率还会有一定的提高。
-
关键词
输入法
ANDROID操作系统
音字转换
自然语言处理
-
Keywords
input method
Android OS
phonetic symbol-character conversion
natural language processing
-
分类号
TP11
[自动化与计算机技术—控制理论与控制工程]
-
-
题名置信度加权在线序列标注算法
被引量:3
- 4
-
-
作者
汤步洲
王晓龙
王轩
-
机构
哈尔滨工业大学深圳研究生院计算机科学与技术学科部
-
出处
《自动化学报》
EI
CSCD
北大核心
2011年第2期188-195,共8页
-
基金
国家高技术研究发展计划(863计划)(2006AA01Z197)
国家自然科学基金(60703015
60973076)资助~~
-
文摘
序列标注问题是自然语言处理领域的基本问题之一.序列标注任务是将连续输入的不定长序列,标注成连续等长的标签序列.在在线序列标注方法的基本框架下,针对序列标注任务的特征稀疏特性,采用置信度加权分类算法思想,提出了一种新的线性判别式在线序列标注方法—置信度加权在线序列标注算法.该方法对每个特征权值参数引入一个概率置信度,取得了优于其他相关算法的性能.在中文分词,中文名实体识别以及英文组块分析等问题上,验证了本文方法的有效性.
-
关键词
序列标注问题
自然语言处理
在线序列标注算法
置信度加权
概率置信度
-
Keywords
Sequence labeling problem, natural language processing, online sequence labeling linear algorithm,confidence-weighted, probabilistic measure of confidence
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名一种工程建造的工作流可靠性度量方法
被引量:2
- 5
-
-
作者
单汨源
李佳莅
黄振
宋泽宇
-
机构
湖南大学工商管理学院
哈尔滨工业大学深圳研究生院计算机科学与技术学科部
-
出处
《统计与决策》
CSSCI
北大核心
2009年第17期22-24,共3页
-
文摘
精益建造将生产到产品交付的过程看作是一个连续的工作流,如何提高工作流的可靠性和构建持续流已成为研究的焦点。文章根据精益建造中流的理论分析了导致工作流不可靠的原因,从促进工作流持续改进的角度剖析了目前用来度量工作流可靠性的常用方法——计划完成比(PPC)——的不足,提出了一种可促进工作流持续改进的工作流可靠性度量方法,为构建持续流以及优化工程项目提供了一种可行方案。
-
关键词
精益建造
工作流
可靠性度量
PPC
-
分类号
F270.3
[经济管理—企业管理]
-
-
题名关于图的L(d_1,d_2)-标号问题(英文)
被引量:1
- 6
-
-
作者
邵振东
刘家壮
-
机构
哈尔滨工业大学深圳研究生院计算机科学与技术学科部
山东大学数学研究所
-
出处
《工程数学学报》
CSCD
北大核心
2006年第3期559-562,共4页
-
文摘
图的L(2,1)-标号问题是由频率分配问题归结而来,本文研究作为L(2,1)-标号问题的推广的L(d_1,d_2)-标号问题。首先定义了顶点2-着色,2-色数及其它有关概念,给出了2-色数的上界。然后得出了λ_(d_1,d_2)(G)与δ(G)和Δ(G)的一般关系。最后得出了一般图与平面图的λ_(d_1,d_2)(G)的上界。
-
关键词
L(d1
d2)-标号
顶点2-着色
2-色数
-
Keywords
L(d1,d2)-labeling
Vertex 2-coloring
2-chromatic number
-
分类号
O157.5
[理学—基础数学]
-
-
题名关于图的距离标号问题
- 7
-
-
作者
邵振东
刘家壮
-
机构
哈尔滨工业大学深圳研究生院计算机科学与技术学科部
山东大学数学研究所
-
出处
《运筹与管理》
CSCD
2006年第4期44-46,共3页
-
文摘
图G的L(2,1)-标号是一个从顶点V(G)集到非负整数集的函数f(x),使得若d(x,y)=1,则|f(x)-f(y)|≥2;若d(x,y)=2,则|f(x)-f(y)|≥1。图G的L(2,1)-标号数λ(G)是使得G有max{f(v):v∈V(G)}=k的L(2,1)-标号中的最小数k。本文将L(2,1)-标号问题推广到更一般的情形即L(d1,d2,d3)-标号问题,并得出了复合图的λd1,d2,d3(G)的上界。
-
关键词
运筹学
频率分配
T-染色
L(2
1)-标号
-
Keywords
operations research
frequency assignment
T-coloring
L (2,1) labeling.
-
分类号
O157.5
[理学—基础数学]
-