-
题名基于统计和规则的中文姓名自动辨识
被引量:13
- 1
-
-
作者
季姮
罗振声
-
机构
清华大学中文系计算语言研究室北京
-
出处
《语言文字应用》
CSSCI
北大核心
2001年第1期14-18,共5页
-
基金
国家自然科学基金项目!批准号 :69972 0 2 5
-
文摘
中文姓名的辨识是自动分词、自动文摘的基础。独立于自动分词 ,我们运用姓名用字概率和规则 ,设计并实现了一个中文姓名辨识系统。对 2 0 775 7字语料进行了测试 ,召回率达到 92 .5 7% ,精确率达到 80 .35 % ,且速度较快。
-
关键词
概率分布
规则筛选
兼类姓
专有人名
特殊候选姓名对
-
Keywords
probability distribution, rules based peel, multiply firstname, proprietary name,special candidate name partners
-
分类号
H085.6
[语言文字—语言学]
-
-
题名口语对话系统中的语句主题提取
- 2
-
-
作者
王彬
江铭虎
-
机构
清华大学中文系计算语言研究室
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第18期58-60,98,共4页
-
文摘
语句的主题提取是口语对话系统中话语分析部分的工作。目前的口语对话系统大多将自然语言处理的重点放在语法和语义平面,而忽视了对上下文语境的分析,该文提出一种基于规则的语句主题提取方法,通过自底向上与自顶向下两种分析器完成主题与用户意图的提取,为系统的自然语言生成提供更准确的领域知识,从而大大提高了系统的整体性能。
-
关键词
主题提取
口语对话系统
自然语言理解
-
Keywords
topic extraction,spoken dialog system,natural language understanding
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-