-
题名基于自动句对齐的相似古文句子检索
被引量:15
- 1
-
-
作者
郭锐
宋继华
廖敏
-
机构
北京师范大学信息科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2008年第2期87-91,105,共6页
-
基金
国家社科基金资助项目(05BYY022)
-
文摘
随着语料库语言学的兴起,基于实例的机器翻译(EBMT)得到越来越多的研究。如何快速准确地构建大规模古今汉语平行语料库,以及从大量的对齐实例(句子级)中检索和输入句子最相似的源句子是基于实例的古今汉语机器翻译必须解决的问题。本文综合考虑句子长度、汉字字形、标点符号三个因素提出了古今汉语句子互译模型,基于遗传算法、动态规划算法实现了古今汉语的自动句对齐。接着为古文句子建立全文索引,基于汉字的信息熵,本文设计与实现一种高效的最相似古文句子检索算法。最后给出了自动句对齐和最相似古文句子检索的实验结果。
-
关键词
计算机应用
中文信息处理
古今汉语平行语料库
句子对齐
相似句子
基于实例的机器翻译
-
Keywords
computer application
chinese information processing
parallel corpus of ancient and modern chinese
sentence alignment
similar sentence
EBMT
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名MCP多处理机系统研究与设计
- 2
-
-
作者
王能忠
王宽全
张为群
-
机构
西南师范大学计算机科学系
-
出处
《计算机科学》
CSCD
北大核心
1994年第3期69-71,共3页
-
文摘
一、引言 人工智能(AI)中自然语言处理(理解)的研究在八十年代进入了并行处理阶段,国外已有众多研究成果[1]。进入九十年代,其研究水平已相当高,其中比较成功和有名的有美国卡内基·梅隆大学与南加利福尼亚大学联合研制的SNAP(语义网络阵列处理机),它由160个TMS320C32DSP芯片组成[2],用于机器翻译系统;美国卡内基·梅隆大学与日本NEC公司联合研制的大规模并行联想处理机IXM2,它由64个处理机组成[3],用于大规模并行句法分析。笔者1991年在澳大利亚墨尔本大学成功地用Encore多处理机系统进行了汉语并行句法分析[4]。最近我们承担了“汉藏英机器翻译系统”课题中的部分研究任务,进行了适用于MCP(现代汉语处理)的一种多处理机系统设计。
-
关键词
多处理机
MCP
系统设计
-
Keywords
multiprocessor system,modern chinese processing ,parallel parsing.
-
分类号
TP332.02
[自动化与计算机技术—计算机系统结构]
-