期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于词典的汉藏句子对齐研究与实现
被引量:
10
1
作者
于新
吴健
洪锦玲
《中文信息学报》
CSCD
北大核心
2011年第4期57-62,共6页
双语语料库加工的关键技术之一是对齐,构建句子级别的对齐语料是构建语料库最基本的任务。该文参考其他语言句子对齐的成熟的方法,针对藏文语言的特殊性,提出基于词典的汉藏句子对齐。整理了对齐所用双语词典,并对其词语覆盖率进行了评...
双语语料库加工的关键技术之一是对齐,构建句子级别的对齐语料是构建语料库最基本的任务。该文参考其他语言句子对齐的成熟的方法,针对藏文语言的特殊性,提出基于词典的汉藏句子对齐。整理了对齐所用双语词典,并对其词语覆盖率进行了评价。在汉藏句子对齐过程中发现汉语与藏文的分词粒度不同的问题,采用在藏汉词典中进一步查词并在汉语句子中比对的方法,使正确句对的得分增加,从而提高对齐正确率。采用该方法准确率为81.11%。
展开更多
关键词
汉藏句子对齐
词典
分词粒度
平行语料库
藏文信息处理
下载PDF
职称材料
一个并行分词体系结构模型
2
作者
杨春花
万建成
姜合
《计算机工程与应用》
CSCD
北大核心
2004年第33期89-91,共3页
文章提出并讨论了一种并行全切分分词方法,给出了该方法在MIMD_SM上的并行分词体系结构模型。经过单CPU机上的模拟实验,证明该模型是可行而且有效的。该模型为克服串行全切分存在的复杂性及效率问题提供了新的思路,对于深入研究书面汉...
文章提出并讨论了一种并行全切分分词方法,给出了该方法在MIMD_SM上的并行分词体系结构模型。经过单CPU机上的模拟实验,证明该模型是可行而且有效的。该模型为克服串行全切分存在的复杂性及效率问题提供了新的思路,对于深入研究书面汉语的并行分词问题及实现具有实际意义。
展开更多
关键词
全切分
并行分词
自然语言处理
并行处理
下载PDF
职称材料
用大规模并行网络模型同时解决中文分词和语法分析
3
作者
李堂秋
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
1990年第2期139-143,共5页
提出用大规模并行网络的自然语言处理模型(即 MPNP 模型)处理中文的方法,它将中文的分词和语法分析合为一体加以统一的解决。以便实现多层次知识的综合。这种新的形式化方法吸收了当前连结主义模型的并行的优点,即用主动的节点—带局部...
提出用大规模并行网络的自然语言处理模型(即 MPNP 模型)处理中文的方法,它将中文的分词和语法分析合为一体加以统一的解决。以便实现多层次知识的综合。这种新的形式化方法吸收了当前连结主义模型的并行的优点,即用主动的节点—带局部记忆区和过程的节点和它们之间的连结关系显式地表达知识,用节点间的信息传送实现信息的并行处理。同时又保持了在较高层次模拟智能行为的特点。由于它的特殊的控制方法,它能够将自下而上的分析和信息传送与自上而下的期望扩散模型有机地结合起来。通过从左至右的扫描,并行地生成所有可能的分析,这一并行方法为新一代计算机的自然语言处理提供了一个有用模型。本文中从实现的角度较详细地阐述了这种处理方法的基本原理、结构和控制,以及中文分析系统的建造方法。
展开更多
关键词
大规模
并行网络
词
切分
语法分析
下载PDF
职称材料
双语平行语料的预处理
被引量:
1
4
作者
张霄军
陈小荷
《外语教育》
2007年第1期145-149,共5页
本文分析和讨论了双语平行语料库建设中的纯文本化、分词处理和文本对齐三个步骤,并认为它们是双语平行语料的预处理过程。探讨了各个步骤之间的关系以及各个步骤目前发展现状和存在的问题,对我国现已建成的汉英双语语料库也作了剖析说明。
关键词
平行语料
预处理
纯文本化
分词处理
文本对齐
原文传递
题名
基于词典的汉藏句子对齐研究与实现
被引量:
10
1
作者
于新
吴健
洪锦玲
机构
中国科学院软件研究所
中国科学院研究生院
出处
《中文信息学报》
CSCD
北大核心
2011年第4期57-62,共6页
基金
中国科学院西部行动计划高新技术项目(KGCX2-YW-512)
文摘
双语语料库加工的关键技术之一是对齐,构建句子级别的对齐语料是构建语料库最基本的任务。该文参考其他语言句子对齐的成熟的方法,针对藏文语言的特殊性,提出基于词典的汉藏句子对齐。整理了对齐所用双语词典,并对其词语覆盖率进行了评价。在汉藏句子对齐过程中发现汉语与藏文的分词粒度不同的问题,采用在藏汉词典中进一步查词并在汉语句子中比对的方法,使正确句对的得分增加,从而提高对齐正确率。采用该方法准确率为81.11%。
关键词
汉藏句子对齐
词典
分词粒度
平行语料库
藏文信息处理
Keywords
Chinese-Tibetan sentence alignment
dictionary
word
segmentation
granularity
parallel
corpus
Tibetan information
processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一个并行分词体系结构模型
2
作者
杨春花
万建成
姜合
机构
山东轻工业学院计算机系
山东大学计算机科学与技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2004年第33期89-91,共3页
文摘
文章提出并讨论了一种并行全切分分词方法,给出了该方法在MIMD_SM上的并行分词体系结构模型。经过单CPU机上的模拟实验,证明该模型是可行而且有效的。该模型为克服串行全切分存在的复杂性及效率问题提供了新的思路,对于深入研究书面汉语的并行分词问题及实现具有实际意义。
关键词
全切分
并行分词
自然语言处理
并行处理
Keywords
omni-word-segmentation
,
parallel word segmentation
,
nlp
,
parallel processing
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
用大规模并行网络模型同时解决中文分词和语法分析
3
作者
李堂秋
机构
厦门大学人工智能与计算机科学研究所
出处
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
1990年第2期139-143,共5页
文摘
提出用大规模并行网络的自然语言处理模型(即 MPNP 模型)处理中文的方法,它将中文的分词和语法分析合为一体加以统一的解决。以便实现多层次知识的综合。这种新的形式化方法吸收了当前连结主义模型的并行的优点,即用主动的节点—带局部记忆区和过程的节点和它们之间的连结关系显式地表达知识,用节点间的信息传送实现信息的并行处理。同时又保持了在较高层次模拟智能行为的特点。由于它的特殊的控制方法,它能够将自下而上的分析和信息传送与自上而下的期望扩散模型有机地结合起来。通过从左至右的扫描,并行地生成所有可能的分析,这一并行方法为新一代计算机的自然语言处理提供了一个有用模型。本文中从实现的角度较详细地阐述了这种处理方法的基本原理、结构和控制,以及中文分析系统的建造方法。
关键词
大规模
并行网络
词
切分
语法分析
Keywords
Massively
parallel
network, Natural language
processing
,
word
segmentation
, Parsing, Conncctionist model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
双语平行语料的预处理
被引量:
1
4
作者
张霄军
陈小荷
机构
陕西师范大学外国语学院
南京师范大学文学院
出处
《外语教育》
2007年第1期145-149,共5页
文摘
本文分析和讨论了双语平行语料库建设中的纯文本化、分词处理和文本对齐三个步骤,并认为它们是双语平行语料的预处理过程。探讨了各个步骤之间的关系以及各个步骤目前发展现状和存在的问题,对我国现已建成的汉英双语语料库也作了剖析说明。
关键词
平行语料
预处理
纯文本化
分词处理
文本对齐
Keywords
parallel
corpora
pre-
processing
text-formatting
word
segmentation
sentence alignment
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于词典的汉藏句子对齐研究与实现
于新
吴健
洪锦玲
《中文信息学报》
CSCD
北大核心
2011
10
下载PDF
职称材料
2
一个并行分词体系结构模型
杨春花
万建成
姜合
《计算机工程与应用》
CSCD
北大核心
2004
0
下载PDF
职称材料
3
用大规模并行网络模型同时解决中文分词和语法分析
李堂秋
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
1990
0
下载PDF
职称材料
4
双语平行语料的预处理
张霄军
陈小荷
《外语教育》
2007
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部