期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
关于设立源点词、中间词、临界词和终点词的思考——以语气词为例
1
作者
王珏
《对外汉语研究》
2014年第1期59-71,共13页
鉴于已有描写语法化过程的术语不足,本文建议增加“中间词”“临界词”两个新术语。本文还讨论了新术语系统对语法化过程的研究可能带来三个便利:一是有利于归纳语法化过程的类型,二是有利于细致刻画语法化过程,三是有利于认识源点...
鉴于已有描写语法化过程的术语不足,本文建议增加“中间词”“临界词”两个新术语。本文还讨论了新术语系统对语法化过程的研究可能带来三个便利:一是有利于归纳语法化过程的类型,二是有利于细致刻画语法化过程,三是有利于认识源点词、临界词的特点。最后分类讨论了语气词源点词的源义特征。
展开更多
关键词
源点
词
临界词
中间
词
终点
词
语气
词
原文传递
SegT:一个实用的藏文分词系统
被引量:
25
2
作者
刘汇丹
诺明花
+2 位作者
赵维纳
吴健
贺也平
《中文信息学报》
CSCD
北大核心
2012年第1期97-103,共7页
在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,...
在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,然后采用最大匹配方法分词,并进行紧缩词识别。系统采用双向切分检测交集型歧义字段并使用预先统计的词频信息进行消歧。实验结果表明,该文设计的格助词分块和临界词识别方法可以将分词速度提高15%左右,但格助词分块对分词效果没有明显提高或降低。系统最终分词正确率为96.98%,基本达到了实用的水平。
展开更多
关键词
藏文分
词
格助
词
临界词
识别
词
频统计
藏文信息处理
中文信息处理
下载PDF
职称材料
基于单字特征和搜索引擎的新词识别
被引量:
2
3
作者
苏宁
惠子敬
刘娟
《武汉大学学报(理学版)》
CAS
CSCD
北大核心
2010年第6期704-710,共7页
新词识别是影响搜索准确率以及速率的重要因素.本文提出了一种基于统计模型和词语搭配的中文新词自动识别方法.采用条件概率的方法提取单字词搭配特征和临界词特征,并采用层次结构实现新词定位以及识别.首先采用双向最大匹配相结合的方...
新词识别是影响搜索准确率以及速率的重要因素.本文提出了一种基于统计模型和词语搭配的中文新词自动识别方法.采用条件概率的方法提取单字词搭配特征和临界词特征,并采用层次结构实现新词定位以及识别.首先采用双向最大匹配相结合的方法对文本进行词法粗切分,然后根据单字词搭配得到候选新词的位置,用临界词方法确定候选新词的边界,采用改进Nagao串频统计方法对新词候选词在本文内进行重复串统计,对于只在文中出现一次的新词则借助搜索引擎进行确定.对新浪网近期的网络文章进行测试,结果表明,基于本文方法设计的系统可以识别不同领域的新词,在低频词、较长的词以及新词语搭配方面取得了良好的效果.单字词搭配检查发现新词位置综合指标F值达到96.8%.
展开更多
关键词
新
词
识别
单字
词
临界词
搭配抽取
搜索引擎
原文传递
题名
关于设立源点词、中间词、临界词和终点词的思考——以语气词为例
1
作者
王珏
机构
上海交通大学国际教育学院
出处
《对外汉语研究》
2014年第1期59-71,共13页
基金
国家社会科学基金项目(13BYY119)的资助
文摘
鉴于已有描写语法化过程的术语不足,本文建议增加“中间词”“临界词”两个新术语。本文还讨论了新术语系统对语法化过程的研究可能带来三个便利:一是有利于归纳语法化过程的类型,二是有利于细致刻画语法化过程,三是有利于认识源点词、临界词的特点。最后分类讨论了语气词源点词的源义特征。
关键词
源点
词
临界词
中间
词
终点
词
语气
词
分类号
H146.2 [语言文字—汉语]
原文传递
题名
SegT:一个实用的藏文分词系统
被引量:
25
2
作者
刘汇丹
诺明花
赵维纳
吴健
贺也平
机构
中国科学院软件研究所
中国科学院研究生院
北京语言大学
青海师范大学
出处
《中文信息学报》
CSCD
北大核心
2012年第1期97-103,共7页
基金
国家重大科技专项资助项目(2010ZX01036-001-002
2010ZX01037-001-002)
中国科学院西部行动计划资助项目(KGCX2-YW-512)
文摘
在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,然后采用最大匹配方法分词,并进行紧缩词识别。系统采用双向切分检测交集型歧义字段并使用预先统计的词频信息进行消歧。实验结果表明,该文设计的格助词分块和临界词识别方法可以将分词速度提高15%左右,但格助词分块对分词效果没有明显提高或降低。系统最终分词正确率为96.98%,基本达到了实用的水平。
关键词
藏文分
词
格助
词
临界词
识别
词
频统计
藏文信息处理
中文信息处理
Keywords
Tibetan word segmentation
case-auxiliary words
critical word detection
word frequency statistics
Tibetan information processing
Chinese information processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于单字特征和搜索引擎的新词识别
被引量:
2
3
作者
苏宁
惠子敬
刘娟
机构
武汉大学计算机学院
出处
《武汉大学学报(理学版)》
CAS
CSCD
北大核心
2010年第6期704-710,共7页
文摘
新词识别是影响搜索准确率以及速率的重要因素.本文提出了一种基于统计模型和词语搭配的中文新词自动识别方法.采用条件概率的方法提取单字词搭配特征和临界词特征,并采用层次结构实现新词定位以及识别.首先采用双向最大匹配相结合的方法对文本进行词法粗切分,然后根据单字词搭配得到候选新词的位置,用临界词方法确定候选新词的边界,采用改进Nagao串频统计方法对新词候选词在本文内进行重复串统计,对于只在文中出现一次的新词则借助搜索引擎进行确定.对新浪网近期的网络文章进行测试,结果表明,基于本文方法设计的系统可以识别不同领域的新词,在低频词、较长的词以及新词语搭配方面取得了良好的效果.单字词搭配检查发现新词位置综合指标F值达到96.8%.
关键词
新
词
识别
单字
词
临界词
搭配抽取
搜索引擎
Keywords
new word recognition
one character word
boundary word
collocation extraction
search engine
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
关于设立源点词、中间词、临界词和终点词的思考——以语气词为例
王珏
《对外汉语研究》
2014
0
原文传递
2
SegT:一个实用的藏文分词系统
刘汇丹
诺明花
赵维纳
吴健
贺也平
《中文信息学报》
CSCD
北大核心
2012
25
下载PDF
职称材料
3
基于单字特征和搜索引擎的新词识别
苏宁
惠子敬
刘娟
《武汉大学学报(理学版)》
CAS
CSCD
北大核心
2010
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部