期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于词的分布式实值表示的汉语基本块识别
被引量:
3
1
作者
侯潇琪
王瑞波
李济洪
《中北大学学报(自然科学版)》
CAS
北大核心
2013年第5期582-585,共4页
基于神经语言模型生成汉语词语的实值向量表示,称为词语的分布式表示,相应地以这种分布式表示构造的词特征称为分布式词特征.将这种分布式词特征替换基本块识别任务中所常用的条件随机场模型中的词特征,在清华大学TCT语料上进行了汉语...
基于神经语言模型生成汉语词语的实值向量表示,称为词语的分布式表示,相应地以这种分布式表示构造的词特征称为分布式词特征.将这种分布式词特征替换基本块识别任务中所常用的条件随机场模型中的词特征,在清华大学TCT语料上进行了汉语基本块识别任务实验,结果表明:在仅使用词窗口[-2,2]的词特征的模型中,和使用词窗口[-2,2]+词性特征的模型中,采用分布式词特征比传统的词特征的模型的标记精度分别高38.01%,1.86%,说明词语的分布式表示对汉语基本块识别任务是有作用的.
展开更多
关键词
神经语言模型
分布式词特征
基本块分析
边界识别
下载PDF
职称材料
自动获取大规模的汉语紧密组合词汇关联对
被引量:
1
2
作者
邱晗
周强
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第9期1293-1297,共5页
词汇关联对(lexical cohesion pairs,LCP)是真实文本中出现的反映不同句法语义关联关系的实词组合对。可靠的词汇关联对可以在汉语文本的复合词分析、句法结构排歧、远距离依赖识别和语义排歧等研究中发挥重要作用。该文提出了一种将基...
词汇关联对(lexical cohesion pairs,LCP)是真实文本中出现的反映不同句法语义关联关系的实词组合对。可靠的词汇关联对可以在汉语文本的复合词分析、句法结构排歧、远距离依赖识别和语义排歧等研究中发挥重要作用。该文提出了一种将基本块分析和统计筛选相结合的处理方法,保证在较高的提取精度条件下,尽可能多地从大规模真实文本语料库中自动获取较可靠的汉语紧密组合词汇关联对。在约4 000万字规模的人民日报词语切分和词性标注库上进行的关联对获取实验结果表明:该方法可以在废弃35.6%的有效分析信息条件下,自动提取出约73万个汉语名和动名关联对,抽样提取精度达到了96%左右,显示了较好的处理效果。
展开更多
关键词
词汇关联对
基本块分析
统计筛选
文本挖掘
知识获取
原文传递
题名
基于词的分布式实值表示的汉语基本块识别
被引量:
3
1
作者
侯潇琪
王瑞波
李济洪
机构
山西大学数学科学学院
山西大学计算机中心
出处
《中北大学学报(自然科学版)》
CAS
北大核心
2013年第5期582-585,共4页
基金
国家自然科学基金资助项目(60873128)
文摘
基于神经语言模型生成汉语词语的实值向量表示,称为词语的分布式表示,相应地以这种分布式表示构造的词特征称为分布式词特征.将这种分布式词特征替换基本块识别任务中所常用的条件随机场模型中的词特征,在清华大学TCT语料上进行了汉语基本块识别任务实验,结果表明:在仅使用词窗口[-2,2]的词特征的模型中,和使用词窗口[-2,2]+词性特征的模型中,采用分布式词特征比传统的词特征的模型的标记精度分别高38.01%,1.86%,说明词语的分布式表示对汉语基本块识别任务是有作用的.
关键词
神经语言模型
分布式词特征
基本块分析
边界识别
Keywords
neural language model
distributed word representation
Chinese base chunk
boundary identifi- cation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
自动获取大规模的汉语紧密组合词汇关联对
被引量:
1
2
作者
邱晗
周强
机构
清华大学信息技术研究院语音和语言研究中心
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第9期1293-1297,共5页
基金
国家自然科学基金面上项目(60873173)
文摘
词汇关联对(lexical cohesion pairs,LCP)是真实文本中出现的反映不同句法语义关联关系的实词组合对。可靠的词汇关联对可以在汉语文本的复合词分析、句法结构排歧、远距离依赖识别和语义排歧等研究中发挥重要作用。该文提出了一种将基本块分析和统计筛选相结合的处理方法,保证在较高的提取精度条件下,尽可能多地从大规模真实文本语料库中自动获取较可靠的汉语紧密组合词汇关联对。在约4 000万字规模的人民日报词语切分和词性标注库上进行的关联对获取实验结果表明:该方法可以在废弃35.6%的有效分析信息条件下,自动提取出约73万个汉语名和动名关联对,抽样提取精度达到了96%左右,显示了较好的处理效果。
关键词
词汇关联对
基本块分析
统计筛选
文本挖掘
知识获取
Keywords
lexical cohesion
basic chunk parsing
statistics-based filtering
text mining
knowledge acquisition
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于词的分布式实值表示的汉语基本块识别
侯潇琪
王瑞波
李济洪
《中北大学学报(自然科学版)》
CAS
北大核心
2013
3
下载PDF
职称材料
2
自动获取大规模的汉语紧密组合词汇关联对
邱晗
周强
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部