期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于大规模语料的新词发现算法
被引量:
7
下载PDF
职称材料
导出
摘要
对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/结婚/的/和尚/未/结婚/的”呢?
作者
顾森
机构地区
北京大学中文系
出处
《程序员》
2012年第7期54-57,共4页
Programmer
关键词
发现算法
自然语言处理
语料
中文资料
计算机
空格
汉语
分词
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
引文网络
相关文献
节点文献
二级参考文献
0
参考文献
0
共引文献
0
同被引文献
55
引证文献
7
二级引证文献
35
同被引文献
55
1
陈光.
现代汉语双音动词和形容词的特别重叠式──兼论基本重叠式的类化作用与功能渗透[J]
.汉语学习,1997(3):54-58.
被引量:16
2
李宇明.
双音节性质形容词的ABAB式重叠[J]
.汉语学习,1996(4):24-27.
被引量:26
3
崔建新.
可重叠为AABB式的形容词的范围[J]
.世界汉语教学,1995,9(4):14-22.
被引量:32
4
贾自艳,史忠植.
基于概率统计技术和规则方法的新词发现[J]
.计算机工程,2004,30(20):19-21.
被引量:28
5
殷寄明.
从语源学角度看“干巴巴”类派生词[J]
.南京师范大学文学院学报,2001(1):50-56.
被引量:7
6
郑厚尧.
ABB式叠词的内部结构分析[J]
.湖北师范学院学报(哲学社会科学版),2005,25(3):51-55.
被引量:7
7
崔世起,刘群,孟遥,于浩,西野文人.
基于大规模语料库的新词检测[J]
.计算机研究与发展,2006,43(5):927-932.
被引量:32
8
任禾,曾隽芳.
一种基于信息熵的中文高频词抽取算法[J]
.中文信息学报,2006,20(5):40-43.
被引量:22
9
周蕾,朱巧明.
基于统计和规则的未登录词识别方法研究[J]
.计算机工程,2007,33(8):196-198.
被引量:21
10
贺敏,龚才春,张华平,程学旗.
一种基于大规模语料的新词识别方法[J]
.计算机工程与应用,2007,43(21):157-159.
被引量:24
引证文献
7
1
郝晓玲,茅嘉惠,于秀艳.
微博热词抽取及话题发现研究[J]
.情报杂志,2015,34(6):109-113.
被引量:10
2
杨帆,刘亮亮.
基于统计的汉语叠词自动识别研究[J]
.重庆理工大学学报(自然科学),2016,30(7):123-128.
3
陈环环,陈小红,阮彤,高大启,王昊奋.
知识驱动的游戏攻略自动标注算法[J]
.计算机应用,2017,37(1):278-283.
被引量:4
4
陈小红,陈环环,方之家,阮彤,王昊奋.
基于领域本体的游戏攻略文本标注算法研究与实现[J]
.计算机应用与软件,2017,34(2):80-86.
被引量:2
5
张华平,商建云.
面向社会媒体的开放领域新词发现[J]
.中文信息学报,2017,31(3):55-61.
被引量:15
6
王雪瑞,刘渊.
基于边界增强的中文直播弹幕新词发现[J]
.传感器与微系统,2018,37(7):142-146.
被引量:1
7
曹帅.
结合关联置信度与结巴分词的新词发现算法[J]
.计算机系统应用,2020,29(5):144-151.
被引量:5
二级引证文献
35
1
万红新,彭云,郑睿颖.
时序化LDA的舆情文本动态主题提取[J]
.计算机与现代化,2016(7):91-94.
被引量:3
2
伏琰.
高校图书馆微博热点话题与传播分析[J]
.河南图书馆学刊,2016,36(12):51-53.
被引量:1
3
孙明溪,刘春琦.
基于DBSCAN算法与句间关系的热点话题发现研究[J]
.图书情报工作,2017,61(12):113-121.
被引量:7
4
孙文峥.
基于“用户—媒体—学术”视角的网络热词传播特征分析[J]
.出版科学,2017,25(5):99-104.
被引量:1
5
李智,徐展琦,丁喆,赵国强.
基于本体的业务源模型知识库构建及应用研究[J]
.计算机应用与软件,2018,35(2):16-21.
被引量:6
6
王欣.
一种基于多字互信息与邻接熵的改进新词合成算法[J]
.现代计算机(中旬刊),2018(4):7-11.
被引量:5
7
段青玲,张璐,刘怡然,王沙沙.
基于农业网络信息分类的热词自动提取方法[J]
.农业机械学报,2018,49(7):160-167.
被引量:8
8
陈秋瑞,郑世珏,陈辉,陈星男,杨岚江.
基于AlphaGo算法的网络媒体不良词汇自动检测模式研究[J]
.计算机与数字工程,2018,46(8):1589-1592.
被引量:1
9
俞琰,赵乃瑄.
基于通用词与术语部件的专利术语抽取[J]
.情报学报,2018,37(7):742-752.
被引量:14
10
王国华,汪恒,李慧芳,王戈.
重大社会热点事件在青年学生群体中的多元话语建构研究——以高校研究生自杀为例[J]
.情报杂志,2018,37(9):100-105.
被引量:4
1
赫优讯发布2008全系列工业通信产品中文资料[J]
.现代制造,2008(34):28-28.
2
小抄速记[J]
.电脑爱好者,2010(9):35-35.
3
龙治理,李西南.
开机自动设定中文输入法的方法[J]
.中国教育技术装备,2003(1):31-32.
4
杨永峰.
浅析水处理方面控制系统的选用[J]
.西南给排水,2005,27(3):42-44.
5
袁荣庆,谢劲松.
SIFT算法研究内容概述[J]
.长春大学学报,2014,24(6):728-730.
被引量:5
6
车晓阳.
Linux学习资源汇总[J]
.网管员世界,2005(6):109-111.
7
Thomson全新中文版网站面世[J]
.物流技术与应用,2010(11):110-110.
8
飞云.
繁体中文信可以直接写[J]
.电脑爱好者(普及版),2010(5):44-44.
9
张振国.
谈因特网上的中文农业信息资源[J]
.计算机与农业,2001(3):5-7.
被引量:2
10
酷站推荐[J]
.中外童话画刊(经典美文),2010(2):37-37.
程序员
2012年 第7期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部