-
题名基于改进最大匹配算法的中文分词粗分方法
被引量:18
- 1
-
-
作者
周俊
郑中华
张炜
-
机构
华中科技大学模具技术国家重点实验室
安徽博约信息科技有限责任公司
中国人民大学教育学院
-
出处
《计算机工程与应用》
CSCD
2014年第2期124-128,共5页
-
基金
国家自然科学基金(No.70773052)
-
文摘
中文粗分和歧义消解是中文分词的两大基本过程。通过引入广义词条和诱导词集,在最大匹配算法基础上提出一种中文分词的粗分方法,以最长广义词匹配为原则进行中文分词,利用诱导词集实现交叉型歧义识别。在保证快速准确切分无歧义汉语语句的同时,100%检测并标记有歧义汉语语句中的交叉型歧义,最大程度上简化后续歧义消解过程。通过对含有160万汉字1998年1月人民日报语料测试的结果证明了算法速度、歧义词准确率以及粗分召回率的有效性。
-
关键词
中文分词
最大匹配
广义词
诱导词集
-
Keywords
Chinese words segmentation
maximum match
generalized term
induced word set
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名网络媒体影响力评估:挑战与趋势
- 2
-
-
作者
汤书昆
郑中华
张炜
-
机构
中国科学技术大学
中国人民大学教育研究所
安徽博约信息科技有限责任公司
-
出处
《中国传媒科技》
2011年第12期58-60,共3页
-
文摘
网络媒体的兴起对传统媒体的挑战
网络媒体的兴起
近年来,网络媒体在全球范围内的兴起已是势不可挡。以国内为例,据2011年6月CNNIC发布的最新报告显示中国网民已达4.85亿,其中微博用户为1.95亿,上半年增速达208.9%。截至2011年我国已有网站183万个,域名总数786万个。在受众数量、内容资源迅速增长的同时,网络媒体的形式也不断推陈出新,从门户网站、论坛、博客再到新近兴起的搜索引擎、视频、微博和社交,形式日益多样化。
-
关键词
网络媒体
媒体影响力
评估
门户网站
CNNIC
传统媒体
内容资源
搜索引擎
-
分类号
G210.7
[文化科学—新闻学]
-
-
题名做互联网时代的聆听者
- 3
-
-
作者
郑中华
-
机构
安徽博约信息科技有限责任公司
-
出处
《中国高新区》
2014年第7期162-165,共4页
-
文摘
“ 我一直认为,创业要有所成,先要看“天气”,是不是符合时代大潮,如雷军所说“站在台风口上,猪也能飞上天”;再要接“地气”,一定是消费者和目标客户实实在在需要,每日不可离开的;还要有“人气”,才散人聚,吸引一帮精英一起努力,那么离成功就不远了.”
-
关键词
互联网时代
目标客户
消费者
创业
雷军
人气
-
分类号
F832.33
[经济管理—金融学]
-