期刊文献+

基于搜索引擎的模糊字频统计 被引量:2

Fuzzy frequency statistics of Chinese characters based on search engine
下载PDF
导出
摘要 针对传统字频统计方法周期长、代价高的弱点,提出了一种利用互联网内容并借助搜索引擎检索进行汉字模糊字频统计的全新方法,有效利用了网络时代的相关技术和发展成果,在一定程度上缓解了字频统计需求频繁的和传统统计方法的低效且代价高昂之间的矛盾,同时对该方法进行了实例化的分析、验证和改进。 Considering the traditional frequency statistics methods have drawbacks that may take longer time and higher spending, a brand new way of fuzzy frequency statistics of Chinese characters is presented by utilizing content of Internet and relying on search engines. To a certain degree the new method relieves the inconsistency between excessive demand of frequency statistics and ineffectiveness, expensiveness of traditional statistical method. Meanwhile, the analysis, verification and improvement of this new method are discussed by using a prototype.
出处 《计算机工程与设计》 CSCD 北大核心 2010年第2期443-446,共4页 Computer Engineering and Design
关键词 中文信息处理 模糊字频统计 搜索引擎 互联网 汉字字频 Chinese information process fuzzy frequency statistics search engine Intemet Chinese characters frequency
  • 相关文献

参考文献6

二级参考文献15

  • 1董志勇.Web信息检索中基于超链接的网页评估算法的研究[D].中国科学院软件研究所,2001.
  • 2阮彤.信息过滤模型与算法的研究[D].河海大学,2004.
  • 3周有光.现代汉语用字的定量问题[A].中国语文的现代化[M].上海:上海教育出版社,1986.
  • 4司玉英.关于”字母“和”字“[J].语言:第1卷.北京:首都师范大学出版社,2000.
  • 5748工程查频组.汉字频率统计表[M].1976.
  • 6北京语言学院教学研究所.现代汉语频率词典[M].北京:北京语言学院出版社,1986.
  • 7中国文字改革委员会,国家标准局.社会科学、自然科学综合字频统计表[M].北京:语文出版社,1992.
  • 8新华社技术研究所.汉字流通频度表[M].1987.
  • 9荣传湘,张晓辉,常桂然.中英文WWW搜索引擎中数据获取的设计与实现[J].小型微型计算机系统,1999,20(5):339-342. 被引量:16
  • 10雷鸣,刘建国,王建勇,陈葆珏.一种基于词典的搜索引擎系统动态更新模型[J].计算机研究与发展,2000,37(10):1265-1270. 被引量:13

共引文献16

同被引文献17

引证文献2

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部