期刊文献+

藏文搜索引擎系统中网页自动摘要的研究 被引量:3

Research on Automatic Abstract of Web Document Summarization of Tibetan Search Engine
下载PDF
导出
摘要 给出了藏文搜索引擎中网页自动摘要的基本思路、基本步骤和Web文摘的定义,讨论了分词算法,提出了基于句子抽取的Web文摘生成算法。算法中将每个Web句子的权重分解为Web特征词权重和Web句子结构权重,Web句子结构权重充分考虑排版格式和超连接属性。根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要。最后实验分析表明效果较好。 This paper provided the basic thinking and step of the automatic abstract of Web Document of Tibetan search engine and a definition for Web Document,the algorithm of words frequency is discussed,and presents an algorithm for Web Document based on sentences extraction.each sentence's weight is a weighted sum of word's weight and its sentence structure's weight,the sentence structure's weight considers both the Web formats and hyperlink attributes.Some sentences are selected according to the proportion definitely and the size of weights.Moreover,dealing with them smoothly.And last,generating automatic abstract,which is of some quality and fluent.
作者 安见才让
出处 《微处理机》 2010年第5期77-80,共4页 Microprocessors
基金 国家教育部项目资助(2008704)
关键词 自然语言处理 自动摘要 分词 权重 平滑处理 Natural language processing Automatic abstract Words frequency Weights Dealing with levelly and smoothly
  • 相关文献

参考文献4

二级参考文献30

  • 1陈小荷.自动分词中未登录词问题的一揽子解决方案[J].语言文字应用,1999(3):103-109. 被引量:26
  • 2刘挺,吴岩,王开铸.基于信息抽取和文本生成的自动文摘系统设计[J].情报学报,1997,16(S1):31-36. 被引量:13
  • 3傅间莲,陈群秀.基于连续段落相似度的主题划分算法[J].计算机应用,2005,25(9):2022-2024. 被引量:10
  • 4傅间莲,陈群秀.自动文摘系统中的主题划分问题研究[J].中文信息学报,2005,19(6):28-35. 被引量:13
  • 5才旦夏茸.藏文文法详解[M].西宁:青海民族出版社,1988..
  • 6LUHN HP.The automatic creation of literature abstract[J].IBM Journal of Research and Development,1958,2(2):159-165.
  • 7RUSH JE,SALVADOR R,ZAMORA A.Automatic abstracting and indexing production of indicative abstracts by application of contextual inference and syntactic coherence criteria[J].Journal of American Society for Information Society,1971,22(4):260-274.
  • 8SALTON G,SINGHAL A,MITRA M.Automatic Text Structuring and Summarization[J].Information Processing and Management,1997,33(2):193-207.
  • 9RAU LF.Concpetual information extraction and retrieval from natural language input[A].Proceedings of RIAO 88 Conference[C],1988.424-437.
  • 10DELORT JY,BOUCHON-MEUNIER B,RIFQI M.Enhanced Web Document Summarization Using Hyperlinks[A].Proceedings of the fourteenth ACM conference on Hypertext and hypermedia[C].United Kingdom,2003.208-215.

共引文献77

同被引文献4

引证文献3

二级引证文献15

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部