基于高频词汇的英文文本可视化被引量：3

Visualization Based on High-frequency Words for English Text

下载PDF

导出

摘要为探索高频词汇间上下文关系的远近,本文研究了一种基于英文文本中高频词汇的可视化算法流程,并进行了可视化实现。我们首先用统计算法从英文文本中抽取出高频词汇及词汇间的上下文,然后定义了3种词汇间的连接方式,计算出有上下文关系的词汇间的关系度,并通过k-means算法对词汇间的关系度进行聚类,以体现出词汇间关系的远近,最后利用放射状树布局对聚类结果进行可视化。通过这种可视化形式,我们能够快速理解英文文本的内容。 Targeting at exploring whether high-frequency words＇ context relations are close or distant,this paper studied on the algorithmic process of a kind of visual form based on high-frequency words in English texts and achieves this visual form.This paper firstly used statistic algorithm to extract high-frequency words and their context,then defined three kinds of context relations among words,compute values of relations among words that have context,cluster the values＇ set through k-means cluster algorithm to show whether words＇ context relations are close or distant.Finally,visualized these clustering results by means of radial layout graph.Through this visual form,can quickly understand the contents of the English text.

作者刘春江杨世瀚杨宁

机构地区国家科学图书馆成都分馆

出处《现代情报》 CSSCI 2011年第8期21-24,共4页 Journal of Modern Information

关键词文本可视化高频词汇 K-MEANS聚类算法放射状树布局 text visualization high-frequency words k-means algorithm radial layout graph

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1Dan Kurland.Three Ways to Read and Discuss Texts. http:∥www.criticalreading.com/ways-to-read.htm . 2010
2M.Wattenberg,F.B.Viégas.The word tree,an interactive visualconcordance. IEEE Trans.on Visualization and Computer Graph-ics . 2008
3Stop words. http:∥en.wikipedia.org/wiki/Stop-words . 2010
4M.F.Porter.An algorithm for suffix stripping. Program:elec-tronic library and information systems .
5Edward Segel,Jeffrey Heer.Narrative Visualization:Telling Storieswith Data. IEEE Transactions on Visualization and ComputerGraphics . 2010
6k-means clustering. http:∥en.wikipedia.org/wiki/K-means-clustering . 2010
7Prefuse. http:∥www.prefuse.org . 2010
8Yee K P,Fisher D,Dhamija R,Hearst M.Animated exploration of dynamic graphs with radial layout. IEEE Symposium on Information Visualization . 2001
9Paley W B.TextArc:Showing Word Frequency and Distribution inText. IEEE Symposium on Information Visualization . 2002
10L.Nowell,S.Havre,B.Hetzler,P.Whitney."Themeriver:Visualizing thematic changesinlarge docu-ment collections,". Transactions on Visualization and Computer Graphics . 2001

同被引文献41

1罗式胜.科学文献关键词链的概念──一种统计分析方法[J].情报学报,1994,13(2):126-131. 被引量：23
2熊频,胡小勇.可视化思维支架:概念图研究的新视角[J].信息技术教育,2005(10):54-56. 被引量：47
3冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006,32(2):88-92. 被引量：572
4索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88
5魏晓俊.基于科技文献中词语的科技发展监测方法研究[J].情报杂志,2007,26(3):34-36. 被引量：47
6马费成.论情报学的基本原理及理论体系构建[J].情报学报,2007,26(1):3-13. 被引量：136
7Julie Steele, Noah Iliinsky.数据可视化之美[M].北京:机械工业出版社,2011:39-60.
8Andy Ramsden,Andrew Bate.Using Word Clouds inTeaching and Leaming[Z].University of Bath,2008.
9Melissa Baralt,Susan Pennestri,Marie Selvandin.UsingWordles to Teach Foreign Language Writing [J].LanguageLearning & Technology,2011 ,(6): 12-22.
10Collins,A-Towards a Design Science ofEducation[A].Scanlon,E-New Directions in EducationalTechnology [C].Berlin: Springer, 1992,15-22.

引证文献3

1杜华.文字云图的英语阅读教学设计与实践——以文字云图工具Wordle为例[J].现代教育技术,2012,22(9):65-69. 被引量：17
2王蕾.文字云图在英语阅读教学中的应用研究[J].读与写（教育教学刊）,2014,11(6):52-52. 被引量：1
3许海云,董坤,刘春江,王超,王振蒙.文本主题识别关键技术研究综述[J].情报科学,2017,35(1):153-160. 被引量：13

二级引证文献31

1王峰.整合文字云图的高中英语可视化教学设计[J].上海教育科研,2013(6):85-87. 被引量：10
2杜华.文字云图在英语写作工坊中的研究设计与实践[J].英语研究,2013,11(4):73-79. 被引量：1
3程玉胜,梁辉.文字云及主题模型的统计挖掘[J].安庆师范学院学报（自然科学版）,2014,20(1):32-35.
4方玉霜.论整合文字云图的高中英语可视化教学设计[J].赤子,2015(2):233-233. 被引量：3
5李凯旋,闫宇,胡凌绚.信息技术在高中英语学科中的应用研究[J].软件导刊.教育技术,2016,15(8):28-30. 被引量：13
6曲靖野,陈震,胡轶楠.共词分析与LDA模型分析在文本主题挖掘中的比较研究[J].情报科学,2018,36(2):18-23. 被引量：22
7薛耀锋,杨金朋,郭威,李卓玮.面向在线学习的多模态情感计算研究[J].中国电化教育,2018(2):46-50. 被引量：34
8刘宝莹.信息技术助力英语教学的实践探索[J].中小学电教（综合）,2018,0(5):43-46. 被引量：1
9吴筱明.词云在高职英语视听说教学中的应用[J].顺德职业技术学院学报,2018,16(2):58-62. 被引量：4
10张运超,朱晓申,袁娇,宁姣姣.基于Word Clouds的大学英语读写教学设计[J].宁波教育学院学报,2018,20(5):87-90. 被引量：1

1杨松.中职计算机专业如何利用微课实现翻转课堂[J].科学咨询,2015,0(20):86-88. 被引量：1
2辛竹,周亚建.文本分类中互信息特征选择方法的研究与算法改进[J].计算机应用,2013,33(A02):116-118. 被引量：15
3肖七妹.浅谈微课在中职计算机翻转课堂中的应用[J].福建电脑,2016,32(9):134-135. 被引量：5
4周智涛.幸福在哪里?[J].软件工程师,2006(12):1-1.
5唐家渝,刘知远,孙茂松.文本可视化研究综述[J].计算机辅助设计与图形学学报,2013,25(3):273-285. 被引量：53
6李仿松.信息时代网络安全探究[J].数字技术与应用,2016,34(9):207-207. 被引量：1
7向文容.融入用户心流体验——微信朋友圈广告维护用户体验的关键[J].传播与版权,2015(10):81-82. 被引量：4
8陈金梁,李青.基于本体的领域文档主题抽取方法研究[J].电脑开发与应用,2014,27(9):44-47.
93D立体打印技术——掀起制造技术新革命[J].军民两用技术与产品,2012(12):8-10. 被引量：1
10朱巧.基于词频统计的文本可视化实现[J].软件,2016,37(11):114-117. 被引量：3

现代情报

2011年第8期

浏览历史

内容加载中请稍等...

基于高频词汇的英文文本可视化被引量：3

参考文献13

同被引文献41

引证文献3

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于高频词汇的英文文本可视化 被引量：3

参考文献13

同被引文献41

引证文献3

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于高频词汇的英文文本可视化被引量：3