-
题名基于概念关系的文本特征提取方法
被引量:2
- 1
-
-
作者
文必龙
李乃峰
任秀英
冯翔
吕鹏全
-
机构
东北石油大学计算机与信息技术学院
-
出处
《计算机与数字工程》
2014年第11期2066-2068,2163,共4页
-
基金
国家科技重大专项(编号:2011ZX05023-005-012)资助
-
文摘
针对基于词频统计的TD-IDF文本特征提取方法缺乏对文本中概念关系处理,而使提取到的文本特征具有概念冗余、特征不明确等问题,提出基于本体概念相似度的词频统计方法。利用文本元素之间的语义相似度调整特征元素的词频,突出特征元素的语义贡献、消除特征冗余,增强特征集合元素的特征独立性。最后结合文本概念的共现特性,对可能出现某些重要特征元素因词频统计而被忽略的问题进行处理,从而准确、高效地提取文本特征。
-
关键词
文本特征
词频统计
本体概念相似度
共现特征
-
Keywords
text feature, word frequency statistics, similarity of ontology concepts, co-ocurrence features
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名地震数据作业处理模型优化的研究
- 2
-
-
作者
冯亚丽
吕鹏全
刘永江
李乃峰
任秀英
-
机构
东北石油大学计算机与信息技术学院
-
出处
《计算机与数字工程》
2014年第8期1427-1430,共4页
-
基金
国家科技重大专项(编号:2011ZX05023-005-012)资助
-
文摘
论文针对海量地震数据并行处理平台中运行作业效率低,作业运行过程中各个模块需要互相等待的现状,提出对现有的作业串行处理的运算方式进行改变和优化。在分析了当前的作业处理机制,经过多种用例测试后,发现串行的各个模块由于互相等待,没能发挥集群节点多核的优点,CPU利用率极低。于是建立海量地震数据的作业并行处理模型,即输入模块,处理模块及输出模块分别建立独立的进程,各自独立完成相应的任务,以提高计算机CPU、内存、磁盘输入输出的利用率,各个模块不必互相等待对方而使集群节点的性能得到充分利用。
-
关键词
地震数据文件
作业
并行处理模型
-
Keywords
seismic data file
operation
parallel processing model
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-