-
题名基于文本集密度的特征选择与权重计算方案
被引量:8
- 1
-
-
作者
吴科
石冰
卢军
牛小飞
-
机构
山东大学计算机科学与技术学院
山东轻工业学院物理系
-
出处
《中文信息学报》
CSCD
北大核心
2004年第1期42-47,共6页
-
基金
山东省教育厅项目 (J0 0F0 4 )
-
文摘
在信息检索的向量空间模型中 ,文本被形式化表示为由词语权重组成的向量。因此如何让这种向量尽量准确的有效的表示出文本内容一直是该模型中的基础性问题。在这篇论文中 ,我们提出了一种基于文本集密度的特征词选择与权重计算方案的方法。它是一种使用词对文本集密度的贡献衡量该词的价值的方法。使用这种方法 ,我们能找出不损失文本有效信息的最小特征词语集 ,并且创造出更为合理权重计算方案。在文中还用了一种新的衡量权重好坏的标准———元打分法 。
-
关键词
计算机应用
中文信息处理
信息检索
文本集密度
权重计算方案
元打分法
-
Keywords
computer application
Chinese information Processing
information retrieval
text set density
weighting scheme
meta scoring
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于文本集密度的社交媒体软件内容推荐系统设计研究
被引量:4
- 2
-
-
作者
汪涛
夏彬
-
机构
沈阳航空航天大学
-
出处
《现代电子技术》
2021年第12期73-77,共5页
-
基金
辽宁省自然科学基金项目(20180550282)。
-
文摘
针对传统的推荐系统中由于人工分配推荐内容权重导致的推荐内容单一的问题,提出基于文本集密度的社交媒体软件内容推荐系统设计研究。在硬件设计上,以FPGA作为系统硬件加速的核心,通过PCIE接口将其与服务器相连接,将FPGA的指令缓冲区作为控制数据访问和计算单元使用;在软件设计上,以空间文本信息作为对象,采用密度聚类的方式检索空间文本内容,生成推荐内容结果集,提前训练用户主题,根据用户ID实时向用户推荐内容。至此,系统设计完成。实验结果表明,设计的基于文本集密度的社交媒体软件内容推荐系统中与关键词实体相似的实体集概率高,推荐内容权重分配合理,能够向用户提供内容丰富的社交媒体相关信息。
-
关键词
社交媒体软件
内容推荐系统
文本集密度
硬件设计
软件设计
内容检索
实验分析
-
Keywords
social media software
content recommendation system
text set density
hardware design
software design
content retrieval
experiment analysis
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于AMTW算法的文本特征词权值计算
- 3
-
-
作者
曹慧
-
机构
山东中医药大学公共教学部
-
出处
《山东大学学报(工学版)》
CAS
2004年第3期92-95,共4页
-
文摘
提出了一种基于文本集密度的特征词选择与权值计算的方法AMTW (ApproachofModifyingTermWeighting) .该方法可以找出不损失文本有效信息的最小特征词语集 ,设计出更为合理权值计算方案 .
-
关键词
信息检索
文本集密度
权值计算
元打分法
-
Keywords
information retrieval
text set density
weighting
meta-scoring
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种新的用于文本分类的特征选择算法
- 4
-
-
作者
王卫玲
孔波
初建崇
杨玫
-
机构
海军航空工程学院
-
出处
《信息技术与信息化》
2009年第6期39-41,45,共4页
-
文摘
目前在文本分类领域较常用到的特征选择算法中,仅仅考虑了特征与类别之间的关联性,而对特征与特征之间的关联性没有予以足够的重视。在特征相关性分析的基础上,提出了一种新的算法,改进了特征选择算法中所出现的上述问题。实验验证了算法的可行性和有效性。
-
关键词
特征选择
文本分类
文本集密度
-
Keywords
Feature selection Text categorization Text set density
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-