为满足企业的技术服务及研发需求,各地陆续建设线上供需服务平台.线上技术供需匹配难的主要原因在于文本相似度计算的准确性以及多元数据对于成交结果的影响.为解决上述问题,本文提出一种融合多属性的供需推荐模型,针对“陕西省中小企...为满足企业的技术服务及研发需求,各地陆续建设线上供需服务平台.线上技术供需匹配难的主要原因在于文本相似度计算的准确性以及多元数据对于成交结果的影响.为解决上述问题,本文提出一种融合多属性的供需推荐模型,针对“陕西省中小企业研发服务平台”数据进行供需推荐,其中包括论文、专利、成果、项目等多属性特征,采用基于Bert(Bidirectional Encoder Representation from Transformers)的句向量表示方法计算供需文本的相似得分,并结合熵值法确定各属性权重,对各属性数据得分加权变换后实现推荐.实验表明,所提出的相似度计算模型在真实数据集上,各项评价指标优于词向量的表示方法.结合权值矩阵的多属性推荐模型,可较好的实现企业科技研发的供需推荐.展开更多
全面丰富的兴趣点(Point of Interest,POI)数据直接影响着地图App厂商的地理位置服务。针对传统的POI数据采集与上线方式周期长、速度慢的问题,提出一种高效的采集、上线POI数据的方式。将数据上线工作细化为:数据采集,数据格式化,数据...全面丰富的兴趣点(Point of Interest,POI)数据直接影响着地图App厂商的地理位置服务。针对传统的POI数据采集与上线方式周期长、速度慢的问题,提出一种高效的采集、上线POI数据的方式。将数据上线工作细化为:数据采集,数据格式化,数据判重与存储。在数据采集模块上采用一种负载均衡的分布式网络爬虫采集技术,数据格式化模块用于处理数据采集模块采集出的原始数据格式不统一的问题。数据判重模块将新旧数据的名称进行相似度计算,再结合经纬度计算的距离进行判重。结合Word2Vec与Siamese-LSTM设计判重模型,准确率达93.5%。展开更多
文摘为满足企业的技术服务及研发需求,各地陆续建设线上供需服务平台.线上技术供需匹配难的主要原因在于文本相似度计算的准确性以及多元数据对于成交结果的影响.为解决上述问题,本文提出一种融合多属性的供需推荐模型,针对“陕西省中小企业研发服务平台”数据进行供需推荐,其中包括论文、专利、成果、项目等多属性特征,采用基于Bert(Bidirectional Encoder Representation from Transformers)的句向量表示方法计算供需文本的相似得分,并结合熵值法确定各属性权重,对各属性数据得分加权变换后实现推荐.实验表明,所提出的相似度计算模型在真实数据集上,各项评价指标优于词向量的表示方法.结合权值矩阵的多属性推荐模型,可较好的实现企业科技研发的供需推荐.
文摘全面丰富的兴趣点(Point of Interest,POI)数据直接影响着地图App厂商的地理位置服务。针对传统的POI数据采集与上线方式周期长、速度慢的问题,提出一种高效的采集、上线POI数据的方式。将数据上线工作细化为:数据采集,数据格式化,数据判重与存储。在数据采集模块上采用一种负载均衡的分布式网络爬虫采集技术,数据格式化模块用于处理数据采集模块采集出的原始数据格式不统一的问题。数据判重模块将新旧数据的名称进行相似度计算,再结合经纬度计算的距离进行判重。结合Word2Vec与Siamese-LSTM设计判重模型,准确率达93.5%。