结合台风属性数据和多标签分类方法,以BERT-BiLSTM(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term Memory)为分类模型,提出基于微博文本与深度学习的台风灾情识别方法,对2010—2019年登陆广...结合台风属性数据和多标签分类方法,以BERT-BiLSTM(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term Memory)为分类模型,提出基于微博文本与深度学习的台风灾情识别方法,对2010—2019年登陆广东省的强台风/超强台风灾情进行识别,在粗分类获取台风灾情相关微博文本的基础上,进一步细分类为交通影响、社会影响、电力影响、林业影响和内涝积水等5类灾情。结果表明:1)提出的台风灾情识别方法粗分类和细分类精度分别达到0.907和0.814;2)强台风/超强台风的灾情占比受台风强度、路径和受灾地区发展水平等因素影响而存在差异;3)台风登陆前,灾情主要为台风预防措施导致的交通影响和社会影响。台风登陆后,灾情表现出单峰和双峰特征,反映台风灾情的变化趋势和特点。展开更多
相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进...相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进行相似用户挖掘的方法。该方法首先使用TextRank话题提取方法对用户进行兴趣话题提取,再对用户发表内容进行训练,计算出所有词之间的相似度。提出CP(Corresponding Position similarity)、CPW(Corresponding Position Weighted similarity)、AP(All Position similarity)、APW(All Position Weighted similarity)四种用户兴趣话题词相似度计算方法,通过用户和相似用户间关注、粉丝重合率验证相似用户挖掘效果,APW similarity的相似用户的关注/粉丝重合百分比为1.687%,优于提出的其他三种算法,分别提高了26.3%、2.8%、12.4%,并且比传统的文本相似度方法 Jaccard相似度、编辑距离算法、余弦相似度分别提高了20.4%、21.2%、45.0%。因此APW方法可以更加有效地挖掘出用户的相似用户。展开更多
文摘结合台风属性数据和多标签分类方法,以BERT-BiLSTM(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term Memory)为分类模型,提出基于微博文本与深度学习的台风灾情识别方法,对2010—2019年登陆广东省的强台风/超强台风灾情进行识别,在粗分类获取台风灾情相关微博文本的基础上,进一步细分类为交通影响、社会影响、电力影响、林业影响和内涝积水等5类灾情。结果表明:1)提出的台风灾情识别方法粗分类和细分类精度分别达到0.907和0.814;2)强台风/超强台风的灾情占比受台风强度、路径和受灾地区发展水平等因素影响而存在差异;3)台风登陆前,灾情主要为台风预防措施导致的交通影响和社会影响。台风登陆后,灾情表现出单峰和双峰特征,反映台风灾情的变化趋势和特点。
文摘相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进行相似用户挖掘的方法。该方法首先使用TextRank话题提取方法对用户进行兴趣话题提取,再对用户发表内容进行训练,计算出所有词之间的相似度。提出CP(Corresponding Position similarity)、CPW(Corresponding Position Weighted similarity)、AP(All Position similarity)、APW(All Position Weighted similarity)四种用户兴趣话题词相似度计算方法,通过用户和相似用户间关注、粉丝重合率验证相似用户挖掘效果,APW similarity的相似用户的关注/粉丝重合百分比为1.687%,优于提出的其他三种算法,分别提高了26.3%、2.8%、12.4%,并且比传统的文本相似度方法 Jaccard相似度、编辑距离算法、余弦相似度分别提高了20.4%、21.2%、45.0%。因此APW方法可以更加有效地挖掘出用户的相似用户。