海关商品HS编码分类是企业和个人进出口贸易的重要国际程序。HS编码分类可以看作是一个文本分类问题,即给定一段商品的描述,确定商品由HS编码表示的所属类别。然而,该任务比一般的文本分类任务更具挑战性,原因是商品描述文本具有特定的...海关商品HS编码分类是企业和个人进出口贸易的重要国际程序。HS编码分类可以看作是一个文本分类问题,即给定一段商品的描述,确定商品由HS编码表示的所属类别。然而,该任务比一般的文本分类任务更具挑战性,原因是商品描述文本具有特定的层次结构,同时商品描述文本展现出了两个层次上的序列特征,并且商品描述文本还存在关键信息分散且描述形式多样的特点。现有的文本分类方法无法综合考虑以上因素来捕获商品描述文本中的关键信息。对此,文中提出了一种融合文本序列和图信息的神经网络(Text Sequence and Graph Information combination Neural Network,TSGINN)模型,用于解决海关商品HS编码分类问题。TSGINN将HS编码分类问题定义为基于词共现网络的子图分类问题,通过图注意力网络建模非连续词之间的关联关系,同时利用分层的长短期记忆网络结合商品文本层次结构捕获多层次的序列信息。在真实海关商品数据集上进行了实验,结果表明TSGINN模型的HS编码分类效果优于其他分类方法。展开更多
在软件著作权保护时需要进行两个软件代码相似度的识别和比较,为了更简便进行代码相似度的识别,出了一种与编程语言无关的软件代码特征提取的方法称之为逻辑层级序列(the sequence of the logic levels),主要以记录逻辑嵌套的层次变化...在软件著作权保护时需要进行两个软件代码相似度的识别和比较,为了更简便进行代码相似度的识别,出了一种与编程语言无关的软件代码特征提取的方法称之为逻辑层级序列(the sequence of the logic levels),主要以记录逻辑嵌套的层次变化来提取软件代码的特征,根据提出的方法,文中还模拟进行了两个代码片段的比较,结果可以定位出两组代码有相似性的部位,便于进一步人工审核,根据模拟结果,可以认为文中提出的方法具有实用性。展开更多
文摘海关商品HS编码分类是企业和个人进出口贸易的重要国际程序。HS编码分类可以看作是一个文本分类问题,即给定一段商品的描述,确定商品由HS编码表示的所属类别。然而,该任务比一般的文本分类任务更具挑战性,原因是商品描述文本具有特定的层次结构,同时商品描述文本展现出了两个层次上的序列特征,并且商品描述文本还存在关键信息分散且描述形式多样的特点。现有的文本分类方法无法综合考虑以上因素来捕获商品描述文本中的关键信息。对此,文中提出了一种融合文本序列和图信息的神经网络(Text Sequence and Graph Information combination Neural Network,TSGINN)模型,用于解决海关商品HS编码分类问题。TSGINN将HS编码分类问题定义为基于词共现网络的子图分类问题,通过图注意力网络建模非连续词之间的关联关系,同时利用分层的长短期记忆网络结合商品文本层次结构捕获多层次的序列信息。在真实海关商品数据集上进行了实验,结果表明TSGINN模型的HS编码分类效果优于其他分类方法。
文摘在软件著作权保护时需要进行两个软件代码相似度的识别和比较,为了更简便进行代码相似度的识别,出了一种与编程语言无关的软件代码特征提取的方法称之为逻辑层级序列(the sequence of the logic levels),主要以记录逻辑嵌套的层次变化来提取软件代码的特征,根据提出的方法,文中还模拟进行了两个代码片段的比较,结果可以定位出两组代码有相似性的部位,便于进一步人工审核,根据模拟结果,可以认为文中提出的方法具有实用性。