本发明是关于某种商品自动化匹配方法。该方法包括:根据电商不同分类的行业知识,建立关于各类商品属性的知识库;根据知识库,将商品库中的商品及待匹配商品的属性值转换为标准属性值;对商品库中的商品及待匹配商品,构建其特征;根据构建的特征将待匹配的商品与商品库中的商品进行匹配。本发明提供的技术方案,通过建立一个完善而标准的电商商品库与知识库,能够将所需要的信息映射为标准化的信息,随着商品库与知识库建设的不断完善,匹配效果会越来愈好。这种匹配方式与传统的模糊匹配相比,准确性更高。另外,文本相似度与图片相似度作为补充方案与属性精准匹配方案相互配合相互补充,使得商品匹配的结果更加多元化。

1.某种商品自动化匹配方法,其特征在于,包括:根据电商不同分类的行业知识,建立关于各类商品属性的知识库;根据所述知识库,将商品库中的商品及待匹配商品的属性值转换为标准属性值:对所述商品库中的商品及所述待匹配商品,构建其特征;根据构建的特征将所述待匹配的商品与所述商品库中的商品进行匹配。
2.根据权利要求1所述的方法,其特征在于,所述根据电商不同分类的行业知识,建立关于各类商品属性的知识库,具体包括:梳理电商所有细分行业的具体分类,包括多级分类的所属关系;根据不同的分类线条,梳理具体线条上的末级分类其spu行业区分标准与sku行业区分标准,行业区分标准即为能够唯一确定属于同一spu或者sku的商品属性的组合,进一步,依据spu行业区分标准,得到多个sku聚合至所属spu的标准与依据:收集与整理各个分类的商品属性,建立知识库。
3.根据权利要求1所述的方法,其特征在于,所述特征包括文本特征和图像特征,其中,所述文本特征包括能够区分具体spu与sku的属性的标准属性值构成的文本键值对和商品标题文本向量,所述图像特征为从图片提取的全局特征向量。
4.根据权利要求3所述的方法,其特征在于,所述商品标题的文本向量的建立过程,具体包括:建立电商行业的干扰词库,将所述电商行业的干扰词库作为停止词从标题文本中剔除,然后依据剩下的文本,通过bert预训练模型输出向量,建立商品标题文本向量。
5.根据权利要求3所述的方法,其特征在于,所述图像特征的构建过程,具体包括:将图片进行去背景操作,保留白底商品图,然后通过Resnet或者vgg模型进行图片全局特征的提取,构成spu或者sku的图像特征。

6.根据权利要求3所述的方法,其特征在于,所述将所述待匹配的商品与所述商品库中的商品进行匹配,具体包括:如果所述待匹配商品的型号和属性值齐全,直接采用文本精准匹配的方法,找到商品库内型号和属性值一致的商品作为其精准匹配的结果;如果精准匹配没有匹配到,则根据型号相似度从大到小得到结果召回集,在召回集中取属性值能匹配一致的第一个结果作为最终模糊匹配的结果。
7.根据权利要求3所述的方法,其特征在于,所述将所述待匹配的商品与所述商品库中的商品进行匹配,具体包括:如果所述待匹配商品的型号有缺失,并且有属性值,则根据图片相似度从大到小得到结果召回集,在召回集中取属性值能匹配一致的第一个结果作为最终模糊匹配的结果。
8.根据权利要求3所述的方法,其特征在于,所述将所述待匹配的商品与所述商品库中的商品进行匹配,具体包括:如果所述待匹配商品的属性值有缺失,并且型号不缺失,则根据型号相似度从大到小得到结果召回集,在召回集中取属性值能匹配一致的第一个结果作为最终模糊匹配的结果。
9.根据权利要求3所述的方法,其特征在于,所述将所述待匹配的商品与所述商品库中的商品进行匹配,具体包括:如果所述待匹配商品没有属性值,并且型号不缺失,直接采用文本精准匹配的方法,找到库内型号一致的商品作为其精准匹配的结果;如果精准匹配没有匹配到,则根据型号相似度从大到小得到最相似的结果作为召回集,若召回集中只有一个结果,则直接作为最终模糊匹配的结果;若召回集中有多个结果,则在召回集中取图片相似度最大的结果作为最终模糊匹配的结果。
10.根据权利要求3所述的方法,其特征在于,所述将所述待匹配的商品与所述商品库中的商品进行匹配,具体包括:如果所述待匹配商品没有属性值和型号,则根据图片相似度从大到小得到结果召回集,若召回集中只有一个结果,则直接作为最终模糊匹配的结果:若召回集中有多个结果,则在召回集中取标题文本相似度最大的结果作为最终模糊匹配的结果。
文章来源:互联网,倘若您发现本站有侵权或不当信息,请与本站联系,经本站核实后将尽快修正!