1.一种基于文本解耦合和图像处理的垃圾分类识别系统,其特征在于,包括:存储器、服务器、存储在所述存储器上并可在所述服务器上运行的计算机程序、数据库以及显示屏,其中,所述存储器上存储有分类对象的图像特征和第一对象文本,所述第一对象文本包括多个表征分类对象的名称的第一文本内容;其中,每个分类对象的图像特征对应唯一的一个第一文本内容;
所述数据库存储有分类记录表,所述分类记录表包括表征已分类垃圾的名称的第二对象文本,基于第二对象文本生成的分词向量和类别标志,每个分类记录包括表征每个已分类垃圾的名称的第二文本内容、对应的分词向量和类别标志;所述第一对象文本和所述第二对象文本的文本内容存在交集;
所述服务器执行所述计算机程序时实现如下步骤:
获取待分类对象的图像;
对待分类对象的图像进行识别,得到该图像的图像特征;
基于识别的图像特征在所述存储器中获取相应的第一文本内容;
对获取的第一文本内容进行分词处理,得到对应的分词向量;
使用所述分词向量在所述数据库中进行检索,得到对应的检索结果并在所述显示屏上进行显示,具体包括:对于所述分词向量中的每个分词,分别在所述数据库中进行检索,得到与每个分词匹配的检索分类记录;所述检索分类记录包括表征与所述第一文本内容对应的已分类垃圾的名称的第二文本内容、对应的分词向量和类别标志;
将得到的每个检索分类记录中的第二文本内容和类别标志的作为所述检索结果并在所述显示屏上进行显示;
其中,所述检索结果包括第二文本内容和类别标志,如果待分类对象在数据库存储的垃圾分类中,给用户呈现的检索结果包括待分类对象的名称、与待分类对象相关的已分类垃圾的名称和对应的类别标志,如果待分类对象不在数据库存储的垃圾分类中,给用户呈现的检索结果包括与待分类对象相关的已分类垃圾的名称和对应的类别标志,即所述第二文本内容包括所述第一文本内容和与所述待分类对象相关的已分类垃圾的名称或者仅包括与待分类对象相关的已分类垃圾的名称。
2.根据权利要求1所述的垃圾分类识别系统,其特征在于,所述分类记录还包括耦合标志,所述耦合标志用于表征所述分类记录表中的所有分词向量中的任意两个分词的分词集合之间的耦合关系;所述检索结果基于所述耦合标志确定。
3.根据权利要求2所述的垃圾分类识别系统,其特征在于,所述耦合标志通过下述方式得到:获取数据库中类别标志对应的所有分词向量中的所有分词的分词集合U1,U2,......,UN;
如果Ui和Uj存在交集Uij,则将交集Uij中的分词作为文本耦合词;i,j的取值为1...N;
使用文本耦合词在数据库中的分词向量中进行检索,并对检索到的分类记录设置耦合标志。
4.根据权利要求3所述的垃圾分类识别系统,其特征在于,所述耦合标志通过标志代码表示。
5.根据权利要求3所述的垃圾分类识别系统,其特征在于,所述耦合标志通过字符串表示。
6.根据权利要求2所述的垃圾分类识别系统,其特征在于,所述使用所述分词向量在所述数据库中进行检索,得到对应的检索结果并在所述显示屏上进行显示,具体包括:使用所述分词向量在所述数据库中进行检索,得到对应的检索分类记录;所述检索分类记录包括表征与所述第一文本内容对应的已分类垃圾的名称的第二文本内容、对应的分词向量、类别标志和耦合标志;
如果检索到的所有检索分类记录的耦合标志均为表征非耦合的标志,则将检索分类记录中的类别标志作为检索结果并在所述显示屏上进行显示;
如果检索到至少一个检索分类记录的耦合标志为表征耦合的标志,则将检索分类记录中的第二文本内容和类别标志作为检索结果并在所述显示屏上进行显示。
7.根据权利要求1或6所述的垃圾分类识别系统,其特征在于,所述服务器执行所述计算机程序时还实现:根据分词向量相似度对所述检索结果进行排序。
8.根据权利要求7所述的垃圾分类识别系统,其特征在于,所述分词向量相似度表示为A/B,其中,A为基于第一文本内容得到的分词向量中和基于第二文本内容得到的分词向量中的相同分词的数量,B为基于第二文本内容得到的分词向量中分词的数量。
9.根据权利要求1所述的垃圾分类识别系统,其特征在于,所述类别标志通过标志代码或者字符串表示。