第一句子网 > 图像获取方法装置电子设备及存储介质与流程

图像获取方法装置电子设备及存储介质与流程

时间：2019-06-23 21:07:22

本公开的实施例涉及图像处理技术领域，尤其涉及一种图像获取方法、装置、电子设备及存储介质。

背景技术：

外卖铂金广告位是指在美团外卖首页中部横幅广告位置的cpm(costpermille)广告位，展示样式可以如图1所示，展示样式由商家主图、商家标题、商家文案、商家满减信息以及三款该商家的菜品组成。

而现有的菜品推荐算法一般把该问题抽象为监督学习问题，即离线基于用户的历史数据建立模型，线上为用户预估点击率(或者转化率等其他给定目标)最高的三个菜品展示给用户。广告展示的内容是一个整体，单纯的个性化菜品推荐算法会把推荐的菜品与店铺其他样式剥离开。如图1所示，三个推荐菜品是和商家主图一起展示的，菜品图片跟商家主图是否搭配，菜品标题与商家标题是否搭配，展示的菜品是否足够有代表性，都是需要考虑的要素。

上述方式容易造成菜品推荐结果出现冗余，从而降低了用户的使用体验。

技术实现要素：

本公开的实施例提供了一种图像获取方法、装置、电子设备及存储介质，用以减少展示菜品出现的冗余，可以提高用户的使用体验。

根据本公开的实施例的第一方面，提供了一种图像获取方法，包括：

获取商户的多幅菜品图像和一幅商户主图；

获取每幅所述菜品图像对应的菜品标题文本，及所述商户主图对应的主图标题文本；

获取每幅所述菜品图像中的菜品特征，及所述商户主图中的主图特征；

基于每幅所述菜品图像的菜品标题文本和菜品特征，确定每幅所述菜品图像的菜品表征向量；

基于所述商户主图的主图标题文本和主图特征，确定所述商户主图的主图表征向量；

基于各所述菜品表征向量，对所述多幅菜品图像进行聚类处理，生成多个图像类簇；

基于各所述菜品表征向量、所述主图表征向量和预置点击率预估模型，获取各所述菜品图像对应的预估点击率；

从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。

可选地，所述基于每幅所述菜品图像的菜品标题文本和菜品特征，确定每幅所述菜品图像的菜品表征向量，包括：

获取每幅所述菜品图像中的菜品特征对应的第一表征向量；

基于各所述菜品标题文本，获取每幅所述菜品图像对应的第一文本表征向量；

将每幅菜品图像的第一表征向量和第一文本表征向量相结合，生成每幅所述菜品图像的菜品表征向量。

可选地，所述基于所述商户主图的主图标题文本和主图特征，确定所述商户主图的主图表征向量，包括：

获取所述主图特征对应的第二表征向量；

基于所述主图标题文本，获取所述商户主图对应的第二文本表征向量；

将所述第二表征向量和所述第二文本表征向量相结合，生成所述主图表征向量。

可选地，所述基于各所述菜品表征向量，对所述多幅菜品图像进行聚类处理，生成多个图像类簇，包括：

采用预置聚类算法对多个所述菜品表征向量进行聚类处理，生成多个图像类簇；每个所述图像类簇中包含至少一幅菜品图像。

可选地，所述基于各所述菜品表征向量、所述主图表征向量和预置点击率预估模型，获取各所述菜品图像对应的预估点击率，包括：

基于各所述菜品表征向量和所述主图表征向量，获取每幅菜品图像对应的相似度；

将各所述相似度输入至所述预置点击率评估模型，输出各所述菜品图像对应的预估点击率。

可选地，所述基于各所述菜品表征向量和所述主图表征向量，获取每幅菜品图像对应的相似度，包括：

计算各所述菜品表征向量和所述主图表征向量之间的余弦相似度，将各所述余弦相似度作为每幅菜品图像的相似度。

可选地，在所述从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像之后，还包括：

将所述商户主图和各所述待展示菜品图像进行融合处理，生成所述商户在指定业务平台上的展示图像。

根据本公开的实施例的第二方面，提供了一种图像获取装置，包括：

商户主图获取模块，用于获取商户的多幅菜品图像和一幅商户主图；

标题文本获取模块，用于获取每幅所述菜品图像对应的菜品标题文本，及所述商户主图对应的主图标题文本；

菜品主图特征获取模块，用于获取每幅所述菜品图像中的菜品特征，及所述商户主图中的主图特征；

菜品表征向量确定模块，用于基于每幅所述菜品图像的菜品标题文本和菜品特征，确定每幅所述菜品图像的菜品表征向量；

主图表征向量确定模块，用于基于所述商户主图的主图标题文本和主图特征，确定所述商户主图的主图表征向量；

图像类簇生成模块，用于基于各所述菜品表征向量，对所述多幅菜品图像进行聚类处理，生成多个图像类簇；

预估点击率获取模块，用于基于各所述菜品表征向量、所述主图表征向量和预置点击率预估模型，获取各所述菜品图像对应的预估点击率；

待展示图像获取模块，用于从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。

可选地，所述菜品表征向量确定模块包括：

第一表征向量获取子模块，用于获取每幅所述菜品图像中的菜品特征对应的第一表征向量；

第一文本向量获取子模块，用于基于各所述菜品标题文本，获取每幅所述菜品图像对应的第一文本表征向量；

菜品表征向量生成子模块，用于将每幅菜品图像的第一表征向量和第一文本表征向量相结合，生成每幅所述菜品图像的菜品表征向量。

可选地，所述主图表征向量确定模块包括：

第二表征向量获取子模块，用于获取所述主图特征对应的第二表征向量；

第二文本向量获取子模块，用于基于所述主图标题文本，获取所述商户主图对应的第二文本表征向量；

主图表征向量生成子模块，用于将所述第二表征向量和所述第二文本表征向量相结合，生成所述主图表征向量。

可选地，所述图像类簇生成模块包括：

图像类簇生成子模块，用于采用预置聚类算法对多个所述菜品表征向量进行聚类处理，生成多个图像类簇；每个所述图像类簇中包含至少一幅菜品图像。

可选地，所述预估点击率获取模块包括：

相似度获取子模块，用于基于各所述菜品表征向量和所述主图表征向量，获取每幅菜品图像对应的相似度；

预估点击率输出子模块，用于将各所述相似度输入至所述预置点击率评估模型，输出各所述菜品图像对应的预估点击率。

可选地，所述相似度获取子模块包括：

余弦相似度计算子模块，用于计算各所述菜品表征向量和所述主图表征向量之间的余弦相似度，将各所述余弦相似度作为每幅菜品图像的相似度。

可选地，还包括：

展示图像生成模块，用于将所述商户主图和各所述待展示菜品图像进行融合处理，生成所述商户在指定业务平台上的展示图像。

根据本公开的实施例的第三方面，提供了一种电子设备，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一项所述的图像获取方法。

根据本公开的实施例的第四方面，提供了一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一项所述的图像获取方法。

本公开的实施例提供了一种图像获取方案，通过获取商户的多幅菜品图像和一幅商户主图，获取每幅菜品图像对应的菜品标题文本及商户主图对应的主图标题文本，获取每幅菜品图像中的菜品特征，及商户主图中的主图特征，基于每幅菜品图像的菜品标题文本和菜品特征，确定每幅菜品图像的菜品表征向量，基于商户主图的主图标题文本和主图特征，确定商户主图的主图表征向量，基于各菜品表征向量，对多幅菜品图像进行聚类处理，生成多个图像类簇，基于各菜品表征向量、主图表征向量和预置点击率预估模型，获取各菜品图像对应的预估点击率，从每个图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。本公开的实施例通过将商户的菜品图像划分为多个图像类簇，并从每个图像类簇中选取预估点击率最高的菜品图像作为商户的展示菜品，可以避免出现展示菜品的冗余，能够提升用户的使用体验。

附图说明

为了更清楚地说明本公开的实施例的技术方案，下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的实施例的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1示出了现有技术中的一种广告图像展示样式的示意图；

图2示出了本公开实施例的一种图像获取方法的步骤流程图；

图3示出了本公开实施例的一种图像获取方法的步骤流程图；

图4示出了本公开实施例的一种图像获取装置的结构示意图；

图5示出了本公开实施例的一种图像获取装置的结构示意图。

具体实施方式

下面将结合本公开的实施例中的附图，对本公开的实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开的实施例一部分实施例，而不是全部的实施例。基于本公开的实施例中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开的实施例保护的范围。

实施例一

参照图2，示出了本公开实施例提供的一种图像获取方法的步骤流程图，该图像获取方法可以包括如下步骤：

步骤101：获取商户的多幅菜品图像和一幅商户主图。

本公开的实施例可以应用于对指定业务平台(如美团外卖平台等)展示商户的推荐菜图像的场景中。

在本公开中，商户是指餐饮商户。

菜品图像是指商户经营的菜品的图像，商户主图是指包含有商户名称、商户logo、商户优惠活动等字样的图像。

在某些示例中，菜品图像和商户主图可以是由商户上传至指定业务平台上的。具体地，商户可以使用相机等设备对门头进行拍摄得到门头图，并对商户门头图进行处理，添加上商户名称、商户logo、商户优惠活动等字样，从而生成商户主图，然后，对其特色菜品进行拍照，从而得到多幅菜品图像，并将得到的商户主图和菜品图像上传至指定业务平台。

在某些示例中，菜品图像和商户主图可以是由指定业务平台安排的业务人员采集的商户的图像，如，业务人员在商户所在地进行现场拍摄，并进行后期处理，从而得到商户的多幅菜品图像和商户主图。

可以理解地，上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例，不作为对本公开实施例的唯一限制，在具体实现中，商户的菜品图像和商户主图还可以是从评论区所获取的，如商户在评论区对其它菜品进行推广时，所上传的菜品图像和商户主图等，具体地，可以根据实际情况而定，本公开实施例对此不加以限制。

在获取商户的多幅菜品图像和一幅商户主图之后，执行步骤102和步骤103。

步骤102：获取每幅所述菜品图像对应的菜品标题文本，及所述商户主图对应的主图标题文本。

菜品标题文本是指每幅菜品图像对应的标题文本，如“麻辣香锅”、“香辣虾”等标题文本。

主图标题文本是指商户主图对应的标题文本，如“xxx小龙虾”、“xxx羊汤馆”等标题文本。

在本公开中，每幅菜品图像的菜品标题文本和商户主图的主题标题文本可以是由商户为每幅菜品图像和一幅商户主图输入的文本。也可以是由指定业务平台的业务人员为每幅菜品图像和一幅商户主图输入的文本，具体地，可以根据业务需求而定，本公开实施例对此不加以限制。

步骤103：获取每幅所述菜品图像中的菜品特征，及所述商户主图中的主图特征。

菜品特征是指菜品图像中所包含的菜品的特征，例如，如图1所示，展示图像中所包含的菜品特征为“虾”。

主图特征是指商户主图中所包含的特征，如图1所示，该展示图像中的商家的logo等即为主图特征。

可以理解地，上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例，不作为对本公开实施例的唯一限制。

在获取商户的多幅菜品图像和一幅商户主图之后，可以采用图像识别技术对每幅菜品图像和商户主图进行图像识别处理，以获取每幅菜品图像中的菜品特征，及商户主图中的主图特征。

当然，在具体实现中，还可以采用其它方式获取每幅菜品图像的菜品特征和商户主图中的主图特征，如人工录入等方式，具体地，可以根据业务需求而定，本公开实施例对此不加以限制。

在获取每幅菜品图像对应的菜品标题文本和每幅菜品图像中的菜品特征，及商户主图对应的主图标题文本和商户主图中的主图特征之后，执行步骤104。

步骤104：基于每幅所述菜品图像的菜品标题文本和菜品特征，确定每幅所述菜品图像的菜品表征向量。

步骤105：基于所述商户主图的主图标题文本和主图特征，确定所述商户主图的主图表征向量。

菜品表征向量是指结合菜品图像菜品标题文本和菜品特征相结合之后得到的表征向量。

主图表征向量是指将商户主图中的主图特征和主图标题文本转换为向量进行表示。

获取商户的多幅菜品图像和一幅商户主图之后，可以采用inceptionv4模型提取出菜品图像以及商户主图的图像特征(即菜品特征和主图特征)，并通过网络层avgpooling对提取的图像特征进行压缩，从而可以得到每幅菜品图像的向量表示，可以得到商户主图的向量表示。

然后，根据每幅菜品图像对应的菜品标题文本，得到每幅菜品图像对应的文本表征向量，及根据商户主图对应的主图标题文本，得到商户主图对应的文本表征向量。

结合每幅菜品图像的菜品特征的表征向量和菜品标题文本的表征向量，可以得到每幅菜品图像的菜品表征向量。

结合商户主图的主图特征的表征向量和主图标题文本的表征向量，可以得到商户主图的主图表征向量。

对于获取每幅菜品图像对应的菜品表征向量，及商户主图对应的主图表征向量的具体方式，将在下述实施例二中进行详细描述，本公开实施例在此不再加以赘述。

在获取每幅菜品图像对应的菜品表征向量，及商户主图对应的主图表征向量之后，执行步骤106。

步骤106：基于各所述菜品表征向量，对所述多幅菜品图像进行聚类处理，生成多个图像类簇。

图像类簇是指将菜品图像进行分类，所得到的类簇，每个图像类簇中的菜品图像的菜品特征是相似的，那么不同的图像类簇中，两幅菜品图像所包含的菜品特征是不相同的。

在得到多幅菜品图像中每幅菜品图像的菜品表征向量之后，可以根据每幅菜品图像的菜品表征向量，对多幅菜品图像进行聚类处理，从而可以生成多个图像类簇，具体地，可以采用预置聚类算法对多幅菜品图像的表征向量进行聚类处理，从而可以产生多个图像类簇。

对于聚类处理的详细过程将在下述实施例中进行描述，本公开实施例在此不再加以赘述。

在基于各菜品表征向量，对多幅菜品图像进行聚类处理，生成多个图像类簇之后，执行步骤107。

步骤107：基于各所述菜品表征向量、所述主图表征向量和预置点击率预估模型，获取各所述菜品图像对应的预估点击率。

预估点击率是指评估得到的每幅菜品图像的点击率。

预置点击率预估模型是指用于对每幅菜品图像的点击率进行评估的模型。

在得到上述每幅菜品图像的菜品表征向量及商户主图的主图表征向量之后，可以将每幅菜品图像的菜品表征向量及商户主图的主图表征向量输入至预置点击率预估模型中，从而可以得到每幅菜品图像对应的预估点击率。

在获取各菜品图像对应的预估点击率之后，执行步骤108。

步骤108：从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。

在得到多幅菜品图像分别对应的预估点击率之后，可以根据之前得到的图像类簇，分别从每个图像类簇中获取预估点击率最高的一副菜品图像，作为待展示菜品图像，例如，图像类簇包括类簇a、类簇b和类簇c，类簇a中预估点击率最高的菜品图像为图像a，类簇b中预估点击率最高的菜品图像为图像b，类簇c中预估点击率最高的菜品图像为图像c，则将图像a、图像b和图像c作为待展示菜品图像。

可以理解地，上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例，不作为对本公开实施例的唯一限制。

本公开实施例通过将商户的菜品图像划分为多个图像类簇，并从每个图像类簇中选取预估点击率最高的菜品图像作为商户的展示菜品，可以避免出现展示菜品的冗余。

本公开的实施例提供的图像获取方法通过获取商户的多幅菜品图像和一幅商户主图，获取每幅菜品图像对应的菜品标题文本及商户主图对应的主图标题文本，获取每幅菜品图像中的菜品特征，及商户主图中的主图特征，基于每幅菜品图像的菜品标题文本和菜品特征，确定每幅菜品图像的菜品表征向量，基于商户主图的主图标题文本和主图特征，确定商户主图的主图表征向量，基于各菜品表征向量，对多幅菜品图像进行聚类处理，生成多个图像类簇，基于各菜品表征向量、主图表征向量和预置点击率预估模型，获取各菜品图像对应的预估点击率，从每个图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。本公开的实施例通过将商户的菜品图像划分为多个图像类簇，并从每个图像类簇中选取预估点击率最高的菜品图像作为商户的展示菜品，可以避免出现展示菜品的冗余，能够提升用户的使用体验。

实施例二

参照图3，示出了本公开实施例提供的一种图像获取方法的步骤流程图，该图像获取方法可以包括如下步骤：

步骤201：获取商户的多幅菜品图像和一幅商户主图。

本公开的实施例可以应用于对指定业务平台(如美团外卖平台等)展示商户的推荐菜图像的场景中。

在本公开中，商户是指餐饮商户。

菜品图像是指商户经营的菜品的图像，商户主图是指包含有商户名称、商户logo、商户优惠活动等字样的图像。

在获取商户的多幅菜品图像和一幅商户主图之后，执行步骤202。

步骤202：获取每幅所述菜品图像对应的菜品标题文本，及所述商户主图对应的主图标题文本。

菜品标题文本是指每幅菜品图像对应的标题文本，如“麻辣香锅”、“香辣虾”等标题文本。

主图标题文本是指商户主图对应的标题文本，如“xxx小龙虾”、“xxx羊汤馆”等标题文本。

步骤203：获取每幅所述菜品图像中的菜品特征，及所述商户主图中的主图特征。

菜品特征是指菜品图像中所包含的菜品的特征，例如，如图1所示，展示图像中所包含的菜品特征为“虾”。

主图特征是指商户主图中所包含的特征，如图1所示，该展示图像中的商家的logo等即为主图特征。

可以理解地，上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例，不作为对本公开实施例的唯一限制。

在获取每幅菜品图像对应的菜品标题文本和每幅菜品图像中的菜品特征，及商户主图对应的主图标题文本和商户主图中的主图特征之后，执行步骤204。

步骤204：获取每幅所述菜品图像中的菜品特征对应的第一表征向量。

第一表征向量是指将菜品图像的菜品特征转换为向量进行表示，如将每幅菜品图像的菜品特征通过网络层avgpooling进行压缩，最终得到154维的向量表示，该154维的向量表示即为第一表征向量。

在获取每幅菜品图像中的菜品特征之后，可以将菜品特征进行向量表示，从而可以得到每幅菜品图像中的菜品特征对应的第一表征向量。

在获取每幅菜品图像中的菜品特征对应的第一表征向量之后，执行步骤205。

步骤205：基于各所述菜品标题文本，获取每幅所述菜品图像对应的第一文本表征向量。

第一文本表征向量是指将菜品图像的菜品标题文本转换为向量进行表示。

对于获取第一文本表征向量的方式可以是：首先对菜品标题文本进行分词，然后采用基于fasttext工具实现的pvdm算法抽取菜品文本信息的向量表示，该算法可以直接获取到每个菜品标题文本的向量表示，如将每幅菜品图像的菜品标题文本转换为154维的向量表示，该154维的向量表示即为第一文本表征向量。

在基于各菜品标题文本，获取每幅菜品图像对应的第一文本表征向量之后，执行步骤206。

步骤206：将每幅菜品图像的第一表征向量和第一文本表征向量相结合，生成每幅所述菜品图像的菜品表征向量。

菜品表征向量是指将菜品图像的第一表征向量和第一文本表征向量相结合，得到的表征向量。

在得到每幅菜品图像的第一表征向量和第一文本表征向量，可以将每幅菜品图像的第一表征向量和第一文本表征向量相结合，从而可以生成每幅菜品图像的菜品表征向量，例如，上述示例中，获取的第一表征向量为154维的向量表示，第一文本表征向量也为154维的向量表示，将第一表征向量和第一文本表征向量相结合，可以得到一个308维的向量表示，该308维的向量表示即为菜品表征向量。

可以理解地，上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例，不作为对本公开实施例的唯一限制。

步骤207：获取所述主图特征对应的第二表征向量。

第二表征向量是指将商户主图的主图特征转换为向量进行表示，如将商户主图的主图特征通过网络层avgpooling进行压缩，最终得到154维的向量表示，该154维的向量表示即为第二表征向量。

在获取商户主图中的主图特征之后，可以将商户主图中的主图特征转换为向量表示，即获取商户主图中的主图特征对应的第二表征向量。

在获取主图特征对应的第二表征向量之后，执行步骤208。

步骤208：基于所述主图标题文本，获取所述商户主图对应的第二文本表征向量。

第二文本表征向量是指将商户主图的主图标题文本转换为向量进行表示。

对于获取第二文本表征向量的方式可以是：首先对主题标题文本进行分词，然后采用基于fasttext工具实现的pvdm算法抽取主图标题文本的向量表示，该算法可以直接获取到主图标题文本的向量表示，如将主图图像的主图标题文本转换为154维的向量表示，该154维的向量表示即为第二文本表征向量。

在基于主图标题文本，获取商户主图对应的第二文本表征向量之后，执行步骤209。

步骤209：将所述第二表征向量和所述第二文本表征向量相结合，生成所述主图表征向量。

主图表征向量是指将商户主图的第二表征向量和第二文本表征向量相结合，得到的表征向量。

在得到商户主图的第二表征向量和第二文本表征向量，可以将商户主图的第二表征向量和第二文本表征向量相结合，从而可以生成商户主图的主图表征向量，例如，上述示例中，获取的第二表征向量为154维的向量表示，第二文本表征向量也为154维的向量表示，将第二表征向量和第二文本表征向量相结合，可以得到一个308维的向量表示，该308维的向量表示即为主图表征向量。

可以理解地，上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例，不作为对本公开实施例的唯一限制。

步骤210：采用预置聚类算法对多个所述菜品表征向量进行聚类处理，生成多个图像类簇；每个所述图像类簇中包含至少一幅菜品图像。

预置聚类算法是指用于多幅菜品图像进行分类的算法，预置聚类算法可以为keans算法等，具体地，可以根据业务需求而定，本公开实施例对此不加以限制。

在得到多幅菜品图像对应的菜品表征向量之后，可以将多个菜品表征向量输入至预置聚类算法，由预置聚类算法对多幅菜品图像进行聚类处理，从而可以生成多个图像类簇。在每个图像类簇中包含有至少一幅菜品图像。

在采用预置聚类算法对多个菜品表征向量进行聚类处理，生成多个图像类簇之后，执行步骤211。

步骤211：基于各所述菜品表征向量和所述主图表征向量，获取每幅菜品图像对应的相似度。

在得到每幅菜品图像的菜品表征向量和商户主图的主图表征向量之后，可以根据每个菜品表征向量和主图表征向量计算相似度，即计算每个菜品表征向量和主图表征向量之间的余弦相似度，将各余弦相似度作为每幅菜品图像与商户主图的相似度。

在基于各菜品表征向量和主图表征向量，获取每幅菜品图像对应的相似度之后，执行步骤212。

步骤212：将各所述相似度输入至所述预置点击率评估模型，输出各所述菜品图像对应的预估点击率。

预估点击率是指评估得到的每幅菜品图像的点击率。

预置点击率预估模型是指用于对每幅菜品图像的点击率进行评估的模型。

在得到每幅菜品图像所对应的相似度之后，可以将相似度值输入至预置点击率评估模型中，并由预置点击率评估模型输出各菜品图像的预估点击率。

当然，在具体实现中，还可以将每幅菜品图像的离散特征(如商户标识、菜品标识和感兴趣菜品标识等特征)、统计类特征(即用户与菜品的统计类特征，如菜品的点赞次数等特征)、菜品图像的菜品特征表征向量和文本表征向量等特征共同输入至预置点击率评估模型，以根据多维度的特征计算每幅菜品图像的预估点击率。

在将各相似度输入至预置点击率评估模型，输出各菜品图像对应的预估点击率之后，执行步骤213。

步骤213：从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。

可以理解地，上述示例仅是为了更好地理解本公开实施例的技术方案而列举的示例，不作为对本公开实施例的唯一限制。

在从每个图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像之后，执行步骤214。

步骤214：将所述商户主图和各所述待展示菜品图像进行融合处理，生成所述商户在指定业务平台上的展示图像。

在得到多幅待展示菜品图像后，可以将多幅待展示菜品图像和商户主图进行融合，从而可以生成商户在指定业务平台上的展示图像，例如，如图1所示，商户在指定业务平台上的展示图像可以包括三个展示菜品及商户的logo、优惠信息等。

本公开的实施例提供的图像获取方法，通过获取商户的多幅菜品图像和一幅商户主图，获取每幅菜品图像对应的菜品标题文本及商户主图对应的主图标题文本，获取每幅菜品图像中的菜品特征，及商户主图中的主图特征，基于每幅菜品图像的菜品标题文本和菜品特征，确定每幅菜品图像的菜品表征向量，基于商户主图的主图标题文本和主图特征，确定商户主图的主图表征向量，基于各菜品表征向量，对多幅菜品图像进行聚类处理，生成多个图像类簇，基于各菜品表征向量、主图表征向量和预置点击率预估模型，获取各菜品图像对应的预估点击率，从每个图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。本公开的实施例通过将商户的菜品图像划分为多个图像类簇，并从每个图像类簇中选取预估点击率最高的菜品图像作为商户的展示菜品，可以避免出现展示菜品的冗余，能够提升用户的使用体验。

实施例三

参照图4，示出了本公开实施例提供的一种图像获取装置的结构示意图，该图像获取装置可以包括如下模块：

商户主图获取模块310，用于获取商户的多幅菜品图像和一幅商户主图；

标题文本获取模块320，用于获取每幅所述菜品图像对应的菜品标题文本，及所述商户主图对应的主图标题文本；

菜品主图特征获取模块330，用于获取每幅所述菜品图像中的菜品特征，及所述商户主图中的主图特征；

菜品表征向量确定模块340，用于基于每幅所述菜品图像的菜品标题文本和菜品特征，确定每幅所述菜品图像的菜品表征向量；

主图表征向量确定模块350，用于基于所述商户主图的主图标题文本和主图特征，确定所述商户主图的主图表征向量；

图像类簇生成模块360，用于基于各所述菜品表征向量，对所述多幅菜品图像进行聚类处理，生成多个图像类簇；

预估点击率获取模块370，用于基于各所述菜品表征向量、所述主图表征向量和预置点击率预估模型，获取各所述菜品图像对应的预估点击率；

待展示图像获取模块380，用于从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。

本公开的实施例提供的图像获取装置，通过获取商户的多幅菜品图像和一幅商户主图，获取每幅菜品图像对应的菜品标题文本及商户主图对应的主图标题文本，获取每幅菜品图像中的菜品特征，及商户主图中的主图特征，基于每幅菜品图像的菜品标题文本和菜品特征，确定每幅菜品图像的菜品表征向量，基于商户主图的主图标题文本和主图特征，确定商户主图的主图表征向量，基于各菜品表征向量，对多幅菜品图像进行聚类处理，生成多个图像类簇，基于各菜品表征向量、主图表征向量和预置点击率预估模型，获取各菜品图像对应的预估点击率，从每个图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。本公开的实施例通过将商户的菜品图像划分为多个图像类簇，并从每个图像类簇中选取预估点击率最高的菜品图像作为商户的展示菜品，可以避免出现展示菜品的冗余，能够提升用户的使用体验。

实施例四

参照图5，示出了本公开实施例提供的一种图像获取装置的结构示意图，该图像获取装置可以包括如下模块：

商户主图获取模块410，用于获取商户的多幅菜品图像和一幅商户主图；

标题文本获取模块420，用于获取每幅所述菜品图像对应的菜品标题文本，及所述商户主图对应的主图标题文本；

菜品主图特征获取模块430，用于获取每幅所述菜品图像中的菜品特征，及所述商户主图中的主图特征；

菜品表征向量确定模块440，用于基于每幅所述菜品图像的菜品标题文本和菜品特征，确定每幅所述菜品图像的菜品表征向量；

主图表征向量确定模块450，用于基于所述商户主图的主图标题文本和主图特征，确定所述商户主图的主图表征向量；；

图像类簇生成模块460，用于基于各所述菜品表征向量，对所述多幅菜品图像进行聚类处理，生成多个图像类簇；

预估点击率获取模块470，用于基于各所述菜品表征向量、所述主图表征向量和预置点击率预估模型，获取各所述菜品图像对应的预估点击率；

待展示图像获取模块480，用于从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像；

展示图像生成模块490，用于将所述商户主图和各所述待展示菜品图像进行融合处理，生成所述商户在指定业务平台上的展示图像。

可选地，所述菜品表征向量确定模块440包括：

第一表征向量获取子模块441，用于获取每幅所述菜品图像中的菜品特征对应的第一表征向量；

第一文本向量获取子模块442，用于基于各所述菜品标题文本，获取每幅所述菜品图像对应的第一文本表征向量；

菜品表征向量生成子模块443，用于将每幅菜品图像的第一表征向量和第一文本表征向量相结合，生成每幅所述菜品图像的菜品表征向量。

可选地，所述主图表征向量确定模块450包括：

第二表征向量获取子模块451，用于获取所述主图特征对应的第二表征向量；

第二文本向量获取子模块452，用于基于所述主图标题文本，获取所述商户主图对应的第二文本表征向量；

主图表征向量生成子模块453，用于将所述第二表征向量和所述第二文本表征向量相结合，生成所述主图表征向量。

可选地，所述图像类簇生成模块460包括：

图像类簇生成子模块461，用于采用预置聚类算法对多个所述菜品表征向量进行聚类处理，生成多个图像类簇；每个所述图像类簇中包含至少一幅菜品图像。

可选地，所述预估点击率获取模块470包括：

相似度获取子模块471，用于基于各所述菜品表征向量和所述主图表征向量，获取每幅菜品图像对应的相似度；

预估点击率输出子模块472，用于将各所述相似度输入至所述预置点击率评估模型，输出各所述菜品图像对应的预估点击率。

可选地，所述相似度获取子模块471包括：

余弦相似度计算子模块，用于计算各所述菜品表征向量和所述主图表征向量之间的余弦相似度，将各所述余弦相似度作为每幅菜品图像的相似度。

本公开的实施例还提供了一种电子设备，包括：处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现前述实施例的图像获取方法。

本公开的实施例还提供了一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述实施例的图像获取方法。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本公开的实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本公开的实施例的内容，并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本公开的示例性实施例的描述中，本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本公开的实施例的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。

本公开的实施例的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述仅为本公开的实施例的较佳实施例而已，并不用以限制本公开的实施例，凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本公开的实施例的保护范围之内。

以上所述，仅为本公开的实施例的具体实施方式，但本公开的实施例的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的实施例的保护范围之内。因此，本公开的实施例的保护范围应以权利要求的保护范围为准。

技术特征：

1.一种图像获取方法，其特征在于，包括：

获取商户的多幅菜品图像和一幅商户主图；

获取每幅所述菜品图像对应的菜品标题文本，及所述商户主图对应的主图标题文本；

获取每幅所述菜品图像中的菜品特征，及所述商户主图中的主图特征；

基于每幅所述菜品图像的菜品标题文本和菜品特征，确定每幅所述菜品图像的菜品表征向量；

基于所述商户主图的主图标题文本和主图特征，确定所述商户主图的主图表征向量；

基于各所述菜品表征向量，对所述多幅菜品图像进行聚类处理，生成多个图像类簇；

基于各所述菜品表征向量、所述主图表征向量和预置点击率预估模型，获取各所述菜品图像对应的预估点击率；

从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。

2.根据权利要求1所述的方法，其特征在于，所述基于每幅所述菜品图像的菜品标题文本和菜品特征，确定每幅所述菜品图像的菜品表征向量，包括：

获取每幅所述菜品图像中的菜品特征对应的第一表征向量；

基于各所述菜品标题文本，获取每幅所述菜品图像对应的第一文本表征向量；

将每幅菜品图像的第一表征向量和第一文本表征向量相结合，生成每幅所述菜品图像的菜品表征向量。

3.根据权利要求1所述的方法，其特征在于，所述基于所述商户主图的主图标题文本和主图特征，确定所述商户主图的主图表征向量，包括：

获取所述主图特征对应的第二表征向量；

基于所述主图标题文本，获取所述商户主图对应的第二文本表征向量；

将所述第二表征向量和所述第二文本表征向量相结合，生成所述主图表征向量。

4.根据权利要求1所述的方法，其特征在于，所述基于各所述菜品表征向量，对所述多幅菜品图像进行聚类处理，生成多个图像类簇，包括：

采用预置聚类算法对多个所述菜品表征向量进行聚类处理，生成多个图像类簇；每个所述图像类簇中包含至少一幅菜品图像。

5.根据权利要求1所述的方法，其特征在于，所述基于各所述菜品表征向量、所述主图表征向量和预置点击率预估模型，获取各所述菜品图像对应的预估点击率，包括：

基于各所述菜品表征向量和所述主图表征向量，获取每幅菜品图像对应的相似度；

将各所述相似度输入至所述预置点击率评估模型，输出各所述菜品图像对应的预估点击率。

6.根据权利要求5所述的方法，其特征在于，所述基于各所述菜品表征向量和所述主图表征向量，获取每幅菜品图像对应的相似度，包括：

计算各所述菜品表征向量和所述主图表征向量之间的余弦相似度，将各所述余弦相似度作为每幅菜品图像的相似度。

7.根据权利要求1所述的方法，其特征在于，在所述从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像之后，还包括：

将所述商户主图和各所述待展示菜品图像进行融合处理，生成所述商户在指定业务平台上的展示图像。

8.一种图像获取装置，其特征在于，包括：

商户主图获取模块，用于获取商户的多幅菜品图像和一幅商户主图；

标题文本获取模块，用于获取每幅所述菜品图像对应的菜品标题文本，及所述商户主图对应的主图标题文本；

菜品主图特征获取模块，用于获取每幅所述菜品图像中的菜品特征，及所述商户主图中的主图特征；

菜品表征向量确定模块，用于基于每幅所述菜品图像的菜品标题文本和菜品特征，确定每幅所述菜品图像的菜品表征向量；

主图表征向量确定模块，用于基于所述商户主图的主图标题文本和主图特征，确定所述商户主图的主图表征向量；

图像类簇生成模块，用于基于各所述菜品表征向量，对所述多幅菜品图像进行聚类处理，生成多个图像类簇；

预估点击率获取模块，用于基于各所述菜品表征向量、所述主图表征向量和预置点击率预估模型，获取各所述菜品图像对应的预估点击率；

待展示图像获取模块，用于从每个所述图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。

9.一种电子设备，其特征在于，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述权利要求1至7中任一项所述的图像获取方法。

10.一种计算机可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述权利要求1至7中任一项所述的图像获取方法。

技术总结

本公开提供了一种图像获取方法、装置、电子设备及存储介质。所述方法包括：获取商户的多幅菜品图像和一幅商户主图；获取每幅菜品图像对应的菜品标题文本，及商户主图对应的主图标题文本；获取每幅菜品图像中的菜品特征，及商户主图中的主图特征；基于菜品标题文本和菜品特征，确定菜品表征向量；基于主图标题文本和主图特征，确定主图表征向量；基于各菜品表征向量，对多幅菜品图像进行聚类处理，生成多个图像类簇；基于各菜品表征向量、主图表征向量和预置点击率预估模型，获取各菜品图像对应的预估点击率；从每个图像类簇中获取预估点击率最高的一幅菜品图像，作为待展示菜品图像。本公开可以避免出现展示菜品的冗余，能够提升用户的使用体验。

技术研发人员：崔同;陈英杰;王永康;王兴星

受保护的技术使用者：北京三快在线科技有限公司

技术研发日：.10.23

技术公布日：.02.28

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。