智慧零售是一种基于先进技术的零售业态,通过整合物联网、大数据分析、人工智能等技术,实现零售过程的智能化管理并提升消费者体验。
实现智慧零售的关键技术包括商品的自动识别与分类、商品的自动结算等等。
为了实现商品的自动识别与分类,需要借助先进的图像识别技术。本文将介绍一些开源库和数据集,这些资源有助于研究者和开发者在智慧零售领域进行相关工作。
PaddleClas
PaddleClas 是由百度飞桨开发的一个图像识别和图像分类任务的工具集,可用在工业界和学术界,助力使用者训练出更好的视觉模型和落地应用。
ColugoMum 是基于 PP-ShiTu 开发的智能购物平台,可以准确定位和识别每种商品,返回完整的购物清单以及显示客户应支付的商品实际价格。项目地址在https://github.com/thomas-yanxin/Smart_container
。
-
项目链接:https://github.com/PaddlePaddle/PaddleClas
FastReID
FastReID 是由京东 AI 研究院发布的基于 PyTorch 的通用目标重识别(ReID)开源库,可广泛应用于线下零售、智能供应链、智能园区等项目。
-
项目链接:https://github.com/JDAI-CV/fast-reid
-
更多介绍:https://zhuanlan.zhihu.com/p/351587618
数据集
Open Brand
Open Brand 数据集源于各大电商平台,包含了 584920 张图片,1303563 个标注量,包含了行业内大部分商标。
-
论文地址:https://arxiv.org/pdf/2012.07350.pdf
-
下载地址:https://tianchi.aliyun.com/dataset/130462
RP2K
RP2K 数据集收录了超 50 万张零售商品货架图片,商品种类超 2000 种,所有图片均来自真实场景下的人工采集,并针对每种商品,提供了十分详细的注释,包含尺寸/形状/味道等特征。
优势:全球 SKU 种类最多。
-
论文地址:https://arxiv.org/pdf/2006.12634.pdf
-
下载地址:https://wRPCww.pinlandata.com/rp2k_dataset/
AliProduct
AliProduct 数据集收录了近 300 万张图片,涵盖 5 万个 SKU 级商品类别,含有大量的生活用品、食物等。
商品图像的类别和总量均为业界之最。
缺点:该数据集中没有人工标注,数据较脏,数据分布较不均衡,且有很多相似的商品图片。
-
下载地址:https://openi.pcl.ac.cn/ColugoMum/Exprements-public/datasets
RPC
RPC 是一个大规模零售产品结账数据集,收录了 200 个产品类别(17个大类)和 83739 张图像,包括单品图和结算图,并进行了注释。
-
论文地址:https://arxiv.org/pdf/1901.07249.pdf
-
下载地址:https://rpc-dataset.github.io/
-
更多介绍:https://zhuanlan.zhihu.com/p/55627416
-
更多介绍:https://zhuanlan.zhihu.com/p/55987842
Products-10K
Products-10K 是一个完全人工标注的商品图片数据集,其中收录了 10000 种(10 大类)细粒度的 SKU 级商品,这些商品均是经常被中国消费者购买的产品,包括时尚、3C、食品、保健、家居用品等全品类。
-
论文地址:https://arxiv.org/abs/2008.10545
-
下载地址:https://products-10k.github.io/challenge.html#downloads
Locount
Locount 数据集收录了 50394 张图像,包括 140 个类别(9 大类)中超过 190 万个图像实例,并提供了丰富的注释。
-
下载地址:https://isrc.iscas.ac.cn/gitlab/research/locount-dataset
趋动云是一款强大的AI训练平台,内置已近 900 条数据集和 AI 模型资源,覆盖多个领域。
用户可以轻松选择适用于其研究的数据集和模型,例如,杂货商品数据集Grocery Store Dataset
和自动结算场景下的大型商品数据集RPC
等,这些数据集在商品识别、分类等任务中具有广泛的应用价值。
通过趋动云,用户能够一键获取所需的数据集和模型,为研究和实验提供便利,进一步推动人工智能领域的发展。