115.【论文理解】RP2K

RP2K

细粒度图像分类的大规模零售商品数据集

核心问题:用物体识别方法来识别货架上商品。

种类多、同类不同品类(或规格、角度)但外观相似、拍摄角度和光照差异大。
2000种SKU、真实零售商品、分级标注(根据形状等分成6、7类)。

Related

  • 细粒度图像分类:

    零售商品的识别是图像细粒度分类的领域问题,因为不同品牌、口味的商品人眼看起来很相似。

  • 零售产品数据集:

1)RPC数据集有200类,8w+图片,由于每张图片中每个物体都提供了边界框和标签,因此可提供40w张单物体图像。但光照简单、背景干净,不是真实场景。

2)TGFS: 自主售货机真实场景图片,3w张图片只有24类,3大类,数据为480*640。

3)SKU-110K数据集:100w张图片,但只是密集场景中零售物体检测,只有边界框没有提供种类。

4)MVTEC:实例感知的语义分割数据集,60种,2.1w张图片,与RPC类似,只有受限的摄像头设置,种类少。

Dataset

  • 组织:

    用RetinaNet在辅助检测数据集上训练检测子,后人为筛选、标注每个边界框图
    一般,每个裁剪出的边界框图有六个SKU属性。

种类标签有两种:一种是罐、瓶、袋等7种形状类别,另一种是通过非酒精饮料、调味品、化妆品等6种类别分类。

  • 数据收集:

    10个城市500多个不同商店收集得到,一个图片中心位置是架子,一个图片只有一个架子,每个图片至少3000*3000像素。
    使用不同相机,采集到的单个目标大小至少80*80

  • 统计:

    共拍摄1.4w张高清货架图,单目标图像有53w+, 一共有2000个SKU, 平均每个SKU有267张图。
    训练/测试集为0.85/0.15

  • 辅助检测数据集:

    抽出1400个货架图中的9.6万张图(7种形状类别)训练目标检测子。

衡量数据集

以上检测数据集用于衡量RP2K数据集,在分类任务上的效果。

使用MobileNet和inceptionV3作为分类。

四种训练方式——从头训练、预训练、带增强的从头训练和带增强的预训练——中,带有增强的预训练方式效果较好。

两千个商品排序(由多向少排列)、每十个聚集在一起,然后计算top1分类准确度,预测准确度随实例数减少而减低。

以上构成细粒度识别的长尾问题。

其他可能的研究问题

  • 对抗攻击和防御

    细粒度特征使得我们得到的数据集中两种类别的图像之间差异非常不明显,2000个的类别数比传统的imageNet和CIFAR/MNIST(防御算法基于的数据集),类别更多,防御问题就更富挑战。

  • 结构图片上的生成模型

    提供了真实的语义输出布局信息,用于生成模型

  • 少样本学习

    我们数据集的长尾效应提供了100多类实例数小于30个图片(一共有200大类),所以该数据集可以用于少量样本学习算法的评估。

Conclusion

货架产品识别任务激发下,提出零售产品识别数据集RP2K,可用于大量AI驱动的零售业的——图片检索、空货架检测和销售活动跟踪等等。

作为细粒度分类数据集,RP2K是最多种类的数据集,但种类中的实例数量递减。

数据集中有丰富的属性信息。

当前模型在识别系统中的改进可以有很大的提升空间,除目标识别外少样本学习、生成模型等也能用拿到次数据集。

最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,100评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,308评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事?!?“怎么了?”我有些...
    开封第一讲书人阅读 159,718评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,275评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,376评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,454评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,464评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,248评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,686评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,974评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,150评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,817评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,484评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,140评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,374评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,012评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,041评论 2 351