呼吁开放外网_服装数据集:呼吁采取行动

呼吁开放外网

Getting a dataset with images is not easy if you want to use it for a course or a book. Yes, there are many datasets with images, but few of them are suitable for commercial or educational use.

如果您想将其用于课程或书籍,则获取带有图像的数据集并不容易。 是的,有很多带有图像的数据集,但是很少有适合商业或教育用途的数据集。

To solve this issue, I decided to collect a dataset with clothing. All the pictures will be shared under the CC0 license. This means that anyone can use this data for any purpose.

为了解决这个问题,我决定收集衣服数据集。 所有图片将在CC0许可证下共享。 这意味着任何人都可以出于任何目的使用此数据。

For example:

例如:

  • Creating a tutorial or a course (free or paid)

    创建教程或课程(免费或付费)
  • Writing a book

    写书
  • Kaggle competitions (as an external dataset)

    Kaggle竞赛(作为外部数据集)
  • Training an internal model at any company

    在任何公司培训内部模型

I already collected more than 1,000 pictures, but it’s not easy to do alone. I need your help.

我已经收集了1000多张照片,但是要单独完成并不容易。 我需要你的帮助。

我该如何帮忙? (How can I help?)

There are many ways you can help.

您可以通过多种方式提供帮助。

Spread the word about it. Share it on social media, send it to your colleagues and friends.

散布关于它的话 。 在社交媒体上分享,并将其发送给您的同事和朋友。

Image for post
Use the share buttons at the top
使用顶部的共享按钮
Or simply retweet this tweet
或者只是转发此推文

Upload your pictures. If don’t want to go through your entire wardrobe and take a picture of every item — it’s okay. Even one image is helpful. Perhaps there’s a t-shirt nearby, jeans, or shoes? Take a picture and upload it using this form. See the next section for details on how to take pictures.

上载您的图片。 如果不想翻遍整个衣橱,为每件照片拍照-没关系。 甚至一张图像也是有帮助的。 也许附近有一件T恤,牛仔裤或鞋子? 拍照并使用此表格上传。 有关如何拍照的详细信息,请参见下一部分。

Image for post
Airtable formAirtable表单上传图像

The form works on mobile too!

该表格也可以在移动设备上使用!

Upload many pictures at once. If you have more than a couple of images, using the previous form is not convenient. There are other options:

一次上传许多图片。 如果您有多个图像,则使用前一个表格不方便。 还有其他选择:

  • Google Photos. The app can automatically synchronize all your images. Just move the pictures of clothes to a separate album and share the link.

    Google相簿。 该应用程序可以自动同步所有图像。 只需将衣服图片移到单独的相册中并共享链接即可。
  • Dropbox, Google Drive, Yandex Disk, or any similar cloud storage. Upload a folder or a zip archive and share the link.

    Dropbox,Google云端硬盘,Yandex磁盘或任何类似的云存储。 上载文件夹或zip存档并共享链接。
  • WeTransfer.com. You can use it to upload files up to 2GB without registering.

    WeTransfer.com 。 您可以使用它上传最大2GB的文件而无需注册。

Once you have a link, use another form to submit it:

有了链接后,请使用其他表单提交它:

Image for post
another Airtable form其他Airtable形式批量上传图像

图片 (Images)

There are the following categories of clothes:

有以下几类衣服:

  • T-shirts

    T恤衫
  • Long sleeves, sweaters, hoodies

    长袖,毛衣,连帽衫
  • Shirts

    上衣
  • Jeans, pants, shorts

    牛仔裤,裤子,短裤
  • Dresses, skirts

    连衣裙,裙子
  • Shoes

    鞋类
  • Jackets, coats

    外套,大衣
  • Hats

    礼帽
  • Clothes for kids

    孩子们的衣服

To make a picture, put the item on a floor or a bed:

要拍照,请将物品放在地板或床上:

Image for post

Pictures of hanging clothes are fine, but make sure the item is visible:

可以挂衣服的图片很好,但是请确保物品可见:

Image for post

The item shouldn’t be crumpled or packed:

该物品不应该被弄皱或包装:

Image for post

The background should be contrasting enough to see the item:

背景的对比度应足以看到该项目:

Image for post

An image should contain only one item:

图像应仅包含一项:

Image for post

And there should be no people:

而且应该没有人:

Image for post

If you’re not sure about something, just share it, and I’ll figure it out.

如果您不确定某件事,请分享一下,我会解决的。

我怎么知道什么时候数据准备好了? (How can I know when the data is ready?)

When I collect enough pictures, I’ll annotate them and upload the result to Kaggle. If you provide your email when sharing images, I’ll inform you when it happens.

当我收集到足够的图片时,将对其进行批注并将结果上传到Kaggle。 如果您在共享图像时提供了电子邮件,则在发生这种情况时会通知您。

I will also post in other places:

我还将在其他地方发布:

  • Data Science Insider on Medium

    数据科学内幕

  • My Twitter account: @Al_Grigor

    我的Twitter帐户: @Al_Grigor

  • My LinkedIn account: agrigorev

    我的LinkedIn帐户: agrigorev

  • The #datasets channel in ods.ai

    在#datasets通道ods.ai

  • The /r/datasets/ subreddit

    / r / datasets / subreddit

I’d like to collect 10,000 images and I need your help!

我想收集10,000张图片,需要您的帮助!

  • Upload a few images right now: https://airtable.com/shr7Go5VUAGKRx2sW

    立即上传一些图片: https : //airtable.com/shr7Go5VUAGKRx2sW

  • Batch-upload more images later: https://airtable.com/shrJHj9bxUuQQaWNR

    稍后批量上传更多图像: https : //airtable.com/shrJHj9bxUuQQaWNR

Image for post

翻译自: https://medium.com/data-science-insider/clothing-dataset-call-for-action-3cad023246c1

呼吁开放外网

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/390902.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

React JS 组件间沟通的一些方法

刚入门React可能会因为React的单向数据流的特性而遇到组件间沟通的麻烦,这篇文章主要就说一说如何解决组件间沟通的问题。 1.组件间的关系 1.1 父子组件 ReactJS中数据的流动是单向的,父组件的数据可以通过设置子组件的props传递数据给子组件。如果想让子…

数据可视化分析票房数据报告_票房收入分析和可视化

数据可视化分析票房数据报告Welcome back to my 100 Days of Data Science Challenge Journey. On day 4 and 5, I work on TMDB Box Office Prediction Dataset available on Kaggle.欢迎回到我的100天数据科学挑战之旅。 在第4天和第5天,我将研究Kaggle上提供的TM…

先知模型 facebook_Facebook先知

先知模型 facebook什么是先知? (What is Prophet?) “Prophet” is an open-sourced library available on R or Python which helps users analyze and forecast time-series values released in 2017. With developers’ great efforts to make the time-series …

搭建Maven私服那点事

摘要:本文主要介绍在CentOS7.1下使用nexus3.6.0搭建maven私服,以及maven私服的使用(将自己的Maven项目指定到私服地址、将第三方项目jar上传到私服供其他项目组使用) 一、简介 Maven是一个采用纯Java编写的开源项目管理工具, Mave…

gan训练失败_我尝试过(但失败了)使用GAN来创作艺术品,但这仍然值得。

gan训练失败This work borrows heavily from the Pytorch DCGAN Tutorial and the NVIDA paper on progressive GANs.这项工作大量借鉴了Pytorch DCGAN教程 和 有关渐进式GAN 的 NVIDA论文 。 One area of computer vision I’ve been wanting to explore are GANs. So when m…

19.7 主动模式和被动模式 19.8 添加监控主机 19.9 添加自定义模板 19.10 处理图形中的乱码 19.11 自动发现...

2019独角兽企业重金招聘Python工程师标准>>> 19.7 主动模式和被动模式 • 主动或者被动是相对客户端来讲的 • 被动模式,服务端会主动连接客户端获取监控项目数据,客户端被动地接受连接,并把监控信息传递给服务端 服务端请求以后&…

华盛顿特区与其他地区的差别_使用华盛顿特区地铁数据确定可获利的广告位置...

华盛顿特区与其他地区的差别深度分析 (In-Depth Analysis) Living in Washington DC for the past 1 year, I have come to realize how WMATA metro is the lifeline of this vibrant city. The metro network is enormous and well-connected throughout the DMV area. When …

Windows平台下kafka环境的搭建

近期在搞kafka,在Windows环境搭建的过程中遇到一些问题,把具体的流程几下来防止后面忘了。 准备工作: 1.安装jdk环境 http://www.oracle.com/technetwork/java/javase/downloads/index.html 2.下载kafka的程序安装包: http://kafk…

铺装s路画法_数据管道的铺装之路

铺装s路画法Data is a key bet for Intuit as we invest heavily in new customer experiences: a platform to connect experts anywhere in the world with customers and small business owners, a platform that connects to thousands of institutions and aggregates fin…

IBM推全球首个5纳米芯片:计划2020年量产

IBM日前宣布,该公司已取得技术突破,利用5纳米技术制造出密度更大的芯片。这种芯片可以将300亿个5纳米开关电路集成在指甲盖大小的芯片上。 IBM推全球首个5纳米芯片 IBM表示,此次使用了一种新型晶体管,即堆叠硅纳米板,将…

async 和 await的前世今生 (转载)

async 和 await 出现在C# 5.0之后,给并行编程带来了不少的方便,特别是当在MVC中的Action也变成async之后,有点开始什么都是async的味道了。但是这也给我们编程埋下了一些隐患,有时候可能会产生一些我们自己都不知道怎么产生的Bug&…

项目案例:qq数据库管理_2小时元项目:项目管理您的数据科学学习

项目案例:qq数据库管理Many of us are struggling to prioritize our learning as a working professional or aspiring data scientist. We’re told that we need to learn so many things that at times it can be overwhelming. Recently, I’ve felt like there could be …

react 示例_2020年的React Cheatsheet(+真实示例)

react 示例Ive put together for you an entire visual cheatsheet of all of the concepts and skills you need to master React in 2020.我为您汇总了2020年掌握React所需的所有概念和技能的完整视觉摘要。 But dont let the label cheatsheet fool you. This is more than…

查询数据库中有多少个数据表_您的数据中有多少汁?

查询数据库中有多少个数据表97%. That’s the percentage of data that sits unused by organizations according to Gartner, making up so-called “dark data”.97 %。 根据Gartner的说法,这就是组织未使用的数据百分比,即所谓的“ 暗数据…

数据科学与大数据技术的案例_作为数据科学家解决问题的案例研究

数据科学与大数据技术的案例There are two myths about how data scientists solve problems: one is that the problem naturally exists, hence the challenge for a data scientist is to use an algorithm and put it into production. Another myth considers data scient…

Spring-Boot + AOP实现多数据源动态切换

2019独角兽企业重金招聘Python工程师标准>>> 最近在做保证金余额查询优化,在项目启动时候需要把余额全量加载到本地缓存,因为需要全量查询所有骑手的保证金余额,为了不影响主数据库的性能,考虑把这个查询走从库。所以涉…

leetcode 1738. 找出第 K 大的异或坐标值

本文正在参加「Java主题月 - Java 刷题打卡」&#xff0c;详情查看 活动链接 题目 给你一个二维矩阵 matrix 和一个整数 k &#xff0c;矩阵大小为 m x n 由非负整数组成。 矩阵中坐标 (a, b) 的 值 可由对所有满足 0 < i < a < m 且 0 < j < b < n 的元素…

商业数据科学

数据科学 &#xff0c; 意见 (Data Science, Opinion) “There is a saying, ‘A jack of all trades and a master of none.’ When it comes to being a data scientist you need to be a bit like this, but perhaps a better saying would be, ‘A jack of all trades and …

leetcode 692. 前K个高频单词

题目 给一非空的单词列表&#xff0c;返回前 k 个出现次数最多的单词。 返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率&#xff0c;按字母顺序排序。 示例 1&#xff1a; 输入: ["i", "love", "leetcode", "…

数据显示,中国近一半的独角兽企业由“BATJ”四巨头投资

中国的互联网行业越来越有被巨头垄断的趋势。百度、阿里巴巴、腾讯、京东&#xff0c;这四大巨头支撑起了中国近一半的独角兽企业。CB Insights日前发表了题为“Nearly Half Of China’s Unicorns Backed By Baidu, Alibaba, Tencent, Or JD.com”的数据分析文章&#xff0c;列…