谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里
本篇文章857字,读完约2分钟
昨天,谷歌打开了它的语音命令数据集,开发者可以用它来构建最基本的语音交互应用。
今天,好消息又来了:谷歌又一次宣布了一个全新的绘图数据集的开放,它的由来非同寻常:
还记得去年年底谷歌发布的人工智能涂鸦游戏吗?是吗?
这个游戏会弹出一个对话框,允许玩家在20秒内画出一个物体,然后用它的机器算法来识别这个物体并猜测玩家画了什么。感兴趣的朋友可以点击这里体验。
快,画!最初的意图是谷歌的教育体验项目,以帮助公众了解神经网络——例如,它能做什么。设计它的谷歌工程师团队希望让每个人都意识到人机学习系统之间的互动也可以充满乐趣。显然,设计师的目的已经完美实现了。
既然快,就画吧!在发布之初,它吸引了来自世界各地的人们来尝试它。在过去的六个月里,来自世界各地的球员都很快,平局!涂鸦,逐渐形成了一个相当大的数据集:
根据雷锋获得的数字。(公开号码:雷锋。来自100个国家的2000万用户。地图上总共画了8亿个涂鸦。
今天,谷歌宣布将开放这个数据集,让世界各地的数据科学家和设计师进行分析,或许还能从人们最直观的涂鸦中获得产品设计创意。
目前,数据集包含5000万个涂鸦。谷歌表示,剩余的7亿份将陆续发布。
谷歌表示:
“这不仅是一个巨大的数据量,也是一面有趣的镜子——它可以用来观察如何以众包的形式让公众参与机器学习系统的培训,以及如何创建一个能够反映不同文化背景和概念的数据集。”
事实上,谷歌根据用户的国籍对他们进行分组,很快,抽签!在数据集中发现了许多有趣的现象。例如,不同国家头脑中的“椅子”:
在韩国和俄罗斯用户的心目中,最直观的椅子形象是横放的,而美国、德国、巴西和南非的椅子形象是正面的。
谷歌说,快,画!它为研究如何避免人工智能系统对文化、种族和社会群体的偏见提供了很好的研究材料。对这个话题感兴趣的读者可以访问谷歌博客。
快,画!数据集的Github地址:
github/googlecreativelab/quick draw-dataset
雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。
标题:谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里
地址:http://www.6st8.com/zbxw/3524.html
免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。