中关村手机论坛,北京中关村手机( 三 )


所以,我给了一张新的波多野结衣照片给计算机看的时候,它就能分开了,穿不穿衣服都认识,道理就是这么简单,但做起来还是不容易的,因为涉及到大量的数据归一化,参数调整以及算力的支持 。
前后端的大概原理就是这样,眼见为实,如果你想体验的话,我就帮你把小程序贴在这儿了 。
点这里↓,点这里↓,点这里↓
如果你有兴趣,我还建了个群,欢迎你加入,没事儿可以一起吹吹牛逼 。
9,那些给人工智能打工的人
本文转自微信公众号:GQ报道(ID:GQREPORT),作者:刘敏,编辑:何瑫,摄影:张博然Eric 。
这里生产你美颜时“一键瘦脸”的尖下颌,你一起学猫叫时的动态胡须,生产张学友演唱会被实时识别的犯人,生产未来的自动驾驶,智能门禁……
这里是中国特色的数据车间,他们遍布在河南、山东、河北等地的四五线小城里,日以继夜地为世界领先的AI产品服务 。
越来越多的人正在加入他们的行列,成为为人工智能打工的人 。
“梯子(可以移动的)”
马萌利面前出现一张欧洲户外咖啡馆的照片 。她移动鼠标,绿色的画框浮现在照片上,显示备注“椅子”,她迅速在一瓶花束上补了一个绿框,标上“花(放在容器中)” 。
下一张,一个日本花卉市场,几排密密麻麻的绿植中,马萌利检查了每一个标出的“花盆” 。
下一张,一个美国孩子的卧室,“椅子”“桌子”……她飞速删掉了“梯子”的画框——客户要求是能移动的梯子,这种高低床上已经焊死的梯子就不能算 。
下一张、下一张、下一张,不管眼前是什么场景,马萌利手速不变,依次圈出“梯子”“茶几”“地毯”“沙发” 。
“梯子”“茶几”“地毯”“沙发” 。“梯子”“茶几”“地毯”“沙发”……如此周而复始,不停重复循环 。马萌利每天的工作从早晨8点钟开始,坐到工位,打开电脑,输入用户名和密码,移动鼠标开始标记,日复一日,每天持续9个小时 。
屏幕上的图片很模糊,这些都是从全球社交网络上抓取的,角度混乱,像素也不高 。那张韩国泡菜摊的照片,很明显来自一个角落里的摄像头 。马萌利放大图片,在路人的脚边,圈出一个糊成一团的轮廓:“垃圾桶” 。
旁边工位有人打开了音箱,活泼的流行歌响了起来:“燃烧我的卡路里!”
房间里有几百个屏幕,闪动着颜色不一的图片,每个人都在框选同样的内容:垃圾桶、梯子、茶几、地毯……这是河南省平顶山市郏县,一家叫千机数据的公司,房间看起来像一个网吧,在网络神曲伴奏下,年轻的员工们窝在柔软的沙发里,不停地拉框 。马萌利是最后的审核员,她和同事要检查所有人拉的框,以保证每个画框都严丝合缝地贴着目标的边缘,图片里所有目标都要被框出来,不能有任何遗漏 。
马萌利每天要检查至少1000张图 。手头这个单子已经干了两个月,同事们标注了上万个垃圾桶、梯子、茶几、地毯……29岁的马萌利知道,这些标好框的图片汇总后,将发回北京一家AI独角兽公司,变成人工智能的学习材料 。
她不知道的是,这几万个“梯子(可以移动的)”标注,展示了梯子的无数个样子,再经过深度学习算法加工,最终让计算机认识,这就是梯子,可以移动的那种 。
她日复一日标注的数据来自百度、京东、阿里、旷视、Momenta等大公司,全部应用于人工智能训练 。一种行业说法是,任何人类能在5岁之后做的事,对机器人来说都很简单,但是5岁之前,人类用本能就能理解的实际信息,计算机要用最笨的办法学习 。这时候,就需要数以万计的马萌利们为人工智能提供标注服务了 。

推荐阅读