第227章 霍从军的爱女
“人脸识别”项目只用了10天时间就开发的差不多了,叶晓奇隔三差五的都会出现在项目组里,解答问题和开小灶,各个项目组都有了初代的代码。 也就是说18个人,一共产生了4套代码,在这4套代码里叶晓奇打算找一套质量相对较好的,经过训练后再交付给总承包方,这事就算结了。 图片识别的问题,代码是一方面,海量的训练是另一方面。好在“人脸识别”属于特定领域的AI视觉问题,相关的技术储备都差不多比较成熟了,其准备率相较于泛性的AI视觉,要高上很多。 这里面最大的问题还是权值的问题,卷积计算的乘法系数和均值计算的偏差系数,都是需要经过多次调试的。这个系数开不了挂,后世几百套相关的架构,其系数都是不同的,适合自己的,才是最好的。这里面,服务器上新安装的侏罗纪贡献的10个gpu,发挥了巨大的作用,在“学习”的过程中极大的提高了效率。 霍从军也来过几次,达成了一系列的校企合作协议。 紧跟着没两天,天网课堂第二届也已经开始了,第一届“留级”的孩子将和这一届学员一起上课。 课程还是那些课程,同样要求保密,这一届学员已经换成了委培应届生,学员规模已经扩大到了50个人。 但是和第一届相比,这一届有了很大的不同:首先不再是薪资系数评定了,而是纯考核制,同样的四朵小花,拿到2朵为合格,3朵及其以上为良好。学员毕业后的初始薪资直接和学习分数相关:2分5000元,3分8000元,4分12000元,1分的退回学校。 校企合作的第二条则是委托填充数据集的工作,被称之为白垩纪“勤工俭学”计划。简单来说就是找照片,一张照片附带至少5个标签,参与的学生可以得到一毛钱。在此基础上,该图片每个新增的标签可以多得2分钱。同样,给数据集中的已有图片打标签,也是2分钱。 举个栗子,一张带有汽车的图片,根据图片表现内容,可以有以下几个标签:汽车、轮胎、法拉利、后视镜、飞翼门、玻璃、方向盘、雨刷。这就值1毛6分钱。 搜集来的照片打标签也不是没有要求的:首先是不能出错,不能乱打标签,图片标签出错的,后台审核人员发现后,会扣除这张图片的三倍收入。其次是不能重复,一模一样的两张图是没有意义的,这点天网团队后续将开发出一套程序,专门用于检测图片是否相同。 “勤工俭学”的费用都估算过了,这么算下来,假如一个学生这一天什么都不干,专门搞这个,少说能完成200张图片,拿到30块钱。初期的图片还特别好找,因为不存在重复的问题,随便拍一张肯定是数据集里不存在的,这样下来一天500张照片都是轻轻松松,比在有些公司里上班都安逸了。 同时还有一条附加条款:如果一个学生在一个学期里搜集图片超过1万张,且错误率不超过0.1%,该学生本学期将会得到由红烧rou赞助的奖学金,奖学金金额等同于该学生的一年学费。如果该学生的专业对口,且在校表现优异,毕业后将由天网项目免试录取。 李飞飞不止一次说过,数据集不好做,本来想找学生做的,最后发现成本负担不起。那是她没找对地方,论人工论素质,还没哪个国家能比的上国内的,米帝的学生多贵啊。 而国内最不缺的就是为五斗米折腰的人了,多的是贫苦家庭出身的孩子。有的五口之家里,为了给弟弟meimei们省出个学费来,舍不得吃,舍不得穿,常年的营养不良(多数是女孩)就不说了,还要一边上学一边给人当家教。