图片来源:摄图网
芥末堆 子航 9月14日 报道
相较于大数据概念甚嚣尘上的三、四年前,如今的大数据技术已经被应用到许多实际场景中。根据工信部发布的《大数据产业发展规划(2016-2020年)》,2020年大数据相关产品和服务业务收入将突破1万亿元,年均复合增长率保持30%左右。
行业收入高增长率的背后,必然隐藏着对相关行业人才的需求。据统计,未来3~5年,大数据人才缺口将达150万人。那么,大数据专业人才培养体系到底是怎样的?课堂学习内容与工作需求是否存在鸿沟?芥末堆为此进行了调查。
现状|为就业选择大数据专业
事实上,高校和教育企业们也都注意到了大数据行业对人才的需求。2013年1月,慧科集团与北京航空航天大学合作成立了首个国内大数据技术与应用软件工程项目。2016年2月,教育部公布新增本科专业“数据科学与大数据技术”专业,首次获批高校3所,目前全国共有35所高校获批该专业。可以说,大数据专业是伴随行业发展而诞生的。
现正在阿里巴巴从事数据挖掘相关工作的杨婕,回忆自己选择大数据专业的原因,她说,“我本科学的是信息管理,但毕业去找工作时,发现没有特别对口的,就希望学到更多偏应用的知识,有一天能在工作中真正用到的东西”。2016年3月,杨婕毕业于慧科集团与北京航空航天大学共建的大数据技术与应用专业。
同样,北京大学软件与微电子学院2016级硕士研究生过正,也是因为感觉大数据行业比较容易就业才选择大数据作为自己的研究方向,而他身边许多研究生同学也是持有同样的观点。“我本科学的是编程相关的专业,对大数据的了解都是在电视新闻里看到的,感觉比较热,所以研究生方向就都填的大数据。”
对于选择大数据相关专业的学生来说,大多数的动力是来自于大数据行业有更好的就业可能性,但大数据专业能否真正提供给毕业学生更多且更好的就业机会。压力来自于企业的需求,也同样来自于自己掌握的知识以及其他专业的竞争者。
芥末堆了解到,不仅大数据专业毕业生会选择从事该行业,数学、统计、计算机等其他相关专业毕业生也是这个行业的有力竞争者。正在在线教育公司51talk担任算法工程师的杜亚磊,其硕士研究方向便是统计学。“相较于一般软件工程师,算法工程师的薪水和前景都要好,同事中学习统计和数学方向的也比较多。”
问题|课堂教学与业界需求存鸿沟
曾参与过阿里云计算开发,某教育公司CTO大宇(化名)认为,在高校中开展专门的大数据专业是有必要的。“原来的计算机专业教的东西都是非常基础的,有很多知识可能是到公司才知道,现在大数据方面已经积累了很多理论知识,专门去培养针对大数据的专业人才,这是对行业有贡献的。”
但另一方面,大宇也有自己的担心,大数据技术的发展实际上是大数据算法和算力两种技术能力的发展,当算力充足时,算法就会繁荣,反之亦然。“但是因为算法容易出成绩,所以现在研究算法的学校比较多,而且有一种很差的风气,只要会用开源软件我就是人工智能的专家或从业者,但这样可能会解决一些小问题,如果真正需要在一个问题做深入时,这时候能力是远远达不到的。”大宇认为,目前高校的培养模式,会导致培养人才滞后。
因此,和许多高校专业面临的问题一样,伴随行业发展而产生的大数据专业要面对的是,如何让毕业生能够符合企业的实际需求。正在腾讯从事算法工程师实习的过正坦言,虽然学校会提供一些到企业实践的机会,但是在工作中接触到的内容仍然是全新的。“很多应用的内容在课堂上并没有学到,所以还是要靠自学,因为大公司是要在一个细分的方向进行深耕。”
“学校和业界还是有很大的鸿沟的。”大宇告诉芥末堆,学生在学校里接触到的更多的是如何改进算法,但对实际的应用场景,和整个数据链条缺少足够的认知,这需要补很多的知识。“比如我想做一个电影推荐系统,需要将获得的数据清洗成我想要的数据,搭建相应的模型,但很多学生仅知道中间一小块的算法,不懂得上下游的其他事情。”
手段|校企合作能否成为解决办法
慧科集团高级副总裁管刚认为,高校缺乏的是对产业最新状态和真实需求的了解,而有企业方加入的校企合作项目正在改善这个问题。目前,除了与北京航空航天大学共建的大数据专业,慧科集团还和上海交通大学、华南理工大学等高校合作进行大数据人才培养。2014年,慧科集团与贵州大学进行合作,开始进行本科阶段大数据人才的培养。
“每个高校都有自己完整的一套体系,我们会先和学校确定合作意向,然后由学校来确定专业方向。”管刚告诉芥末堆,慧科集团在与高校共建专业时,首先和学校的教学负责人进行研讨,确定该校的具体教学实施方案,然后在每一届学生的具体实施中,根据学生的反馈,进行教学内容的更新和调整。“本科一般是150到170个学分,慧科一般会和学校合作40-50个学分,主要专注在专业实践课,实习、实训等课程部分。”
在教学实施方面,慧科集团组建了3000多人的教师团队,高校中的课程会由总部的老师和驻扎在地方的老师分别进行。此外,学校内课程还会利用慧科集团所开发的线上平台,通过双师课堂等模式来进行教学。
此外,慧科集团还邀请相关行业的企业老师去学校上课,并由专门的教学运营团队协助教师完成试题研发、试卷分析、课程改进等环节,帮助企业老师减负,以此达成让学生能够与企业无缝对接的目标。同时,慧科集团会对全职老师和企业老师均进行打分测评,来监督课程质量。
杨婕印象最深的研究生课程内容是,在一门课上,企业导师带来了脱敏企业数据,让她们运用学习到的统计学方法和大数据算法得到一些结论,“后来面试的时候,面试官最关心的也是之前做过的和大数据相关的项目。”
慧科研究院院长陈滢认为,产教融合最重要的便是引入产业老师,传统课堂中的老师能力并不差,但是缺少瑞新应用场景的认知,“产教融合是搭建一个桥梁,链接企业专家和学校,将企业专家的知识最终形成教育产品。”
未来|用人梯度的变化与学科融合
“相较于前端、后端的开发人员,大数据开发人才的培养周期和成本都是要更高的。”大宇认为,不论是在系统还是算法的能力上,大数据开发都要求从业人员具有数学等基础学科的能力,同时在研究生的学习和实验过程培养的方法论,也是十分重要的。这一点在杜亚磊那里得到了验证,他在51talk的算法工程师同事大多都是研究生毕业。
此外,大宇认为,大数据开发人才会向着标准化、流程化的趋势发展。“现在所有开源出来的东西,包括许多公司内部做得尝试,都是把这类工作通用化、简单化、使其变得更流程化,让更多的人从基础算法的研究中解脱出来,变成一种机器的操作。”今后从业者的门槛会越来越低,但要求从业者拥有更多的垂直领域知识。
陈滢也有同样的观点,随着产业发展的链条越来越长,产业中需要高、中、普通等多层面的人;同时,培养层次也正在发生变化,大数据专业也正在随着产业升级而变化。“例如,慧科一开始比较专注大数据方面工程人才的培养,但是随着产业发展,我们也在把大数据和其它学科进行融合。”目前,慧科集团已经与四所学校共建阿里巴巴大数据学院,并开始与高校合作培养大数据与互联网+战略管理,互联网+金融、互联网营销等方面的专业。
大宇总结了早些年的大数据开发从业人员的来源,一种是来自于研究院,例如微软研究院,这类人通常有很先进的理论知识,但是缺少工程实现能力;另外一种来自于普通从业者,这部分人对工程实现很了解,但是缺少理论知识。“当这两伙人合到一块时,就能把这个事情做出来了。”
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。