居然在一个月里碰到两位在相对传统行业创业的亲友,来打听将AI技术应用到他们所在行业上的问题,例如:是聊天机器人是否可以代替人工客服。
两位亲友居然都动了雇佣一位算法工程师的念头。其中一位真的已经开始物色了。
颇费周折找到一位某非院校专业对口的博士,友人有点动心想要聘用,奈何人家开口就要万年薪。
创业企业虽然已经拿了两轮融资,还是不敢烧钱作死,故而多方打听“算法”这东西的用处。
笔者所在公司今年的校园招聘,本人照例作为interviewer参加,面试了几个来自不同院校的学生(明年毕业)。顺便又和几位今年刚入职的应届生聊了聊。
结果发现,所有interviewee(至少是我碰到的),全都是人工智能或机器学习方向的学生,所有交流过的新同事,在学校里做的也全部都是机器学习or深度学习算法。
而且,每一个人对于入职后工作的期望都是做算法。
人工智能,已经跌入到两三年前大数据风口上,全民皆“数据科学家”的套路里了。
到底做什么,算是入行AI
工业界直接应用AI技术的人员,大致可以分为三个不同角色:算法、工程,和数据。
01
做算法
所有人都想做算法,那么,说到底,在工业界做算法倒是干什么?
真正的算法工程师(也有公司叫科学家),最基本的日常工作其实是:读论文实现之——确认最新论文中的阐述是否真实可重现,进一步确认是否可应用于本企业的产品,进而将其应用到实践中提升产品质量。
算法工程师,可不是用别人写好的工具填几个参数去运行就可以的,需要负责实际业务问题到数学模型的抽象,并能够将他人最新成果(敲黑板——那些论文!!!)应用到业务数据上去。
算法工程师,即使自己不发明新的算法,不提出新的算法优化方法,也得去尝试最新算法的使用或者把已有算法用出新花样来。
毋庸置疑,这是一个有着必然创新性的角色。因此,这个角色必然不适合绝大多数人!
02
做工程
相对于算法的创新和尖端,做工程要平实得多。
这一角色比较有代表性的一种岗位就是:机器学习工程师(或戏称调参工程师)——他们使用别人开发的框架和工具,运行已有算法,训练业务数据,获得工作模型。
其间可能需要一些处理数据、选取特征或者调节参数的手段,不过一般都有据可循,并不需要自己去发明一个XXXX。
但说到底,开发人工智能产品的程序员,也还是程序员。不过是需要懂一定程度的领域内理论知识而已,和以前开发PCI协议栈要懂PCI协议,写网卡driver要懂TCP/IP的道理是一样的。
既然是程序员,首先就不能丢掉程序员的基本素质:编码能力,和基础算法能力(不是前面说的那种算法,而是链、树、图的构建、删除、遍历、查找、排序等数据结构里讲的那种算法),是最起码要求。
其实,在AI成为潮流的今天,只要能找到一个在AI方面相对比较前沿的企业,进去做一名普通程序员。
那么即使本来开发的产品不属于AI范畴,未来通过在旧产品上应用新的AI技术,或者在公司内部transfer到做AI产品的team,都可能获得入行的机会。
甚至具体知识的掌握,都可以在入职后慢慢积累——对于大多数AI工程人员,这可能才是一条自然的入行之路。
但这一切的前提是:此人首先得是一个合格的程序员!
而不是本末倒置,虽然花功夫学了几个模型、算法,却连最基本的编程面试题都做不对。
03
做数据
此处说得做数据并非数据的清洗和处理——大家可以看到做工程的岗位,有一部分工作内容就是ETL和处理数据。此处说的做数据是指数据标注。
无论是做ML还是DL的工程师(算法工程),后者有甚,都共同确认一个事实:现阶段而言,数据远比算法重要。
就目前而言,数据对模型的影响远胜于算法。一群年薪百万起步的算法工程师耗费经年的成果,对于模型质量直接的影响甚至比不上一个靠谱标注团队一两个月的精心标注。对模型的影响尚且如此,更何况是商业价值。
此时此刻,AI在风口浪尖,大公司、拿了巨额风投的独角兽startup,一个个拿出千金市马骨的气概,将不可思议的高薪狠狠砸向AI领域的顶尖学者,顺便捧起了一批年轻的博士,也引来了世人的垂涎。
这种情形能维持多久?商业企业能承受多少年不挣钱只烧钱?待潮涌过后,行业回归理性,模型还是要用来挣钱的。
到了那个阶段,大小企业不会去算成本收益吗?他们会意识不到将资源投入数据和算法的不同产出比吗?
企业为了创造利润应用AI技术,算法工程师不是刚需,而数据标注这个人工智能领域的“勤行”,人工智能蓝领,一定是刚需!
一切标注工作的难点和潜藏的风险,也就是这项工作的潜力和从事这项工作未来职业发展的可能性所在。
入门AI,先吃透「机器学习」
近来一段时间,能明显感到,想入行AI的人越来越多,而且增幅越来越大。
为什么这么多人想入行AI呢?真的是对计算机科学研究或者扩展人类智能抱着无限的热忱吗?说白了,大多数人是为了高薪。
人们为了获得更高的回报而做出选择、努力工作,原本是非常正当的事情。关键在于,找对路径。
寻求入行的人虽多,能真的认清市场当前的需求,了解不同层次人才定位,并结合自己实际寻找一条可行之路的人太少。
首先,我们来看一下当前机器学习领域招聘市场的行情。
上面表格中所有带有“算法”、“人工智能”、“数据挖掘”、“视觉”字样的职位,都需要懂机器学习。
说得更直接一点,人工智能正处在炙手可热的风口浪尖上,作为程序员不会机器学习都不好意思去找工作了。
针对机器学习初学者,我们可以从机器学习、深度学习最基本的原理及学习意义入手,以模型为驱动,吃透几大最经典的机器学习模型——学习其原理、数学推导、训练过程和优化方法。
以为例的设置:
1.有监督学习:
详细讲解有监督学习中经典的线性回归、朴素贝叶斯、逻辑回归、决策树、支持向量机、支持向量回归、隐马尔科夫和条件随机场模型。2.无监督学习
重在详细讲解无监督学习中的聚类、高斯混合及主成分分析等模型。3.从机器学习到深度学习。
讲解深度学习基本原理、深度学习与机器学习的关联与衔接、以及深度学习目前的应用领域,为「深度学习」的进阶奠定基础。配合精心设计的极小数据量的「极简版」实例,方便读者从直观上了解模型的运行原理,利用实例大家还可将自己变身为「人肉计算机」,通过口算/笔算每一步的推导,模拟算法全过程,进而彻底理解每个模型的运作方式。
从可以收获什么?
1.AI技术岗位求职知识储备
如果大家真的有意投身到人工智能领域做技术性工作,那么经过技术笔试、面试是必要条件。
在面试中被要求从头解释某一个机器学习模型的运行原理、推导过程和优化方法,是目前非常常见的一种测试方法。
机器学习模型虽然很多,但是经典、常用的很有限。如果能把这个课程中讲解的经典模型都学会,用来挑战面试题相信是足够了。
2.触类旁通各大模型与算法
各种机器学习模型的具体形式和推导过程虽然有很大差别,但却在更基础的层面有许多共性。
掌握共性之后,再去学新的模型、算法,就会高效得多。虽然本课的第二部分集中描述了部分一般性共同点,但真要理解个中含义,却还要以若干具体模型为载体,经由学习其从问题发源,到解决方案,再到解决方案的数学抽象,以及后续数学模型求解的全过程,来了解体味。这也就是本课以模型为驱动的出发点。
3.极简版实例体验实际应用
运用到实践中去,是我们学习一切知识的目的。机器学习本身更是一种实操性很强的技术,学习它,原本就是为了应用。反之,应用也能够促进知识的深化理解和吸收。
本课虽然以原理为核心,但也同样介绍了:划分数据集;从源数据中提取特征;模型训练过程;模型的测试和评估等方法和工具。
4.配套数据+代码快速实操上手
本课程中各个实例的Python代码及相应数据,大家可以下载、运行、改写、参考。
除了上述几点,我希望本课的读者在知识和技巧的掌握之外,能够将学习到的基本规律运用到日常生活中,更加理性地看待世界。
再遇到“人工智能产品”,能够根据自己的知识,去推导:Howitworks?
它背后有没有用到机器学习模型?如果有的话是有监督的还是无监督的模型?是分类模型还是回归模型?选取的特征会是哪些?如果由你来解决这个问题,有没有更好的方法?
限时福利
如果你想快速入行AI,请别犹豫
↓↓↓这门专栏非常适合你!↓↓↓
原价69元,限时立享7折!
↓↓前60位购买者再送7门万人订阅的编程课↓↓
49元=原理实战+老师1V1答疑+源码+7门编程课
现在订阅你将获得什么?
1.专业老师陪伴式教学
李烨:微软中国开发者
现就职于微软(Microsoft),从事人工智能产品开发。曾在易安信(EMC)和太阳微系统(SunMicrosystems)任软件工程师。先后参与聊天机器人、大数据分析平台等项目的开发。
2.度全方位答疑服务
每个专栏都配有多个答疑交流群便于你们提问,老师几乎全程在线解答。群内还会有小助手负责日常整洁,让你在交流学习的同时不受到外界干扰。
3.额外福利
你不仅能以每篇只需1.17元的优惠价格拥有这份专栏,现在下单还将免费得到7门编程专栏。
限时福利
如果你想快速入行AI,请别犹豫
↓↓↓这门专栏非常适合你!↓↓↓
原价69元,限时立享7折!
↓↓前60位购买者再送7门万人订阅的编程课↓↓
49元=原理实战+老师1V1答疑+源码+7门编程课
适读人群亡
机器学习初学者理科在校生有一定编码经验,有意向转向AI领域的IT从业者
订阅须知
1.怎样获取福利?
订阅专栏后可联系小助手「GitChatty6」,发送入群口令即可获取额外福利。
2.如何阅读专栏?
本专栏可在GitChat服务号、App及网页端上多端阅读。
3.专栏内容有多少?
本专栏为图文内容,总共42篇课时。
4.专栏有效期多久?
本专栏一经购买,即可享受永久阅读权限。