算起来,自己的算法在岗应该也有一年了,在美团担任算法工程师大概有7个月,OPPO加上实习,估计也一年多吧,时间过的好快,这周末给大家谈谈我的感想吧,相比各位大佬,我的经验尚属稚嫩,但是也希望能给一些准备入行的、刚入行的人一些经验和建议吧,相关文章其实我也聊得不少,这里有部分重点我可能还会聊到,但是不见得都会说到,所以可以看看我以前的文章:
我从研究生生活中得到的经验
NLP.TM
我的NLP学习之路
懒人目录:
算法工作的一天都要干什么。
特别的经验。
有关学习。
写在最后。
算法工作一天都要干什么很多人可能再想想着每天在研究模型,看论文,实现模型之类的,这方面虽然非常重要,但是实际上并非如此。每天这些时间会花的更多:
和产品沟通,技术方案设计。
数据层面花费的时间最多。
需要什么样的数据。
写SQL。
检查数据质量,空的、错的、不合法的。
特征工程。
有监督学习,需要标注数据,怎么标,标注本身是否可靠。
模型选择与开发。这块可以这么说,随着工作经验提升,这块时间会越来越少。
模型选择的话,把问题抽象出来,其实都比较好选,第一版模型一般是业内基线或者最简单的模型,像我,二分类先搞LR(logisticregression),序列标注就是CRF。
模型开发也基本不耗时,LR和CRF之类的其实都有现成的东西。
结果分析和诊断。
不生效的原因是什么。
怎么解决。
模型层面还是规则层面解决。
解决方案的影响面是多少,会不会导致出现新的问题。
评价指标设计。
分析上述模型是否生效。
上面都是自评,可能还要交给测试、产品之类的评价。
工程化上线。
模型上线,需要特征生产、AB实验、部署之类的操作。
如果你熟悉在线跑的代码,例如Java、c++之类的,这块的时间会比较少。
提测,提交给测试人员测试。
评估上线。
这是一个算法工程师基本的工作内容,当然的,会随着你的业务不同会有一些不同,但是点上都是一样的。
特别的经验工作也一年了,有一些比较有意思的经验。
规则应该首先使用,保证高准确,模型后续补充来提升泛化能力。
模型不求高端,只求实用和稳定。
与科研不同,很多时候科研只