Tag Archives: Interview

2016面试经历

分两部分,第一部分(1-15)是完全没有准备,算法结构一塌糊涂,第二部分(16-)是算法数据结构有些许准备。所以1. 去年没找;2. 算法数据结构差(更没刷题),要找算法/机器学习类就比较局限了。

收到深圳移动-数据分析,绿盟-数据挖掘,网易-数据挖掘,小米云平台-自然语言,有一些像十二维度-深度学习,西井科技-机器学习,CVTE-机器学习,子衿晨风-软件开发这样的众多创业公司offer,但是风险较大,不考虑了。其中有几家没有写到(360-算法,第四范式-数据分析,SenseTime-数据研发)。

  • 360问的比较全:概率统计类题目,常见模型的优缺点和改进(四个算法题,应该都是Leetcode上的,还让写K均值代码,最后是C++的)。
  • 第四范式问的多是数据认识上的问题,整个业务流程(二面),一面简单了解项目,写逻辑回归伪代码等等。
  • SenseTime,一面简单项目经历介绍,写类似最大连续子数组和的一个题,说了说CNN,二面是问了Spark等等,一些属性记不大清了,好久不用了。说了遇到OOM的解决方案等等。

先这里总结一下。算法/机器学习工程师(最好有研究生学历)需要做到

  1. 算法结构熟悉(体现写代码能力)。熟悉指的是刷过Leetcode题目至少两遍,书上概念熟悉(看你细心不,比方Java有的要写try-catch,或者一次能写对不,最好整齐,关键地方或函数有注释,我是在草稿纸上写好然后腾上去所以写的慢!);
  2. 项目经历。机器学习/数据挖掘项目(用上Spark/Hadoop以及生态体系内的其它框架如HBase、MongoDB等等),并对其中用到模型非常熟悉(概念特点,流程写出公式,优缺点,改进);
  3. 对机器学习模型熟悉。常见模型(基本的有SVM,LR这些很常问,还有就是随机森林,GBDT也很常问,不少大公司都会问SVM、随机森林(bagging)、GBDT,答对是亮点,普通的有Kmeans/Knn,朴素贝叶斯,线性回归,逻辑回归这些算常识了吧)怎么做、优缺点,改进;
  4. 证明和推倒。模型的证明和推倒,比方SVM,LR等等。

要找好公司的offer,这个能力逐层递进,算法数据结构的代码能力是基础(这也是很多做ACM同学的优势),还有对机器学习模型有了解,项目经历是附加(锦上添花),最后就是更高阶的推倒和证明。

而一般的数据挖掘工程师对学历往往要求不高(Java、Hadoop等等),主要体现在学历上。

 

Continue reading

数组面试题总结

学习笔记。来自七月算法公开课视频(https://www.julyedu.com/video/play/25/29)。

 
Continue reading

概率面试题总结

七月算法-概率面试题精讲(https://www.julyedu.com/video/play/25/35)。内容如下

 
Continue reading