Category Archives: 闲来无聊

2016面试经历

分两部分,第一部分(1-15)是完全没有准备,算法结构一塌糊涂,第二部分(16-)是算法数据结构有些许准备。所以1. 去年没找;2. 算法数据结构差(更没刷题),要找算法/机器学习类就比较局限了。

收到深圳移动-数据分析,绿盟-数据挖掘,网易-数据挖掘,小米云平台-自然语言,有一些像十二维度-深度学习,西井科技-机器学习,CVTE-机器学习,子衿晨风-软件开发这样的众多创业公司offer,但是风险较大,不考虑了。其中有几家没有写到(360-算法,第四范式-数据分析,SenseTime-数据研发)。

  • 360问的比较全:概率统计类题目,常见模型的优缺点和改进(四个算法题,应该都是Leetcode上的,还让写K均值代码,最后是C++的)。
  • 第四范式问的多是数据认识上的问题,整个业务流程(二面),一面简单了解项目,写逻辑回归伪代码等等。
  • SenseTime,一面简单项目经历介绍,写类似最大连续子数组和的一个题,说了说CNN,二面是问了Spark等等,一些属性记不大清了,好久不用了。说了遇到OOM的解决方案等等。

先这里总结一下。算法/机器学习工程师(最好有研究生学历)需要做到

  1. 算法结构熟悉(体现写代码能力)。熟悉指的是刷过Leetcode题目至少两遍,书上概念熟悉(看你细心不,比方Java有的要写try-catch,或者一次能写对不,最好整齐,关键地方或函数有注释,我是在草稿纸上写好然后腾上去所以写的慢!);
  2. 项目经历。机器学习/数据挖掘项目(用上Spark/Hadoop以及生态体系内的其它框架如HBase、MongoDB等等),并对其中用到模型非常熟悉(概念特点,流程写出公式,优缺点,改进);
  3. 对机器学习模型熟悉。常见模型(基本的有SVM,LR这些很常问,还有就是随机森林,GBDT也很常问,不少大公司都会问SVM、随机森林(bagging)、GBDT,答对是亮点,普通的有Kmeans/Knn,朴素贝叶斯,线性回归,逻辑回归这些算常识了吧)怎么做、优缺点,改进;
  4. 证明和推倒。模型的证明和推倒,比方SVM,LR等等。

要找好公司的offer,这个能力逐层递进,算法数据结构的代码能力是基础(这也是很多做ACM同学的优势),还有对机器学习模型有了解,项目经历是附加(锦上添花),最后就是更高阶的推倒和证明。

而一般的数据挖掘工程师对学历往往要求不高(Java、Hadoop等等),主要体现在学历上。

 

Continue reading

对聚类的几个思考和疑问

这算是一篇日记吧(主要是今天下课后,有好几个问题想问老师来着,但是老师比较赶时间,就没机会了,唉!,所以就产生了这篇文章,主要用来记录自己对今天所学的方法的一些疑问,以及相关的思考)。

今天模式识别课上讲了一些聚类方法(最大最小距离法,系统聚类法/分层聚类法)等等,其中还有比较特殊的用来比较类与类之间距离的方法(最小距离法,最大距离法)等等,当然还有一些别的老师一带而过的距离判别方法。 Continue reading

关于+=符号

要让x的值,等于x和y的和:

  • A. x = x + y
  • B. x += y
  • C. x += x + y
  • D. x += y + x
 x += x +y 可以理解为,先不看左边的+=,先做x+y,最后再考虑+=左边,再加个x。同理,x += y + x,可以理解为x = y + (y + x)。

简历重写简单提纲

最近考虑到一些公司已经开始内推,以及三月份一些互联网公司即将开始校招暑期实习生,主要受这篇博文影响:

  • 除了简历开头的个人基本信息,【紧接】的内容请让我看到你与别人的【差异点】(优势点)
  • 下一部分内容【放大】你的【优势】,告诉我你做过什么,尤其是竞赛类或工程实践类的事情,【适当详细】一点
  • 不要看到你说你会 c/php 语言,就等于你告诉我你会吃饭一样(我也会吃饭 谢谢)。我要看到的是你用 c 和 php 写过什么你认为最好最复杂的【作品】是什么,你参加过 xx 竞赛,你在里面承担什么样的【角色】,做了什么【具体的事】,这些都请告诉我【结果】,直接了当地体现你的【专业水平程度】(如果你拿过NOI金牌。拿过全国网络安全大赛一等奖,直接的结果放在我面前,我第一时间就会对你有兴趣。越是弯弯绕的人,水分越重,因为肚子里没货,只能各种口水话来填简历。)

Continue reading

红外检测报警系统课程设计心得

在这次的四人协作当中,我主要是负责仿真和程序,焊电路什么的也有些不好意思,是让那两个女生做的,就是帮着找找元器件什么的。不过,通过这个课程的学习,也发现C程序操纵单片机并没有想象中的难,此外,对电路的理解(主要是和单片机一起的)有了更深一步的认识。

Continue reading

美国大学生数学建模竞赛(MCM/ICM)规则更新(重大调整:新增D题等)

消息来源:http://www.comap.com/undergraduate/contests/mcm/instructions.php

2015年美国大学生数学建模竞赛(MCM/ICM)将于美国东部时间2015年2月5日至9日举行。近日,COMAP调整了部分竞赛规则,最主要的变动为,ICM竞赛新增一道题目,D题,即MCM为A、B题,ICM为C、D题,参赛者可以在四道题目中任选一题。原文如下:

Continue reading