关于”算法工程师/机器学习工程师”的笔试和面试总结

从16年九月份开始,参加了一些公司的算法工程师/机器学习工程师岗位的校园招聘,做一些总结,希望可以给大家准备这个职位提供些信息。

一、需要的基本技能

  1. 数据结构知识
  2. 掌握一门编程语言,c/c++/Java/Python
  3. 机器学习常用算法或者某一细分领域(推荐,自然语言处理,图像识别,语音识别等)的常用算法

二、笔试和面试内容

大多是技术笔试然后二到三轮的技术面试

  1. 技术笔试都是考察基本的计算机知识,概率统计相关题目,智力题,linux常用命令和编程/算法能力等

  • 计算机知识包括:
    主要是数据结构包括数组,增删链表,树,排序算法等。也可能会有数据库基本语句,操作系统进程和 线程相关的,计算机网络的TCP/IP协议部分)
  • 编程能力:
    一到三道在线编程题目
  • 算法能力:
    给出一个场景,回答使用什么算法去建模解决
  • 面试问题

    • 机器学习常用算法,例如:
      • 决策树的ID3,C4.5,CART等,决策树的split原理和剪枝策略
      • 神经网络如何工作
      • SVM的原理及公式推导
      • 朴素贝叶斯的公式
      • Bagging 和 Boosting的区别
      • GBDT的参数怎么调
      • 聚类过程
      • 偏差和方差是什么,高偏差和高方差说明了什么
      • 怎么理解损失函数,SVM的损失函数是什么,写出公式
      • 过拟合怎么解决,L1和L2正则化有什么区别
      • 为什么用最小二乘而不是最小四乘
      • GB和牛顿法的区别,它们和泰勒公式的关系
    • 数据结构算法知识,手写代码,例如:

    • 最大子数组和
    • 快速排序
    • 字典排序
  • 特征工程

  • PCA的原理

  • 数据结构算法知识,手写代码,例如:

    • 最大子数组和
    • 快速排序
    • 字典排序
  • 编程能力,考察熟悉的编程语言的相关知识,编程语言掌握一门即可,例如:

    • java:static的作用,hashmap,arraylist和linklist的区别,多线程
    • c/c++:实现strstr(判断一个字符串是否是另一个的子串)
  • 编程能力,考察熟悉的编程语言的相关知识,编程语言掌握一门即可,例如:

    • java:static的作用,hashmap,arraylist和linklist的区别,多线程
    • c/c++:实现strstr(判断一个字符串是否是另一个的子串)
    • python:安装Python的命令是什么,用python读取一个文件,一行一行的输出(不能用库函数)

    • python:安装Python的命令是什么,用python读取一个文件,一行一行的输出(不能用库函数),python常用库

  • 大数据开发能力:Hadoop/Hive/Map Reduce开发,例如Map Reduce 写 word count

  • 深度学习知识:

    • 深度学习框架
    • CNN:什么是卷积,为什么要padding(根据简历的具体项目问
  • Udacity的机器学习项目P0和P1,如果写,请想好如下问题:

    • P0(泰坦尼克号项目):预测这个有啥用?召回率是多少?(题目中并没有算)
    • P1(预测波士顿房价):特征都是离散的,为什么用决策树?
      (虽然是用的决策回归树,但我也没想 到更好的回答的方式)。。。

    这些面试题目仅供大家参考,各个公司问每个人的也不一样,会根据公司的需求,个人简历上的项目问

    三、总结:

    1. 各个公司的侧重点不太一样,有的公司侧重数据分析/数据挖掘(京东,笔试题好多spass),有的公司偏向推荐算法(协同过滤,CTR点击率预估)(美团,汽车之家也很注重思维能力),用户画像(百度的百家号),有的公司侧重大数据开发(要求里写了Hadoop/Hive)(中国移动),有的公司更侧重算法层面,建模能力(滴滴)

    2. 如果是面试自然语言处理(NLP),图像识别,语音识别之类的公司,基本是要求深度学习知识的。创业公司的话,要求关注最新会议,跟paper,关注领域内最新进展

    四、推荐网站和书目

    推荐编程刷题网站:牛客网,Leecode
    推荐书目《剑指offer》(c++),《程序员代码面试指南》(java编写),
    《机器学习(周志华著)》(西瓜书),《统计学习方法(李航著)》

    五:一些建议:

    掌握基本知识后要确定好自己的目标,机器学习是一个大的方向,还有很多细分,究竟是要做文本,推荐,图像还是语音识别,差别都很大,人不可能面面俱到,掌握好一个领域的内容就很厉害啦~~

    六:数据分析与机器学习的区别

    个人的一点理解,具体还是看岗位要求怎么写的
    数据分析偏向统计一些,要会SQL/Spass/SAS等数据分析软件等,更适合数学和统计专业
    * 大数据开发能力:Hadoop/Hive/Map Reduce开发,例如Map Reduce 写 word count

    • 深度学习知识:

     * 深度学习框架* CNN:什么是卷积,为什么要padding(根据简历的具体项目问
    
    • 1
    • 2
    • Udacity的机器学习项目P0和P1,如果写,请想好如下问题:
      • P0(泰坦尼克号项目):预测这个有啥用?召回率是多少?(题目中并没有算)
      • P1(预测波士顿房价):特征都是离散的,为什么用决策树?
        (虽然是用的决策回归树,但我也没想 到更好的回答的方式)。。。

    这些面试题目仅供大家参考,各个公司问每个人的也不一样,会根据公司的需求,个人简历上的项目问

    三、总结:

    1. 各个公司的侧重点不太一样,有的公司侧重数据分析/数据挖掘(京东,笔试题好多spass),有的公司偏向推荐算法(协同过滤,CTR点击率预估)(美团,汽车之家也很注重思维能力),用户画像(百度的百家号),有的公司侧重大数据开发(要求里写了Hadoop/Hive)(中国移动),有的公司更侧重算法层面,建模能力(滴滴)

    2. 如果是面试自然语言处理(NLP),图像识别,语音识别之类的公司,基本是要求深度学习知识的。创业公司的话,要求关注最新会议,跟paper,关注领域内最新进展

    四、推荐网站和书目

    推荐编程刷题网站:牛客网,Leecode
    推荐书目《剑指offer》(c++),《程序员代码面试指南》(java编写),
    《机器学习(周志华著)》(西瓜书),《统计学习方法(李航著)》

    五:一些建议:

    掌握基本知识后要确定好自己的目标,机器学习是一个大的方向,还有很多细分,究竟是要做文本,推荐,图像还是语音识别,差别都很大,人不可能面面俱到,掌握好一个领域的内容就很厉害啦~~

    六:数据分析与机器学习的区别

    个人的一点理解,具体还是看岗位要求怎么写的
    数据分析偏向统计一些,要会SQL/Spass/SAS等数据分析软件等,更适合数学和统计专业
    机器学习要求编程能力较强,即算法实现能力,更适合数学和计算机专业

    七:感受到的现状

    机器学习是一个相对开发来说较新的职位,一些公司也开始增加这些职位,需求还是有的,要求也较高

    机器学习要求编程能力较强,即算法实现能力,更适合数学和计算机专业

    以上是一些笔试面试总结,仅供大家参考,欢迎大家补充交流和批评指正

    2016年11月

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481097.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

史上最通熟易懂的检索式聊天机器人讲解

喵喵喵,一不小心又匿了三个月,突然诈尸害不害怕( ̄∇ ̄) 小夕从7月份开始收到第一场面试邀请,到9月初基本结束了校招(面够了面够了T_T),深深的意识到今年的对话系统/chatbot方向是真的…

【LeetCode】3月16日打卡-Day1

题1 字符串压缩 描述 字符串压缩。利用字符重复出现的次数,编写一种方法,实现基本的字符串压缩功能。比如,字符串aabcccccaaa会变为a2b1c5a3。若“压缩”后的字符串没有变短,则返回原先的字符串。你可以假设字符串中只包含大小写…

Python pandas数据分析中常用方法

官方教程 读取写入文件 官方IO 读取 写入 read_csv       to_csv read_excel      to_excel read_hdf       to_hdf read_sql       to_sql read_json      to_json read_msgpack (experimental)   to_msgpack (experimental) read_html    …

【LeetCode】3月17日打卡-Day2

题1 拼写单词 描述 给你一份『词汇表』(字符串数组) words 和一张『字母表』(字符串) chars。 假如你可以用 chars 中的『字母』(字符)拼写出 words 中的某个『单词』(字符串)&…

小哥哥,检索式chatbot了解一下?

喵喵喵,一不小心又匿了三个月,突然诈尸害不害怕( ̄∇ ̄) 小夕从7月份开始收到第一场面试邀请,到9月初基本结束了校招(面够了面够了T_T),深深的意识到今年的对话系统/chatbot方向是真的…

多重共线性、异方差和自相关性

https://www.jianshu.com/p/1e5389ca9829

【LeetCode】3月18日打卡-Day3

题1 无重复字符的最长子串 描述 给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。 示例 1: 输入: “abcabcbb” 输出: 3 解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。 示例 2: 输入: “bbbbb” 输出: 1 解释: 因为无重复…

别求面经了!小夕手把手教你如何斩下和选择NLP算法岗offer!(2020.4.14更新)...

推完上一篇文章,订阅号和知乎后台有好多小伙伴跟小夕要面经(还有个要买简历的是什么鬼),然鹅小夕真的没有整理面经呀,真的木有时间(。 ́︿ ̀。)。不过话说回来,面经有多大用呢&#…

机器学习算法优缺点改进总结

https://wenku.baidu.com/view/5df50157f121dd36a22d82bf.html

领域应用 | 中医临床术语系统

本文转载自公众号中医药知识组织与标准。什么是中医药术语系统?它是干什么用的呢?中医药术语系统是运用计算机与信息技术等工具,对中医药学各领域中的事物、现象、特性、关系和过程进行标记和概括,并为每个概念赋予指称形成概念体…

鸿蒙(HarmonyOS)项目方舟框架(ArkUI)之Image图片组件

鸿蒙(HarmonyOS)项目方舟框架(ArkUI)之Image图片组件 一、操作环境 操作系统: Windows 10 专业版、IDE:DevEco Studio 3.1、SDK:HarmonyOS 3.1 二、Image组件 Image 用来加载并显示图片的基础组件,它支持从内存、本…

【LeetCode】3月19日打卡-Day4

题1 最长回文串 描述 给定一个包含大写字母和小写字母的字符串,找到通过这些字母构造成的最长的回文串。 在构造过程中,请注意区分大小写。比如 “Aa” 不能当做一个回文字符串。 注意: 假设字符串的长度不会超过 1010。 示例 1: 输入: “abccccdd” 输…

别求面经了!小夕手把手教你如何斩下和选择NLP算法岗offer!(19.11.21更新)

推完上一篇文章,订阅号和知乎后台有好多小伙伴跟小夕要面经(还有个要买简历的是什么鬼),然鹅小夕真的没有整理面经呀,真的木有时间(。 ́︿ ̀。)。不过话说回来,面经有多大用呢&#…

git - 简易指南

http://www.bootcss.com/p/git-guide/

梁家卿 | 百科知识图谱同步更新

本文转载自公众号知识工场。 本文整理自复旦大学知识工场梁家卿博士在IJCAI 2017 会议上的论文报告,题目为《How to Keep a Knowledge Base Synchronized with Its Encyclopedia Source》,作者包括:梁家卿博士(复旦大学&#xff0…

【LeetCode】3月20日打卡-Day5

题1 最小的k个数 描述 输入整数数组 arr ,找出其中最小的 k 个数。例如,输入4、5、1、6、2、7、3、8这8个数字,则最小的4个数字是1、2、3、4。 示例 1: 输入:arr [3,2,1], k 2 输出:[1,2] 或者 [2,1] 示…

别再搜集面经啦!小夕教你斩下NLP算法岗offer!

推完上一篇文章,订阅号和知乎后台有好多小伙伴跟小夕要面经(还有个要买简历的是什么鬼),然鹅小夕真的没有整理面经呀,真的木有时间(。 ́︿ ̀。)。不过话说回来,面经有多大用呢&#…

程序员面试100题之十六:二叉树中两个节点的最近公共父节点(最低的二叉树共同祖先)

这个问题可以分为三种情况来考虑:情况一:root未知,但是每个节点都有parent指针 此时可以分别从两个节点开始,沿着parent指针走向根节点,得到两个链表,然后求两个链表的第一个公共节点,这个方法很…

肖仰华 | 基于知识图谱的问答系统

本文转载自公众号知识工场。 本文整理自复旦大学知识工场肖仰华教授在VLDB 2017 会议上的论文报告,题目为《KBQA: Learning Question Answering over QA Corpora and Knowledge Bases》,作者包括:崔万云博士(现上海财经大学讲师&a…

【LeetCode】3月21日打卡-Day6

题1 水壶问题 描述 有两个容量分别为 x升 和 y升 的水壶以及无限多的水。请判断能否通过使用这两个水壶,从而可以得到恰好 z升 的水? 如果可以,最后请用以上水壶中的一或两个来盛放取得的 z升 水。 你允许: 装满任意一个水壶 清空…