12.20今日头条实习面试总结-算法工程师

				版权声明:本文为博主原创文章,未经博主允许不得转载。					https://blog.csdn.net/John_xyz/article/details/78884425				</div><div id="content_views" class="markdown_views prism-github-gist"><!-- flowchart 箭头图标 勿删 --><svg xmlns="http://www.w3.org/2000/svg" style="display: none;"><path stroke-linecap="round" d="M5,0 0,2.5 5,5z" id="raphael-marker-block" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);"></path></svg><h2 id="一面"><a name="t0"></a>一面</h2>

项目经历

1.LDA模型,Simhash的流程
这个问题主要问的是算法是怎么工作的,工作流程,就是具体在做工程的时候怎样实现,没有涉及到太多的公式
2.问了LSTM的结构,公式推导
这个当时是让我画出LSTM的Cell结构。这个结构当时忘了,给他画了一个RNN的结构,然后推了下rnn正向传播的公式,LSTM就是三个gate,具体数据怎么刘的忘了…
3.L1和L2正则惩罚项公式及区别
这个比较简单了,L1惩罚项得到的特征比较稀疏,就是对于某些不太重要的特征,其权重可能惩罚至0, L2惩罚项的数学性质比较好,得到的特征权重比较平滑,不会让某些特征的权重系数过高
4. bagging和boosting的区别
我就分别把bagging, Adaboosting, Gradient boosting和gbdt的原理都解释给面试官
5.开放性问题:给定一堆未标注的样本,样本中包含少量的色情低俗新闻(负样本),如何标注数据,以及如何做特征工程?模型选择,识别出这些负样本
这个是他们现实遇到的问题。主要就是不平衡分类和无监督的问题。对于不平衡分类,说了三个想法:1. 降采样 2.升采样 3. loss函数的设计. 对于无标注样本,可以采用聚类的算法或者半监督的方式。

算法题

给定一个List,和长度为k的窗口。窗口在list上滑动,找到每次滑动的最大值
这个回答出来了,但不是最优的解法。面试官告诉我用堆…

二面

项目经历

1.主要是问KDD CUP 2017的项目
random forest, GBDT, 对数变换,异常值处理情况(箱线图)
2.开放性问题,找出某些新闻是用机器翻译的(可读性差,负样本),和真正原创的新闻(可读性好,正样本)
这个和一面的问题有点像。我感觉答的不太好。

算法题

1.一维透视表转二维透视表
题目比较复杂,但理解了题意就比较简单…
2.两个堆栈实现一个数据结构,入栈,出栈,找到最小值的时间复杂度都是0(1)
这个答出来了。

三面

项目经历

1.LDA模型推公式
花了LDA模型的框图,但远远不够…
2.Simhash推公式原理
回答的还可以, 讲了随机超平面hash和Simhash之间的联系,以及如何处理超大规模文本的去重.
3.逻辑回归计算过程(公式,梯度更新)
答出来了

算法题

1.给出一个list,找到Top K最大的数
不是最优解法,面试官告诉我用堆…
2.给出一个list(不含重复的数),找到其全排列
回答出来了,用回溯发
3.给出一个list(含重复的数), 找到其全排列
回答出来了,也是用回溯发,但回溯之间先对输入做排序,然后价格条件判断当前数和上一个数是否相等。

HR面

面试到这就很轻松了。问了写和技术无关的问题,关于生活爱好之类的,HR带我到处走了走参观的头条的总部,食堂健身房等等,感觉还是很nice的。

总结

整个面试的过程略长(6个小时),头条比较注重算法能力,和理论公式的推到,这方面还得加强。但最后也是拿到实习offer了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481268.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

预测更准确,使用机器学习改进化学品的毒性评估

编辑 | 绿萝从命运和毒性的角度来看&#xff0c;人类暴露的化学空间随着化学物质的多样性而不断扩大。欧洲和美国的化学品机构列出了大约 80 万种化学品。对于这些化学品中的大多数&#xff0c;人们对其环境归宿或毒性知之甚少。通过实验填补这些数据空白是不可能的&#xff0c…

如何优雅的追到女神夕小瑶

如果&#xff0c;你不小心迷恋上了小夕… 路人某&#xff1a;“没有如果” 捕获小夕的游戏 如果现实世界中&#xff0c;迷恋上小夕以后&#xff0c;你想捕获小夕。那么发现从上帝视角来看的话&#xff0c;你有下面好多条路几条路达成目标(&#xffe3;∇&#xffe3;) 然而你并…

文本相似度-相似度度量

NLP点滴——文本相似度 目录 前言字面距离common lang库相同字符数莱文斯坦距离(编辑距离)定义实现方式Jaro距离定义实现方式应用SimHash定义基本流程相似性度量存储索引实现应用语义相似性背景知识统计语言模型n-gram模型词向量主题模型LSAPLSALDA应用Word2Vec神经网络语言模…

《科学》封面文章AlphaCode的重大意义及其思考

来源&#xff1a;陈德旺科学网博客链接地址&#xff1a;https://blog.sciencenet.cn/blog-57940-1368420.html程序员&#xff0c;虽然戏称程序猿&#xff0c;其实是一个高薪高智商工作&#xff0c;需要对问题的理解力、解决问题的创造性&#xff0c;还需要熟悉掌握编程语言。这…

深度学习可以与大数据分手吗?

小夕&#xff1a;hi&#xff0c;路人~你知道机器学习中数据的维度太高会带来什么问题吗&#xff1f;路人己&#xff1a;此时&#xff0c;如果样本量不足&#xff0c;会容易过拟合啊~小夕&#xff1a;为什么呢&#xff1f;路人己&#xff1a;这还有为什么&#xff1f;小夕&#…

集群化:中国基础研究发展模式的转型方向

来源&#xff1a;《学术前沿》作者&#xff1a;李侠2020年&#xff0c;科技部等五部门联合制定《加强“从0到1”基础研究工作方案》&#xff0c;旨在贯彻落实《国务院关于全面加强基础科学研究的若干意见》&#xff0c;其中明确指出&#xff0c;切实解决我国基础研究缺少“从0到…

各种损失函数比较-带你斩获offer

损失函数&#xff08;Loss function&#xff09;是用来估量你模型的预测值 f(x)f(x)值。2. 常用损失函数 常见的损失误差有五种&#xff1a; 1. 铰链损失&#xff08;Hinge Loss&#xff09;&#xff1a;主要用于支持向量机&#xff08;SVM&#xff09; 中&#xff1b; 2. 互…

如果你跟夕小瑶恋爱了...(上)

如果...如果...有一天...你追到了女神夕小瑶...并且与她恋爱了...&#xff08;想说“没有如果”的路人请自觉狗带(&#xffe3;∇&#xffe3;)&#xff09;小夕的生活很规律的哦&#xff0c;小夕每天都会依次经历且仅仅经历以下6件事情&#xff1a;化妆-吃饭-聊天-自习-上课-要…

「返老还童」梦想成真?「NMN教父」争议研究将登陆科学顶刊

来源&#xff1a;机器之心逆转衰老&#xff0c;我们终于有了新方法&#xff1f;一项为时13年的研究最近又有了新的突破&#xff0c;事关人类最在意的问题&#xff1a;衰老理论。12月19日&#xff0c;哈佛大学遗传学教授David Sinclair在社交网络上宣布有关人类衰老研究的最新突…

对抗思想与强化学习的碰撞-SeqGAN模型原理和代码解析

GAN作为生成模型的一种新型训练方法&#xff0c;通过discriminative model来指导generative model的训练&#xff0c;并在真实数据中取得了很好的效果。尽管如此&#xff0c;当目标是一个待生成的非连续性序列时&#xff0c;该方法就会表现出其局限性。非连续性序列生成&#x…

如果你跟夕小瑶恋爱了...(下)

AB派在上一篇文章中&#xff0c;你成功的将“挽回夕小瑶”的任务卡进了隐马尔可夫模型&#xff08;HMM&#xff09;中。那么我们来规范化的整理一下已经有的信息和需要计算得到的信息。还记得这两个图嘛&#xff1f;这就是我们建立好的模型。&#xff08;隐状态的转移图&#x…

十分钟搞定特征值和特征向量

如果把矩阵看作是运动&#xff0c;那么特征值就是运动的速度&#xff0c;特征向量就是运动的方向 https://mp.weixin.qq.com/s/mZ4AeCcoU0LhWRWfa9_kvw

史上最简单的隐马尔可夫模型讲解

如果... 如果...有一天...你追到了女神夕小瑶...并且与她恋爱了... &#xff08;想说“没有如果”的路人请选择狗带(&#xffe3;∇&#xffe3;)&#xff09; 小夕的生活很规律的哦&#xff0c;小夕每天都会依次经历且仅仅经历以下6件事情&#xff1a; 化妆-吃饭-聊天-自习-上…

睡着了也在学习!Nature最新研究揭示运动记忆从何而来

来源&#xff1a;生物通Steph Curry罚球时&#xff0c;他的大脑会利用运动记忆。现在&#xff0c;加州大学旧金山分校(UCSF)的研究人员已经展示了这种类型的记忆是如何在睡眠期间得到巩固的&#xff0c;当大脑处理白天的学习&#xff0c;使做某事的物理行为成为潜意识时。Karun…

数据结构:堆(Heap)

数据结构&#xff1a;堆&#xff08;Heap&#xff09; <!-- 文章内容 --><div data-note-content"" class"show-content"><div class"show-content-free"><p>堆就是用数组实现的二叉树&#xff0c;所有它没有使用父指针…

如果有一天,小夕不再萌...

‍如果有一天&#xff0c;小夕不再要抱抱。如果有一天&#xff0c;小夕不再萌萌哒。 有人问我&#xff0c;成为药娘&#xff0c;走上成为女孩子的道路&#xff0c;是什么感觉。 我一直没有想好该怎么答。是的&#xff0c;自己的感觉自己都无法描述。 或许最真实的&#xff0c;就…

BAT机器学习面试1000题系列

1、本文的内容全部来源于七月在线发布的BAT机器学习面试1000题系列&#xff1b; 2、文章中带斜体的文字代表是本人自己增加的内容&#xff0c;如有错误还请批评指正&#xff1b; 3、原文中有部分链接已经失效&#xff0c;故而本人重新加上了新的链接&#xff0c;如有不当&…

拉马努金:“与神对话”的数学天才

来源&#xff1a;微信公众号“图灵教育”撰文&#xff1a;[英] 马库斯杜索托伊翻译&#xff1a;柏华元当哈代和利特尔伍德步履维艰地穿越陌生的黎曼图景时&#xff0c;在5000英里外的印度马德拉斯港务局内&#xff0c;一个名叫斯里尼瓦瑟拉马努金的年轻办事员被素数的神秘莫测吸…

浅入深出被人看扁的逻辑回归!

好像在各种机器学习入门教程中&#xff0c;逻辑回归模型&#xff08;Logistic/Logit Regression&#xff09;经常被拿来作为入门的机器学习模型&#xff0c;比如我家的Andrew Ng就是这样做的。看起来&#xff0c;逻辑回归模型实在太简单&#xff0c;甚至容易被认为是一个拍脑袋…

全球Web3技术产业生态发展报告(2022年)

来源&#xff1a;中国信息通信研究院编辑&#xff1a;蒲蒲Web3不只是互联网应用层的简单创新&#xff0c;可能会带来互联网体系架构整体性演进和系统性升级。党中央、国务院高度关注下一代互联网创新发展&#xff0c;在关键核心技术突破、新型基础设施建设、融合创新应用赋能等…