揭开互联网公司的神秘面纱,数据解读那些slay整个行业的互联网公司

前言:

随着互联网行业的日益兴盛,吸引力越来越多的牛人加入其中,也有许多小伙伴跃跃欲试,想要在互联网的浪潮中大展身手。今天我们通过看准网的数据,帮助大家对各大互联网公司有一个比较概括的了解。


01.数据来源


640


看准网提供了许多员工对于公司的评价,我们从中提取需要的数据,包括整体评分、面试难度、推荐率、前景看好情况、CEO支持率,代码如下:

## 获得信息 
def get_company_info(num,headers):
   ## 获得评价数据
   url = 'https://www.kanzhun.com/gsr'+str(num)+'.html?ka=com-blocker1-review'
   js='window.open("'+url+'")'
   driver.execute_script(js)
   time.sleep(5)
   driver.close()
   driver.switch_to_window(driver.window_handles[0])
   bsObj=BeautifulSoup(driver.page_source,"html.parser")
   tag=bsObj.find('div',attrs={'class':'all_item'}).text.replace(' ','').replace(' ','').replace('(',' ').replace(')',' ').split(' ')
   tag=tag[0:len(tag)-1]
   this_tag = {tag[i*2]:tag[i*2+1] for i in np.arange(int(len(tag)/2-1))}
   this_name = bsObj.find('div',attrs={'class':'co_name t_center'}).text
   this_overal = float(bsObj.find('div',attrs={'class':'res_box_star f_right'}).find('em').text)
   points = bsObj.find('ul',attrs={'class':'score_rate clearfix'}).text.replace(' ',' ').split()
   this_recommend = float(points[0][0:2])/100*5
   this_future = float(points[2][0:2])/100*5
   this_ceo = float(points[4][0:2])/100*5
   ## 获得CEO头像和公司logo
   ceo_pic = bsObj.find('div',attrs={'class':'ceo_info'}).find('div').find('img').attrs['src']
   ceo_name = bsObj.find('div',attrs={'class':'ceo_info'}).find('p').text
   head_logo = bsObj.find('div',attrs={'class':'com_logo f_left'}).find('img').attrs['src']
   head_loc = 'D:/爬虫/看准/公司logo/'+this_name+'.jpg'
   ceo_loc = 'D:/爬虫/看准/CEOlogo/'+this_name+'.jpg'
   request.urlretrieve(head_logo,head_loc)
   request.urlretrieve(ceo_pic,ceo_loc)
   ## 获得面试难度
   url = 'https://www.kanzhun.com/gsm'+str(num)+'.html?ka=com-floater-interview'
   js='window.open("'+url+'")'
   driver.execute_script(js)
   time.sleep(5)
   driver.close()
   driver.switch_to_window(driver.window_handles[0])
   bsObj=BeautifulSoup(driver.page_source,"html.parser")
   req=request.Request(url,headers=headers)  
   html=urlopen(req)  
   bsObj=BeautifulSoup(html.read(),"html.parser")    
   this_difficulty = float(bsObj.find('section',attrs={'class':'interview_feel'}).find('em').text)
   this_feeling = bsObj.find('ul',attrs={'class':'score_list'}).find_all('span',attrs={'class':'percent'})
   this_feeling = [float(k.text.replace('%','')) for k in this_feeling]
   this_feeling = (this_feeling[0]*5+this_feeling[1]*3+this_feeling[2]*1)/100
   ## 整合数据成为字典
   this_company ={'name':this_name,'overal':this_overal,'comments':tag[1],'recommend':this_recommend,
                  'future':this_future,'ceo':this_ceo,'difficulty':this_difficulty,'feeling':this_feeling}    
   return this_company,this_tag,this_name



02.整体对比


我们最终选取了50家互联网公司作为样本进行对比,选取来源主要是结合2018年互联网公司百强榜单和看准网上的实际评价数量,选取的公司logo拼图如下,我们会在第4部分讲解如何将图片进行拼接:

640


首先对比各项评价指标的TOP15:

640

640

640

640


可以看到,榜单中BAT在各项排名中都处于十分靠前的位置,网易也占据了多个榜单的靠前位置,腾讯霸占了所有排名的TOP1。下面我们再来看一下面试难度,我们选取了面试难度评分的TOP15和BOTTOM15,该数据仅供参考,根据小编的经验,同一个公司的不同部门不同岗位之间的难度差异也非常大。


640

640

在面试难度偏低的一些公司中,有许多非常不错的公司,该数据仅仅是一个参考,真正的面试还是要取决于求职者的实际能力,所谓会者不难,难者不会。真正的大牛无论是面对多么困难的面试,依然可以slay全场。


## 整体评分top15柱形图
company=pd.read_excel('company_info.xlsx')
company_overal = company.sort_values('overal',ascending=False)[0:15]
attr = company_overal['name']
v1=round(company_overal['overal'],2)
bar = Bar("整体评分TOP15",title_pos='center')
bar.use_theme('essos')
bar.add("", attr, v1, is_stack=False,xaxis_rotate=30,yaxis_min=3.7,is_label_show=True,
        xaxis_interval =0,is_splitline_show=False)
bar.render('整体评分TOP15.html')


03.雷达图


前面我们看的都是各个公司之间的对比,下面我们看一下同一个公司不同维度的情况,我们选取了BAT和TMD作为数据,其他的公司也可以按照同样的方式进行对比,首先看一下BAT:


640

BAT真的是名副其实的业界标杆,各项指标都slay整个行业,下面我们看一下此前发展势头迅猛的TMD三家公司:


640

TMD三家公司和行业整体水平相比,也是出于领先地位,可见其还不错的发展势头,最后放上和小编息息相关的三家公司,具体是哪三家,相信了解小编的朋友一定是可以猜出来的:


640


value_avg = [list(company.iloc[:,[1,3,4,5,6]].mean())]
value_company0 = [list(company.iloc[0,[1,3,4,5,6]])]
value_company1 = [list(company.iloc[1,[1,3,4,5,6]])]
value_company2 = [list(company.iloc[2,[1,3,4,5,6]])]
c_schema= [{"name": "总体评价", "max": 4.4, "min": 3.2},
          {"name": "推荐度", "max": 4.75, "min": 2.4},
          {"name": "前景看好", "max": 4.25, "min": 1},
          {"name": "CEO/董事长认可度", "max": 4.8,"min":3},
          {"name": "面试难度", "max": 3.4,"min":2.3}]
radar = Radar()
radar.use_theme('essos')
radar.config(c_schema=c_schema, shape='circle')
radar.add(company['name'][0], value_company0, item_color="blue", symbol=None,linewidht=5)
radar.add(company['name'][1], value_company1, item_color="orange", symbol=None,linewidht=5)
radar.add(company['name'][2], value_company2, item_color="red", symbol=None,linewidht=5)
radar.add("整体水平", value_avg, item_color="purple", symbol=None,linewidth=5,
         legend_selectedmode='multiple')
radar.render('bat.html')


04.图片拼接


看准网提供了各个公司的logo和各位公司大佬的头像,我们冒昧地利用这些数据进行简单的图片拼接,制作成一副大的合成图。主要原理是利用numpy中的多维数组进行拼接,由于图像本身就可以看做是一个三维数组(彩色)或者一位数组(黑白),所以我们只需利用数组的拼接方法,就可以达到我们的目的。


代码如下:

## 拼接公司logo成为5*10的拼图
i = 0
for filename in os.listdir("./公司logo"):
   file_loc = "D:/爬虫/看准/公司logo/"+filename
   img = mpimg.imread(file_loc)[:,:,0:3]
   img = cv2.resize(img, (180,180),interpolation=cv2.INTER_AREA)
   if i % 10 == 0:
       row_img=img
   elif i == 9:
       row_img=np.hstack((row_img,img))
       all_img = row_img
   elif i % 10 == 9:
       row_img=np.hstack((row_img,img))
       all_img = np.vstack((all_img,row_img))
   else:
       row_img=np.hstack((row_img,img))
   i = i+1
plt.imshow(all_img)    
plt.axis('off')    

## 拼接大佬头像成为7*7的拼图
i = 0
for filename in os.listdir("./CEOlogo"):
   file_loc = "D:/爬虫/看准/CEOlogo/"+filename
   img = mpimg.imread(file_loc)[:,:,0:3]
   img = cv2.resize(img, (500,500),interpolation=cv2.INTER_CUBIC)
   if i % 7 == 0:
       row_img=img
   elif i == 6:
       row_img=np.hstack((row_img,img))
       all_img = row_img
   elif i % 7 == 6:
       row_img=np.hstack((row_img,img))
       all_img = np.vstack((all_img,row_img))
   else:
       row_img=np.hstack((row_img,img))
   i = i+1
plt.imshow(all_img)    
plt.axis('off')


下面就是我们的效果图,不知道大家是否能一眼就把所有的logo都认全


640


最后是各位大佬的拼图,不知道大家第一眼看到的是哪位大佬,第一眼看到的大佬,或许就是你未来的老板smiley_13.png


640


作者介绍:徐麟,目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据

文章来源:数据森麟(ID:shujusenlin)


1.微信群:

添加小编微信:tangguoyemeng,备注“进群+姓名+公司职位”即可,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!


2.征稿:

投稿邮箱:lijy@csdn.net;微信号:tangguoyemeng。请备注投稿+姓名+公司职位。


推荐阅读


  • 为什么阿里飞猪、滴滴、携程都被质疑滥用大数据杀熟?

  • 云漫圈 | 计数排序,你真的了解么?

  • 我们研究了1.5万场活动,换个大城市生活可能对你有用

  • 大数据揭秘: 原来单身女生有这些特点...

  • 放弃培训班自学编程,9 个月后我成为年薪 6 位数的软件工程师

  • 82岁的北大教授证明了黎曼猜想?

  • 继承变量覆盖及构造函数失配,竟然会导致这些漏洞

  • 35岁IT老兵,转型AI,我做错了吗?

640?wx_fmt=jpeg


↓↓↓  点击【阅读原文】查看「CSDN云计算」往期精彩内容

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/525400.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cloud一分钟 | Gartner发布2018年第二季度全球服务器市场报告;中信银行联合腾讯云推出手机银行智能语音产品...

Hello,everyone:10月16日早,星期二,祝大家工作愉快!一分钟新闻时间:完1.微信群:添加小编微信:tangguoyemeng,备注“进群姓名公司职位”即可,加入【云计算学习…

Cloud一分钟 | 华为云发布云数据安全白皮书;OPPO携手阿里云举行天池OGeek算法挑战赛...

Hello,everyone:10月17日早,星期三,祝大家工作愉快!一分钟新闻时间:完1.微信群:添加小编微信:tangguoyemeng,备注“进群姓名公司职位”即可,加入【云计算学习…

关于这道填空题,你会如何回答?(附带学习链接)

曾经有一篇百万阅读量的爆文,里面出了道填空题,问:____是铜牌,____是银牌,____是金牌,____是王牌。小白的答案是:Java是铜牌,Linux是银牌,Hadoop是金牌,大数据…

BugkuCTF-Crypto题affine

题目描述: 这题考的是仿射密码,了解一下仿射密码 仿射密码为一类替换密码。它是一个字母对一个字母的。它的加密函数为 其a和m互质,m为字母的数目。 解码函数为 其a^-1为a在Zm群的乘法逆元 乘法逆元: 所有与26互素元素的乘法…

Python set集合 - Python零基础入门教程

目录 一.set 集合简介二.set 集合常用函数三.set 集合运算符四.猜你喜欢 零基础 Python 学习路线推荐 : Python 学习目录 >> Python 基础入门 在 Python 变量中除了以前文章所提到的整形 int / 浮点数 float / 布尔值 bool / 列表 list / 字典 dict 之外,还有…

Cloud一分钟 | 华为云、腾讯云、阿里云中标「央视2018年租赁公有云服务」项目...

Hello,everyone:10月18日早,星期四,祝大家工作愉快!一分钟新闻时间:完1.微信群:添加小编微信:tangguoyemeng,备注“进群姓名公司职位”即可,加入【云计算学习…

Cloud一分钟 | 华云数据中标上药控股私有云千万级项目; 总投资90亿元的中国移动厦门数据中心,一期电源工程项目候选人公示...

Hello,everyone:10月19日早,星期五,祝大家工作愉快!一分钟新闻时间:完1.微信群:添加小编微信:tangguoyemeng,备注“进群姓名公司职位”即可,加入【云计算学习…

Python set list dict tuple 区别和相互转换 - Python零基础入门教程

目录 一.前言二.Python set list dict tuple 区别三.猜你喜欢 零基础 Python 学习路线推荐 : Python 学习目录 >> Python 基础入门 一.前言 Python 提供多种数据类型来存放数据项集合,主要包括序列(列表 list 和元组 tuple)&#xff…

2023RT-Thread开发者大会

参加了一次RT-Thread的开发者大会,相当有意思,虽然一天奔波挺累,但睡了半天之后简单剪了下22号的视频,也就有时间写自己的参会笔记了。 与openEuler社区不同,RT-Thread社区更专注于嵌入式,与硬件厂商结合较…

企业大咖教你解决Kubernetes的挑战

Kubernetes(K8s)是自动化容器操作的开源平台,这些操作包括部署,调度和节点集群间扩展。如果你曾经用过Docker容器技术部署容器,那么可以将Docker看成Kubernetes内部使用的低级别组件。Kubernetes还可以提供容器弹性&am…

Android 之父裁员 30%:开发者如何避免“被离职”?

近几个月来,Google 和 Android 都不太太平。从 7 月 Google 被欧盟处以 50 亿美元的反垄断罚款,到引起恐慌的 Android 碎片化漏洞,再到 Android 的许可政策遭遇更改......而现在,由 Android 之父一手创立的初创公司也惨遭“滑铁卢…

面趣 | 据说这道烧脑的微软面试题很奇葩,你来试试?

参加 2018 AI开发者大会,请点击 ↑↑↑问面试题目:昨天,我早上8点爬山,晚上8点到山顶。睡了一觉后,今天,我早上8点从山顶原路下山,晚上8点到山脚。请问,有没有一个时刻,昨…

Cloud一分钟 | 苹果更新“隐私页面”;中国联通大数据正式升级,进入数智新阶段...

Hello,everyone:10月22日早,星期一,祝大家工作愉快!一分钟新闻时间:完1.微信群:添加小编微信:tangguoyemeng,备注“进群姓名公司职位”即可,加入【云计算学习…

“双十一”即将来临,先来看看快递物流企业的大数据

继中通、韵达后,圆通速递于日前宣布涨价。据悉,圆通速递将对全国各网点到达上海地区的快件派送费上调,上调幅度为0.5元/票。双十一临近,快递企业接连涨价,行业或将迎来集体涨价潮。据圆通速递称,此次调价行…

Python str / bytes / unicode 区别详解 - Python零基础入门教程

目录 一.前言二.Python str / bytes / unicode 区别 1.Python2.x 版本中 str / bytes / unicode 区别2.Python3.x 版本中 str / bytes / unicode 区别 三.Python string 与 bytes 相互转换 1.string 经过编码 encode 转化成 bytes2. bytes 经过解码 decode 转化成 string 四.猜…

ip服务器ip地址信息配置,服务器ip地址配置

服务器ip地址配置 内容精选换一换当创建文件系统后,您需要将文件系统挂载至云服务器上,在为root用户创建一个本地目录。如已成功挂载文件系统,可跳过此章节。请记录步骤4的本地目录后,按照为每个用户创建有读写权限的子目录执行操…

干货 | 18个Python爬虫实战案例(已开源)

目录爬虫小工具文件下载小助手爬虫实战笔趣看小说下载VIP视频下载百度文库文章下载_rev1百度文库文章下载_rev2《帅啊》网帅哥图片下载构建代理IP池《火影忍者》漫画下载财务报表下载小助手一小时入门网络爬虫抖音App视频下载_rev1抖音App视频下载_rev2抖音App视频下载_rev3GEE…

BugkuCTF-Crypto题Crack it

下载文件得到shadow文件 查看文件:cat shadow/more shadow 应该有工具可以爆破 Kali系统里的john工具可以用。 破解:john shadow 用到john工具。John the Ripper是一个快速的密码破解程序 john --show[LEFT] 显示破解的密码[如果左,然后uncr…

Cloud一分钟 | 一脚踏入云计算2.0时代,京东云这回拼的是“朋友 圈”;8400万元私有云招标...

Hello,everyone:10月23日早,星期二,祝大家工作愉快!一分钟新闻时间:完1.微信群:添加小编微信:tangguoyemeng,备注“进群姓名公司职位”即可,加入【云计算学习…

BugkuCTF-WEB题bp

查看题目的提示和描述 尝试输入admin,zxc111,失败 admin,zxc123,竟然成功登录界面 这题这么随便的吗? 真服! 也可进行爆破得到密码 flag{a03c860c57aca1c9697d8007f358cf1f}