我花了14个小时找了一下长春长生们究竟卖到了哪里去

前言

本文首发于个人的公众号和v2ex,事先也没想到会有这么多人关注。在这边重新编辑一下,去掉了原先前言中对此次疫苗事件背景的描述及部分不严谨的措辞。全文的观点从技术讨论出发,尽量客观中立,观点及行为为员工自发,不代表本人所在公司及团队。


需要说明的是这次数据是涵盖所有的疫苗数据,并不是针对此次问题疫苗定向搜集的数据,所有数据皆来自于政府相关网站的公开数据。

数据采集源

因为有一些数据实在太难找了,只能来看一下近两年的数据,并且不考虑疫苗增补名单数据(太零碎了)。

所以这次整理的数据并不完善,所以把所有搜集到的数据全部同步到了GitHub,有需要可以自取或者提issue和pr。

因为时间跨度较大,所以没有把批次的信息纳入本次的统计范围。本文主要从技术层面搜集了此次问题疫苗事件相关企业生产的各类疫苗在各省份的销售情况。

采集关键词

  • 省名  第二类疫苗  采购

  • 省名  第二类疫苗  公示

  • 省名  第二类疫苗  产品及价格

  • 省名  第二类疫苗  供应商

  • 省名  第二类疫苗  中标目录

  • 省名  第二类疫苗  参考价

  • 省名  第二类疫苗  入围结果

采集结果整理如下

  • 北京市,来源:北京市2018-2019年免疫规划用第二类疫苗采购项目

  • 天津市,来源:天津市2018-2020年第二类疫苗集中采购项目拟中标/拟中选结果

  • 上海市,来源:2018 年度上海市第二类疫苗集团采购项目中标目录

  • 重庆市,来源:重庆市第二类疫苗供应商入围采购-采购结果预公示

  • 河北省,来源:河北省疾病预防控制中心2018年度第二类疫苗省级集中采购项目中标公告

  • 山西省,来源:2018年度山西省第二类疫苗集中采购入围企业产品及价格

  • 辽宁省,来源:辽宁省第二类疫苗平台招标采购公告

  • 吉林省,来源:2017年度吉林省第二类疫苗集中采购企业产品议价结果名单

  • 黑龙江省,来源:黑龙江省2018年第二类疫苗挂网采购中标企业产品及价格审核结果

  • 江苏省,来源:江苏省第二类疫苗集中采购中标产品

  • 浙江省,来源:浙江省2018年第二类疫苗中标目录

  • 安徽省,来源:安徽省2018年第二类疫苗集中采购目录

  • 福建省,来源:福建省2018年第二类疫苗集中采购目录_湄洲岛

  • 江西省,来源:1228江西省2018年度第二类疫苗入围品种目录

  • 山东省,「找不到」

  • 河南省,来源:2017年河南省二类疫苗供应商入围资格采购项目中标结果公告

  • 湖北省,来源:2017年湖北省第二类疫苗集中采购成交产品

  • 湖南省,来源:湖南省第二类疫苗集中采购文件

  • 广东省,来源:2018年度广东省第二类疫苗成交品种目录

  • 海南省,来源:海南省第二类疫苗品种目录(第一批)

  • 四川省,来源:2017年度第二类疫苗挂网阳光采购结果

  • 贵州省,来源:贵州省第二类疫苗集中采购报价解密结果

  • 云南省,来源:云南省疾病预防控制中心二类疫苗公开招标入围项目入围公告

  • 陕西省,来源:陕西省2018年二类疫苗集中采购项目入围供应商磋商结果

  • 甘肃省,来源:甘肃省第二类疫苗供应资格采购项目中标公示

  • 青海省,来源:所有的第二类的价格信息全部转到:223.220.250.135:8038  无法查看

  • 台湾省,暂无

  • 内蒙古自治区,2018年内蒙古自治区第二类疫苗集中采购入围企业产品及价格

  • 广西壮族自治区,2017年度广西壮族自治区第二类疫苗直接挂网采购拟入围产品目录(电子版)

  • 西藏自治区,实在找不到

  • 宁夏回族自治区,2016年宁夏回族自治区第二类疫苗公开招标预中标结果

  • 新疆维吾尔自治区,《自治区2017年第二类疫苗入围品种及价格目录》20170828.xls

  • 香港特别行政区,暂无

  • 澳门特别行政区,暂无


综上,除去港澳台 ,山东,青海以及西藏以外,只搜集到了28个省级行政区的二类疫苗数据公示情况。


单单是检索,下载的过程,就花了7个多小时,主要遇到了一些问题:


  • 某些网站需要注册登录才可以查看

  • 有些网站缺乏维护被挂了黑链

  • 搜索框有,但是实际并不能搜索

  • 有些只有图片,没有文字

  • 有些只在纯公告但无具体数据

  • 找不到信息的有

    • 山东省,只看到新闻说建了可追溯的展示平台,但本次暂未找到

    • 青海省,所有的第二类的价格信息需要账号登录进相关系统才能访问

    • 西藏,暂时没能搜索到相关数据


如图,最终获取到28个省份的数据,(图中漏掉了河北)。

640?wx_fmt=png

数据整理

由于本人不是专业的医学行业人士,所以统一把数据整理成以下的csv格式。

通用名,来源,生产企业,申报企业,省,中标年份
name,src,create_company,report_company,prov,year

各项含义如下:

  • 通用名 :药名  -> name

  • 来源:国产/进口 -> src

  • 生产企业 ->  create_company

  • 申报企业:如果为空再填充为生产企业 ->  report_company

  • 省  ->  prov

  • 中标年份 ->  year


期间因为整理非XLS的文件消耗了大量的时间,暂时只能先把成型的数据集提取出来。

640?wx_fmt=png

目前处理结果如下:

  • 数据标准csv(14)

    吉林省,四川省,天津市,宁夏回族自治区,安徽省,山西省,广东省,新疆维吾尔自治区,江苏省,江西省,海南省,贵州省,辽宁省,黑龙江省,

  • 等待整理的数据(13)

    上海市,云南省,内蒙古,北京市,广西省,河南省,浙江省,湖北省,湖南省,甘肃省,福建省,重庆市,陕西省,


如图所示 

640?wx_fmt=jpeg

  • 亮绿色是容易获取的数据

  • 暗绿色的可以获取的数据

  • 黑色的是没有获取到数据

数据分析

直接采用pandas+echart进行处理,首先把所有的csv整合,共有1529条数据

,对所有的生成企业进行统计分析:

count    167.000000
mean       9.143713
std       15.839281
min        1.000000
25%        1.000000
50%        3.000000
75%        9.000000
max       98.000000

共 167 个厂家,其中中位数是3,最高是98,很明显这是一个偏态分布。  顺手看一下箱线图:

640?wx_fmt=png

也就是说,绝大多数的药,都由大厂生产。我们输出前10个看看,长春长生位列第2。

生产厂家数量
北京科兴生物制品有限公司98
长春长生生物科技有限责任公司91
华兰生物疫苗有限公司72
玉溪沃森生物技术有限公司57
上海生物制品研究所有限责任公司56
大连雅立峰生物制药有限公司51
长春生物制品研究所有限责任公司50
华北制药金坦生物技术股份有限公司46
辽宁成大生物股份有限公司44
北京智飞绿竹生物制药有限公司43

我们再来看看各个省份中,长春长生等占据的百分比

[{'name': '天津', 'value': 14.0625},{'name': '辽宁', 'value': 17.647058823529413},{'name': '黑龙江', 'value': 13.274336283185843},{'name': '安徽', 'value': 9.75609756097561},{'name': '新疆', 'value': 16.94915254237288},{'name': '江苏', 'value': 14.563106796116504},{'name': '江西', 'value': 12.179487179487179},{'name': '山西', 'value': 16.52173913043478},{'name': '吉林', 'value': 17.857142857142858},{'name': '贵州', 'value': 14.17910447761194},{'name': '广东', 'value': 13.445378151260504},{'name': '四川', 'value': 16.93548387096774},{'name': '宁夏', 'value': 17.5},{'name': '海南', 'value': 14.285714285714285}]

长春长生等在14个有数据的省份供应商中均占有一席之地:

  • 亮红色 接近20%

  • 暗红色 接近10%

  • 黑色的是没有获取到数据

640?wx_fmt=png

对比下从官网下载的公司销售策略图640?wx_fmt=png

做到这里已经到了晚上11点,从早上9点做到现在,花了整整14小时,才将将整理了一半的省份,所以目前的数据并不完整,仅供参考,后面空了可能会继续整理更新到Github上。

后记

除了在朋友圈和微博刷屏表达我们的愤怒,或许我们还能做点什么,这也是我的出发点。最初的文章里面有些措辞不是太中性,抱歉,本只想在自己能力范围内做一点事情。

如果说有什么建议的话,希望相关部门在数据公示方面后续能继续加强吧。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/525623.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java jackson 注解,java – 如何使用Jackson注释序列化此JSON?

我有以下JSON:{fields : {"foo" : "foovalue","bar" : "barvalue"}}我写了一个pojo如下:public class MyPojo {JsonProperty("fields")private List fields;static class Field {JsonProperty("…

我们分析了50万条拼多多商品数据,告诉你到底是消费升级还是降级?

作者:放开那个猕猴桃来源:人工智能与大数据生活转自:知乎,恋习Python一、缘起我在杭州有位朋友,提到有家做社交的电商很火,叫拼多多,我没有在意,直到有一天,我居然在电视…

java并发集合面试题,那些经常被问的JAVA面试题(1)—— 集合部分

【本文转自极客原创 作者:张锋 原文链接:】Java集合框架是什么?说出一些集合框架的优点?每种编程语言中都有集合,最初的Java版本包含几种集合类:Vector、Stack、HashTable和Array。随着集合的广泛使用&…

php7 二维数组排序,PHP二维数组排序

以前遇到二维数组排序的问题都是自己写排序函数,今天遇到一个二维数组排序问题,就想简单一点,网上找了一圈,没发现比较简单的写法,研究了一下PHP自带的函数,发现只使用array_multisort这个函数就可以实现二…

拯救阿波罗14号!那些伟大太空计划背后的计算机工程师们

1971年1月31日,阿波罗14号发射。外太空旅行近一周后的凌晨,回程中的阿波罗14号突然面临一个严峻的问题:它可能没办法正常降落了。问题出在其计算机工程师Don Eyles编写的一个应急程序上,他必须在很短的时…

golang web php,golang 适合做web开发吗

使用go语言来做web开发,是非常方便的。如果不使用框架,仅仅使用net/http包,也能快速开发一个web应用。但是,官方包不支持RESTful风格的API,所以我们依然还是需要选择一个框架来帮助我们进行开发。 (推荐学习&#xff1…

我又花了28个小时分析了一下各省二类疫苗采购公示数据

1前 言距离《我花了14个小时找了一下长春长生们究竟卖到了哪里去》发出来已经过去了4天,过去的几天里,每天晚上我都在搜集和整理数据,终于把之前没做完的工作做的差不多了。现在做一个大致的总结,分析相对粗略,大家见…

mysql 中 end like,MySQL 这三道必问面试题,你都会吗?

来源:JAVA面试精选据群友面试反馈,整理了3道MySQL面试题,对很多人可能是小菜一碟,对这些熟悉,有更好的理解的话,可以留言补充,不断完善我们的题库。MySQL查询字段区不区分大小写?MyS…

[重磅] 如何更好地实现服务调用和消息推送

第四届阿里中间件性能挑战赛是由阿里巴巴集团发起,阿里巴巴中间(Aliware)、阿里云天池联合举办,是集团少有的工程性品牌赛事。大赛的初衷是为热爱技术的年轻人提供一个挑战世界级技术问题的舞台,希望选手在追求性能极致的同时,能深…

linux下安装配置apache+php,linux下安装apache与php;Apache+PHP+MySQL配置攻略

linux下安装apache与php;ApachePHPMySQL配置攻略时间:2019-10-09 20:041.apache在如下页面下载apache的for Linux 的源码包http://www.apache.org/dist/httpd/;存至/home/xx目录,xx是自建文件夹,我建了一个wj的文件夹。命令列表:c…

开发怼产品,天经地义?大惊小怪?

最近,又有一件轰动程序员界的事情发生了,想必大家伙都已经奔走相告了。来回顾下事情的经过,1张图就能说明白了骚不?反正有句话叫「从技术层面出发,总归有办法实现的」,还有这么一句话叫「从技术角度出发&am…

php实现数据排序算法,PHP实现排序堆排序算法

这篇文章主要为大家详细介绍了PHP实现排序堆排序(Heap Sort)算法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下算法引进:在这里我直接引用《大话数据结构》里面的开头:在前面讲到 简单选择排序 ,它在待排序的 n 个…

谷歌Edge TPU:将机器学习引入边缘,撬动边缘计算/IOT大“地球”

近期,谷歌在Cloud Next会议上推出其最新产品,Edge TPU芯片和Cloud IOT Edge软件,并将于10月推出Edge TPU开发套件。作为Cloud TPU的补充,目前Edge TPU仅用于推理,专为在边缘运行TensorFlow Lite ML模型而设计。Edge TP…

matlab实验函数编写与程序设计,matlab实验四函数编写与程序设计

《matlab实验四函数编写与程序设计》由会员分享,可在线阅读,更多相关《matlab实验四函数编写与程序设计(8页珍藏版)》请在金锄头文库上搜索。1、实验四:函数编写与程序设计一、实验目的 1 . 掌握 M 文件的创建。2掌握函数的编写规则。3掌握函…

eclipse运行java快捷键,eclipse常用快捷键

eclipse常用快捷键eclipse 常用快捷键Eclipse的编辑功能非常强大,掌握了Eclipse快捷键功能,能够大大提高开发效率。Eclipse中有如下一些和编辑相关的快捷键。1. 【ALT/】此快捷键为用户编辑的好帮手,能为用户提供内容的辅助,不要为…

详解云计算、大数据和人工智能的区别与联系

今天跟大家讲讲云计算、大数据和人工智能。为什么讲这三个东西呢?因为这三个东西现在非常火,并且它们之间好像互相有关系:一般谈云计算的时候会提到大数据、谈人工智能的时候会提大数据、谈人工智能的时候会提云计算……感觉三者之间相辅相成…

php phar包require报错,php,_很奇怪,php 引入了phar,但是报错,说Predis\Client类找不到?,php - phpStudy...

很奇怪,php 引入了phar,但是报错,说Predis\Client类找不到?require Predis.phar;use Predis\Client;ini_set(session.save_path, tcp://localhost:6379);ini_set(session.name, YMFSESSION);ini_set(session.save_handler, user);…

关于腾讯云丢数据事件的一些看法

事件回顾:创业公司“前沿数控”8月5日发文称,公司存放在腾讯云上的精准注册用户以及内容数据全部丢失,并且不能恢复,造成公司平台全部停运的状态。前沿数控表示,公司丢失的数据近千万元级,对此索赔1000余万…

Navicat for mysql备份与恢复

文章目录 一、Navicat for mysql备份1.打开navicat,找到备份2.点击新建备份,直接点备份3.备份完成 二、恢复数据1.删除表2.点击备份,选中备份文件,点击还原备份3.还原完成 三、其他命令四、视频演示总结 一、Navicat for mysql备份…

java mysql order by,java-使用LIMIT和MySQL进行ORDER BY

我在使用MySQL查询时遇到问题,在该查询中我得到了一个带有LIMIT 1的行.但是,将其与order一起使用时,它不起作用.在mysql工作台中运行的查询如下:select * from train twhere t.togId 1125and t.tilDato > 2013-12-20order by t.fraDato LIMIT 1;但是,当我通过ja…