摘要:开源协作是数字化时代的必备技能,而背后的开发行为分析,能够让你看到一幅开源世界的全景图;2020年2月,X-lab 开放实验室联合InfoQ发布了《GitHub 2019 数字年报》,收到了业界的一致好评。数据科学与工程能够让你领略这种数据洞见的魅力,你会看到,无论是我们熟悉的 TensorFlow、VS Code,还是阿里百度这样的明星企业,都只是这片海洋中的沧海一粟;这份数字报告背后的数据基础设施是什么?用的什么分析方法?如何建立合理的模型?最终结果如何展示能让各个大厂信服?后续还能继续做些什么?本次课程将给你带来这些回答。本报告为第二部分,第一部分参加上一篇文章《Github 大数据行为分析简介》。
报告PPT:
:
重磅 | GitHub 2019 数字年报全文正式发布
摘要:在开源日益重要的今天,我们需要一份建立在全域大数据基础上的相对完整、可以反复进行推演的数据报告(报告、数据、算法均需开源)。本项目为X-lab 开放实验室团队发起,旨在通过分析Github全网的开发者行为日志,通过数据的视角,来观察全球范围内的开源现状、进展趋势、演化特征、以及未来挑战等问题,除了展现目前开源世界全貌之外,我们特别关注中国的开发者和企业组织在整个开源产业中的表现。本报告中使用 2019 年全年 GitHub 日志进行统计,总日志条数约 5.46 亿条。
关键词:开源、行为数据、开发者行为、Github、数字年报