数据科学团队管理

定位:

  • 有核心竞争力的工业算法部门
  • 与PM、RD等深度合作

业务方向:(不同产品线)

  • 工业预测性维护与数据挖掘
  • 视觉检测、OCR

工作内容

  • 项目需求与交付
  • 内部框架(frameworks \packages)
  • 应用demo
  • 专利、竞赛、论文

日常管理

  • 项目管理
  • 数据管理(原始数据管理、更新数据管理与检查、主数据管理)
    • https://zhuanlan.zhihu.com/p/359960152
  • 代码管理(个人explore的时候随个人风格,生产或系统时统一要求和设计)
  • 知识管理insight
  • 实验管理( 数据、代码、参数、模型)(例如数据统一存放和备份,需要时建立软链接)
  • 版本迭代管理:更新版本与changlog

日常会议

  • 一次 知识分享的会
  • 一次 业务align的会

代码流程规范

  • design doc
    • https://github.com/mercari/production-readiness-checklist/blob/master/docs/references/design-doc-template.md
    • https://docs.google.com/document/d/1C2uf4SaAtwLTlBCciOhvdiKQ2Eay4U72VxAD4bXe7iU/edit#heading=h.jomk6uyby0wp
    • 互联网公司大致通用的Architecture Review模版 - 张泰源的文章 - 知乎 https://zhuanlan.zhihu.com/p/659097994
  • 代码规范
    • PEP8 (clean, simple, loosely coupled, does not repeat itself, modular.)
    • https://google-styleguide.readthedocs.io/zh_CN/latest/google-python-styleguide/contents.html
    • https://github.com/zh-google-styleguide/zh-google-styleguide
  • 注释
  • 测试
    • https://mp.weixin.qq.com/s/7sQ6p0IDWvttbvv_c71Etg
  • 文档: sphinx-build,(防止自己看不懂自己的代码,细节都已经忘了)
  • 构建打包 setup
  • git flow
  • Docker file
  • 持续集成 git workflow
  • code review: https://github.com/joho/awesome-code-review
  • 生产:https://github.com/mercari/production-readiness-checklist

项目流程 (
The CRoss Industry Standard Process for Data Mining (CRISP-DM)

  • 理解商业需求
  • 获取与探索数据
  • 建模 (先清晰的目标)
  • 部署 (系统设计、监视 Prometheus, Grafana)

招聘(技术)

  • 基础扎实:计算机(数据结构、算法、编程语言)、机器学习(统计学习、深度学习)
  • 加分项:工程能力、大数据、数学、数据竞赛与论文 之一

注意事项

  • quick win 和 长期价值
  • 管理要以人为本,认可、共赢、信心、文化
  • 数据与业务结合
  • 需要技术视野来做选型、产品和商业思维做方向

真正的人格魅力、

  • 是否有面对世界级难题的勇气和能力
  • 艺术级的向上管理和向下管理
  • 回归自我,投机性、人格型或是制度型
  • 不断攀高峰 或是 稳住局面

其他

  • 121
  • 周报/meeting minutes

Pipeline

  • https://github.com/criteo/deepr
  • https://github.com/mercari/production-readiness-checklist

其他

注册: https://readthedocs.org/
https://pypi.org/project/pip/

参考:
https://github.com/taowen/12fallacy

https://github.com/taowen/modularization-examples

https://github.com/kdeldycke/awesome-engineering-team-management

算法工程师技术路线图 - 字节的文章 - 知乎
https://zhuanlan.zhihu.com/p/192633890

行业、公司、leader

团队基本:聚焦主要,
整体优化大于局部优化

招聘信息、专利信息去了解一个公司

https://linkedin.github.io/school-of-sre/

设计文档: Design Doc

讲故事:引导情绪 如何评价动画《进击的巨人》最终季第五集? - Moustache的回答 - 知乎
https://www.zhihu.com/question/438545545/answer/1671944835

诺斯罗普·弗莱先生说过,喜剧,就是两个团体的冲突。

https://github.com/jesselpalmer/the-engineering-managers-booklist

Git commits历史是如何做到如此清爽的? - elgoog的回答 - 知乎
https://www.zhihu.com/question/61283395/answer/186223235
https://zhuanlan.zhihu.com/p/23478654

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/891047.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何保证mysql数据库到ES的数据一致性

1.同步双写方案 在代码中对数据库和ES进行双写操作,确保先更新数据后更新ES。 优点: 数据一致性:双写策略可以保证在MySql和Elasticsearch之间数据的强一致性,因为每次数据库的变更都会在Elasticsearch同步反映。实时性&#xf…

敏捷测试文化的转变

敏捷文化是敏捷测试转型的基础,只有具备敏捷文化的氛围,对组织架构、流程和相关测试实践的调整才能起作用。在前面的敏捷测试定义中,敏捷测试是遵从敏捷软件开发原则的一种测试实践,这意味着敏捷的价值观。 此外,从传…

在 C# 中优化 JPEG 压缩级别和文件大小

此示例可让您检查不同 JPEG 压缩级别的图像质量。使用文件菜单的打开命令加载图像文件。然后使用“JPEG 压缩指数 (CI)”组合框选择压缩级别。程序将图像保存到具有该压缩级别的临时文件中,并显示生成的图像和文件大小。 该程序的关键是以下SaveJpg方法,…

Pandas02

Pandas01: Pandas01 文章目录 内容回顾1 数据的读取和保存1.1 读写Excel文件1.2 读写CSV1.3 读写Mysql 2 DataFrame 数据查询2.1 筛选多列数据2.2 loc 和 iloc2.3 query查询方法和isin 方法 3 DataFrame增 删 改数据3.1 增加一列数据3.2 删除一行/一列数据3.3 数据去重3.4 数据…

Flink定时器

flink的定时器都是基于事件时间(event time)或事件处理时间(processing time)的变化来触发响应的。对一部分新手玩家来说,可能不清楚事件时间和事件处理时间的区别。我这里先说一下我的理解,防止下面懵逼。…

Docker中的分层(Layer)

docker中有分层的概念,如下图所示 上面是容器层(Container layer),下面是镜像层(Image layers)。 镜像层的内容是静态的,读和写的操作,都是在容器层发生,专门为容器的读…

RoboMIND:多体现基准 机器人操纵的智能规范数据

我们介绍了 RoboMIND,这是机器人操纵的多体现智能规范数据的基准,包括 4 个实施例、279 个不同任务和 61 个不同对象类别的 55k 真实世界演示轨迹。 工业机器人企业 埃斯顿自动化 | 埃夫特机器人 | 节卡机器人 | 珞石机器人 | 法奥机器人 | 非夕科技 | C…

用友-友数聚科技CPAS审计管理系统V4 getCurserIfAllowLogin存在SQL注入漏洞

免责声明: 本文旨在提供有关特定漏洞的深入信息,帮助用户充分了解潜在的安全风险。发布此信息的目的在于提升网络安全意识和推动技术进步,未经授权访问系统、网络或应用程序,可能会导致法律责任或严重后果。因此,作者不对读者基于本文内容所采取的任何行为承担责任。读者在…

python报错ModuleNotFoundError: No module named ‘visdom‘

在用虚拟环境跑深度学习代码时,新建的环境一般会缺少一些库,而一般解决的方法就是直接conda install,但是我在conda install visdom之后,安装是没有任何报错的,conda list里面也有visdom的信息,但是再运行代…

C语言性能优化:从基础到高级的全面指南

引言 C 语言以其高效、灵活和功能强大而著称,被广泛应用于系统编程、嵌入式开发、游戏开发等领域。然而,要写出高性能的 C 语言代码,需要对 C 语言的特性和底层硬件有深入的了解。本文将详细介绍 C 语言性能优化的背后技术,并通过…

go多版本管理工具g win安装配置

go多版本管理工具g 基本介绍仓库安装配置配置环境配置系统变量配置path变量测试使用配置完环境变量之后,打开终端进行测试使用查看 g 的环境变量配置,g env 为环境变量配置,g -v为当前版本信息查看可下载列表下载安装指定版本go,并…

PlasmidFinder:质粒复制子的鉴定和分型

质粒(Plasmid)是一种细菌染色体外的线性或环状DNA分子,也是一种重要的遗传元素,它们具有自主复制能力,可以在细菌之间传播,并携带多种重要的基因(如耐药基因与毒力基因等)功能。根据质粒传播的特性&#xf…

细说STM32F407单片机通过IIC读写EEPROM 24C02

目录 一、操作说明 二、工程配置 1、时钟、DEBUG、GPIO、USART6、NVIC、Code Generator 2、 IIC2 (1)Master Features组,主设备参数 (2)Slave Features组,从设备参数 三、软件设计 1、KELED 2、E…

【C语言】库函数常见的陷阱与缺陷(三):内存分配函数[2]--calloc

C语言中的calloc函数是一个用于分配多个具有相同大小的内存块的函数,它在动态内存管理中扮演着重要角色。然而,在使用calloc时也存在一些陷阱与缺陷。 一、功能与常见用法 calloc(contiguous allocation)函数用于动态分配内存,相较于 malloc 函数,不仅能够在堆上为程序…

神经网络-Inception

Inception网络是由Google开发的一种深度卷积神经网络架构,旨在解决计算机视觉领域中的图像分类和物体识别任务。 Inception网络最初在2014年被提出,并在ImageNet图像分类挑战赛上取得了很好的结果。其设计灵感来自于模块化的思想,将不同尺度…

CUTLASS:高性能 CUDA 线性代数模板库详解

CUTLASS:高性能 CUDA 线性代数模板库详解 引言什么是 CUTLASS?CUTLASS 的主要特点: CUTLASS 的用途如何安装 CUTLASS1. 环境准备2. 下载 CUTLASS3. 构建 CUTLASS4. 设置环境变量5. 验证安装 使用 CUTLASSCUTLASS 的优势总结 引言 在深度学习…

PyTorch Instance Normalization介绍

Instance Normalization(实例归一化) 是一种标准化技术,与 Batch Normalization 类似,但它对每个样本独立地对每个通道进行归一化,而不依赖于小批量数据的统计信息。这使得它非常适合小批量训练任务以及图像生成任务(如风格迁移)。 Instance Normalization 的原理 对每…

国内独立开发者案例及免费送独立开发蓝图书

独立开发者在国内越来越受到关注,他们追求的是一种自由且自给自足的工作状态。 送这个: 少楠light(Flomo、小报童、如果相机):他们是独立开发者的典范,不仅开发了多款产品,还坚信“剩者为王”…

【小程序】自定义组件的data、methods、properties

目录 自定义组件 - 数据、方法和属性 1. data 数据 2. methods 方法 3. properties 属性 4. data 和 properties 的区别 5. 使用 setData 修改 properties 的值 自定义组件 - 数据、方法和属性 1. data 数据 在小程序组件中,用于组件模板渲染的私有数据&…

MATLAB用find函数结合all,any函数高效解决问题

如本节中最后提到的问题,我们输出后还需要判断,不是特别的一目了然,这时候我们可以再加上 f i n d find find函数直接标记序号并输出。首先我们先来了解 f i n d find find的用法, f i n d ( a ) find(a) find(a)表示将矩阵或向量…