数据科学团队管理

定位:

  • 有核心竞争力的工业算法部门
  • 与PM、RD等深度合作

业务方向:(不同产品线)

  • 工业预测性维护与数据挖掘
  • 视觉检测、OCR

工作内容

  • 项目需求与交付
  • 内部框架(frameworks \packages)
  • 应用demo
  • 专利、竞赛、论文

日常管理

  • 项目管理
  • 数据管理(原始数据管理、更新数据管理与检查、主数据管理)
    • https://zhuanlan.zhihu.com/p/359960152
  • 代码管理(个人explore的时候随个人风格,生产或系统时统一要求和设计)
  • 知识管理insight
  • 实验管理( 数据、代码、参数、模型)(例如数据统一存放和备份,需要时建立软链接)
  • 版本迭代管理:更新版本与changlog

日常会议

  • 一次 知识分享的会
  • 一次 业务align的会

代码流程规范

  • design doc
    • https://github.com/mercari/production-readiness-checklist/blob/master/docs/references/design-doc-template.md
    • https://docs.google.com/document/d/1C2uf4SaAtwLTlBCciOhvdiKQ2Eay4U72VxAD4bXe7iU/edit#heading=h.jomk6uyby0wp
    • 互联网公司大致通用的Architecture Review模版 - 张泰源的文章 - 知乎 https://zhuanlan.zhihu.com/p/659097994
  • 代码规范
    • PEP8 (clean, simple, loosely coupled, does not repeat itself, modular.)
    • https://google-styleguide.readthedocs.io/zh_CN/latest/google-python-styleguide/contents.html
    • https://github.com/zh-google-styleguide/zh-google-styleguide
  • 注释
  • 测试
    • https://mp.weixin.qq.com/s/7sQ6p0IDWvttbvv_c71Etg
  • 文档: sphinx-build,(防止自己看不懂自己的代码,细节都已经忘了)
  • 构建打包 setup
  • git flow
  • Docker file
  • 持续集成 git workflow
  • code review: https://github.com/joho/awesome-code-review
  • 生产:https://github.com/mercari/production-readiness-checklist

项目流程 (
The CRoss Industry Standard Process for Data Mining (CRISP-DM)

  • 理解商业需求
  • 获取与探索数据
  • 建模 (先清晰的目标)
  • 部署 (系统设计、监视 Prometheus, Grafana)

招聘(技术)

  • 基础扎实:计算机(数据结构、算法、编程语言)、机器学习(统计学习、深度学习)
  • 加分项:工程能力、大数据、数学、数据竞赛与论文 之一

注意事项

  • quick win 和 长期价值
  • 管理要以人为本,认可、共赢、信心、文化
  • 数据与业务结合
  • 需要技术视野来做选型、产品和商业思维做方向

真正的人格魅力、

  • 是否有面对世界级难题的勇气和能力
  • 艺术级的向上管理和向下管理
  • 回归自我,投机性、人格型或是制度型
  • 不断攀高峰 或是 稳住局面

其他

  • 121
  • 周报/meeting minutes

Pipeline

  • https://github.com/criteo/deepr
  • https://github.com/mercari/production-readiness-checklist

其他

注册: https://readthedocs.org/
https://pypi.org/project/pip/

参考:
https://github.com/taowen/12fallacy

https://github.com/taowen/modularization-examples

https://github.com/kdeldycke/awesome-engineering-team-management

算法工程师技术路线图 - 字节的文章 - 知乎
https://zhuanlan.zhihu.com/p/192633890

行业、公司、leader

团队基本:聚焦主要,
整体优化大于局部优化

招聘信息、专利信息去了解一个公司

https://linkedin.github.io/school-of-sre/

设计文档: Design Doc

讲故事:引导情绪 如何评价动画《进击的巨人》最终季第五集? - Moustache的回答 - 知乎
https://www.zhihu.com/question/438545545/answer/1671944835

诺斯罗普·弗莱先生说过,喜剧,就是两个团体的冲突。

https://github.com/jesselpalmer/the-engineering-managers-booklist

Git commits历史是如何做到如此清爽的? - elgoog的回答 - 知乎
https://www.zhihu.com/question/61283395/answer/186223235
https://zhuanlan.zhihu.com/p/23478654

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/891047.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在 C# 中优化 JPEG 压缩级别和文件大小

此示例可让您检查不同 JPEG 压缩级别的图像质量。使用文件菜单的打开命令加载图像文件。然后使用“JPEG 压缩指数 (CI)”组合框选择压缩级别。程序将图像保存到具有该压缩级别的临时文件中,并显示生成的图像和文件大小。 该程序的关键是以下SaveJpg方法,…

Pandas02

Pandas01: Pandas01 文章目录 内容回顾1 数据的读取和保存1.1 读写Excel文件1.2 读写CSV1.3 读写Mysql 2 DataFrame 数据查询2.1 筛选多列数据2.2 loc 和 iloc2.3 query查询方法和isin 方法 3 DataFrame增 删 改数据3.1 增加一列数据3.2 删除一行/一列数据3.3 数据去重3.4 数据…

Flink定时器

flink的定时器都是基于事件时间(event time)或事件处理时间(processing time)的变化来触发响应的。对一部分新手玩家来说,可能不清楚事件时间和事件处理时间的区别。我这里先说一下我的理解,防止下面懵逼。…

Docker中的分层(Layer)

docker中有分层的概念,如下图所示 上面是容器层(Container layer),下面是镜像层(Image layers)。 镜像层的内容是静态的,读和写的操作,都是在容器层发生,专门为容器的读…

RoboMIND:多体现基准 机器人操纵的智能规范数据

我们介绍了 RoboMIND,这是机器人操纵的多体现智能规范数据的基准,包括 4 个实施例、279 个不同任务和 61 个不同对象类别的 55k 真实世界演示轨迹。 工业机器人企业 埃斯顿自动化 | 埃夫特机器人 | 节卡机器人 | 珞石机器人 | 法奥机器人 | 非夕科技 | C…

python报错ModuleNotFoundError: No module named ‘visdom‘

在用虚拟环境跑深度学习代码时,新建的环境一般会缺少一些库,而一般解决的方法就是直接conda install,但是我在conda install visdom之后,安装是没有任何报错的,conda list里面也有visdom的信息,但是再运行代…

C语言性能优化:从基础到高级的全面指南

引言 C 语言以其高效、灵活和功能强大而著称,被广泛应用于系统编程、嵌入式开发、游戏开发等领域。然而,要写出高性能的 C 语言代码,需要对 C 语言的特性和底层硬件有深入的了解。本文将详细介绍 C 语言性能优化的背后技术,并通过…

go多版本管理工具g win安装配置

go多版本管理工具g 基本介绍仓库安装配置配置环境配置系统变量配置path变量测试使用配置完环境变量之后,打开终端进行测试使用查看 g 的环境变量配置,g env 为环境变量配置,g -v为当前版本信息查看可下载列表下载安装指定版本go,并…

PlasmidFinder:质粒复制子的鉴定和分型

质粒(Plasmid)是一种细菌染色体外的线性或环状DNA分子,也是一种重要的遗传元素,它们具有自主复制能力,可以在细菌之间传播,并携带多种重要的基因(如耐药基因与毒力基因等)功能。根据质粒传播的特性&#xf…

细说STM32F407单片机通过IIC读写EEPROM 24C02

目录 一、操作说明 二、工程配置 1、时钟、DEBUG、GPIO、USART6、NVIC、Code Generator 2、 IIC2 (1)Master Features组,主设备参数 (2)Slave Features组,从设备参数 三、软件设计 1、KELED 2、E…

神经网络-Inception

Inception网络是由Google开发的一种深度卷积神经网络架构,旨在解决计算机视觉领域中的图像分类和物体识别任务。 Inception网络最初在2014年被提出,并在ImageNet图像分类挑战赛上取得了很好的结果。其设计灵感来自于模块化的思想,将不同尺度…

PyTorch Instance Normalization介绍

Instance Normalization(实例归一化) 是一种标准化技术,与 Batch Normalization 类似,但它对每个样本独立地对每个通道进行归一化,而不依赖于小批量数据的统计信息。这使得它非常适合小批量训练任务以及图像生成任务(如风格迁移)。 Instance Normalization 的原理 对每…

国内独立开发者案例及免费送独立开发蓝图书

独立开发者在国内越来越受到关注,他们追求的是一种自由且自给自足的工作状态。 送这个: 少楠light(Flomo、小报童、如果相机):他们是独立开发者的典范,不仅开发了多款产品,还坚信“剩者为王”…

【小程序】自定义组件的data、methods、properties

目录 自定义组件 - 数据、方法和属性 1. data 数据 2. methods 方法 3. properties 属性 4. data 和 properties 的区别 5. 使用 setData 修改 properties 的值 自定义组件 - 数据、方法和属性 1. data 数据 在小程序组件中,用于组件模板渲染的私有数据&…

MATLAB用find函数结合all,any函数高效解决问题

如本节中最后提到的问题,我们输出后还需要判断,不是特别的一目了然,这时候我们可以再加上 f i n d find find函数直接标记序号并输出。首先我们先来了解 f i n d find find的用法, f i n d ( a ) find(a) find(a)表示将矩阵或向量…

2022博客之星年度总评选开始了

作者简介:陶然同学 专注于Java领域开发 熟练掌握Java、js等语言的“Hello World” CSDN原力计划作者、CSDN内容合伙人、Java领域优质作者、Java领域新星作者、51CTO专家、华为云专家、阿里云专家等 🎬 陶然同学🎥 由 陶然同学 原创&#…

vue2 升级为 vite 打包

VUE2 中使用 Webpack 打包、开发,每次打包时间太久,尤其是在开发的过程中,本文记录一下 VUE2 升级Vite 步骤。 安装 Vue2 Vite 依赖 dev 依赖 vitejs/plugin-vue2": "^2.3.3 vitejs/plugin-vue2-jsx": "^1.1.1 vite&…

20241227在ubuntu20.04.6系统中,如何用watch命令每秒钟调用nvidia-smi来监控GPU

watch -n 1 nvidia-smi 20241227在ubuntu20.04.6系统中,如何用watch命令每秒钟调用nvidia-smi来监控GPU 2024/12/27 17:04 缘起:在ubuntu20.04.6系统中,使用M6000显卡来跑whisper,显存拉满/占用巨大,但是CPU占用比低&…

[江科大STM32] 第五集STM32工程模板——笔记

保存,进去选芯片型号,我们是F10C8T6 再添加一些文件,自己看路径 然后去 复习这三文件 打开KEIL add existing那个,添加已经存在的文件 还有5个.c.h文件也要添加进来 回到KEIL 点击旁边的settings 如果你用寄存器开发就建到这里就可…

Bitmap(BMP)图像信息分析主要说明带压缩的形式

文章目录 参考资料Bitmap图片结构Bitmap图片组成实例说明 参考资料 微软官方-位图存储 Bitmap图片结构 序号名称说明1Bitmap File HeaderBitmap文件头2Bitmap Info HeaderBitmap信息头3Color Palette Data调色板数据4Bitmap Image Data图像数据 说明 Bitmap文件头的大小为…