像数据科学家一样思考:12步指南(下)

第三-完成

一旦产品构建完成,你仍然需要做一些事情来使项目更加成功并使你的未来生活更轻松。那么我们如何完成数据科学项目呢?

10-交付

完成阶段的第一步是产品交付。为了创建可以交付给客户的有效产品,首先必须了解客户的观点。其次,你需要选择最佳的方式将项目成果反馈给客户。最后,你必须选择要包含在产品中的信息和结果以及要放弃的内容。在产品创建和交付过程中做出好的选择可以大大提高项目的成功机会。

沟通媒介可以采取多种形式。在数据科学中,产品最重要的一个方面是客户是否积极参与产品并且能够使用产品来回答多种可能的问题。具体的沟通媒介有很多方式:

·       向客户提交结果可能是最简单的选项,其中包括文本、表格、图表和其他信息,这些信息可以解决你的项目要回答的部分或全部问题。

·       在一些数据科学项目中,数据集的分析和结果也可用项目原始数据范围之外的数据,其中可能包括原始数据生成的数据、其他不同来源的类似数据、或由于某种原因尚未分析的其他数据。在这种情况下,如果你可以为客户创建可以执行分析新数据集并生成结果的分析工具,对客户有所帮助。同时客户可以有效地使用此分析工具,并继续在将来和各种(但类似的)数据集中回答他们的主要问题,这是最好的情况。

·       如果你想提供比分析工具更好的产品,你可能需要构建某种类型的完整的应用程。如果你正在考虑提供交互式图形应用程序,那么你必须设计,构建和部署它。通常,这些都不是一项小任务。如果你希望应用程序具有许多功能并且具有灵活性,那么设计它并构建它将变得更加困难。

除了决定提供结果的媒介外,你还必须决定它将包含哪些结果。有些结果和内容可能是包含的明显选择,但对于其他信息位,可能不那么明显。通常,你希望包含尽可能多的有用信息和尽可能多的结果,但你希望避免客户可能误解或误用你选择包含的结果。在许多情况下,这可以是微妙的平衡,并且它在很大程度上取决于具体项目以及客户和其他人对结果的知识和经验。

11-进行修订

产品交付后,我们会在初步反馈后继续修改产品。一旦客户开始使用该产品,就有可能出现一系列全新的问题。尽管你付出了最大努力,但你可能没有预料到客户使用产品的方式的各个方面。即使产品完成了它应该做的事情,你的客户和用户也可能不会做这些事情并且有效地完成这些工作。

通常很难从客户、用户或其他任何人那里获得建设性的反馈。因此一些数据科学家提供完产品后就会忘记它们,一些数据科学家提供产品后会选择等待客户提供反馈。进行产品修订可能会非常棘手,找到合适的解决方案和实施策略取决于你遇到的问题类型以及你需要更改以解决问题的方法。如果在整个项目过程中,你始终保持对不确定性和许多可能结果的认识,那么你发现自己现在面临的结果与你之前预期的结果不同可能就不足为奇了。但是,如果你一直勤奋,问题很小,修复相对容易。

一旦你发现产品出现问题并弄清楚如何修复产品,仍然需要决定是否修复产品。一些人最初的倾向是每个问题都需要解决,这不一定是真的。如果有理由可以说服你不想进行修复问题,那就需要慎重考虑了,因为如果选择盲目地修复发现的每个问题,那一定会花费大量的时间和精力。

12-结束项

数据科学过程的最后一步是将其包装起来。随着数据科学项目的结束,似乎所有的工作都已完成,剩下的就是修复任何剩余的错误,然后才能完全停止思考并继续下一个。但在完成项目调试之前,你可以采取一些措施来增加未来成功的机会,无论是扩展同一个项目还是完全不同的项目。

现在有两种方法可以增加你未来成功的机会。一种方法是确保在将来的任何时候你都可以轻松地再次获取该项目并重做、扩展或修改它。通过这样做,你将增加在后续项目中获得成功的机会,所以,你需要从现在开始开始挖掘项目材料和代码并记下你用什么做的或者你是怎么做到的。最实用的方法是通过文档存储

提高未来项目成功率的第二种方法是尽可能多地从这个项目中学习,并将这些知识带到每个未来的项目中。通过进行项目分解,你可以从中梳理出有用的知识,这包括审查旧目标、旧计划、技术选择、团队协作等。是否可以应用于未来项目,通过项目回溯在事后进行思考,可以帮助发现有用的知识,使你能够以不同的方式做事,并在下次更好。

不确定性充斥在我们每个人工作的方方面面,记住过去给你带来问题的所有不确定因素,可以防止类似的事情再次发生。从数据到分析再到项目目标,几乎任何事情都可能在短时间内发生变化。了解所有可能性不仅是一项艰巨的挑战,而且几乎是不可能的。良好的数据科学家和伟大的数据科学家之间的区别在于能够预见可能出现的问题并做好准备。

结论

数据科学仍然具有新领域的光环。它的大多数组成部分:统计学、软件开发、基于证据的问题解决等等,这些可能是属于旧领域的知识,但数据科学似乎是这些部分的新组合成新的东西。数据科学的核心并不关心特定的数据库实现或编程语言,即使这些对于从业者来说是必不可少的,其核心应该是数据内容,给定项目的目标以及用于实现这些目标的数据分析方法之间的相互作用。

原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/519202.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据加载操作手册

文章目录一、基础资料准备1.1.表名规约1.2.设计1套临时表和1套同构层表1.3.存储过程二、流程规范2.1. 生成控制文件(.ctl)2.2. 拉取ods推送的数据文件2.3. 数据加载数据同步三、手动调度3.1. 到下载的数据文件路径:3.2. 数据文件筛选3.3. 将要加载的表的备份表清空;…

基于Tablestore管理海量快递轨迹数据架构实现

快递轨迹管理 对于一个快递公司,在全国范围内有着大量的快递点、快递员、运输车辆以及仓储中心。而快递自产生后,就会在这些地点、人物之间流转。因而,一套完善的快递管理追踪系统是快递公司的重要管理工具; 用户通过平台客户端…

完了!Python黄了! 80%的程序员:痛快!你怎么看?

Python真的万能语言?在我的一个朋友看来,他坚信 Python 可以做任何事情。其实我是不服的,因为我在某网站看到有条评论:Python将要黄了!事实究竟如何?这篇文章会揭开这个黑幕,让程序员看清现实&a…

趣谈预留实例券,一文搞懂云上省钱最新玩法

ECS近期推出了预留实例券(Reserved Instances),简称RI,这东西很cool,今天我们聊聊这个。 首先这篇Blog不是文档,读完后想详细了解文档的朋友请点击 一个小故事 我来给大家讲一个故事理解云上的几种付费方…

到底什么是空指针?如何避免空指针_01

文章目录1. 场景案例2. 针对于空指针的场景,有哪些方式可以避免问题1. 场景案例 package com.gblfy;import org.springframework.beans.factory.annotation.Autowired;import javax.servlet.http.HttpServletRequest;/*** 理解什么是空指针*/ public class WhatIsn…

在 IntelliJ IDEA 中部署应用到服务器(Eclipse)

在之前的文章《在 Intellij IDEA 中部署 Java 应用到 阿里云 ECS》中讲解了如何将一个本地应用部署到阿里云 ECS 上去,有些读者反馈目前还有一些测试机器是在经典网络,甚至是在本地机房中,咨询是否可以通过 Cloud Toolkit 插件将应用部署到这…

linux所有文件打包压缩,Linux基础教程:对文件打包压缩

一、须知文件数量太多, 如果需要拷来拷去是不是很麻烦? 怎么办? 打包!文件太大,通过网络下载、传输会不会很费时间? 怎么办? 压缩!在Linux环境中,打包压缩文件的…

钉钉平台助力中国一汽疫情防控 数字化迈入新阶段

面对突如其来的疫情,中国一汽紧急应对、快速响应,携旗下一汽-大众、一汽丰田捐赠资金8100万元,并成立了疫情防控专项基金。同时,通过旗下“一汽出行”公司组织 “特别爱心车队”,在抗击疫情期间,提供安全、…

自动拆箱引发的空指针_02

文章目录1. 场景案例2. 规避自动拆箱引发的空指针的建议1. 场景案例 package com.gblfy;/*** 自动拆箱引起的空指针问题场景*/ public class Unboxingnpe {private static int add(int x, int y) {return x y;}private static boolean compare(long x, long y) {return x >…

阿里靠什么支撑 EB 级计算力?

阿里妹导读:MaxCompute 是阿里EB级计算平台,经过十年磨砺,它成为阿里巴巴集团数据中台的计算核心和阿里云大数据的基础服务。去年MaxCompute 做了哪些工作,这些工作背后的原因是什么?大数据市场进入普惠红海的新阶段&a…

linux查看网卡的驱动命令行,Linux下查看网卡驱动和版本信息

Linux下查看网卡驱动和版本信息查看网卡生产厂商和信号查看基本信息:lspci查看详细信息:lspci -vvv # 3个小写的v查看网卡信息:lspci | grep Ethernet查看网卡驱动查看网卡驱动信息:lspci -vvv # 找到网卡设备的详细信息&#xff…

为什么说流处理即未来?

本文整理自 Flink 创始公司 Ververica 联合创始人兼 CTO - Stephan Ewen 在 Flink Forward China 2018 上的演讲《Stream Processing takes on Everything》。 这个演讲主题看似比较激进:流处理解决所有问题。很多人对于 Flink 可能还停留在最初的认知,…

别再用那些已经淘汰的技术了!2020 年 9 大顶级 Java 框架出炉!!

来源 | Patricia Neil责编 | Carol出品 | CSDN云计算(ID:CSDNcloud)顶级Java框架#1:Spring顶级Java框架#2:Hibernate顶级Java框架#3:Struts顶级Java框架#4:Play顶级Java框架#5:Googl…

字符串、数组、集合在使用时出现空指针怎么办?_03

文章目录1. 寻找代码案例中出错的场景2. 案例1. 寻找代码案例中出错的场景 字符串使用equals时报空指针错误 对象数组最燃new出来了,但是如果没有初始化,一样会报空指针错误 List对象add null不报错,但是addAll 不能添加null,否则…

云原生时代来袭 下一代云数据库技术将走向何方?

全面云化的时代已经到来,面对一系列的新技术和挑战,数据库市场将面临怎样的变革?作为云服务提供商,如何帮助更多的企业级用户把握“云”潮,提供最高效、最具价值的数据库解决方案? 日前,在阿里…

linux popd 命令,Linux中的pushd推入和popd弹出命令

pushd和popd是允许您使用目录堆栈并在Linux和其他类似Unix的操作系统中更改当前工作目录的命令。尽管pushd和popd是非常强大和有用的命令,但它们却被低估并且很少使用。在本教程中,我们将向您展示如何使用pushd和popd命令导航系统的目录树。目录堆栈目录…

开发跨平台app推荐React Native还是flutter?

嗯。。。这个问题十分不好回答啊(捋下鱼须)。闲鱼作为flutter领域的先驱者,以及fish_redux、flutter_boost等当红flutter库的作者,当然是欢迎广大的开发者多多使用flutter相关技术栈 逃~:)。咳咳,不过呢,我们还是正经得聊一下Reac…

直播连麦贾扬清,谈谈他所理解的四大 AI 落地问题 | 攻“疫”技术公开课

从机器学习模型的层次来看,大致经历了两次发展浪潮:浅层学习(Shallow Learning)和深度学习(Deep Learning)。1980年代,人工神经网络的反向传播算法(也叫Back Propagation算法或者BP算…

解决linux下创建用户时出现Creating mailbox file: File exists

在linux下用useradd添加用户时,出现错误: Creating mailbox file: File exists? 为什么会出现这样的问题? 原来linux下添加用户后,会在系统里自动加一个邮箱(系统邮箱) 路径是:/var/spool/mail/用户名. 可以直接用命令#rm -rf /var/spool/mail/用户…

flutter在2019年会有怎样的表现?

Flutter的趋势 在移动端,受成本和效率的驱使,跨平台一站式开发慢慢成为一个趋势。从Hybird,RN,WEEX,Flutter,到各种小程序或快应用的大量涌现,虽然很多跨平台方案都有各自的优缺点,…