netflix_Netflix的Polynote

netflix

Netflix open source Polynote is a new notebook environment and was born out of the necessity to accelerate data science experimentation at Netflix.

Netflix开源Polynote是一种新的笔记本环境,其诞生是出于加速Netflix数据科学实验的需要。

Over the last few years, Netflix has transformed its use of data science notebooks from an experimentation artifact to a key component of the lifecycle of machine learning solutions. Initially, Netflix adopted Jupyter Notebooks like a data exploration and analysis tools.

在过去的几年中,Netflix已将其对数据科学笔记本的使用从实验工件转变为机器学习解决方案生命周期的关键组成部分。 最初,Netflix将Jupyter Notebooks用作数据探索和分析工具。

Polynote (Polynote)

Polynote is a multi-language notebook experimentation environment. In addition to Python, the current release supports languages such as SQL, Vega(visualizations) and, of course, Scala. The platform is also integrated with data science infrastructures such as Apache Spark. At its core, Polynote includes the following capabilities:

Polynote是一种多语言笔记本实验环境。 除Python外 ,当前版本还支持SQLVega (可视化),当然还有Scala等语言 。 该平台还与数据科学基础架构(例如Apache Spark)集成在一起。 Polynote的核心包括以下功能

a) Improved Editing Experience: Polynote tries to enable an editing experience closer to modern IDEs. b) Multi-Language Support: Polynote introduces first-class support for Scala and other languages used in data science environmenhts. c) Data Visualization Improvements: Polynote integrates native data visualizations into notebooks’ dataset without the need of adding a lot of code. d) Configuration and Dependency Management: Languages like Scala require complex package dependencies in its programs. Polynote saves the package dependency configuration within the notebook itself addressing some of the common challenges in this area experienced by JVM developers. e) Reproducibility: The combination of code, data and execution results into a single document makes notebooks powerful, but also difficult to reproduce. Polynote includes reproducibility as a first-class capability of the framework.

a) 改进的编辑体验: Polynote试图使编辑体验更接近现代IDE。 b) 多语言支持: Polynote引入了对Scala和数据科学环境中使用的其他语言的一流支持。 c) 数据可视化方面的改进: Polynote将原生数据可视化集成到笔记本的数据集中,而无需添加大量代码。 d) 配置和依赖性管理:诸如Scala之类的语言在其程序中需要复杂的软件包依赖性。 Polynote将包依赖项配置保存在笔记本自身中,以解决JVM开发人员在该领域遇到的一些常见挑战。 e)可复制性:将代码,数据和执行结果组合到一个文档中,使笔记本功能强大,但也难以复制。 Polynote将可再现性作为框架的一流功能。

改进的编辑体验 (Improved Editing Experience)

Polynote includes common features in IDEs such as code auto-completion or syntax error highlighting which improves the experience for data scientists and researchers building Notebooks. More of the editing capabilities are powered by the Monaco editor which powers the experience of Visual Studio Code.

Polynote包含IDE中的常见功能,例如代码自动完成或语法错误突出显示,从而改善了构建笔记本电脑的数据科学家和研究人员的体验。 摩纳哥编辑器提供了更多的编辑功能,该编辑器为Visual Studio Code的体验提供了支持。

多国语言支持 (Multi-Language Support)

Polynote does not only provide support for multiple languages but it also allows those languages to be combined in a single program. In Polynote, every cell can be based on a different language. When a cell is run, the kernel provides the available typed input values to the cell’s language interpreter. In turn, the interpreter provides the resulting typed output values back to the kernel. This allows cells in Polynote notebooks to operate within the same context. The example below shows a Python library, to compute an isotonic regression of a dataset generated with Scala.

Polynote不仅提供对多种语言的支持,而且还允许将这些语言组合在一个程序中。 在Polynote中,每个单元格可以基于不同的语言。 当单元运行时,内核将可用的类型化输入值提供给单元的语言解释器。 反过来,解释器将结果输入的输出值提供回内核。 这使Polynote笔记本中的单元格可以在相同的上下文中运行。 下面的示例显示了一个Python库,用于计算使用Scala生成的数据集的等渗回归。

Image for post
Source: https://polynote.org/
资料来源: https : //polynote.org/

数据可视化 (Data Visualization)

Data visualizations are a common component of most notebook environment. However, Polynote takes the visualization value proposition to another level by including it as a native component of the platform which does not require developers to write any code in order to visually explore a dataset.

数据可视化是大多数笔记本环境的常见组件。 但是,Polynote通过将可视化价值主张作为平台的本机组件,将可视化价值主张提升到了另一个层次,不需要开发人员编写任何代码即可直观地浏览数据集。

组态 (Configuration)

Most of the time, data scientists working on notebooks can enjoy the efficiency of Python’s package management model to handle the dependencies of a program. However, in JVM-languages like Scala dependency management can become a total night mare. Polynote addresses that challenge by storing the configuration and dependency information directly in the notebook itself, rather than relying on external files. Additionally, Polynote provides a user-friendly Configuration section where users can set dependencies for each notebook.

大多数时候,从事笔记本工作的数据科学家可以享受Python的包管理模型处理程序依赖关系的效率。 但是,在诸如Scala依赖关系管理之类的JVM语言中,它们可能会变成一头噩梦。 Polynote通过将配置和相关性信息直接存储在笔记本本身中而不是依赖于外部文件来解决这一挑战。 此外,Polynote还提供了一个用户友好的“配置”部分,用户可以在其中为每个笔记本设置依赖性。

Image for post
Source: https://polynote.org/
资料来源: https : //polynote.org/

重现性 (Reproducibility)

With Polynote, Netflix a new code interpretation block instead of relying on a REPL model like a traditional notebook. One of the key capabilities of the new interpretation model is that it removes hidden states which allows data scientists to copy cells within a notebook without introducing any state from the previous position.

借助Polynote,Netflix有了新的代码解释模块,而不再像传统笔记本那样依赖REPL模型。 新解释模型的关键功能之一是,它消除了隐藏状态,这使数据科学家可以在笔记本中复制单元而无需从先前位置引入任何状态。

Polynote is a new release in the ambitious competitive of data science notebooks but one that stands in its own merits. The support for JVM-based languages could make Polynote a favorite of developers working on Spark infrastructures. Also the editing and reproducatility capabilities are definitely welcomed enhancements to traditional notebook environments. Polynote is available in Github and you can also follow the project’s website.

Polynote是在雄心勃勃的数据科学笔记本电脑竞争中推出的新版本,但它有自己的优点。 对基于JVM的语言的支持可能使Polynote成为使用Spark基础结构的开发人员的最爱。 同样,编辑和再现性功能无疑是对传统笔记本环境的增强。 Polynote 在Github中可用,您也可以访问该项目的网站 。

Image for post
Source: https://polynote.org/
资料来源: https : //polynote.org/

推荐文章 (Recommended Articles)

  1. Learn Python & ML with Kaggle

    使用Kaggle学习Python和ML

  2. GitHub Launches Codespaces

    GitHub启动代码空间

  3. Netflix’s Polynote

    Netflix的Polynote

  4. The List of Top 10 lists

    前十名名单

  5. Most popular Python libraries

    最受欢迎的Python库

  6. Top Data Science Courses & Certification for 2020

    2020年热门数据科学课程和认证

  7. Influencers in AI to follow

    人工智能中的影响者要关注

  8. Data Science Programming Languages

    数据科学编程语言

  9. Examples of Artificial Intelligence

    人工智能的例子

  10. What the BigTech Knows… about You

    BigTech对您的了解...

  11. Lemonade and the power of Artificial Intelligence

    柠檬水和人工智能的力量

Source and original: https://www.kdnuggets.com by Jesus Rodriguez

出处和原文: https : //www.kdnuggets.com ,作者:耶稣·罗德里格斯(Jesus Rodriguez)

翻译自: https://medium.com/swlh/netflixs-polynote-34b5adcb064a

netflix

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/392221.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图片管理程序(Java)

图片管理程序 gitee完整代码下载 github完整代码下载 华南农业大学课程设计作品(99分) 问题描述 题目目的是编写一个能够对数字像片进行管理的应用程序。 程序能够显示的图片格式包括,.JPG、.JPEG、.GIF、.PNG、和.BMP。 图像文件尺寸,要求能够处理从…

气流与路易吉,阿戈,MLFlow,KubeFlow

任务编排工具和工作流程 (Task orchestration tools and workflows) Recently there’s been an explosion of new tools for orchestrating task- and data workflows (sometimes referred to as “MLOps”). The quantity of these tools can make it hard to choose which o…

模拟操作系统(Java)

gitee完整代码下载 github完整代码下载 一、 需求分析 模拟一个采用多道程序设计方法的单用户操作系统,该操作系统包括进程管理、存储管理、设备管理、文件管理和用户接口四部分。预计程序所能达到的功能: 进程管理模拟:实现操作系统进程管…

数据库面试复习_数据科学面试复习

数据库面试复习大面试前先刷新 (REFRESH BEFORE THE BIG INTERVIEW) 介绍 (Introduction) I crafted this study guide from multiple sources to make it as comprehensive as possible. This guide helped me prepare for both the technical and behavioral aspects of the …

hibernate缓存

(转自:http://www.cnblogs.com/java-class/p/6108175.html) 阅读目录 1. 为什么要用 Hibernate 缓存?2. 项目实战3. Hibernate 缓存原理回到顶部1. 为什么要用 Hibernate 缓存? Hibernate是一个持久层框架,…

分布与并行计算—用任务管理器画CPU正弦曲线(Java)

class drawSin implements Runnable{Overridepublic void run() {final double SPLIT 0.01;// 角度的分割final int COUNT (int) (2 / SPLIT);// 2PI分割的次数,也就是2/0.01个,正好是一周final double PI Math.PI;final int interval 100;// 时间间…

Asp.net mvc中使用配置Unity

第一步:添加unity.mvc 第二步:在添加之后会在app_start中生成UnityConfig.cs,UnityMvcActivator.cs 第三步:使用 第四步:效果展示 转载于:https://www.cnblogs.com/WJ--NET/p/7117839.html

正确认识 Vista 激活期限

当我们在安装 Vista 时,可以不输入序列号进行安装,这和以往的操作系统安装有所不同,我们不必再为安装系统时找不到我们的序列号标签而发愁。如果不输入序列号而继续安装系统,那么系统将提示我们有30天的激活期限!这里的…

Oracle使用hs odbc连接mssql2008

1.创建odbc 2.在 product\11.2.0\dbhome_1\hs\admin\ 下拷贝initdg4odbc,把名字改为initcrmsql(init所建odbc的名称) HS_FDS_CONNECT_INFO crmsql #odbc名称 HS_FDS_TRACE_LEVEL 0 HS_FDS_RECOVERY_ACCOUNTsa #要连接的数据库名称 HS_FDS_RECOVERY_PWD…

【NGN学习笔记】6 代理(Proxy)和背靠背用户代理(B2BUA)

1. 什么是Proxy模式? 按照RFC3261中的定义,Proxy服务器是一个中间的实体,它本身即作为客户端也作为服务端,为其他客户端提供请求的转发服务。一个Proxy服务器首先提供的是路由服务,也就是说保证请求被发到更加”靠近”…

《人人都该买保险》读书笔记

内容目录: 1.你必须知道的保险知识 2.家庭理财的必需品 3.保障型保险产品 4.储蓄型保险产品 5.投资型保险产品 6.明明白白买保险 现在我所在的公司Manulife是一家金融保险公司,主打业务就是保险,因此我需要熟悉一下保险的基础知识&#xff0c…

如何击败腾讯_击败股市

如何击败腾讯个人项目 (Personal Proyects) Note from Towards Data Science’s editors: While we allow independent authors to publish articles in accordance with our rules and guidelines, we do not endorse each author’s contribution. You should not rely on an…

配置静态IPV6 NAT-PT

一.概述: IPV6 NAT-PT( Network Address Translation - Port Translation)应用与ipv4和ipv6网络互访的情况,根据参考链接配置时出现一些问题,所以记录下来。参考链接:http://www.cisco.com/en/US/tech/tk648/tk361/technologies_c…

python3虚拟环境中解决 ModuleNotFoundError: No module named '_ssl'

前提是已经安装了openssl 问题 当我在python3虚拟环境中导入ssl模块时报错,报错如下: (py3) [rootlocalhost Python-3.6.3]# python3 Python 3.6.3 (default, Nov 19 2018, 14:18:18) [GCC 4.8.5 20150623 (Red Hat 4.8.5-28)] on linux Type "help…

通过Xshell登录远程服务器实时查看log日志

主要想总结以下几点: 1.如何使用生成密钥的方式来登录Xshell连接远端服务器 2.在远程服务器上如何上传和下载文件(下载log文件到本地) 3.如何实时查看log,提取错误信息 一. 使用生成密钥的方式来登录Xshell连接远端服务器 ssh登录…

如何将Jupyter Notebook连接到远程Spark集群并每天运行Spark作业?

As a data scientist, you are developing notebooks that process large data that does not fit in your laptop using Spark. What would you do? This is not a trivial problem.作为数据科学家,您正在开发使用Spark处理笔记本电脑无法容纳的大数据的笔记本电脑…

是银弹吗?业务基线方法论

Fred.Brooks在1987年就提出:没有银弹。没有任何一项技术或方法可以能让软件工程的生产力在十年内提高十倍。 我无意挑战这个理论,只想讨论一个方案,一个可能大幅提高业务系统开发效率的方案。 方案描述 我管这个方案叫做“由基线扩展…

同一服务器部署多个tomcat时的端口号修改详情

2019独角兽企业重金招聘Python工程师标准>>> 同一服务器部署多个tomcat时&#xff0c;存在端口号冲突的问题&#xff0c;所以需要修改tomcat配置文件server.xml&#xff0c;以tomcat7为例。 首先了解下tomcat的几个主要端口&#xff1a;<Connector port"808…

第一章-从双向链表学习设计

链表学习链表是一种动态的数据结构使用节点作为链表的基本单位存储在节点包括数据元素和节点指针一个完整的数据链表应包括转载于:https://www.cnblogs.com/cjxltd/p/7125747.html

思维导图分析http之http协议版本

1.结构总览 在http协议这一章&#xff0c;我将先后介绍上图六个部分&#xff0c;本文先介绍http的协议版本。 2.http协议版本 http协议的历史并不长&#xff0c;从1991的0.9版本到现在(2017)仅仅才20多年&#xff0c;算算下来,http还是正处青年&#xff0c;正是大好发展的好时光…