微软发布ML.NET 1.0,可一键添加机器学习模型

今天,我们很高兴宣布发布 ML.NET 1.0。ML.NET 是一个免费的、跨平台的开源机器学习框架,旨在将机器学习(ML)的强大功能引入.NET 应用程序。

640?wx_fmt=png

  ML.NET GitHub:https://github.com/dotnet/machinelearning

入门 @ http://dot.net/ml

ML.NET 允许你使用 C#或 F#训练、构建和发布自定义机器学习模型,用于情景分析、问题分类、预测、推荐等场景。你可以在我们的ML.NET 样品库中查看这些常见的场景和任务。

ML.NET 最初是在微软研究院内部研发,后来演变成许多微软产品使用的重要框架,例如 Windows Defender、Microsoft Office(Powerpoint 设计思想、Excel 图表推荐)、Azure 机器学习、PowerBI 关键影响者等!

自推出以来,许多组织都在使用 ML.NET,如 SigParser(垃圾邮件检测)、William Mullens(法律问题分类)和 Evolution 软件(榛子水分检测)。

ML.NET 1.0 版本添加了新的预览功能,如自动机器学习(AutoML)功能,ML.NET CLI 和 ML.NET Model Builder 等新工具,这意味着,现在为你的应用程序添加机器学习模型只需点击右键!

640?wx_fmt=png

本文的其余部分重点介绍这些新体验。

  • ML.NET 核心组件

  • 自动机器学习预览

  • ML.NET 模型生成器预览

  • ML.NET CLI 预览

  • ML.NET 入门

  • 未来计划

ML.NET 核心组件

ML.NET 旨在提供终端工作流程,以便在机器学习(预处理、特征工程、建模、评估和操作)的各个步骤中将 ML 用于.NET 应用程序。ML.NET 1.0 提供以下关键组件:

  • 数据表示

    • 基本 ML 数据管道数据类型,如 IDataView——基本数据管道类型

    • 阅读器支持从分隔文本文件或 IEnumerable 对象中读取数据

  • 支持机器学习任务:

    • 二进制分类

    • 多级分类

    • 回归

    • 排序

    • 异常检测

    • 聚类

    • 推荐(预览)

  • 数据转换和特性化

    • 文本

    • 分类

    • 特征选择

    • 规范化和缺失值处理

    • 图像特征化

    • 时间序列(预览)

    • 支持 ONNX 和 TensorFlow 模型集成(预览)

  • 其他

    • 模型理解和解释

    • 用户定义的自定义转换

    • 架构操作

    • 支持数据集操作和交叉验证

自动机器学习预览

如今,机器学习入门学习过程非常艰难。在构建自定义机器学习模型时,你必须确定为你的场景选择机器学习任务(即分类或回归?),将你的数据转换为 ML 算法可以理解的格式(例如文本数据 - > 数字向量),并微调这些 ML 算法以达到最佳性能。如果你是 ML 新手,这些步骤中的每一步都会非常艰巨!

自动机器学习通过自动确定如何转换输入数据并选择性能最佳的 ML 算法,使你能够轻松构建一流的自定义 ML 模型,使你的 ML 之旅更加简单。

ML.NET 中的 AutoML 支持处于预览阶段,我们目前支持回归(用于价格预测等场景)和分类(用于情感分析、文档分类、垃圾邮件检测等场景)ML 任务。

你可以使用 ML.NET Model Builder、ML.NET CLI 或直接使用 AutoML API(可在此处找到样本)三种形式在 ML.NET 中体验 AutoML。

对于不熟悉机器学习的用户,我们建议从 Visual Studio 中的 ML.NET 模型构建器和任何平台上的 ML.NET CLI 开始。AutoML API 对于你想要动态构建模型的场景也非常方便。

模型生成器预览

为了简化.NET 开发人员构建 ML 模型的过程,我们今天也很高兴地发布 ML.NET 模型构建器。使用 ML.NET 模型构建器,只需右键单击即可将机器学习添加到你的应用程序中!

Model Builder 是一个简单的 UI 工具,供开发人员使用自己的数据集,通过 AutoML 使构建最佳的 ML 模型。除此之外,Model Builder 还可以生成模型训练和模型消耗代码,以达到最佳性能,让你快速将 ML 添加到现有应用程序中。

640?wx_fmt=png

了解有关 ML.NET 模型构建器的更多信息

Model Builder 目前处于预览阶段,欢迎试用并告诉我们你的想法!

ML.NET CLI 预览

ML.NET CLI(命令行界面)是我们今天推出的另一个新工具!

ML.NET CLI 是一个 dotnet 工具,允许使用 AutoML 和 ML.NET 生成 ML.NET 模型。ML.NET CLI 可以快速遍历你的数据集以获取特定的 ML 任务(目前支持回归和分类)并生成最佳模型。

CLI 除了生成最佳模型外,还允许用户为最佳性能模型生成模型训练和模型消耗代码。

ML.NET CLI 是跨平台的,可以轻松添加到.NET CLI。Model Builder Visual Studio 扩展还使用 ML.NET CLI 提供模型构建器功能。

你可以通过此命令安装 ML.NET CLI。

dotnet tool install -g mlnet

下图显示了 ML.NET CLI 构建情感分析数据集。

640?wx_fmt=gif
了解有关 ML.NET CLI 的更多信息

ML.NET CLI 目前也处于预览状态,欢迎试用并分享你的想法!

开始吧!

从头开始使用 ML.NET 很简单,你可以通过几个简单的步骤来完成,如下所示。 下面的示例显示了如何使用 ML.NET 进行情绪分析。


var ctx = new MLContext();



IDataView dataReader = ctx.Data

    .LoadFromTextFile<MyInput>(dataPath, hasHeader: true);



IEstimator<ITransformer> est = ctx.Transforms.Text

    .FeaturizeText("Features", nameof(SentimentIssue.Text))

    .Append(ctx.BinaryClassification.Trainers

        .LbfgsLogisticRegression("Label", "Features"));



ITransformer trainedModel = est.Fit(dataReader);



var predictionEngine = ctx.Model

    .CreatePredictionEngine<MyInput, MyOutput>(trainedModel);


var sampleStatement = new MyInput { Text = "This is a horrible movie" };


var prediction = predictionEngine.Predict(sampleStatement);

你还可以探索各种其他学习资源,如 ML.NET 的教程和资源,以及 ML.NET 示例、演示产品推荐、异常检测和更多实际操作等流行方案。

ML.NET 的下一步

今天发布 ML.NET 1.0 的同时,我们的团队已经在努力为 ML.NET 1.0 版发布以下功能。

  • 其他 ML 场景的 AutoML 体验

  • 改进了对深度学习场景的支持

  • 支持其他其他来源,如 SQL Server、CosmosDB、Azure Blob 存储等。

  • 在 Azure 上横向扩展以进行模型训练和消耗

  • 使用模型构建器和 CLI 时,支持其他 ML 方案和功能

  • 用于 Apache Spark 和 ML.NET 的.NET 大规模机器学习的本地集成

  • .NET 中的新 ML 类型,例如数据帧

感谢创建者

在此,我们特别鸣谢该项目的贡献者,是他们的努力让.NET 开发人员可以使用机器学习。

amiteshenoy,beneyal,bojanmisic,Caraul,dan-drews,DAXaholic,dhilmathy,dzban2137,elbruno,endintiers,f1x3d,feiyun0112,forki,harshsaver,
helloguo,hvitved,Jongkeun,JorgeAndd,JoshuaLight,jwood803,kant2002,kilick,Ky7m,llRandom,malik97160,MarcinJuraszek,mareklinka,
Matei13,mfaticaearnin,mnboos,nandaleite,Nepomuceno nihitb06,Niladri24dutta,PaulTFreedman,Pielgrin,pkulikov,Potapy4,Racing5372,
rantri,rantri,rauhs,robosek,ross-p-smith,SolyarA,Sorrien,suhailsinghbains,terop,ThePiranha,Thomas-S-B,timitoc,tincann,v-tsymbalistyi,
van-tienhoang,veikkoeeva 和 yamachu

非常感谢,
ML.NET 团队

原文地址:https://devblogs.microsoft.com/dotnet/announcing-ml-net-1-0/

.NET社区新闻,深度好文,欢迎访问公众号文章汇总 http://www.csharpkit.com 
640?wx_fmt=jpeg


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/315962.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Codeforces Round #703 (Div. 2)

Codeforces Round #703 (Div. 2) 题号题目知识点AShifting Stacks思维BEastern Exhibition思维C1Guessing the Greatest (easy version)二分C2Guessing the Greatest (hard version)二分DMax Median思维二分EPaired PaymentFPairs of Paths

目前下载VS2017你可能会遇到这个坑

可能现在大伙都已经开始使用VS2019进行开发了。VS2019的下载使用也都很简单。由于工作需要&#xff0c;今天要在笔记本上安装VS2017,结果发现&#xff0c;VS2017的下载变得不是那么容易了&#xff0c;官方的下载方式也隐藏的很深&#xff0c;来来回回折腾了好一会才下载下来&am…

CF1486D Max Median

CF1486D Max Median 题意&#xff1a; 给定一个长度为 n 的序列 a&#xff0c;求所有长度 ≥k 的连续子序列中&#xff0c;中位数的最大值。定义中位数是一个长度为 x 的序列升序排序后的第 ⌊x12⌋\left\lfloor\frac{x1}{2}\right\rfloor⌊2x1​⌋位的值。 题解&#xff1a…

代码整洁之道(Clean Code)- 读书笔记

Sorry, 许久未更新文章了&#xff0c;主要因为刚刚换了一家新公司&#xff0c;忙于组建团队&#xff08;建设、招聘、流程、框架等&#xff09;与熟悉公司业务&#xff0c;还有领导给的其他工作等等&#xff0c;实在是没有时间更新了。最近在和团队分享Bob大叔的《Clean Code》…

cf1499D. The Number of Pairs

cf1499D. The Number of Pairs 题意&#xff1a; 有t组询问&#xff0c;每组询问给定三个整数c&#xff0c;d&#xff0c;x 问有多少对(a,b)使得c∗lcm(a,b)−d∗gcd(a,b)xc*lcm(a,b)-d*gcd(a,b)xc∗lcm(a,b)−d∗gcd(a,b)x 1<t<1e4,1<c,d,x<1e71<t<1e4,1&…

微软Build 2019大会.NET课程视频汇总

点击上方蓝字关注“汪宇杰博客”5月6日至8日&#xff0c;微软在西雅图召开了Build 2019开发者大会。我们关注的.NET领域也迎来了许多激动人心的改进。本文汇总了Build 2019大会上关于.NET的已经公开的视频&#xff0c;欢迎大家观看学习&#xff01;// 注意&#xff1a;以下视频…

Educational Codeforces Round 106 (Rated for Div. 2)

Educational Codeforces Round 106 (Rated for Div. 2) 题号题目知识点ADomino on WindowsillBBinary RemovalsCBinary Removals贪心DThe Number of Pairs推导EChaotic MergeFDiameter CutsGGraph Coloring

黑科技抢先尝 | Windows全新终端初体验(附代码Build全过程)

微软在几天前的build大会上展示了Windows Terminal的威力&#xff0c;由于官宣要在6月中旬才上Microsoft store&#xff0c;还有一个多月要等呢。好在代码已公布在 github, 于是决定自己 build 后体验一番。遇到不少坑&#xff0c;大概整理一下流程&#xff0c;分享给大家。如果…

二项式反演(非详细)

引入 二项式反演又名广义容斥定理 二项式反演可以表示成&#xff1a; f[n]∑i0n(−1)iCnigi⟺gn∑i0n(−1)iCnif[i]f[n]\sum_{i0}^n(-1)^iC_{n}^{i}g_{i}⟺g_{n}\sum_{i0}^{n}(-1)^iC_{n}^{i}f[i]f[n]∑i0n​(−1)iCni​gi​⟺gn​∑i0n​(−1)iCni​f[i] 常用表达为&#xff…

aelf帮助C#工程师10分钟零门槛搭建DAPP私有链开发环境

aelf是一个可扩展的去中心化云计算区块链平台&#xff0c;支持高性能合约并行执行、原生多链数据交互、存储使用高性能分布式数据库。aelf整个系统可以在windows、osx及linux运行&#xff0c;团队在osx环境下开发&#xff0c;基于.net core DAPP开发1.安装.net core及protobufh…

不容易系列之一

不容易系列之一 题意&#xff1a; n个数&#xff0c;求n个人错排(全部错误)的方案数 题解&#xff1a; 这题地推可以求&#xff0c;咱们这里用二项式反演来做 设f(i)为恰好有i个人错排f(i)为恰好有i个人错排f(i)为恰好有i个人错排&#xff0c;g(i)为最多i个人错排g(i)为最多…

Build 2019 上微软的开源动作有点不一样

微软今年举办的 Build 开发者大会可谓是抢足风头&#xff0c;大会第一天就放了不少大招&#xff1a;宣布新的命令行终端 Windows Terminal、Windows 10 的 Linux 子系统 WSL 2 将运行真正的 Linux 内核、跳过 .NET 4 宣布 .NET 5 的计划、宣布 Web 版本的 VS Code (Visual Stud…

P1437 [HNOI2004]敲砖块

P1437 [HNOI2004]敲砖块 题意&#xff1a; 在一个凹槽中放置了 n 层砖块、最上面的一层有 n 块砖&#xff0c;从上到下每层依次减少一块砖。每块砖都有一个分值&#xff0c;敲掉这块砖就能得到相应的分值&#xff0c;如下图所示&#xff1a; 14 15 4 3 2333 33 76 22 …

在kubernetes 集群内访问k8s API服务

所有的 kubernetes 集群中账户分为两类&#xff0c;Kubernetes 管理的 serviceaccount(服务账户) 和 useraccount&#xff08;用户账户&#xff09;。基于角色的访问控制&#xff08;“RBAC”&#xff09;使用“rbac.authorization.k8s.io”API 组来实现授权控制&#xff0c;允…

C. 奇奇怪怪的魔法阵(未搞懂)

C. 奇奇怪怪的魔法阵 题意&#xff1a; n个点m条边&#xff0c;定义集合S为独立集&#xff0c;当且仅当任意x,y∈S&#xff0c;x与y之间没有边。空集也是独立集 现在对于每一个点的集合T&#xff0c;有多少子集为独立集 设N0,1,…,n-1,AT∑S⊂T[S是独立集]A_{T}\sum_{S⊂T}[S…

.NET Core之只是多看了你一眼

技术学习是一件系统性的事情&#xff0c;如果拒绝学习&#xff0c;那么自己就会落后以至于被替代。.NET也是一样&#xff0c;当开源、跨平台成为主流的时候&#xff0c;如果再故步自封&#xff0c;等待.NET的就是死路一条&#xff0c;幸好.NET Core问世了&#xff0c;社区反响积…

Educational Codeforces Round 111 (Rated for Div. 2)

Educational Codeforces Round 111 (Rated for Div. 2) 题号题目知识点AFind The ArrayBMaximum Cost DeletionCManhattan SubarraysDExcellent Arrays组合数学思维EStringforces状压dpFJumping Aroundboruvka算法

TOTP 介绍及基于 C# 的简单实现

TOTP 介绍及基于 C# 的简单实现IntroTOTP 是基于时间的一次性密码生成算法&#xff0c;它由 RFC 6238 定义。和基于事件的一次性密码生成算法不同 HOTP&#xff0c;TOTP 是基于时间的&#xff0c;它和 HOTP 具有如下关系&#xff1a;TOTP HOTP(K, T)HOTP(K,C) Truncate(HMAC-…

微软携手红帽,共筑开源新未来

官宣了&#xff0c;官宣了&#xff01;微软携手红帽正式推出重要力作Global Azure 公有云第一款联合管理的 OpenShift 产品&#xff0c;业界欢腾&#xff01;自此&#xff0c;微软在拥抱云计算开源之路上&#xff0c;多了一股强劲的推动力。5月初刚刚举办的全球 Red Hat Summit…

CF1550D Excellent Arrays(完全会了更新)

CF1550D Excellent Arrays 题意&#xff1a; 定义一个长度为n的整数序列a是好的仅当对于任意整数i∈[1,n]&#xff0c;都有ai!ia_i !iai​!i 设F(a)等于满足1<i<j<n,aiajija_ia_jijai​aj​ij的(i,j)对数 我们定义一个长度为n的序列a是完美的&#xff0c;仅当&#…