ML.NET生成器带来了许多错误修复和增强功能以及新功能

ML.NET是一个开源的跨平台机器学习框架,适合 .NET 开发人员。它允许将机器学习集成到 .NET 应用中,而无需离开 .NET 生态系统,甚至拥有 ML 或数据科学背景。ML.NET工具(Visual Studio 中的 UI 模型生成器和跨平台 ML.NET CLI),可根据您的场景和数据自动训练自定义机器学习模型。

此版本ML.NET生成器带来了许多错误修复和增强功能以及新功能,包括高级数据加载选项和来自 SQL Server的流训练数据。

高级数据加载选项

以前,模型生成器不提供任何数据加载选项,它依赖于 AutoML 来检测列、标头和分隔符以及十进制分隔符样式。

让我们看一下模型生成器中使用出租车费数据集中新的高级数据加载选项。这是一个回归问题,您可以根据旅行距离、付款类型和乘客人数等几个因素预测出租车票价金额。

在模型生成器中,选择值预测方案和本地训练环境后,您将最终进入"数据"步骤。选择"文件"作为数据源类型,浏览出租车票价数据集,选择数据集后,将"列"更改为"预测" fare_amount。

 

 

选择"高级数据"选项以打开高级数据加载选项对话框。

 

 

在此对话框中,有两个部分 -列设置和数据格式

列设置

在"列设置"部分中,您可以将每个要素列(用于预测标签的列)的列更改为分类、文本、数字或忽略:

  • 分类列包含在标记组离散数量中的数据。例如,付款类型可以是 CSH(现金)或 CRD(卡)分类。

  • 文本列包含自由格式文本形式的字符串。例如,如果您有一个模型,该模型预测出租车乘客留下的关于其乘坐的评论是正面的还是负面的,则包含自由格式注释的列将具有 Text 的列目的。

  • 数字列仅包含数字(浮点或整数)。在出租车票价示例中,行程距离和行程时间都是数字列。

  • 您可以忽略不想用于训练的列。

通常,模型生成器会确定合适的列能正常执行,但在某些情况下,它可能会推断错误或可能选择一个列,使模型性能稍微差一些。例如,在出租车票价示例中,模型生成器为"passenger_count"选择分类,可能默认就是数字列。

您可以使用模型生成器选择的默认设置尝试训练,然后尝试将 passenger_count 的列更改为数字,以查看它如何影响模型的性能。

 

 

数据格式

在"数据格式"部分中,您可以覆盖模型生成器选择的以下数据加载选项:

  • 数据集是否具有列标题

  • 列分隔符(逗号、分号或制表符)

  • 十进制分隔符(十进制点或逗号)

 

 

保存数据格式选项后,可以在"数据预览"中看到它如何影响数据集

使用数据库加载程序从 SQL Server流式传输

模型生成器现在利用数据库加载器!

以前,如果您的训练数据存储在 SQL Server 中,模型生成器将在本地下载数据,然后进行训练。现在,模型生成器将直接从 SQL Server 加载和训练数据,而无需加载内存中的所有数据,因此它可以处理大小高达 TB 的巨大数据集。

入门和资源

如果您遇到任何问题,请通过在 GitHub 中创建问题(或使用模型生成器中的新反馈按钮)提交!

  • ML.NET API

  • ML.NET工具(模型构建器ML.NET CLI)

开始学习 ML.NET,详细了解有关 Microsoft 文档中ML.NET模型生成器。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/306005.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

yolo算法的优缺点分析_yolo算法介绍

yolo算法介绍(2020-06-06 16:49:28)把Yolo模型搞清楚后不得不再次为人类的智慧感慨,一个巧妙的模型。要想理解Yolo我们先要搞清楚Yolo到底要解决一个什么问题,解决这个问题必须做哪些事情。Yolo属于多目标检测,因此需要解决两个问题&#xff…

Flash 生命终止,HTML5能否完美替代?

Adobe 对 Flash Player 的支持计划在今天,也就是 2020 年 12 月 31 日终止。Windows 计算机上最新版本的 Flash Player 已经开始弹出生命周期终止提示窗口。提示中指出,为了保护用户系统,Adobe 将在 2021 年 1 月 12 日开始禁止 Flash 内容在…

14考研计算机考前,计算机专业考研考前终极预测试题.docx

PAGE \* MERGEFORMAT #PAGE \* MERGEFORMAT #真理惟一可靠的标准就是永远自相符合计算机专业考研考前终极预测试题一?p单项选择题:1~40小题,每小题2分,共80分。在每小题给出的四个 选项中,请选出一项最符合题目要求的。1若某线性…

typora公式zuo对齐_Markdown编辑神器-Typora

Markdown For Typora Overview Markdown is created by Daring Fireball, the original guideline is here. Its syntax, however, varies between different parsers or editors. Typora is using [GitHub Flavored Markdown][GFM]. 注:Markdown语法与知乎不能完全兼容,显示…

使用 ML.NET 识别乐高颜色块

每一个乐高迷都拥有很多的颜色块,需要进行排序和按类型分拣,按照《Organizing your LEGO Bricks》或许有所帮助,但这不是一个简单的任务,因为有很多颜色块有非常微妙的差异。如果换作一个典型的程序员可以做什么来解决这个问题呢&…

维修计算机机房管理员职责,机房管理员岗位职责

机房管理员在现代教育技术中心主任的领导下,负责学生机房的规划建设和日常管理工作。具体履行以下职责:一、树立一切以教学为中心的服务意识,加强与教师之间的联系,注重业务学习,不断提高业务技能。二、掌握计算机操作…

ccs加载out文件_类加载流程、类加载机制及自定义类加载器详解

原文:juejin.im/post/5cffa528e51d4556da53d091一、引言当程序使用某个类时,如果该类还未被加载到内存中,则JVM会通过加载、链接、初始化三个步骤对该类进行类加载。二、类的加载、链接、初始化1、加载类加载指的是将类的class文件读入内存&a…

写给自己,2020的年终总结

大概从2017年起,每年在博客园写一篇博客回顾自己过去的一年已经成为我的一种习惯,今年也同样毫不例外。不过与往年相比,总归还是受拖延症的影响,在公历年即将过去才开始动手敲下第一行文字。如果要给自己的2020年年终总结列一个篇…

2021福建计算机会考操作题,2021年福建省信息技术会考笔试试题答案.doc

.6信息技术基础(必修)选择题(共50题,每题1分,每题只有一个正确答案)1.下列相关信息叙述,不正确是A.信息无处不在,但并不一定全部是真实B.信息能够被存放和传输C.信息价值完全取决于信…

unity中单位是米还是厘米_【一步数学】小学数学单位换算公式大全及专项训练...

重量单位换算1吨1000千克 1吨1000 000克吨:吨是重量单位,公制一吨等于1000公斤:计算船只容积的单位,一吨等于2.83立方米(合100立方英尺)。1千克1000克 500克1斤千克:克,(符号kg或㎏)…

起点低,是彪悍的最好证明!

阅读本文大概需要4分钟。一个读者的问题:洋哥,我老家是农村的,只考上了专科,毕业后北漂两年月薪才7000,每天都会很焦虑,想努力但想到自己的过去,又怀疑努力是否有用。和这个读者聊了很久&#x…

量子计算机与新型传感器,新型量子传感器为超导量子计算机发展开辟了新路径...

莫斯科国立科技大学(NUSTMISIS)、俄罗斯量子中心(RQC)、以及德国卡尔斯鲁厄理工学院(KIT)的一支联合研究团队,已经在量子优势研究方面取得了重大的进展。由发表在《npj量子信息》期刊上的研究论文可知,其打造的一款量子传感器,为量子比特中两…

二分法查找是基于有序_201,查找顺序查找

查找算法中顺序查找算是最简单的了,无论是有序的还是无序的都可以,也不需要排序,只需要一个个对比即可,但其实效率很低。我们来看下代码1public static int search1(int[] a, int key) {2 for (int i 0, length a.length; i …

河南大学计算机组成原理,河南大学计算机组成原理考点

河南大学计算机组成原理考点 (34页)本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦!11.90 积分第1章 计算机系统概论1、计算机硬件的五大部件?三大部分?运算器 存储器…

【Git】Git-常用命令备忘录(二)

开发过程中,各种问题都会出现,比如手残,眼花,头昏,导致了误操作,那么git作为一款由Linus亲自操刀,替换掉BitMover公司的BitKeeper的优秀源代码管理工具,让您在各种乱七八糟的误操作中&#xff0…

zipsys驱动签名工具_全球首发 300系列主板USB WIN7 64位驱动 SMXDIY

本版为改版驱动,仅供SMXDIY会员学习测试,禁止传播。众所周知,H310/B360/H370/Z390是没USB的WIN7驱动的。网上也找不到相关的资料,大家普遍默认没驱动,但这已经成为历史。我们这发布的是真的驱动,可以整合到…

.NET/C#程序开发中如何更优美地实现失败任务重试的逻辑?

背景在.NET中,异常是指成员没有完成它的名称宣称可以完成的行动。在异常的机制中,异常和某件事情的发生频率无关。有时候需要对一些失败的任务进行多次的重试,如果重试的次数达到我们设定的阀值,则再放弃任务。解决方案使用一个静…

电子商务与计算机科学与技术的相关性,电子商务、计算机科学与技术、法学等相关专业。.doc...

电子商务、计算机科学与技术、法学等相关专业。.doc优先选派专业:金融学、财务管理、经济学、市场营销、电子商务、计算机科学与技术、法学等相关专业。交流学校专业设置情况详见链接: /jwc/jxjh/zyjs.asp1、专业建设概况:学校已形成以经济学…

excel筛选排序从小到大_excel表格怎么按字数的多少来排列!

excel表格怎么按字数的多少来排列为了更好的做好我们的语料编定及翻译工作,尤其是个别语料数量较多,最多可达2000条。我们可以将字数少的,意图明确的,不会有异议的,我们可以根据每句话的字数,用excel来进行…

计算机系统的工作方式,某计算机系统输入/输出采用双缓冲工作方式,其工作过程如下图所示,假设磁盘块与缓冲 - 信管网...

第2题:实时操作系统(RTOS)内核与应用程序之间的接口称为( )。A.I/O接口B.PCIC.APID.GUI答案解析与讨论:www.cnitpm.com/st/2867029381.html第3题:嵌入式处理器是嵌入式系统的核心部…