ML.NET Cookbook:(5)如何查看中间过程数据?

通常,当我们构建实验时,我们希望确保“到某一时刻”的数据处理产生我们想要的结果。对于ML.NET来说,这不是很容易做到的:因为所有的ML.NET操作都是延迟执行的,所以我们构造的对象只是数据的“承诺”。

我们需要创建游标并扫描数据以获得实际值。一种方法是使用模式理解[1]并将数据映射到用户定义的IEnumerable对象中。

另一种允许您检查中间数据的机制是GetColumn<T>扩展方法。它允许您以IEnumerable的形式查看一列数据的内容。

以下是所有这些操作:

示例文件[2]:

Label Workclass education marital-status
0 Private 11th Never-married
0 Private HS-grad Married-civ-spouse
1 Local-gov Assoc-acdm Married-civ-spouse
1 Private Some-college Married-civ-spouse
// 将数据加载到数据视图中。
var data = mlContext.Data.LoadFromTextFile<InspectedRow>(dataPath,// 文件的第一行是标题,而不是数据行。hasHeader: true
);// 开始创建我们的处理管道。现在,让我们把所有的文本列连接在一起。
var pipeline = mlContext.Transforms.Concatenate("AllFeatures", "Education", "MaritalStatus");// 转换数据。
var transformedData = pipeline.Fit(data).Transform(data);// “transformedData”是数据的“承诺”。让我们实际加载它。
var someRows = mlContext// 转换为用户定义类型的可枚举项。.CreateEnumerable<InspectedRowWithAllFeatures>(transformedData, reuseRowObject: false)// 取几个值作为数组。.Take(4).ToArray();// 提取“AllFeatures”列。这将取出整个数据集:确保只取几行,以防数据集太大。与静态API类似,只是您必须指定列名和类型。
var featureColumns = transformedData.GetColumn<string[]>(transformedData.Schema["AllFeatures"])

参考资料

[1]

模式理解: https://github.com/dotnet/machinelearning/blob/main/docs/code/SchemaComprehension.md

[2]

示例文件: https://github.com/dotnet/machinelearning/blob/main/test/data/adult.tiny.with-schema.txt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/302122.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在线交友背后的数学原理

全世界只有3.14 % 的人关注了数据与算法之美欣赏 TED-Ed 带字幕视频, 或者看下面编写的文字版. 01交友网站的背后是算法帝国大家好&#xff0c;我叫 Christian Rudder,我是 OKCupid 网站的创办人之一。这个网站现在已经是全美最大的交友网站。就象这网站上大多数其他人一样,我…

你不得不知道的Visual Studio 2012(3)- 创建Windows应用程序

创建项目 在Visual Studio中创建一个应用程序&#xff0c;应首先创建一个项和一个解决方案。在此示例中&#xff0c;您将创建Windows presentation foundation应用程序。 创建 WPF 项目 在菜单栏上&#xff0c;依次选择 *** 文件 ***&#xff0c;新建&#xff0c;项目。 选择V…

超级智能玩具《小小机器人》|全新50种玩法,创造力之源

致砖《小小机器人》全新套装电动机械的完美结合先来看看视频过过眼瘾吧来自美国STEAM教育让孩子跨学科学知识积木向来是STEAM教育很重要的一部分&#xff0c;因为它涉及到了多种学科&#xff1a;要搭建得稳固——这是工程学&#xff1b;要精准搭建——这是数学&#xff1b;要外…

强烈推荐!孩子的科普从这套全球畅销250万册的最酷科学书起步

在马斯的学生时代的记忆中&#xff0c;数学定义定理、化学方程式、物理公式……这些科学知识点总是冷冰冰的&#xff0c;枯燥、深奥也总是科学的代名词。如今教育局明确规定科学课是小学必修课&#xff0c;孩子也逐步接受科学知识的熏陶。但科学课上冷冰冰的&#xff0c;枯燥、…

技术分享|手机推送原理剖析指南

源宝导读&#xff1a;本文旨在对手机推送原理进行剖析和阐述&#xff0c;对业务开发做一些方向性的解惑。一、手机推送的基本概念 ——什么是手机推送&#xff1f;百度词条&#xff1a;手机推送服务是指服务器 定向将信息实时送达手机的服务词条中有2组概念&#xff1a;第一组是…

闽高校计算机二级c语言模拟器,闽高校计算机二级C语言模拟卷及答案.doc

闽高校计算机二级C语言模拟卷及答案.doc (54页)本资源提供全文预览&#xff0c;点击全文预览即可全文预览,如果喜欢文档就下载吧&#xff0c;查找使用更方便哦&#xff01;9.90 积分&#xfeff;一、单项选择题(每小题2分&#xff0c;共20分)1.以下4组用户定义标识符中&#xf…

重磅!中国最赚钱的公司,要上市了!

全世界只有3.14 % 的人关注了数据与算法之美12月31日&#xff0c;中国烟草子公司中烟国际&#xff08;香港&#xff09;神秘地向香港交易所递交了IPO的材料&#xff0c;赶上了2018年的末班车。嫡子上市&#xff0c;中国烟草自己向众人掀起了裙裾一角。过去三年&#xff0c;中烟…

浅谈VS2012单元测试

1、先建一个工程此工程带有待测试的方法 2、在解决方案中建立单元测试 3、在测试项目中添加测试项目的引用 4、写测试用例 namespace UnitTestProject1 {[TestClass]public class UnitTest1{[TestMethod]public void TestMethod1(){var restClient (IRestClient)new JsonServi…

我写代码时的小倔强

分享自己写代码时的好习惯&#xff0c;让你的编程能力突飞猛进&#xff01;大家好&#xff0c;我是鱼皮&#xff0c;上回说到&#xff0c;很多同学在学编程时不注重代码质量&#xff0c;养成坏习惯的同时&#xff0c;失去了提升自己编程能力的机会。还没读上篇文章的同学&#…

10个舍不得删的高质量公号

全世界有3.14 % 的人已经关注了数据与算法之美在信息爆炸的时代快节奏的生活里 你是否曾有一瞬间觉得忙碌而空虚&#xff1f;以下10个优质公众号能让你在闲暇的时候不断的提升自我&#xff0c;拓宽视野愿以书卷气&#xff0c;行我路千里历史学资讯ID&#xff1a;tongbanlishi▲…

ML.NET Cookbook:(7)如何训练回归模型?

通常&#xff0c;为了在ML.NET中训练任何模型&#xff0c;您将经历三个步骤&#xff1a;弄清楚训练数据如何以IDataView形式进入ML.NET。将“学习管道”构建为一系列基本的“运算符”&#xff08;估计器&#xff09;。在管道上调用Fit以获得经过训练的模型。示例文件[1]:featur…

android动画送礼物,Android仿直播类app赠送礼物功能

直播界面实现的是播放本地的视频文件&#xff1a;/*** 直播界面&#xff0c;用于对接直播功能*/public class LiveFrag extends Fragment {private ImageView img_thumb;private VideoView video_view;NullableOverridepublic View onCreateView(NonNull LayoutInflater inflat…

一张纸一幅图,竟然提高了10倍的学习和工作效率!?

人类大脑的容量远远超出一般人的想象&#xff0c;时到21世纪的今天&#xff0c;我们对大脑的运用远远不够。大脑机能的使用率基于我们的思维模式&#xff0c;而思维导图正是开发大脑中最有效的利器&#xff01;之前小木给大家推荐了一套基于少儿大脑思维开发的书籍——东尼博赞…

C# 消息队列之MSMQ

首先说一下&#xff0c;消息队列 (MSMQ Microsoft Message Queuing)是MS提供的服务&#xff0c;也就是Windows操作系统的功能&#xff0c;并不是.Net提供的。消息队列&#xff08;MSMQ&#xff09;技术使得运行于不同时间的应用程序能够在各种各样的网络和可能暂时脱机的系统之…

惊呆了!竟然还有这样的操作!

2018已成为过去&#xff0c;2019的序幕已经悄然打开&#xff01;2019开年钜惠盛大来袭&#xff01;&#xff08;福利在最后&#xff01;&#xff01;&#xff01;&#xff09;Python专场Python快速入门实战&#xff08;59.9&#xff09;人工智能的浪潮下&#xff0c;Python因其…

使用 .NET 升级助手将.NET Framework应用迁移到.NET 5

从.NET Framework 迁移到.NET 5 犹如搬家&#xff0c;我们都知道搬家是很痛苦的&#xff0c;我们请求搬家公司来减轻我们的压力&#xff0c;.NET 升级助手 的作用就类似我们聘请的搬家公司&#xff0c;帮助我们处理繁重乏味的迁移工作。.NET 升级助手是一个全局命令行工具&…

java 逐行写入csv_go|使用go读写CSV文件

生成CSV文件package mainimport ("encoding/csv""log""os")var data [][]string{{"tom", "18", "beijing"}, {"jon", "19", "shanghai"}}func main() {file, err : os.Create(&qu…

用android ndk编译ffmpeg,AndroidNDK交叉编译FFMPEG

1. 简介在进行安卓音视频开发时&#xff0c;利用安卓NDK工具交叉编译FFmpeg&#xff0c;生成可供安卓平台调用的FFmpeg库是最基础的工作。本篇文章介绍了利用NDK进行FFmpeg编译的具体过程&#xff0c;以及如何在Linux和windows系统下交叉编译出适用于不同安卓平台的FFmpeg库文件…

第106届印度科学大会:牛顿和爱因斯坦的理论惨遭印度科学家驳斥

全世界只有3.14 % 的人关注了数据与算法之美昨天&#xff0c;一年一度的印度科学大会&#xff08;Indian Science Congress&#xff09;落下了帷幕。第106届印度科学大会的主要成员合影一般来说&#xff0c;这种学术性会议是学者们进行学术交流的最佳时期&#xff0c;而且能参加…

润乾报表分组求和_实现报表数据预先计算

报表应用中&#xff0c;如果数据量较大或计算过程较复杂&#xff0c;往往会导致报表数据源准备过慢&#xff0c;从而影响报表性能。这种情况下可以预先计算报表需要的数据&#xff0c;在呈现时直接引用&#xff0c;使得用户在访问报表时可以迅速地获得响应。一、当前的手段及弊…