初窥机器学习

人工智能

近几年来,人工智能(AI)已成为家喻户晓的术语,我们在游戏、电影(还记得J.A.R.V.I.S吗?)和书籍中经常看到它的提及和描绘,但人工智能究竟是什么呢?
人工智能简单来说就是由机器展现出来的智能,这些机器被称为智能机器。智能机器是任何能感知其环境并采取行动以最大化实现某一目标成功率的设备(从小型设备如智能手机到大型设备如电视)。
简单地说,智能机器是一种能研究其环境、从中学习并适应环境变化的设备,通过调整其行动来更好地完成特定任务;这些任务是它被设计出来要完成的。
人工智能的应用
我们都在电影、游戏和书籍中看过人工智能的描绘,但人工智能在现实世界中也有应用,其中一些包括:
• 金融
• 医疗保健
• 客户服务/聊天机器人
• 教育
• 交通运输
• 技术
过去的AI仅限于一些基本功能,如错误报告等。近未来的AI预计能够处理更复杂的事务,我们在现在已经看到了其中的一些。问题是“我们如何发展到这样的AI水平?我们如何构建能够处理复杂事务的智能机器?”,答案是机器学习。
机器学习
与AI相比,“机器学习”这个术语可能不那么常见,或者即使听过,大多数人也不太了解它的含义。
机器学习(ML)是实现人工智能的一种方法。这么说,我们可以认为目标是开发智能机器,而机器学习是实现这一目标的方式。机器学习涉及开发无需明确告知具体做什么的系统,类似于人类的学习方式。

传统编程 VS 机器学习

传统编程

在这里插入图片描述
在传统编程中,我们提供规则和数据作为输入,算法则给出答案作为输出。让我用简单利息来举个快速的例子。
我们都知道数学中的简单利息,对吧?当开始学习编程时,继写出通常的“hello world”程序之后,通常下一步就是编写简单的算术程序;所以这个例子应该很直接。
现在,简单利息的公式是(PRT)/100。利用上面的图示,我们可以分析一个计算简单利息的程序:
• 数据:作为输入提供的数据将是变量P、R和T。
• 规则:规则将是公式 SI = (PRT)/100
• 答案:答案将是变量SI
这基本上就是传统编程的工作方式。

机器学习

在这里插入图片描述
在机器学习中,它与传统编程大不相同。在这里,我们提供数据和预期答案作为输入,算法则生成规则作为输出。
举个例子,比如一个区分真伪钞票的机器学习系统。利用上面的图示,我们可以这样分析这个系统:
• 数据:作为输入提供的数据将是数千张真钞和假钞的图片。
• 答案:作为输入提供的答案将是这些图片上的标签,用来指明特定图片是真钞还是假钞。
• 规则:规则将由机器学习算法生成,这些规则或多或少是算法理解如何区分真假钞票的方式。
为什么我们应该关心机器学习?
我经常被问到像“我为什么要关心机器学习?为什么它突然变得重要?为什么现在?”之类的问题,
以下是我们为什么应该关心机器学习,以及为什么它“突然”变得重要的几个原因:
• 数据可用性:现在正在产生大量数据,非常多(大数据听起来熟悉吗?)。这些数据由我们的智能设备、嵌入式系统和其他多种来源生成。现在的数据比以往任何时候都多,这些数据可以被分析,以发现模式、趋势和关联,这些可以用来做出智能决策,那我们为什么不这样做呢?
• 计算能力:当前的硬件拥有足够的计算能力来分析数据。我们拥有配置强大的个人电脑,我们的手机拥有比带人类登上月球的计算机还要强大的计算能力。
在海量数据和拥有足够计算能力分析这些数据的设备之间,我相信没有比现在更好的时机来关心机器学习。

机器学习过程

机器学习过程可以定义为一系列步骤,包括:
• 数据收集:这包括收集用作输入的数据。数据可以有不同的格式:XML、JSON、CSV、文本文件、图片等,并且可以从各种来源获取。
• 数据准备:这包括根据要开发的机器学习系统的要求分析和过滤数据,移除质量差、无效和不必要的数据。这还涉及将准备好的数据分为训练集和测试集,训练集用于训练算法,测试集用于验证。
• 训练:这是机器学习过程中使用训练集训练算法的部分。
• 评估:训练后,使用测试集评估训练好的模型。
• 优化:根据评估结果,可以优化模型以减少误差幅度并提高效率。优化可能涉及调整算法中的一些细节,引入新的变量以提高效率,或者完全更换整个模型/算法。

机器学习算法

在这里插入图片描述

机器学习算法主要分为三大类,它们是:
• 监督学习。
• 非监督学习。
• 强化学习。

监督学习

监督学习是一类用于构建预测模型的机器学习算法。之所以称为“预测模型”,是因为它们的目标是基于历史数据预测未来的结果。在监督学习中,期望的输出已知,因此数据是标记过的,机器学习模型被清楚地指示它们要学习什么以及如何学习。
监督学习中有两个主要的任务/问题,它们是:
• 分类:这是一个处理将项目分类到类别中的机器学习任务/问题。例如,真假钞票、猫和狗等。
• 回归:这是一个处理预测真实数值的机器学习任务/问题,如重量、金额等。例如,预测2023年的燃料价格,预测30英寸披萨的成本(30英寸的披萨将是一个壮观的景象!),预测2020年的降雨量等。
点击此处关于监督学习的信息。

非监督学习

非监督学习是一类用于构建描述性模型的机器学习算法。之所以称为“描述性模型”,是因为它们的目标是从非结构化和未标记的数据中确定和定义结构和相似性。在非监督学习中,期望的输出未知,因此数据未被标记,模型必须完全自行学习,而不被告知如何学习。
非监督学习中的主要任务是聚类;一个处理确定未标记数据结构的机器学习任务/问题。

强化学习

强化学习是一类用于构建模型的机器学习算法,这些模型通过尝试和错误来确定哪些行为带来最大回报。这些模型和强化学习的目标是最大化回报。强化学习模型主要用于机器人、游戏和导航,但不限于此。
其他机器学习算法包括:
• 半监督学习:这使用少量标记数据和大量未标记数据。
• 主动学习:在这里,模型交互式地查询用户以获得新知识。

开始机器学习之旅的资源

以下是一些帮助您开始机器学习之旅的资源:
• Google的机器学习速成课程:Google作为机器学习领域的大玩家之一,设计了一个旨在教授机器学习基础知识的速成课程。
• Udacity机器学习纳米学位:Udacity提供深入的机器学习纳米学位课程,通过项目带您深入了解机器学习的基础知识和原则。
• Kaggle:Kaggle是数据科学家和机器学习工程师及爱好者最大的社区之一。它提供访问大量数据集的机会,并有机会探索和构建模型、学习以及参与机器学习和数据科学竞赛。
• scikit-learn:scikit-learn是Python中的一个开源机器学习库。它提供简单易用的数据分析和构建机器学习模型的工具。它学习起来很容易,我推荐将它用于初级水平的事物。
• Zindi:Zindi是一个非洲的数据科学家和机器学习工程师及爱好者社区。Zindi提供访问源自非洲的数据集的机会,并有参与数据科学竞赛的机会。
现在是参与机器学习的最佳时机,我希望这能为您提供关于机器学习的深刻概述,并帮助您开始。祝您好运,并继续学习!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/739236.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Python】新手入门学习:什么是硬编码?如何避免硬编码?

【Python】新手入门学习:什么是硬编码?如何避免硬编码? 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教…

初学Vue+Element——Element使用

0 引言 前端的开发模式为MVVM(Model-View-ViewModel),而Vue侧重于VM开发,主要用于数据绑定到视图的,而ElementUI则侧重于V开发的前端框架,主要用于开发美观的页面的。 1 ElementUI介绍 Element:是饿了么公司前端开发…

项目实战-tpshop商城项目

项目实战-tpshop商城项目 环境部署准备软件工具准备远程连接测试远程连接测试-查看虚拟机IP地址远程连接测试-检测本机与虚拟机是否连通远程连接测试-通过远程工具连接linux服务器 常见问题处理 环境部署项目技术架构介绍部署tpshop项目-tpshop验证数据库验证用户信息表熟悉商品…

智慧公厕的创新:革命性的城市公共卫生设施

在现代城市中,公厕作为城市卫生设施的重要组成部分,对于提升城市形象和保障市民生活品质起着重要作用。然而,传统公厕普遍存在环境脏乱差、设施老旧、管理不规范等问题,给市民的使用体验带来了很多不便和不愉快。针对这一问题&…

魔法之线:探索string类的神秘世界

🎉个人名片: 🐼作者简介:一名乐于分享在学习道路上收获的大二在校生 🙈个人主页🎉:GOTXX 🐼个人WeChat:ILXOXVJE 🐼本文由GOTXX原创,首发CSDN&…

bug--xxoobject has no attribute xxx

Python 创建类的实例后却不能调用写的方法,检查了半天原来是缩进的问题,def函数不应该和class并列 只能说这个英文空格太小了,看不出来。。。。

【线代基础】张量、向量、标量、矩阵的区别

1、标量(Scalar) 纯数字,无方向性、无维度概念。因此也叫 标量张量、零维张量、0D张量 例如,x18,x21.34 x1、x2即为标量 2、张量(tensor) 具有方向性,可以理解为一个多维数组&a…

python学习笔记 -- 函数

目录 一. 函数的定义和调用 二. 函数的返回值 三. 变量的作用域 四. 函数的链式调用 五. 函数的嵌套调用 六. 函数的递归调用 七. 函数参数的默认值 八. 关键字传参 一. 函数的定义和调用 函数,指一段可以被重复调用的代码。在python中,函数定义…

Redis系列之持久化机制RDB和AOF

Redis系列之持久化机制RDB和AOF 文章目录 1. 为什么需要持久化?2. 持久化的方式3. RDB机制3.1 RDB机制介绍3.2 配置RDB3.3 什么时候触发3.4 操作实例3.5 RDB优势和不足 4. AOF机制4.1 什么是AOF机制?4.2 同步机制4.3 重写机制4.4 AOF的优势和不足 混合模…

简单使用国产数据库—达梦

达梦数据库是一款由中国的达梦软件公司开发的关系数据库管理系统(RDBMS),它在业界以其高性能、可扩展性和安全性而著称。该系统广泛应用于各种应用程序的数据存储和管理,满足用户对于数据处理和管理的多样化需求。 安装好的达梦数…

119.龙芯2k1000-pmon(18)-全自动安装linux系统

经过两天的测试和完善,现在基本已经正常可用了。 (全自动是假,接近全自动吧。) 需要使用配测电脑的网络功能,windows即可,脱离linux虚拟机。(理论上讲u盘也是可以的) 测试平台&…

客户案例|100M 768 维向量数据,Zilliz Cloud 稳定支持 Shulex VOC 业

日前,国际化 VOC SaaS 公司数里行间(Shulex)将上亿数据量的核心业务从开源向量数据库 Milvus 迁移至全托管的向量数据库云服务 Zilliz Cloud。 相比于 Milvus,Zilliz Cloud 实现了 Shulex VOC 评论分析洞察报告生成速度 30% 的提升…

AI 驱动的医疗变革:迈向未来医疗新生态

直面呼啸而来的人工智能,医疗行业将首当其冲,发生翻天覆地的变化。美国心脏病学家兼基因学教授埃里克托普在《未来医疗》中预测,未来人类将拥有“健康小助手”——个人医疗数据和处理能力,还能轻松预防疾病。诸多评论家也持类似观…

南京观海微电子---快速上手DDR读写例程——DDR接口专栏(三)

1. 前言 本文将向大家介绍如何使用DDR IP核的Native接口来对DDR进行读写操作。 2. DDR IP核接口介绍 要想把DDR3 IP核使用起来,必先需要了解下该IP核有哪些接口。DDR3 IP核接口图如下所示。注:图中展示的为DDR IP的Native接口,除了Native接…

javaEE8(数据库编程课后习题1,2)

一&#xff1a; 二&#xff1a; 数据库内信息&#xff1a; 登录&#xff1a; 注册&#xff1a; Register.jsp <% page pageEncoding"UTF-8" import"java.sql.*"%> <!DOCTYPE html> <html lang"en"> <head> <…

未知生,焉知死!小动物S了,如何处理?一个人一生该坚持的几件事——早读(逆天打工人爬取热门微信文章解读)

天地不仁&#xff0c;以万物为刍狗 引言Python 代码第一篇 人民日报 【夜读】一个人一生该坚持的几件事第二篇 人民日报 来了&#xff01;新闻早班车要闻社会政策 结尾 “未知生&#xff0c;焉知死” 曾经视为定数的冰冷生命 在热烈的内心烛照下 应当焕发出滚烫的热情 唯有热爱…

注意力、自注意力和多头注意力的区别

本文作者&#xff1a; slience_me 注意力、自注意力和多头注意力的区别 理解注意力&#xff08;Attention&#xff09;、自注意力&#xff08;Self-Attention&#xff09;和多头注意力&#xff08;Multi-Head Attention&#xff09;之间的区别非常重要&#xff0c;因为它们是自…

[HackMyVm] Quick

kali:192.168.56.104 主机发现 arp-scan -l # arp-scan -l Interface: eth0, type: EN10MB, MAC: 00:0c:29:d2:e0:49, IPv4: 192.168.56.104 Starting arp-scan 1.10.0 with 256 hosts (https://github.com/royhills/arp-scan) 192.168.56.1 0a:00:27:00:00:05 (Un…

nginx禁止国外ip访问

1.安装geoip2扩展依赖 yum install libmaxminddb-devel -y 2.下载ngx_http_geoip2_module模块 https://github.com/leev/ngx_http_geoip2_module.git 3.编译安装 ./configure --add-module/datasdb/ngx_http_geoip2_module-3.4 4.下载最新数据库文件 模块安装成功后,还要…

【阿里云系列】-基于云效构建部署NodeJS项目到ACK

准备工作 01、编写Dockerfile文件可以根据不同的环境&#xff0c;新建不同的Dockerfile文件&#xff0c;比如Dockerfile-PROD # Deliver the dist folder with NginxFROM nginx:stable-alpine ENV LANGC.UTF-8 ENV TZAsia/ShanghaiCOPY dist/ /usr/share/nginx/html COPY ngi…