【人工智能】穿越科技迷雾:解锁人工智能、机器学习与深度学习的奥秘之旅

在这里插入图片描述


文章目录

  • 前言
  • 一、人工智能
    • 1. 人工智能概述
      • a.人工智能、机器学习和深度学习
      • b.人工智能发展必备三要素
      • c.小案例
    • 2.人工智能发展历程
      • a.人工智能的起源
      • b.发展历程
    • 3.人工智能的主要分支
  • 二、机器学习
    • 1.机器学习工作流程
      • a.什么是机器学习
      • b.机器学习工作流程
      • c.特征工程
    • 2.机器学习算法分类
      • a.监督学习
      • b.无监督学习
      • c.半监督学习
      • d.强化学习
      • e.总结
    • 3.模型评估
      • a.分类模型评估
      • b.回归模型评估
      • c.拟合
  • 三、深度学习
    • 1.神经网络简介
    • 2.神经网络各层负责内容


前言

    在这个科技飞速发展的时代,人工智能(AI)正深刻改变着我们的生活。在本文中,我们将首先概览人工智能的广阔天地,包括其基本概念、发展历程以及推动其发展的三大关键要素,通过生动的案例,让读者对人工智能有一个初步而全面的认识。随后,我们将深入机器学习的腹地,从基础概念讲起,逐步剖析机器学习的工作流程、特征工程的重要性,以及不同学习模式(监督学习、无监督学习、半监督学习、强化学习)的各自特点与应用场景,帮助读者构建起机器学习的完整知识框架。

    在此基础上,我们将重点转向深度学习的探索,作为机器学习的一个分支,深度学习以其强大的数据处理能力和模式识别能力,在图像识别、自然语言处理等领域取得了令人瞩目的成就。我们将从神经网络的基本原理出发,详细解读神经网络各层的功能与角色,为读者打开深度学习这一神秘领域的大门。


一、人工智能

1. 人工智能概述

a.人工智能、机器学习和深度学习

在这里插入图片描述

人工智能和机器学习,深度学习的关系

  • 机器学习是人工智能的一个实现途径
  • 深度学习是机器学习的一个方法(神经网络)发展而来

b.人工智能发展必备三要素

  • 数据
  • 算法
  • 算力
    • CPU、GPU、TPU

CPU和GPU的区别: http://www.sohu.com/a/201309334_468740

Google TPU 介绍:https://www.yundongfang.com/Yun167796.html

c.小案例

AI猜图 参考链接:https://quickdraw.withgoogle.com

参考链接:https://pjreddie.com/darknet/yolo/

2.人工智能发展历程

a.人工智能的起源

图灵测试

测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。

多次测试(一般为5min之内),如果有超过 30% 的测试者不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能
在这里插入图片描述

达特茅斯会议

1956年8月,在美国汉诺斯小镇宁静的达特茅斯学院中,

  • 约翰·麦卡锡(John McCarthy)
  • 马文·闵斯基(Marvin Minsky,人工智能与认知学专家)
  • 克劳德·香农(Claude Shannon,信息论的创始人)
  • 艾伦·纽厄尔(Allen Newell,计算机科学家)
  • 赫伯特·西蒙(Herbert Simon,诺贝尔经济学奖得主

等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:用机器来模仿人类学习以及其他方面的智能。

会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:人工智能

因此,1956年也就成为了人工智能元年。

b.发展历程

人工智能充满未知的探索道路曲折起伏。如何描述人工智能自1956年以来60余年的发展历程,学术界可谓仁者见仁、智者见智。我们将人工智能的发展历程划分为以下6个阶段:

  • 第一是起步发展期:1956年—20世纪60年代初。
    • 人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。
  • 第二是反思发展期:20世纪60年代—70年代初。
    • 人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如,无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入低谷。
  • 第三是应用发展期:20世纪70年代初—80年代中。
    • 20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。
  • 第四是低迷发展期:20世纪80年代中—90年代中。
    • 随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。
  • 第五是稳步发展期:20世纪90年代中—2010年。
    • 由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念。以上都是这一时期的标志性事件。
  • 第六是蓬勃发展期:2011年至今。
    • 随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。

在这里插入图片描述

3.人工智能的主要分支

通讯、感知与行动是现代人工智能的三个关键能力,在这里我们将根据这些能力/应用对这三个技术领域进行介绍:

  • 计算机视觉(CV)
  • 自然语言处理(NLP)
    • 在 NLP 领域中,将覆盖文本挖掘/分类、机器翻译和语音识别。
  • 机器人

分支一:计算机视觉

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。物体检测和人脸识别是其比较成功的研究领域。

当前阶段:
    计算机视觉现已有很多应用,这表明了这类技术的成就,也让我们将其归入到应用阶段。随着深度学习的发展,机器甚至能在特定的案例中实现超越人类的表现。但是,这项技术离社会影响阶段还有一定距离,那要等到机器能在所有场景中都达到人类的同等水平才行(感知其环境的所有相关方面)。

发展历史:
在这里插入图片描述

在这里插入图片描述

分支二:语音识别

语音识别是指识别语音(说出的语言)并将其转换成对应文本的技术。相反的任务(文本转语音/TTS)也是这一领域内一个类似的研究主题。

当前阶段:
    语音识别已经处于应用阶段很长时间了。最近几年,随着大数据和深度学习技术的发展,语音识别进展颇丰,现在已经非常接近社会影响阶段了。
    语音识别领域仍然面临着声纹识别鸡尾酒会效应等一些特殊情况的难题。
    现代语音识别系统严重依赖于云,在离线时可能就无法取得理想的工作效果。

发展历史:

  • 百度语音识别:
    • 距离小于1米,中文字准率97%+
    • 支持耳语、长语音、中英文混合及方言
      在这里插入图片描述

分支三:文本挖掘/分类

这里的文本挖掘主要是指文本分类,该技术可用于理解、组织和分类结构化或非结构化文本文档。 其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。

当前阶段:
我们将这项技术归类到应用阶段,因为现在有很多应用都已经集成了基于文本挖掘的情绪分析或垃圾信息检测技术。文本挖掘技术也在智能投顾的开发中有所应用,并且提升了用户体验。

文本挖掘和分类领域的一个瓶颈出现在歧义和有偏差的数据上。

发展历史:
在这里插入图片描述

分支四:机器翻译

机器翻译(MT)是利用机器的力量自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)。

当前阶段:
机器翻译是一个见证了大量发展历程的应用领域。该领域最近由于神经机器翻译而取得了非常显著的进展,但仍然没有全面达到专业译者的水平;但是,我们相信在大数据、云计算和深度学习技术的帮助下,机器翻译很快就将进入社会影响阶段。

在某些情况下,俚语和行话等内容的翻译会比较困难(受限词表问题)。

专业领域的机器翻译(比如医疗领域)表现通常不好

发展历史:
在这里插入图片描述

分支五:机器人

机器人学(Robotics)研究的是机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理。

    机器人可以分成两大类:固定机器人和移动机器人。 固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。

当前阶段:
    自上世纪「Robot」一词诞生以来,人们已经为工业制造业设计了很多机器人。工业机器人是增长最快的应用领域,它们在 20 世纪 80 年代将这一领域带入了应用阶段。在安川电机、Fanuc、ABB、库卡等公司的努力下,我们认为进入 21 世纪之后,机器人领域就已经进入了社会影响阶段,此时各种工业机器人已经主宰了装配生产线。此外,软体机器人在很多领域也有广泛的应用,比如在医疗行业协助手术或在金融行业自动执行承销过程。

    但是,法律法规和「机器人威胁论」可能会妨碍机器人领域的发展。还有设计和制造机器人需要相对较高的投资

发展历史
在这里插入图片描述

二、机器学习

1.机器学习工作流程

a.什么是机器学习

机器学习是从数据自动分析获得模型,并利用模型对未知数据进行预测。
在这里插入图片描述

b.机器学习工作流程

机器学习工作流程总结:

  • 1.获取数据
  • 2.数据基本处理
  • 3.特征工程
  • 4.机器学习(模型训练)
  • 5.模型评估
    • 结果达到要求,上线服务
    • 没有达到要求,重新上面步骤

预测数据案例:

案例一:房屋价格预测
房屋价格影响因素大概:1、面积大小、2、地理位置、3、房屋整体户型4、面积等。
预测房屋价格结果可能出现小数,如:101.1万等。

案例二:电影类型预测
在这里插入图片描述
案例三:人物归类
在这里插入图片描述

数据简介:

  • 在数据集中一般:
    • 一行数据我们称为一个样本
    • 一列数据我们成为一个特征
    • 有些数据有目标值(标签值),有些数据没有目标值(如上三个表中,房屋价格就是对应的目标值,电影类型就是这个数据集的目标值,而人物归类就没有目标值)

  • 数据类型构成:
    • 数据类型一:特征值+目标值(目标值是连续的和离散的)
    • 数据类型二:只有特征值,没有目标值(聚类算法)

  • 数据分割:
    • 机器学习一般的数据集会划分为两个部分:
      • 训练数据:用于训练,构建模型
      • 测试数据:在模型检验时使用,用于评估模型是否有效
    • 划分比例:
      • 训练集:70% 80% 75%
      • 测试集:30% 20% 25%

数据基本处理:
    即对数据进行缺失值、去除异常值等处理。
    比如:在人物信息统计过程中,有个别人把年龄填写成1000岁,或者不填写性别等

c.特征工程

什么是特征工程?
    特征工程(Feature Engineering)是使用专业背景知识和技巧处理数据使得特征能在机器学习算法上发挥更好的作用的过程

  • 意义:会直接影响机器学习的效果

为什么需要特征工程?
    机器学习领域的大神Andrew Ng(吴恩达)老师说“Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learning” is basically feature engineering. ”

  • 注:业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

特征工程包含内容:

  • 特征提取
  • 特征预处理
  • 特征降维

特征工程类别介绍:

  • 特征提取
    • 将任意数据(如文本或图像)转换为可用于机器学习的数字特征
      在这里插入图片描述
  • 特征预处理
    • 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程
      在这里插入图片描述
  • 特征降维
    • 指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程
      在这里插入图片描述

2.机器学习算法分类

根据数据集组成不同,可以把机器学习算法分为:

  • 监督学习
  • 无监督学习
  • 半监督学习
  • 强化学习

a.监督学习

  • 定义:
    • 输入数据是由输入特征值目标值所组成。
      • 函数的输出可以是一个连续的值(称为 回归 ),
      • 或是输出是有限个离散值(称作 分类 )。

回归问题
例如:预测房价,根据样本集拟合出一条连续曲线。
在这里插入图片描述

分类问题
例如:根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”,是离散的。
在这里插入图片描述

b.无监督学习

  • 定义:

    • 输入数据是由输入特征值组成,没有目标值
      • 输入数据没有被标记,也没有确定的结果。样本数据类别未知;
      • 需要根据样本间的相似性对样本集进行类别划分。
  • 举例:
    在这里插入图片描述

有监督,无监督算法对比:

在这里插入图片描述

c.半监督学习

  • 定义:

    • 训练集同时包含有标记样本数据和未标记样本数据。
  • 扩展:
        无标注数据集 是指在数据集中没有提供明确标注或标签的数据集。这意味着数据集中的每个样本都缺少明确的分类或标签信息。例如,在自然语言处理领域,无标注数据集可能是大量的文本数据,但是这些文本数据没有被标记为不同的语言、主题、情感等类别。
        相比之下,有标注数据集是已经被人工或自动标记或标注了不同类别或标签的数据集。例如,在图像分类问题中,有标注数据集可能是一个包含数万张图像的数据集,每个图像都被标记为它所属的类别(例如"猫"或"狗")。

举例:

  • 监督学习训练方式:
    在这里插入图片描述
    首先获取大量未标记的数据,然后让专家进行预测,得到大量的标记过的数据,通过标记过的数据进行预测和训练模型,就可以获取一个监督学习的训练模型。
  • 半监督学习训练方式
    在这里插入图片描述
    首先从大量数据中获取少量数据,让专家进行标记过获得少量得数据,通过对少量得数据进行训练获得一个初步得模型,然后在使用大量未标记过得数据进行模型的得出

d.强化学习

  • 定义:
    • 实质是make decisions 问题,即自动进行决策,并且可以做连续决策。

举例:

小孩想要走路,但在这之前,他需要先站起来,站起来之后还要保持平衡,接下来还要先迈出一条腿,是左腿还是右腿,迈出一步后还要迈出下一步。

小孩就是 agent,他试图通过采取行动(即行走)来操纵环境(行走的表面),并且从一个状态转变到另一个状态(即他走的每一步),当他完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃),并且当他不能走路时,就不会给巧克力。

主要包含五个元素:agent, action, reward, environment, observation;
在这里插入图片描述
强化学习的目标就是获得最多的累计奖励

监督学习和强化学习的对比:

监督学习强化学习
反馈映射输出的是之间的关系,可以告诉算法什么样的输入对应着什么样的输出。输出的是给机器的反馈 reward function,即用来判断这个行为是好是坏。
反馈时间做了比较坏的选择会立刻反馈给算法结果反馈有延时,有时候可能需要走了很多步以后才知道以前的某一步的选择是好还是坏。
输入特征输入是独立同分布的。面对的输入总是在变化,每当算法做出一个行为,它影响下一次决策的输入。

e.总结

InOut目的案例
监督学习 (supervised learning)有标签有反馈预测结果猫狗分类 房价预测
无监督学习 (unsupervised learning)无标签无反馈发现潜在结构“物以类聚,人以群分”
半监督学习 (Semi-Supervised Learning)部分有标签,部分无标签有反馈降低数据标记的难度
强化学习 (reinforcement learning)决策流程及激励系统一系列行动长期利益最大化学下棋

3.模型评估

a.分类模型评估

在这里插入图片描述

评价指标:

  • 准确率
    • 预测正确的数占样本总数的比例。
  • 其他评价指标:精确率、召回率、F1-score、AUC指标等

b.回归模型评估

在这里插入图片描述

评价指标:

均方根误差(Root Mean Squared Error,RMSE)

  • RMSE是一个衡量回归模型误差率的常用公式。 不过,它仅能比较误差是相同单位的模型。
    在这里插入图片描述

a 为真实值;p 为预测值

举例:

假设上面的房价预测,只有五个样本,对应的
真实值为:100,120,125,230,400
预测值为:105,119,120,230,410

那么使用均方根误差求解得:
在这里插入图片描述

其他评价指标:

  • 相对平方误差(Relative Squared Error,RSE)
  • 平均绝对误差(Mean Absolute Error,MAE)
  • 相对绝对误差(Relative Absolute Error,RAE)

c.拟合

模型评估用于评价训练好的的模型的表现效果,其表现效果大致可以分为两类:过拟合、欠拟合。

欠拟合:
在这里插入图片描述
因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。

欠拟合(under-fitting)模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来

过拟合:
在这里插入图片描述
机器已经基本能区别天鹅和其他动物了。然后,很不巧已有的天鹅图片全是白天鹅的,于是机器经过学习后,会认为天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会认为那不是天鹅。

过拟合(over-fitting):所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳


三、深度学习

1.神经网络简介

    深度学习(Deep Learning)(也称为深度结构学习【Deep Structured Learning】、层次学习【Hierarchical Learning】或者是深度机器学习【Deep Machine Learning】)是一类算法集合,是机器学习的一个分支。
在这里插入图片描述
    深度学习方法近年来,在会话识别、图像识别和对象侦测等领域表现出了惊人的准确性。
    但是,“深度学习”这个词语很古老,它在1986年由Dechter在机器学习领域提出,然后在2000年有Aizenberg等人引入到人工神经网络中。而现在,由于Alex Krizhevsky在2012年使用卷积网络结构赢得了ImageNet比赛之后受到大家的瞩目。

卷积网络之父:Yann LeCun
在这里插入图片描述

一个好玩的深度学习演示网站:http://playground.tensorflow.org
在这里插入图片描述

2.神经网络各层负责内容

1层:负责识别颜色及简单纹理
在这里插入图片描述
2层:一些神经元可以识别更加细化的纹理,布纹,刻纹,叶纹等
在这里插入图片描述
3层:一些神经元负责感受黑夜里的黄色烛光,高光,萤火,鸡蛋黄色等。
在这里插入图片描述
4层:一些神经元识别萌狗的脸,宠物形貌,圆柱体事物,七星瓢虫等的存在。
在这里插入图片描述
5层:一些神经元负责识别花,黑眼圈动物,鸟,键盘,原型屋顶等。
在这里插入图片描述


在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/51279.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于GEC6818开发板+Linux+Qt设计的智能养老院出入管理系统

一、前言 1.1 项目介绍 【1】项目功能介绍 随着我国老龄化进程的加快,养老问题日益突出,如何有效保障老年人的生活质量与安全成为社会关注的重点。智能化、信息化技术的发展为解决这一问题提供了新的思路和手段。基于Linux系统的智能养老院出入管理系统应运而生,为了实现…

Thinkphp仿华为商城源码/红色风格电脑手机数码商城系统网站源码

Thinkphp仿华为商城,主要实现了商品首页展示、用户意见、商品分类列表、商品搜索、商品详细展示、购物车、订单生成、在线付款、以及个人中心完善个人资料、用户修改收货地址、余额查询、消费查询、订单管理、商品评价、热销商品和最近商品浏览; 后台是…

大模型的架构演进史——为什么Decoder-Only成为最终的胜利者

文章目录 大模型的架构encoder onlydecoder nolyencoder-decoder为什么现在decoder-only为主流 大模型的架构 encoder only 使用encoder-only的模型主要的思路是通过编码器,将大量文本、时序数据等资料进行编码、压缩,达到进一步抽象理解输入数据的能力…

【JavaScript】函数的动态传参

Javacript(简称“JS”)是一种具有函数优先的轻量级,解释型或即时编译型的编程语言。虽然它是作为开发Web页面的脚本语言而出名,但是它也被用到了很多非浏览器环境中,JavaScript基于原型编程、多范式的动态脚本语言&…

Python接口自动化测试框架(实战篇)-- 数据库操作MySQL

文章目录 一、前言二、数据库什么是数据验证为什么需要操作数据库做数据验证?现在回到怎样做数据验证的问题上来 三、[PyMSQL](https://pypi.org/project/pymssql/)pymysql如何操作数据库实际应用 四、总结 一、前言 说起数据库的操作,咱们应该保持一颗敬畏的心&a…

Ubuntu安装terminator教程

Terminator 是一个高级的终端仿真器,专为 Linux 和 Unix 系统设计。它的主要特点是提供了丰富的多窗口和多标签功能,使用户能够在一个窗口中管理多个终端会话。这对于系统管理员、开发人员以及需要同时运行多个命令行任务的用户来说,极为方便。 一、安装 1、更新包 sudo a…

vue项目启动报错 vue与vue-template-compiler版本不一致

出现错误 Vue packages version mismatch: vue2.6.12 (/Users/work_ws/project/my/astar-education/astar-education-ui/node_modules/vue/dist/vue.runtime.common.js)vue-template-compiler2.6.13 (/Users/work_ws/project/my/astar-education/astar-education-ui/node_mod…

图中的最短环

2608. 图中的最短环 现有一个含 n 个顶点的 双向 图,每个顶点按从 0 到 n - 1 标记。图中的边由二维整数数组 edges 表示,其中 edges[i] [ui, vi] 表示顶点 ui 和 vi 之间存在一条边。每对顶点最多通过一条边连接,并且不存在与自身相连的顶…

Java1.2标准之重要特性及用法实例(十三)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 新书发布:《Android系统多媒体进阶实战》🚀 优质专栏: Audio工程师进阶系列…

征服 Docker 镜像访问限制:KubeSphere v3.4.1 成功部署全攻略

近期,KubeSphere 社区的讨论中频繁出现关于 Docker 官方镜像仓库访问受限的问题。 本文旨在为您提供一个详细的指南, 展示在 Docker 官方镜像访问受限的情况下,如何通过 KubeKey v3.1.2 一次性成功部署 KubeSphere v3.4.1 以及 Kubernetes …

深入剖析:GaussDB与MySQL在COUNT查询中的并行化技术

引言 数据库查询性能优化是数据库管理和开发中的一个重要议题。在处理大数据量的COUNT查询时,传统的单线程处理方式可能无法满足现代应用的性能需求。GaussDB(for MySQL)和MySQL作为流行的数据库系统,它们在并行查询优化方面有着各自的策略和技术。本文…

Python批量采集某东评论,实现可视化分析

女朋友没事就喜欢网购,买一大堆又不用,总说不合适,为了不让她花冤枉钱,于是我决定用Python写一个采集商品评论的脚本,然后对商品进行分析,这样就不怕踩到坑了! 让我们直接开始本次操作 准备工作…

Python及Jupyter-Notebook安装

来源: “码农不会写诗”公众号 链接:Python及Jupyter-Notebook安装 文章目录 01 Python安装1.1 下载安装包1.2 双击安装包,开始安装1.3 选择安装配置1.4 选择需要安装的Optional Feature,点击Next1.5 选择需要安装的Advanced Feat…

Apache DolphinScheduler Worker Task执行原理解析

大家好,我是蔡顺峰,是白鲸开源的高级数据工程师,同时也是Apache DolphinScheduler社区的committer和PMC member。今天我要分享的主题是《Worker Task执行原理》。 整个分享会分为三个章节: Apache DolphinScheduler的介绍Apache …

Python3网络爬虫开发实战(3)网页数据的解析提取

文章目录 一、XPath1. 选取节点2. 查找某个特定的节点或者包含某个指定的值的节点3. XPath 运算符4. 节点轴5. 利用 lxml 使用 XPath 二、CSS三、Beautiful Soup1. 信息提取2. 嵌套选择3. 关联选择4. 方法选择器5. css 选择器 四、PyQuery1. 初始化2. css 选择器3. 信息提取4. …

一步步理清开源路径规划导航引擎GraphHopper

一步步理清开源路径规划导航引擎GraphHopper,学习应用 GraphHopper简介 源码用 Java 编写,开发人员可以通过 Maven 轻松上手。可以用作** Java 库**来计算两个或多个点之间路线的距离、时间、逐向指示和许多道路属性。可以用作独立的 Web 服务器来计算…

计算R velocity的方法和流程(CellRank2)

愿武艺晴小朋友一定得每天都开心 第一步:拿到cellranger count的文件夹; 运行cellranger count(这个得提前准备:R1和R2的fastq.gz文件 & 鼠的参考基因组文件) wget https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-mm10-2020-A.tar.gz 最后会出现这个:Pipes…

C++简单实现消息队列

简介 消息队列是一种应用间的通讯方式,消息发送后可以立即放回,由消息系统来确保消息的可靠传递。消息发布者只需要将消息发布到消息队列中,而不需要管谁来取。消息使用者只管从消息队列中取消息而不管谁发布的。这样发布者和使用者都不同知…

21.发布确认模式-高级

问题 生产环境中由于一些不明原因,导致rabbitmq重启,在重启的期间生产者消息投递失败,导致消息丢失,需要手动处理恢复。那么如何才能进行rabbitmq的消息可靠性投递?特别是在极端的情况,rabbitmq集群不可用…