计算模型 观察分析 杂记

计算模式

        计算模式通常指的:用特定计算资源完成特定计算任务所采用的计算策略。计算资源主要指运算器和存储器,当然若其他设备影响因素较大的情况下也考虑控制器,输入输出设备;计算任务多种多样,可以是简单的加减乘除,也可以是稍复杂的向量运算,矩阵运算等。
        计算模式的演变动力通常来自于人类日益增长的计算任务需求和明显紧缺的计算资源之间的矛盾,正是这种矛盾的推动,才导致了从CPU到GPU,再到NPU等专用芯片的发展势头。进一步说,正是由于单体计算遇到的性能造价上的性价比瓶颈,才造就了异构并行计算的流行。
        显而易见,人类目前能掌握和利用的微观技术是存在极限的,毕竟和之前芯片几十上百纳米的芯片工艺进展处境不同,当前几纳米级别的芯片制造技术要想单体计算性能几倍十几倍的增加,对应的造价可能就会几十倍上百倍的增加,而这样的处境还不如多造几个计算单体。因此,在没有进一步的单体计算硬件技术的大进步,大概率多体并行计算会是大趋势。
        换句话说,类似GPU的发展前景相对CPU要好很多。当然如果量子计算机和生物计算机等更高效的单体计算形式出现后,或许芯片硬件发展的重心估计又会重回单体计算。

计算顺序

        "计算顺序"是指执行计算任务或操作时的顺序。它决定了计算过程中每个步骤的执行顺序和相互关系。计算顺序可以是线性的,按照一定的顺序依次执行,也可以是并行的,同时执行多个计算任务。在编程和算法设计中,确定良好的计算顺序是非常重要的,因为它直接影响到程序的正确性和效率。
        对于一个具体的计算任务而言,如果让其按部就班的顺序执行计算,那么就是一种串行计算顺序;如果对其进行特定的划分成为多个比较独立的子任务,然后分别计算时,这种方式便是并行计算。在没有针对的具体计算任务而言,串行计算和并行计算不存在优劣之分。当前并行计算的流行,只是技术水平和流行任务的时代缩影罢了。
        串行计算按照顺序执行,通常比较直观,易于理解和编写代码,不涉及多个任务之间的同步和竞争条件,因此避免了并发问题。串行计算只能依次执行每个任务,无法充分利用多核处理器或并行计算资源,因此在并行任务和相同造价的硬件条件下效率相对较低,对于处理大规模数据或复杂任务,串行计算可能会导致计算时间过长。
        并行计算能够同时执行多个任务或多个子任务,充分利用多核处理器或并行计算资源,因此可以显著提高计算效率,并行计算能够有效处理大规模数据或复杂任务,加速计算过程。但是并行计算涉及任务之间的同步、通信和数据共享等问题,编写并行程序相对复杂,容易引入错误和调试困难,并行计算涉及任务之间的同步、通信和数据共享等问题,编写并行程序相对复杂,容易引入错误和调试困难。
        选择串行计算还是并行计算取决于任务的性质、数据规模、计算资源等因素。通常情况下,对于小规模数据或简单任务,串行计算可能更适合;而对于大规模数据或复杂任务,使用并行计算能够更好地发挥计算资源的性能优势。

计算分配

        给定计算任务和计算资源后,使用何种策略去完成任务有时候不一定简单。计算策略的选择可以根据问题的性质、数据的特点、计算资源的限制以及求解目标等因素来确定。
        如果是从任务划分和资源分配的角度分析,计算分配大概有三种模式:流水线模式的流水计算,多线程模式的共享计算,多进程模式的分布计算
        倘若计算任务可划分为多个阶段,各个阶段之间的依赖关系较弱,那么可以各个任务阶段分配固定的计算资源,并以流水线的方式合作完成计算任务,比较典型的就是CPU内部的指令流水线,从这个角度看CPU内部分工存在一定的并行计算味道。如果计算任务存在相当多的逻辑关联和依赖,那么合适的办法就是采用多线程的那种共享计算,即存储器是共享的,处理器也是共享的,要使用的时候可以按照时间片轮流着使用,彼此之间使用同步机制合作。
        但是如果计算任务可以划分为比较独立的多个部分,那么适合每部分独享私有的计算资源,完成计算任务后进行统一汇总。这种情况不太适合共享模式,因为同步机制的问题可能造成处理器调度的资源浪费。比较典型的例子就是GPU的工作模式,它内部存在相当多的独立计算资源单位,用以完成任务的独立部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/791245.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

动态规划基础

动态规划 1、动态规划的概念 简称DP,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。常常适用于有重叠子问题和最优子结构性质的问题。 简单来说,就是给定一个问题,把它拆成一个个子问题,查到子问题可以直接解决。然后把子问题答案保存起来,以减少重复计算…

Flink SQL系列之:解析Debezium数据格式时间字段常用的函数

Flink SQL系列之:解析Debezium数据格式时间字段常用的函数 一、FROM_UNIXTIME二、DATE_FORMAT三、TO_DATE四、CAST五、TO_TIMESTAMP_LTZ六、CONVERT_TZ七、FROM_UNIXTIME八、TO_TIMESTAMP九、常见用法案例1.案例一2.案例二3.案例三4.案例四5.案例五

C/C++ 项目:分别用精密星历和广播星历计算卫星坐标

文章目录 Part.I IntroductionChap.I rinex.hChap.II gmain_body.h Part.II 使用方法扩展阅读 Part.I Introduction 本文将介绍一个小项目的使用方法,此项目可用精密星历和广播星历计算卫星位置,并将两者结果做差,输出至文件。 其实 『分别…

SWM341系列应用(上位机应用)

SWM341系列之上位机应用 1、分级图像和PNG、JPG的应用 现象:客户使用SWM34SVET6HMI_0.4.1版本上位机进行UI界面布局,反馈在模拟运行时(PC端)流畅,在Demo平台(设备端)运行卡顿。 分析及解决&…

【fastadmin】脚本模式下,日志钩子函数执行出现死循环,导致内存溢出奔溃

问题出现原因是想对项目中error级别的日志,接入钉钉告警,方便查看 于是使用钩子方法,日志写入完成后,自动调用自定义的告警方法中 1、在application/tags.php 中添加log_write_done > [app\\common\\behavior\\Common, ],2、在…

【THM】Nmap Post Port Scans(后端口扫描)-初级渗透测试

介绍 本房间是 Nmap 系列的最后一个(网络安全简介模块的一部分)。在这个房间中,我们重点关注端口扫描之后的步骤:特别是服务检测、操作系统检测、Nmap脚本引擎和保存扫描结果。 Nmap实时主机发现Nmap基本端口扫描Nmap高级端口扫描Nmap后端口扫描在本系列的第一个房间中,我…

ZJGSU 1858在数组中查找两个数之和等于输入的另一个数

描述 题目:输入一个已经按升序排序过的数组和一个数字, 在数组中查找两个数,使得它们的和正好是输入的那个数字。如果有多对数字的和等于输入的数字,输出任意一对即可。 例如输入数组1、2、4、7、11、15和数字15。由于41115&…

代码随想录第29天|491.递增子序列 46.全排列 47.全排列 II

目录: 491.递增子序列 46.全排列 47.全排列 II 491.递增子序列 491. 非递减子序列 - 力扣(LeetCode) 代码随想录 (programmercarl.com) 回溯算法精讲,树层去重与树枝去重 | LeetCode:491.递增子序列_哔哩哔哩_bili…

DTFT及其反变换的直观理解

对于离散时间傅里叶变换(DTFT)及其反变换的讲解,教材里通常会先给出DTFT正变换的公式,再举个DTFT的简单变换例子,推导一下DTFT的性质,然后给出DTFT反变换的公式,再证明一下正变换和反变化的对应关系。总的来说就是&…

Spring-IoC 基于xml管理

现大多使用注解方式,xml方式并不简洁,本文仅记录xml用作基础学习。 0、前提 首先在父项目的pom.xml中配置好依赖们。然后子模块也可以使用这些依赖。 在resource目录下创建Spring的xml文件,名称无要求,本文使用bean.xml。文件最…

黄锈水过滤器 卫生热水工业循环水色度水处理器厂家工作原理动画

​ 1:黄锈水处理器介绍 黄锈水处理器是一种专门用于处理“黄锈水”的设备,它采用机电一体化设计,安装方便,操作简单,且运行费用极低。这种处理器主要由数码射频发生器、射频换能器、活性过滤体三部分组成,…

uniapp uni.scss中使用@mixin混入,在文件引入@include 样式不生效 Error: Undefined mixin.(踩坑记录一)

问题: 在uni.scss文件定义mixin 2. 在vue文件引入: 3. 出现报错信息: 4. 问题思考: 是不是需要引入uni.scss ? 答案不需要 uni.scss是一个特殊文件,在代码中无需 import 这个文件即可在scss代码中使用这里的样式变量。uni-app的…

图像识别技术在体育领域的应用

图像识别技术在体育领域的应用是一个充满创新和挑战的研究方向。随着计算机视觉和人工智能技术的快速发展,图像识别技术已经在体育领域展现出广泛的应用潜力和实际价值。以下是一些图像识别技术在体育领域的具体应用: 运动员表现分析: 图像识…

原创【matcap材质在ue4中的实现办法】

matcap材质在ue4中的实现办法 2023-08-29 15:34 https://www.bilibili.com/video/BV1GR4y1b76n/?spm_id_from333.337.search-card.all.click&vd_sourced76b773892c830a157c0ccc97ba78411 评论(0)

《C Prime Plus》02

1. UNIX 系统 C语言因UNIX系统而生,也因此而流行,所以我们从UNIX系统开始(注意:我们提到的UNIX还包含其他系统,如FreeBSD,它是UNIX的一个分支,但是由于法律原因不使用该名称)。 UN…

【运输层】网络数据报协议 UDP

目录 1、UDP 的特点 2、UDP 的首部格式 UDP 只在 IP 协议之上增加了很少的一些功能,比如复用、分用以及差错检测等。 1、UDP 的特点 UDP是无连接的,即发送数据之前不需要建立连接,因此减少了开销和发送数据之前的时延。 UDP使用尽最大努力…

等差数列(蓝桥杯,acwing每日一题)

题目描述: 数学老师给小明出了一道等差数列求和的题目。 但是粗心的小明忘记了一部分的数列,只记得其中 N 个整数。 现在给出这 N 个整数,小明想知道包含这 N 个整数的最短的等差数列有几项? 输入格式: 输入的第一…

基于vscode Arduino插件开发Arduino项目

基于vscode Arduino插件开发arduino项目 插件配置问题记录1. 指定编译输出文件夹2. 编译下载时不输出详细信息3. 输出端口信息乱码4. 通过串口输出中文,vscode对应的串口助手上会显示乱码(未解决) 插件配置 环境:Arduino插件版本…

苏州金龙助力旅游客运加速蜕变

近日,北京铭悦旅游客运有限公司又迎来一批苏州金龙海格纯电动客车。(以下简称北京铭悦旅游)总经理郭保生在车辆交付时说到,“为迎接强劲复苏的旅游市场,要求旅游客运向绿色客运转型,以及人民对品质生活、美…

【LeetCode热题100】51. N 皇后(回溯)

一.题目要求 按照国际象棋的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。 n 皇后问题 研究的是如何将 n 个皇后放置在 nn 的棋盘上,并且使皇后彼此之间不能相互攻击。 给你一个整数 n ,返回所有不同的 n 皇后问题 的解决方…