计算机系统基础 8 循环程序

概要

        两种实现方法——分支指令实现和专门的循环语句实现以及有关循环的优化。

分支指令实现

        倒计数

       ……

       MOV  ECX,循环次数

LOOPA:……

       ……

       DEC   ECX

       JNE   LOOPA     

        正计数 

       ……

       MOV  ECX,0

LOOPA

       ……

       INC  ECX

       CMP  ECX,  n

       JNE  LOOPA              

        循环次数不固定 

        比如要求一个以0为结束符的字符串的长度,需要通过指令来测试条件是否成立,决定继续循环还是结束循环。

下面例子(AX)中 1 出现的次数 -> CL     

MOV  CL, 0

L:  AND  AX , AX

    JZ   EXIT

    SAL  AX , 1

    JNC  L

    INC  CL

    JMP  L

EXIT:

或者这样

      MOV   CL,  0

      MOV   BX, 16

L:    SAL   AX , 1

      JNC   NEXT

      INC   CL

NEXT: DEC   BX

      JNZ   L

 专门的循环指令 

LOOP    标号

LOOPE   标号

LOOPNE  标号

JECXZ   标号

LOOP 

        ① (ECX) -1 ➡  ECX,

        ②若 (ECX)  不为0, 则转标号处执行。

    基本等价于: 

                  DEC   ECX

                  JNZ   标号

  (但LOOP指令对标志位无影响!)

LOOPE / LOOPZ 

        ①(ECX) - 1 ➡ ECX,

        ② 若(ECX)不为0, 且ZF=1,则转标号处执行。

   (等于或为0循环转移指令, 本指令对标志位无影响)

        32位段用 ECX16位段用 CX 

例:判断以BUF为首址的10个字节中是否有非0字节。

    有,则置ZF为0, 否则ZF置为1。                    

      MOV    ECX, 10

      MOV    EBX, OFFSET BUF -1

L3 :  INC    EBX

      CMP    BYTE PTR [EBX], 0

      LOOPE  L3

LOOPNE  / LOOPNZ  

        ①(ECX) -1 ➡ ECX

        ②若(ECX)≠0, 且ZF=0,则转标号处执行。

例:判断以MSG为首址的10个字节中的串中是否有空格字符。无空格字符,置ZF为0,否则为1。                               

       MOV     ECX,  10

       MOV     EBX,  OFFSET MSG -1

L4 :   INC     EBX

       CMP     BYTE PTR [EBX],‘ ’

       LOOPNE  L4

JECXZ  标号

     若 (ECX) 为0, 则转标号处执行。

    (先判断,后执行循环体时,可用此语句,标号为循环结束处)

 有关循环的优化方法

         循环展开

int  i = 0, sum = 0, a[5];

    ……

for  (i = 0; i < 5; i++)       sum += a[i];

Debug版本

00D71750  mov   dword ptr [i],0 

00D71757  jmp   f+62h (0D71762h) 

00D71759  mov   eax,dword ptr [i

00D7175C  add   eax,1 

00D7175F  mov   dword ptr [i],eax 

00D71762  cmp   dword ptr [i],5    

00D71766  jge   f+77h (0D71777h) 

00D71768  mov   eax,dword ptr [i]

00D7176B  mov   ecx,dword ptr [sum] 

00D7176E  add   ecx,dword ptr a[eax*4] 

00D71772  mov   dword ptr [sum],ecx 

00D71775  jmp   f+59h (0D71759h)

00D71777  // 循环结束

Release版本:

 mov  eax,dword ptr [ebp-8] 

 add  eax,dword ptr [ebp-0Ch] 

 add  eax,dword ptr [ebp-10h] 

 add  eax,dword ptr [ebp-14h] 

 add  eax,dword ptr [ebp-18h] 

 mov  sum, eax

若循环变量从5改为n

          mov  edi, sum  ; edi来存放 和

          xor  eax, eax  ; eax 对应 i

          mov  edx, n    ; edx 对应 n

          jmp  main+0C5h (05E1145h)

005E1140  add  edi,dword ptr [ebp+eax*4-18h] 

005E1144  inc  eax 

005E1145  cmp  eax,edx 

005E1147  jl   main+0C0h (05E1140h)

变量与寄存器绑定,语句数量大幅减少,循环部分由 10 条语句减为 4 条语句

        传输优化

#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>void main()
{
char  buf1[20];
char  buf2[20];
int   i;
scanf("%s", buf1); 
for (i = 0;i < 20;i++)buf2[i] = buf1[i];
printf("%s\n", buf2);
return;
}

for (i = 0;i < 20;i++)

buf2[i] = buf1[i];

printf("%s\n", buf2);

0025109E  mov         eax,dword ptr [ebp-8] 

002510A1  movups      xmm0,xmmword ptr [buf1] 

002510A5  mov         dword ptr [ebp-1Ch],eax 

002510A8  lea         eax,[buf2] 

002510AB  push        eax 

002510AC  push        offset string "%s\n" (0252104h) 

002510B1  movups      xmmword ptr [buf2],xmm0 

002510B5  call        printf (0251020h) 

可以看到,ebp - 8就是buf1+16

buf1 的前16个字节拷贝到 xmm0,后4个字节拷贝到 eax,再分别送到 buf2 相应位置

 但是像这种,就不好优化

void main()
{
char  buf1[20];
char  buf2[20];
int   i;
scanf("%s", buf1); 
……
printf("%s\n", buf2);
return;
}
void fcopy(char* dst, char* src)
{int i;for (i = 0;i < 20;i++){*dst = *src;dst++;src++;}
}

scanf("%s", buf1);

003D1090  lea         eax,[ebp-18h] 

003D1093  push        eax 

003D1094  push        3D2100h 

003D1099  call        003D1050 

003D109E  add         esp,8 

003D10A1  xor         eax,eax 

fcopy(buf1-20, buf1);

003D10A3  mov         cl,byte ptr [ebp+eax-18h] 

003D10A7  mov         byte ptr [ebp+eax-2Ch],cl 

003D10AB  inc         eax 

003D10AC  cmp         eax,14h 

003D10AF  jl          003D10A3 

printf("%s\n", buf2);

总结

编译优化

  • 循环展开:消除了循环
  • 与寄存器绑定:减少访存操作,减少指令
  • XMM寄存器、成组运算等,减少指令

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/840155.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

向郭老师学习研发项目管理

学习研发项目管理思路 通过以下思路来学习研发项目管理&#xff1a; 1、研发项目管理分3级 2、研发项目管理分4类 3、研发项目管理分5大过程组 4、新产品开发项目生命周期分6个阶段 5、研发项目管理分10大知识体系 项目组合、项目集、简单项目3级管理 针对Portfolio组合…

Nodejs及stfshow相关例题

Nodejs及stfshow相关例题 Node.js 是一个基于 Chrome V8 引擎的 Javascript 运行环境。可以说nodejs是一个运行环境&#xff0c;或者说是一个 JS 语言解释器而不是某种库。 Node.js可以生成动态页面内容Node.js 可以在服务器上创建、打开、读取、写入、删除和关闭文件Node.js…

解决无法启动Redis,打开redis-server闪退的问题

【问题】 ① 双击redis-server.exe闪退。 ② 终端运行redis-server没反应。 但是终端运行redis -cli没问题。 【解决方法】 步骤1&#xff1a;找到Redis文件夹&#xff0c;右击&#xff0c;在终端打开。 步骤2&#xff1a;输入命令&#xff1a;redis-server.exe redis.windows…

深入解析力扣161题:相隔为 1 的编辑距离(逐字符比较与动态规划详解)

❤️❤️❤️ 欢迎来到我的博客。希望您能在这里找到既有价值又有趣的内容&#xff0c;和我一起探索、学习和成长。欢迎评论区畅所欲言、享受知识的乐趣&#xff01; 推荐&#xff1a;数据分析螺丝钉的首页 格物致知 终身学习 期待您的关注 导航&#xff1a; LeetCode解锁100…

【简单介绍下爬山算法】

&#x1f308;个人主页: 程序员不想敲代码啊 &#x1f3c6;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f44d;点赞⭐评论⭐收藏 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共…

信息学奥赛初赛天天练-10-组合数学-排列组合-一次彻底搞懂分组分配问题

更多资源请关注纽扣编程微信公众号 平均分组 是指将所有的元素分成所有组元素个数相等或部分组元素个数相等&#xff0c;即m个不同的元素平均分成n个组&#xff0c;有多少种分组方法 由于是平均分组&#xff0c;分组选择元素时会出现重复&#xff0c;因此结果需要除以A(n,n…

代码随想录-算法训练营day46【动态规划08:单词拆分、多重背包!背包问题总结篇!】

代码随想录-035期-算法训练营【博客笔记汇总表】-CSDN博客 第九章 动态规划part08● 139.单词拆分 ● 关于多重背包&#xff0c;你该了解这些&#xff01; ● 背包问题总结篇&#xff01; 详细布置 关于 多重背包&#xff0c;力扣上没有相关的题目&#xff0c;所以今天大家的…

知了传课Flask学习(持续更新)

一、基础内容 1.Flask快速应用 pip install flask from flask import Flaskapp Flask(__name__)app.route(/) def index():return Hello worldif __name__ __main__:app.run() 2.debug、host、port配置 from flask import Flask,requestapp Flask(__name__)app.route(/) d…

【全部更新完毕】2024电工杯A题数学建模详细思路代码文章分享

A 题&#xff1a;园区微电网风光储协调优化配置 摘要 在全球范围内&#xff0c;气候变化和环境污染问题日益严重&#xff0c;减少碳排放和实现可持续发展成为各国的共同目标。新能源&#xff0c;尤其是风能和光伏发电&#xff0c;因其清洁、可再生的特性&#xff0c;正在全球范…

Golang | Leetcode Golang题解之第100题相同的树

题目&#xff1a; 题解&#xff1a; func isSameTree(p *TreeNode, q *TreeNode) bool {if p nil && q nil {return true}if p nil || q nil {return false}queue1, queue2 : []*TreeNode{p}, []*TreeNode{q}for len(queue1) > 0 && len(queue2) > …

nextcloud 安装部署

php版本不对 ubuntu nginx 配置php 网站-CSDN博客 抄自chatgpt ubuntu完全卸载干净某个包-CSDN博客 以及设置基本的php nginx环境参照上面两篇博文 然后参照官方文档 Example installation on Ubuntu 22.04 LTS — Nextcloud latest Administration Manual latest document…

5月30日在线研讨会 | 面向智能网联汽车的产教融合解决方案

随着智能网联汽车技术的快速发展&#xff0c;产业对高素质技术技能人才的需求日益增长。为了促进智能网联汽车行业的健康发展&#xff0c;推动教育链、人才链与产业链、创新链的深度融合&#xff0c;经纬恒润推出产教融合相关方案&#xff0c;旨在通过促进教育链与产业链的深度…

第八节 条件装配案例讲解

一、条件装配的作用是什么 条件装配是 Spring 框架中一个强大的特性&#xff0c;使得开发者能够创建更加灵活和可维护的应用程序。在 Spring Boot 中&#xff0c;这个特性被大量用于自动配置&#xff0c;极大地简化了基于 Spring 的应用开发。 二、条件装配注解 <dependen…

Function Calling 介绍与实战

functions 是 Chat Completion API 中的可选参数&#xff0c;用于提供函数定义。其目的是使 GPT 模型能够生成符合所提供定义的函数参数。请注意&#xff0c;API不会实际执行任何函数调用。开发人员需要使用GPT 模型输出来执行函数调用。 如果提供了functions参数&#xff0c;…

AIGC:AI整活!万物皆可建筑设计

在过去的一年里 AI设计爆火 各行业纷纷将之用于工作中 同时不少网友也在借助它整活 万物皆可设计 甲方骂我方案像屎一样 于是我就回馈他屎一样的方案 他有点惊喜&#xff0c;但是没话 不是吧&#xff0c;随便找了个充电头图片 也能生成建筑设计&#xff01;这都能行 鸟…

【spring】@CrossOrigin注解学习

CrossOrigin介绍 CrossOrigin 是 Spring Framework 中的一个注解&#xff0c;用于处理跨域资源共享&#xff08;CORS&#xff09;问题。CORS 是一种机制&#xff0c;它使用额外的 HTTP 头来告诉浏览器&#xff0c;让运行在一个 origin (domain) 上的Web应用被准许访问来自不同…

虹科Pico汽车示波器 | 免拆诊断案例 | 2017款奔驰E300L车行驶中发动机偶尔无法加速

故障现象 一辆2017款奔驰E300L车&#xff0c;搭载274 920发动机&#xff0c;累计行驶里程约为21万km。车主反映&#xff0c;该车行驶中发动机偶尔无法加速&#xff0c;且车辆发闯。 故障诊断 用故障检测仪检测&#xff0c;发动机控制单元&#xff08;N3/10&#xff09;中存储…

Labelme自定义数据集COCO格式【实例分割】

参考博客 labelme标注自定义数据集COCO类型_labelme标注coco-CSDN博客 LabelMe使用_labelme中所有的create的作用解释-CSDN博客 1制作自己的数据集 1.1labelme安装 自己的数据和上面数据的区别就在于没有.json标签文件&#xff0c;所以训练自己的数据关键步骤就是获取标签文…

Web3探索加密世界:空投常见类型有哪些?附操作教程

每种空投类型都有独特的特征和目的&#xff0c;我们需要了解不同类型的加密空投。本文给大家介绍的是流行的加密货币空投类型&#xff0c;以及一般空投是如何做的。感兴趣的话请看下去。 一、空投常见类型 1、持有者空投 持有者空投向钱包中持有一定数量数字货币的人免费发放…