99%算法工程师不知道的if/else优化技巧

文 | IT技术控@知乎、灵剑@知乎

观点一(IT技术控)

前期迭代懒得优化,来一个需求,加一个if,久而久之,就串成了一座金字塔。

当代码已经复杂到难以维护的程度之后,只能狠下心重构优化。那,有什么方案可以优雅的优化掉这些多余的if/else?

1. 提前return

这是判断条件取反的做法,代码在逻辑表达上会更清晰,看下面代码:

if (condition) { // do something
} else {return xxx;
}

其实,每次看到上面这种代码,我都心里抓痒,完全可以先判断!condition,干掉else。

if (!condition) {  return xxx;
} 
// do something

2. 策略模式

有这么一种场景,根据不同的参数走不同的逻辑,其实这种场景很常见。
最一般的实现:

if (strategy.equals("fast")) {  // 快速执行
} else if (strategy.equals("normal")){  // 正常执行
} else if (strategy.equals("smooth")){ // 平滑执行
} else if (strategy.equals("slow")){  // 慢慢执行
}

看上面代码,有4种策略,有两种优化方案。

2.1 多态

interface Strategy {void run() throws Exception;
}
class FastStrategy implements Strategy {@Overridevoid run() throws Exception {// 快速执行逻辑}
}
class NormalStrategy implements Strategy {@Overridevoid run() throws Exception {// 正常执行逻辑}
}
class SmoothStrategy implements Strategy {@Overridevoid run() throws Exception {// 平滑执行逻辑}
}
class SlowStrategy implements Strategy {@Overridevoid run() throws Exception {// 慢速执行逻辑}
}

具体策略对象存放在一个Map中,优化后的实现

Strategy strategy = map.get(param);
strategy.run();

上面这种优化方案有一个弊端,为了能够快速拿到对应的策略实现,需要map对象来保存策略,当添加一个新策略的时候,还需要手动添加到map中,容易被忽略。

2.2 枚举

发现很多同学不知道在枚举中可以定义方法,这里定义一个表示状态的枚举,另外可以实现一个run方法。

public enum Status {NEW(0) {@Overridevoid run() {//do something  }},RUNNABLE(1) {@Overridevoid run() {//do something  }};public int statusCode;abstract void run();Status(int statusCode){this.statusCode = statusCode;}
}

重新定义策略枚举

public enum Strategy {FAST {@Overridevoid run() {//do something  }},NORMAL {@Overridevoid run() {//do something  }},SMOOTH {@Overridevoid run() {//do something  }},SLOW {@Overridevoid run() {//do something  }};abstract void run();
}

通过枚举优化之后的代码如下

Strategy strategy = Strategy.valueOf(param);
strategy.run();

3. 学会使用 Optional

Optional主要用于非空判断,由于是jdk8新特性,所以使用的不是特别多,但是用起来真的爽。

使用之前:

if (user == null) {//do action 1
} else {//do action2
}

如果登录用户为空,执行action1,否则执行action 2,使用Optional优化之后,让非空校验更加优雅,间接的减少if操作

Optional<User> userOptional = Optional.ofNullable(user);
userOptional.map(action1).orElse(action2);

4. 数组小技巧

来自google解释,这是一种编程模式,叫做表驱动法,本质是从表里查询信息来代替逻辑语句,比如有这么一个场景,通过月份来获取当月的天数,仅作为案例演示,数据并不严谨。

一般的实现:

int getDays(int month){if (month == 1)  return 31;if (month == 2)  return 29;if (month == 3)  return 31;if (month == 4)  return 30;if (month == 5)  return 31;if (month == 6)  return 30;if (month == 7)  return 31;if (month == 8)  return 31;if (month == 9)  return 30;if (month == 10)  return 31;if (month == 11)  return 30;if (month == 12)  return 31;
}

优化后的代码

int monthDays[12] = {31, 29, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31};
int getDays(int month){return monthDays[--month];
}

结束

if else作为每种编程语言都不可或缺的条件语句,在编程时会大量的用到。一般建议嵌套不要超过三层,如果一段代码存在过多的if else嵌套,代码的可读性就会急速下降,后期维护难度也大大提高。

观点二(灵剑)

不要去过度关注if/else的层数,而要关注接口语义是否足够清晰;单纯减少if/else的层数,然后拆出一堆do_logic1, do_logic2…这样的接口是毫无帮助的。

任何一个接口的执行过程都可以表示为:输入 + 内部状态 -> 输出这样的形式,我们分以下几种情况来讨论:

  1. 输入、内部状态、输出都很简单,但中间逻辑复杂。比如说一个精心优化过的数值计算程序,可能需要根据输入在不同的取值范围采取不同的策略,还有很多逻辑用来处理会引发问题(比如除0)的边界值,这种情况下if/else数量多是难以避免的,根据步骤拆分出一些内部方法有一定帮助,但也不能完全解决问题。这种情况下最好的做法是写一篇详细的文档,从最原始的数学模型开始,然后表明什么情况下采取什么样的计算策略,策略如何推导,知道得到代码中使用的具体形式,然后给整个方法加上注释附上文档地址,并且在每个分支的地方加上注释指明对应到文档中哪个公式。这种情况下虽然方法很复杂,但是语义是清晰的,如果不修改实现的话理解语义就行了,如果要修改实现那么需要参考对照文档中的公式。

  2. 输入过于复杂,比如输入带有一堆不同的参数,或者有各种奇怪的flag,每个flag有不同作用。这种情况下首先需要提高接口的抽象层次:如果接口有多个不同作用,需要拆分成不同接口;如果接口内部根据不同参数进不同分支,需要将这些参数和对应分支包在Adapter里,使用参数的地方改写成Adapter的接口,根据传入的Adapter类型不同进入不同的实现;如果接口内部有复杂的参数转换关系,需要改写成查找表。这种情况下的主要问题是接口本身抽象的有问题,有更清晰的抽象之后,实现也自然没有那么多if/else了。

  3. 输出过于复杂,为了省事一个过程计算出了太多东西,又为了性能加了一堆flag控制是否计算之类。这种情况下需要果断将方法拆分成多个不同方法,每个方法只返回自己需要的内容。如果不同计算之间有共用的内部结果呢?如果这个内部结果计算并不形成瓶颈,只要提取出内部方法然后在不同过程中分别调用即可;如果希望避免重复计算,可以增加一个额外的cache对象作为参数,cache内容对用户不透明,用户只保证相同输入使用同一个cache对象即可,在计算中将中间结果保存到cache中,下次计算前先检查有没有已经得到的结果,就可以避免重复计算了。

  4. 内部状态过于复杂。首先检查状态设置的是否合理,是不是有一些本来应该作为输入参数的东西被放到了内部状态中(比如用来隐式地在两个不同方法调用之间传递参数)?其次,这些状态分别控制哪些方面,是否可以分组然后实现到不同的StateManager里面?第三,画出状态转移图,尝试将内部状态分成单层分支,然后分别实现到on_xxx_state这样的方法里面,然后通过单层的switch或者查找表来调用。

其实通常需要优化的都是整体接口抽象,而不是单个接口的实现,单个接口实现不清晰通常是因为接口实现和需求不同构造成的。

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478509.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能在线特征系统中的生产调度

在上篇博客《人工智能在线特征系统中的数据存取技术》中&#xff0c;我们围绕着在线特征系统存储与读取这两方面话题&#xff0c;针对具体场景介绍了一些通用技术&#xff0c;此外特征系统还有另一个重要话题&#xff1a;特征生产调度。本文将以美团点评酒旅在线特征系统为原型…

LeetCode 211. 添加与搜索单词 - 数据结构设计(Trie树)

1. 题目 设计一个支持以下两种操作的数据结构&#xff1a; void addWord(word) bool search(word) search(word) 可以搜索文字或正则表达式字符串&#xff0c;字符串只包含字母 . 或 a-z 。 . 可以表示任何一个字母。 示例: addWord("bad") addWord("dad&quo…

研究综述 - TKDE2020 | 基于知识图谱的推荐系统

作者 | 郭庆宇转载公众号 | 读芯术TKDE 2020综述&#xff1a;基于知识图谱的推荐系统A Survey on Knowledge Graph-Based Recommender Systems中科院计算所、百度、港科大、中科大、微软原文Qingyu Guo, Fuzhen Zhuang, Chuan Qin, Hengshu Zhu, Xing Xie, Hui Xiong, Qing He…

谢撩,人在斯坦福打SoTA

文 | Jazon编 | 小戏小编注&#xff1a;不知道大家还记不记得卖萌屋之前人在斯坦福&#xff0c;刚上CS224n的Jazon小哥发来的关于斯坦福神课CS224n上半学期的报道&#xff1f;今天&#xff0c;Jazon又在斯坦福前线发来了关于他在CS224n下半学期的经历&#xff0c;那么现在让我们…

前端感官性能的衡量和优化实践

本文已发表在2017年8月《程序员》杂志。 我们为什么需要关注站点的性能&#xff0c;性能为什么如此重要呢&#xff1f;如今任何互联网产品首先重要的都是流量&#xff0c;流量最终会转换为商业价值。所以在互联网产品中&#xff0c;流量、转化率和留存率基本上是产品经理或者业…

LeetCode 421. 数组中两个数的最大异或值(Trie树)

1. 题目 给定一个非空数组&#xff0c;数组中元素为 a0, a1, a2, … , an-1&#xff0c;其中 0 ≤ ai < 231 。 找到 ai 和aj 最大的异或 (XOR) 运算结果&#xff0c;其中0 ≤ i, j < n 。 你能在O(n)的时间解决这个问题吗&#xff1f; 示例:输入: [3, 10, 5, 25, 2,…

论文浅尝 - EMNLP2020 | 基于知识库的多跳关系推理

笔记整理 | 谢辛&#xff0c;浙江大学硕士研究方向 | 自然语言处理&#xff0c;知识图谱Feng Y, Chen X, Lin B Y, et al. Scalable multi-hop relational reasoning for knowledge-aware question answering[J]. 2020.emnlp-main.99链接&#xff1a;https://arxiv.org/pdf/200…

智能工单处理,达观数据助力运营商实现业务流程智能化改造

智能工单处理&#xff0c;达观数据助力运营商实现业务流程智能化改造 https://m.sohu.com/a/466386308_383123 智能工单处理&#xff0c;达观数据助力运营商实现业务流程智能化改造 达观数据 05-14 14:04 订阅 运营商一线业务运营亟待智能化改造 近几年&#xff0c;运营商领域…

CV和NLP中的无监督预训练(生成式BERT/iGPT和判别式SimCLR/SimCSE)

文 | Smarter在之前的文章中讲过unsupervised learning主要分为生成式和判别式&#xff0c;那么unsupervised pretrain自然也分为生成式和判别式。目前CV和NLP都出现了非常强大的无监督预训练&#xff0c;并且在生成式和判别式都各有造诣&#xff0c;本文主要想归纳一下CV和NLP…

Android Binder漏洞挖掘技术与案例分享

本文由作者根据其在KCon 2016黑客大会上的演讲内容整理而成。演讲稿链接&#xff1a;Binder fuzzing based on drozer。 文章开始&#xff0c;先来看几个我在工作生活中发现的Android漏洞。其中包括Android系统锁屏密码绕过&#xff08;影响了所有安全补丁在2016年10月份以前的…

Transformer太深不行?NUS字节发现注意力坍缩,提出重注意机制!

文 | 陈萍、杜伟源 | 机器之心CNN 通过堆叠更多的卷积层来提高性能&#xff0c;而 transformer 在层次更深时会很快进入饱和。基于此&#xff0c;来自新加坡国立大学和字节跳动 AI Lab 的研究者引入了 Re-attention 机制&#xff0c;以很小的计算代价重新生成注意力图以增强各层…

LeetCode 212. 单词搜索 II(Trie树+DFS)

1. 题目 给定一个二维网格 board 和一个字典中的单词列表 words&#xff0c;找出所有同时在二维网格和字典中出现的单词。 单词必须按照字母顺序&#xff0c;通过相邻的单元格内的字母构成&#xff0c;其中“相邻”单元格是那些水平相邻或垂直相邻的单元格。同一个单元格内的…

研究综述 | 多关系知识图谱表示学习综述

作者 | CHEONG转载自公众号 | 机器学习与自然语言处理本文分享一篇多关系知识图谱表示学习汇报ppt&#xff0c;介绍近几年及2020新出的共七篇处理异质图的模型。先列出该汇报ppt中将要介绍的七篇论文&#xff1a;Motivation异质知识图谱研究的对象便是如何处理多关系知识图谱&a…

PaddleHub教程合集

原文链接&#xff1a;https://aistudio.baidu.com/aistudio/projectdetail/2168053 PaddleHub教程合集 PaddleHub是基于PaddlePaddle生态下的预训练模型管理和迁移学习工具&#xff0c;可以结合预训练模型更便捷地开展迁移学习工作。通过PaddleHub&#xff0c;您可以&#xff1…

人物志 | KDD Cup 2017双料冠军燕鹏

2017年数据挖掘领域最有影响力的赛事KDD Cup近日揭晓&#xff0c;Convolution队从全球70个国家的3582支队伍里脱颖而出&#xff0c;包揽两项任务的冠军。这支双料冠军队成员名单里&#xff0c;有一个我们熟悉的名字——美团点评高级技术专家燕鹏。 说燕鹏可能大家并不一定知道&…

论文浅尝 - IJCAI2020 | KGNN:基于知识图谱的图神经网络预测药物与药物相互作用...

转载公众号 | AI TIME 论道药物间相互作用&#xff08;DDI&#xff09;预测是药理学和临床应用中一个具有挑战性的问题&#xff0c;在临床试验期间&#xff0c;有效识别潜在的DDI对患者和社会至关重要。现有的大多数方法采用基于AI的计算模型&#xff0c;通常倾向于集成多个数…

LeetCode 79. 单词搜索(回溯DFS)

1. 题目 给定一个二维网格和一个单词&#xff0c;找出该单词是否存在于网格中。 单词必须按照字母顺序&#xff0c;通过相邻的单元格内的字母构成&#xff0c;其中“相邻”单元格是那些水平相邻或垂直相邻的单元格。同一个单元格内的字母不允许被重复使用。 示例: board [[…

中文BERT上分新技巧,多粒度信息来帮忙

文 | ????????????????自然语言处理实在是太难啦&#xff01;中文尤其难&#xff01;相比于英文&#xff0c;中文是以词作为语义的基本单位的&#xff0c;因此传统的中文 NLP 都需要先进行分词。分词这步就劝退了很多人&#xff0c;比如“研究生活很充实”&…

监控平台前端SDK开发实践

监控是提高故障处理能力和保障服务质量必需的一环&#xff0c;它需要负责的内容包括&#xff1a;及时上报错误、收集有效信息、提供故障排查依据。 及时上报错误&#xff1a;发生线上问题后&#xff0c;经由运营或者产品反馈到开发人员&#xff0c;其中流转过程可能是几分钟甚至…

论文浅尝 - WWW2020 | 通过对抗学习从用户—项目交互数据中挖掘隐含的实体偏好来用于知识图谱补全任务...

笔记整理 | 陈湘楠&#xff0c;浙江大学在读硕士。现有的知识图谱补全方法都在试图设计全新的学习算法&#xff0c;来使用已知的事实信息去推理知识图谱中的潜在语义。但随着知识图谱的广泛使用&#xff0c;知识图谱中的许多实体对应着应用程序系统的在线项目。但知识图谱和应用…