2019独角兽企业重金招聘Python工程师标准>>>
定义
定义:
- 若存在正常数 c 和 n<sub>0</sub> 使得当 N ≥ n<sub>0</sub> 时 T(N) ≤ cf(N),则记为
T(N) = O(f(N))
- 若存在正常数 c 和 n<sub>0</sub> 使得当 N ≥ n<sub>0</sub> 时 T(N) ≥ cf(N),则记为
T(N) = Ω(f(N))
T(N) = θ(h(N))
当且仅当T(N) = O(h(N))
且T(N) = Ω(h(N))
- 若
T(N) = O(p(N))
且T(N) != θ(p(N))
, 则T(N) = o(p(N))
法则:
-
若 T<sub>1</sub>(N) = O(f(N)) 且 T<sub>2</sub>(N)=O(g(N)),则:
a. T<sub>1</sub>(N) + T<sub>2</sub>(N) = max(O(f(N)), O(g(N)))b. T<sub>1</sub>(N) * T<sub>2</sub>(N) = O(f(N) * g(N))
-
若 T(N) 是一个 k 次多项式,则 T(N) = Θ(N<sup>k</sup>)
-
对任意常数 k,log<sup>k</sup>N = O(N)
注意:
- 不要将常数或低阶项放入 O() ,在 O 分析中,低阶项和常数一般可以忽略。
- 总能够通过计算 n→∞ 时 f(N)/g(N) 的极限来确定这两个函数的相对增长率。
最大子序列问题
可以分段读入数据并处理问题的算法称为 online algrithm
,与之相对,在运算开始时就需要读入全部数据做运算的算法称为 offline algrithm
。仅需要常量内存空间并以线性时间运行的算法几乎是完美的算法。如下例最大子序列问题:
lang:python
data = list(range(-10, 10))
random.shuffle(data)# 算法
def foo(data):this_sum = max_sum = 0for i in data:this_sum += iif this_sum < 0:this_sum = 0elif this_sum > max_sum:max_sum = this_sumreturn max_sum
对数
如果一个算法用常数时间(O(1) )将问题的大小削减为其一部分(通常是 1/2),那么该算法就是 O(logN)。
如果一个算法可以用常数时间把问题减小一个常数,那么他就是 O(N) 的。
对数复杂度的一个典型例子是:二分法查找 (binary search)
def bin_search(numbers, x):"""假设 numbers 已排序"""start = 0end = len(numbers) - 1while start < end:middle = (start + end) / 2if numbers[middle] < x:start = middle + 1elif numbers[middle] > x:end = middle - 1else:return middlereturn -1
欧几里得算法
计算最大公因数:
def gcd(a, b):while b > 0:a = a % ba, b = b, areturn a
定理:
若 M > N, 则 M mod N < M/2
推得:gcd 函数的时间复杂度是 O(log N) 的
幂运算
优化算法的一个原则是:不要做重复的运算。
因此对于幂运算 x<sup>n</sup>,相较于进行 n-1 次乘法,下面的算法效率更高:
def pow(x, n):if n == 0:return 1if n == 1:return nif n % 2 == 0:return pow(x * x, n / 2)else:return x * pow(x * x, (n-1) / 2)
检验算法时间
python 中可以用 timeit.timeit 函数方便的检验算法时间
timeit(stmt='pass', setup='pass', timer=<built-in function perf_counter>,number=1000000, globals=None)
其中:
* stmt statement 是一个字符串表达式
* setup 是一个执行前置语句,如 import
* globals 是一个字典,存放你要使用的全局变量
如,我们要测试 gcd 函数,则
import timeit
timeit.timeit('gcd(15, 234)', globals={'gcd': gcd})