复杂度分析

一、什么是复杂度分析

  1. 数据结构和算法解决是“如何让计算机更快时间、更省空间的解决问题”。
  2. 因此需从执行时间和占用空间两个维度来评估数据结构和算法的性能。
  3. 分别用时间复杂度和空间复杂度两个概念来描述性能问题,二者统称为复杂度。
  4. 复杂度描述的是算法执行时间(或占用空间)与数据规模的增长关系。

二、为什么需要复杂度分析?

  1. 和性能测试相比,复杂度分析有不依赖执行环境、成本低、效率高、易操作、指导性强的特点。
  2. 掌握复杂度分析,将能编写出性能更优的代码,有利于降低系统开发和维护成本。

三、如何进行复杂度分析?

大 O 表示法

  • 来源: 算法的执行时间与每行代码的执行次数成正比,用 T(n) = O(f(n)) 表示,其中 T(n)表示算法执行总时间,f(n)表示每行代码执行总次数,而 n 往往表示数据的规模。
  • 特点: 以时间复杂度为例,由于时间复杂度描述的是算法执行时间与数据规模的增长变化趋势,所以 常量阶、低阶以及系数 实际上对这种增长趋势不产决定性影响,所以在做时间复杂度分析时忽略这些项。

复杂度分析法则

  1. 单段代码看高频:比如循环。
  2. 多段代码取最大:比如一段代码中有单循环和多重循环,那么取多重循环的复杂度。
  3. 嵌套代码求乘积:比如递归、多重循环等
  4. 多个规模求加法:比如方法有两个参数控制两个循环的次数,那么这时就取二者复杂度相加。

四、常用的复杂度级别?

多项式阶:随着数据规模的增长,算法的执行时间和空间占用,按照多项式的比例增长。包括,

  • O(1)(常数阶)
  • O(logn)(对数阶)
  • O(n)(线性阶)
  • O(nlogn)(线性对数阶)
  • O(n^2)(平方阶)
  • O(n^3)(立方阶)

非多项式阶:随着数据规模的增长,算法的执行时间和空间占用暴增,这类算法性能极差。包括,

  • O(2^n)(指数阶)
  • O(n!)(阶乘阶)

五、复杂度分析的 4 个概念

  1. 最坏情况时间复杂度:代码在最理想情况下执行的时间复杂度。
  2. 最好情况时间复杂度:代码在最坏情况下执行的时间复杂度。
  3. 平均时间复杂度:用代码在所有情况下执行的次数的加权平均值表示。
  4. 均摊时间复杂度:在代码执行的所有复杂度情况中绝大部分是低级别的复杂度,个别情况是高级别复杂度且发生具有时序关系时,可以将个别高级别复杂度均摊到低级别复杂度上。基本上均摊结果就等于低级别复杂度。

六、为什么要引入这 4 个概念?

  1. 同一段代码在不同情况下时间复杂度会出现量级差异,为了更全面,更准确的描述代码的时间复杂度,所以引入这 4 个概念。
  2. 代码复杂度在不同情况下出现量级差别时才需要区别这四种复杂度。大多数情况下,是不需要区别分析它们的。

七、如何分析平均、均摊时间复杂度?

平均时间复杂度: 代码在不同情况下复杂度出现量级差别,则用代码所有可能情况下执行次数的加权平均值表示。

均摊时间复杂度: 两个条件满足时使用:

  • 代码在绝大多数情况下是低级别复杂度,只有极少数情况是高级别复杂度;
  • 低级别和高级别复杂度出现具有时序规律。均摊结果一般都等于低级别复杂度。

最后更新: 2020-02-21

评论