一、定义
数组(Array)是一种用连续的内存空间存储相同数据类型数据的线性数据结构。
二、内存结构
1.创建数组
我们创建一个数组 int[] array = {22,33,88,66,55,25} ,在内存结构如下图所示:
首先创建了array数组,会在堆内存开辟一个连续的存储空间,因为我们定义的是int类型,所以是占4个字节。然后会在栈内存定义变量array,变量array会指向数组的首地址,这里指向0x1110。
2.查找数组元素
(1)查找方法
在java中就是通过下标来获取,比如获取array[1],就是数组的第二个元素。那在内存是怎么找到的呢?
寻址公式:a[i] = baseAddress + i * dataTypeSize。
baseAddress: 数组的首地址。
dataTypeSize:代表数组中元素类型的大小,int型的数据,dataTypeSize=4个字节。
例如,找88这个元素,a[2]=10+2*4=18,就找到该元素的首地址了。
(2)为什么索引从0开始
如果数组的索引从1开始,寻址公式中,就需要增加一次减法操作,对于CPU来说就多了一次指令,性能不高。
3.总结
1. 在根据数组索引获取元素的时候,会用索引和寻址公式来计算内存所对应的元素数据,寻址公式是:数组的首地址+索引乘以存储数据的类型大小。
2. 如果数组的索引从1开始,寻址公式中,就需要增加一次减法操作,对于CPU来说就多了一次指令,性能不高。
三、时间复杂度
1.随机查询(根据索引查询)
数组元素的访问是通过下标来访问的,计算机通过数组的首地址和寻址公式能够很快速的找到想要访问的元素。所以时间复杂度就是O(1)。
public int test01(int[] a,int i){ return a[i];
}
2.未知索引查询
(1)情况一
我们在查找数组内的元素,查找55号数据时,是直接去循环一个一个找的,没有排序。如果第一次就找到,时间复杂度是O(1),最后才找到的,时间复杂度是O(n),所以平均时间复杂度就是O(n)。时间复杂度的计算可以看我之前的帖子。
(2)情况二
我们先排序好数组内的元素,再去查找55号数据。我们使用二分查找的方法,第一次找到22,发现比55小,然后只看剩下的,再查找就可以找到55这个元素了,每找一次,可以减少一半的元素,也就是,其中i是执行的次数,所以时间复杂度就是O()。
3.插入、删除
数组是一段连续的内存空间,因此为了保证数组的连续性会使得数组的插入和删除的效率变的很低。
假设数组的长度为 n,现在如果我们需要将一个数据插入到数组中的第 k 个位置。为了把第 k 个位置腾出来给新来的数据,我们需要将第 k~n 这部分的元素都顺序地往后挪一位。
同理可得:如果我们要删除第 k 个位置的数据,为了内存的连续性,也需要搬移数据,不然中间就会出现空洞,内存就不连续了,时间复杂度仍然是O(n)。
最好情况下是O(1)的,最坏情况下是O(n)的,平均情况下的时间复杂度是O(n)。
四、总结
1. 数组(Array)是一种用连续的内存空间存储相同数据类型数据的线性数据结构。
2. 数组下标为什么从0开始? 寻址公式是:baseAddress+ i * dataTypeSize,计算下标的内存地址效率较高。
3. 随机(通过下标)查询的时间复杂度是O(1) ,查找元素(未知下标)的时间复杂度是O(n) ,查找元素(未知下标但排序)通过二分查找的时间复杂度是O(logn)。
4. 插入和删除的时候,为了保证数组的内存连续性,需要挪动数组元素,平均时间复杂度为O(n)。