文章目录
- 按索引排序——sort_index()
- 对Series排序
- 对DataFrame排序
- 按值排序——sort_value()
- 对Series进行排序
- 对DataFrame进行排序
按索引排序——sort_index()
sort_index(axis=0, level=None, ascending=True, inplace=False, kind=‘quicksort’, na_position=‘last’,sort_remaining=True)
上述方法中常用参数:
axis:轴索引(排序的方向),0表示按index,1表示按columns
level:若不为None,则对指定索引级别的值进行排序
ascending:是否升序排列,默认为True,表示升序
inplace:默认为False,表示对数据表进行排序,不创建新的实例
kind:选择排序算法
这里只举例kind参数的作用,其他参数在下文的应用中会被用到
arrays = [np.array(['qux', 'qux', 'foo', 'foo','baz', 'baz', 'bar', 'bar']),np.array(['two', 'one', 'two', 'one','two', 'one', 'two', 'one'])]
s = pd.Series([1, 2, 3, 4, 5, 6, 7, 8], index=arrays)
print("s:\n", s)
print("s.sort_index(level=0):\n", s.sort_index(level=0))
print("s.sort_index(level=1:\n", s.sort_index(level=1))
输出结果:
s:
qux two 1one 2
foo two 3one 4
baz two 5one 6
bar two 7one 8
dtype: int64s.sort_index(level=0):
bar one 8two 7
baz one 6two 5
foo one 4two 3
qux one 2two 1
dtype: int64s.sort_index(level=1:
bar one 8
baz one 6
foo one 4
qux one 2
bar two 7
baz two 5
foo two 3
qux two 1
dtype: int64
对Series排序
import pandas as pd
import numpy as npser_obj = pd.Series(range(10, 15), index=[5, 1, 3, 1, 2])
print("ser_obj:\n", ser_obj)
print("sort:\n", ser_obj.sort_index()) # 升序排列
print("Descending order:\n", ser_obj.sort_index(ascending=False)) # 降序排列
输出结果:
ser_obj:5 10
1 11
3 12
1 13
2 14
dtype: int64
sort:1 11
1 13
2 14
3 12
5 10
dtype: int64
Descending order:5 10
3 12
2 14
1 11
1 13
dtype: int64
对DataFrame排序
df_obj = pd.DataFrame(np.arange(12).reshape(3, 4), index=[2, 1, 3])
print("df_obj:\n", df_obj)
print("sort:\n", df_obj.sort_index())
print("Descending order:\n", df_obj.sort_index(axis=1, ascending=False))
# 按columns进行降序排序
输出结果:
df_obj:0 1 2 3
2 0 1 2 3
1 4 5 6 7
3 8 9 10 11
sort:0 1 2 3
1 4 5 6 7
2 0 1 2 3
3 8 9 10 11
Descending order:3 2 1 0
2 3 2 1 0
1 7 6 5 4
3 11 10 9 8
按值排序——sort_value()
sort_value(by, axis=0, ascending=True, inplace=False, kind=‘quicksort’, na_position=‘last’)
上述方法中常用参数:
by: 表示排序的列
na_position:为first则将NaN值放在开头;为last则将NaN值放在最后
对Series进行排序
ser_obj1 = pd.Series([4, np.nan, 6, np.nan, -3, 2])
print("ser_obj1:\n", ser_obj1)
print("ser_obj1.sort_values():\n", ser_obj1.sort_values()) # 按值升序排列
print("sort_values(na_position='first'):\n", ser_obj1.sort_values(na_position='first'))
输出结果:
ser_obj1:0 4.0
1 NaN
2 6.0
3 NaN
4 -3.0
5 2.0
dtype: float64
ser_obj1.sort_values():4 -3.0
5 2.0
0 4.0
2 6.0
1 NaN
3 NaN
dtype: float64
sort_values(na_position='first'):1 NaN
3 NaN
4 -3.0
5 2.0
0 4.0
2 6.0
dtype: float64
对DataFrame进行排序
df_obj1 = pd.DataFrame([[0.4, -0.1, -0.3, 0.0],[0.2, 0.6, -0.1, -0.7],[0.8, 0.6, -0.5, 0.1]])
print("df_obj1:\n", df_obj1)
print("df1.value:\n", df_obj1.sort_values(by=2, ascending=False))
# 对列索引为2的数据进行降序排序
输出结果:
df_obj1:0 1 2 3
0 0.4 -0.1 -0.3 0.0
1 0.2 0.6 -0.1 -0.7
2 0.8 0.6 -0.5 0.1
df1.value:0 1 2 3
1 0.2 0.6 -0.1 -0.7
0 0.4 -0.1 -0.3 0.0
2 0.8 0.6 -0.5 0.1