⼀、sort_values()函数⽤途
pandas中的sort_values()函数原理类似于SQL中的order by,可以将数据集依照某个字段中的数据进⾏排序,该函数即可根据指定列数据也可根据指定⾏的数据排序。⼆、sort_values()函数的具体参数⽤法:
DataFrame.sort_values(by=‘##',axis=0,ascending=True, inplace=False, na_position=‘last')
参数说明
参数byaxis
说明
指定列名(axis=0或'index')或索引值(axis=1或'columns')
若axis=0或'index',则按照指定列中数据⼤⼩排序;若axis=1或'columns',则按照指定索引中数据⼤⼩排序,默认axis=0
是否⽤排序后的数据集替换原来的数据,默认为False,即不替换
ascending是否按指定列的数组升序排列,默认为True,即升序排列inplace
na_position{‘first',‘last'},设定缺失值的显⽰位置三、sort_values⽤法举例创建数据框
#利⽤字典dict创建数据框import numpy as npimport pandas as pd
df=pd.DataFrame({'col1':['A','A','B',np.nan,'D','C'], 'col2':[2,1,9,8,7,7], 'col3':[0,1,9,4,2,8]})
print(df)>>>
col1 col2 col30 A 2 01 A 1 12 B 9 93 NaN 8 44 D 7 25 C 7 8
依据第⼀列排序,并将该列空值放在⾸位
#依据第⼀列排序,并将该列空值放在⾸位
print(df.sort_values(by=['col1'],na_position='first'))>>>
col1 col2 col33 NaN 8 40 A 2 01 A 1 12 B 9 95 C 7 84 D 7 2
依据第⼆、三列,数值降序排序
#依据第⼆、三列,数值降序排序
print(df.sort_values(by=['col2','col3'],ascending=False))>>>
col1 col2 col32 B 9 93 NaN 8 45 C 7 84 D 7 20 A 2 0
1 A 1 1
根据第⼀列中数值排序,按降序排列,并替换原数据
#根据第⼀列中数值排序,按降序排列,并替换原数据df.sort_values(by=['col1'],ascending=False,inplace=True, na_position='first')print(df)>>>
col1 col2 col33 NaN 8 44 D 7 25 C 7 82 B 9 91 A 1 10 A 2 0
按照索引值为0的⾏,即第⼀⾏的值来降序排序
x = pd.DataFrame({'x1':[1,2,2,3],'x2':[4,3,2,1],'x3':[3,2,4,1]}) print(x)
#按照索引值为0的⾏,即第⼀⾏的值来降序排序print(x.sort_values(by =0,ascending=False,axis=1))>>>
x1 x2 x30 1 4 31 2 3 22 2 2 43 3 1 1 x2 x3 x10 4 3 11 3 2 22 2 4 23 1 1 3
以上就是本⽂的全部内容,希望对⼤家的学习有所帮助,也希望⼤家多多⽀持。
因篇幅问题不能全部显示,请点此查看更多更全内容