Day27:Pandas数据处理函数
在上一节中,我们学习了pandas的两种数据结构,学会了如何利用padnas读写文件,这一节我们将正式利用pandas处理数据。在数据分析中,pandas提供了丰富的数据处理函数,用于对数据进行查看、索引、选择、切片、过滤、排序、分组聚合、合并以及数学统计等操作,就让我们一起来学习一下。
1. 数据查看与索引
对于DataFrame类型的数据,我们可以直接全部打印整个表格,但是有时候表格很大没必要全部查看,我们可以打印标签前几行或者后几行,甚至通过列名、行号之类的进行索引,这样查看起来就会方便很多。
1.1查看数据
head(n)
:查看前n行数据,默认显示前5行。tail(n)
:查看后n行数据,默认显示后5行。
import pandas as pd
data = {
'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']
}
df = pd.DataFrame(data)
# 查看前3行数据
print(df.head(3))
# 查看后3行数据
print(df.tail(3))
1.2 索引操作
- 通过列名进行索引:
df['列名']
。 - 通过行号进行索引:
df.loc[行号]
。 - 通过条件进行索引:
df[条件]
,这个在第三节过滤的时候也会讲到。
import pandas as pd
data = {
'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']
}
df = pd.DataFrame(data)
# 通过列名进行索引
print(df['A'])
# 通过行号进行索引
print(df.loc[2])
# 通过条件进行索引
print(df[df['A'] > 3])
2. 选择与切片
若是要获取表格的部分数据,可以单独选择其中的几列,只需要通过列名,也可以通过切片的方式访问。
2.1 选择列
df['列名']
:选择单列,返回Series。df[['列1', '列2']]
:选择多列,返回DataFrame。
import pandas as pd
data = {
'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e'],
'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)
# 选择单列
print(df['A'])
# 选择多列
print(df[['A', 'C']])
2.2 切片行
df[start:end:step]
:切片行,返回DataFrame,同样的第三个参数为步长。
import pandas as pd
data = {
'A': [
剩余60%内容,订阅专栏后可继续查看/也可单篇购买
大模型-AI小册 文章被收录于专栏
1. AI爱好者,爱搞事的 2. 想要掌握第二门语言的Javaer或者golanger 3. 决定考计算机领域研究生,给实验室搬砖的uu,强烈建议你花时间学完这个,后续搬砖比较猛 4. 任何对编程感兴趣的,且愿意掌握一门技能的人