Day27:Pandas数据处理函数

alt

在上一节中,我们学习了pandas的两种数据结构,学会了如何利用padnas读写文件,这一节我们将正式利用pandas处理数据。在数据分析中,pandas提供了丰富的数据处理函数,用于对数据进行查看、索引、选择、切片、过滤、排序、分组聚合、合并以及数学统计等操作,就让我们一起来学习一下。

1. 数据查看与索引

对于DataFrame类型的数据,我们可以直接全部打印整个表格,但是有时候表格很大没必要全部查看,我们可以打印标签前几行或者后几行,甚至通过列名、行号之类的进行索引,这样查看起来就会方便很多。

1.1查看数据

  • head(n):查看前n行数据,默认显示前5行。
  • tail(n):查看后n行数据,默认显示后5行。
import pandas as pd

data = {
    'A': [1, 2, 3, 4, 5],
    'B': ['a', 'b', 'c', 'd', 'e']
}
df = pd.DataFrame(data)

# 查看前3行数据
print(df.head(3))

# 查看后3行数据
print(df.tail(3))

1alt

1.2 索引操作

  • 通过列名进行索引:df['列名']
  • 通过行号进行索引:df.loc[行号]
  • 通过条件进行索引:df[条件],这个在第三节过滤的时候也会讲到。
import pandas as pd

data = {
    'A': [1, 2, 3, 4, 5],
    'B': ['a', 'b', 'c', 'd', 'e']
}
df = pd.DataFrame(data)

# 通过列名进行索引
print(df['A'])

# 通过行号进行索引
print(df.loc[2])

# 通过条件进行索引
print(df[df['A'] > 3])

2alt

2. 选择与切片

若是要获取表格的部分数据,可以单独选择其中的几列,只需要通过列名,也可以通过切片的方式访问。

2.1 选择列

  • df['列名']:选择单列,返回Series。
  • df[['列1', '列2']]:选择多列,返回DataFrame。
import pandas as pd

data = {
    'A': [1, 2, 3, 4, 5],
    'B': ['a', 'b', 'c', 'd', 'e'],
    'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)

# 选择单列
print(df['A'])

# 选择多列
print(df[['A', 'C']])

3alt

2.2 切片行

  • df[start:end:step]:切片行,返回DataFrame,同样的第三个参数为步长。
import pandas as pd

data = {
    'A': [

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

大模型-AI小册 文章被收录于专栏

1. AI爱好者,爱搞事的 2. 想要掌握第二门语言的Javaer或者golanger 3. 决定考计算机领域研究生,给实验室搬砖的uu,强烈建议你花时间学完这个,后续搬砖比较猛 4. 任何对编程感兴趣的,且愿意掌握一门技能的人

全部评论
整理了好多函数,赞!
点赞
送花
回复
分享
发布于 2023-07-14 15:27 上海

相关推荐

点赞 评论 收藏
转发
1 1 评论
分享
牛客网
牛客企业服务