Day26:Pandas数据结构

alt

前面三节中,我们详细讲解了Numpy数据分析库的用法,现在我们来介绍另一个库Pandas。在数据分析和处理中,Pandas是一个强大的库,提供了高性能、易于使用的数据结构和数据分析工具。本节将详细介绍Pandas的两个核心数据结构:Series和DataFrame,以及如何使用Pandas读取和写入JSON文件和CSV文件。

1. Series数据结构

Series是Pandas中的一维数据结构,类似于带有标签的数组。它由两个数组组成:索引(index)和值(value)。索引用于标识和访问数据,值则是实际存储的数据,有点像Python中的字典。

创建Series对象的方式如下:

import pandas as pd

data = [10, 20, 30, 40, 50]
index = ['a', 'b', 'c', 'd', 'e']
series = pd.Series(data, index)

通过上述代码,我们创建了一个Series对象,其中data是存储的数据,index是对应的索引。可以使用print(series)查看Series对象的内容。

1alt

2. DataFrame数据结构

DataFrame是Pandas中的二维数据结构,类似于电子表格或关系型数据库中的表格。它由行索引(index)和列名(columns)组成,每列可以包含不同的数据类型。

3alt

创建DataFrame对象的方式有多种,其中一种常用的方式是使用带列表的字典创建:

import pandas as pd

data = {
    'Name': ['Alice'

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

大模型-AI小册 文章被收录于专栏

1. AI爱好者,爱搞事的 2. 想要掌握第二门语言的Javaer或者golanger 3. 决定考计算机领域研究生,给实验室搬砖的uu,强烈建议你花时间学完这个,后续搬砖比较猛 4. 任何对编程感兴趣的,且愿意掌握一门技能的人

全部评论

相关推荐

1 收藏 评论
分享
牛客网
牛客企业服务