2020-05-09 16:54 已编辑华南理工大学 C++

关注

Python数据处理笔记

Python有多容易忘记, 如果不整理, 过一段时间就完全重新学了. 所以借着这一些练习, 把自己学过的东西记录并总结, 才方便日后回顾.

import pandas as pd
另外可以导入Series和DataFrame，因为这两个经常被用到：

from pandas import Series, DataFrame

DataFrame

生成DataFrame的若干种方式

从文件中来: 最常见的方式

手动生成: 可以根据自己的喜好来定制数据

data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'], 
        'year': [2000, 2001, 2002, 2001, 2002, 2003], 
        'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
df = pd.DataFrame(data)

一种比较漂亮的生成方式, 里面用的state, year, pop 都成为了columns:

>>> frame.columns
Index(['pop', 'state', 'year'], dtype='object')

    pop   state  year
0  1.5    Ohio  2000
1  1.7    Ohio  2001
2  3.6    Ohio  2002
3  2.4  Nevada  2001
4  2.9  Nevada  2002
5  3.2  Nevada  2003

但是这种方式通常只能适合于比较小的Dict, 如果有定制好的数据集, 那么就要通过dict() 生成各种各样的dictionary对象. 对dict的操作在这里按下不表

获取DataFrame的信息

可以把DataFrame当成一个Excel表格来看待

df2.index看对列序号:

df.columns每一列的名字

隐藏index columns , 只看df2的values:

print(df2.values)

"""
array([[1.0, Timestamp('2013-01-02 00:00:00'), 1.0, 3, 'test', 'foo'],
       [1.0, Timestamp('2013-01-02 00:00:00'), 1.0, 3, 'train', 'foo'],
       [1.0, Timestamp('2013-01-02 00:00:00'), 1.0, 3, 'test', 'foo'],
       [1.0, Timestamp('2013-01-02 00:00:00'), 1.0, 3, 'train', 'foo']], dtype=object)
"""

describe():数据总结, 返回数据的mean, std, count 等

df2.describe()

"""
         A    C    D
count  4.0  4.0  4.0
mean   1.0  1.0  3.0
std    0.0  0.0  0.0
min    1.0  1.0  3.0
25%    1.0  1.0  3.0
50%    1.0  1.0  3.0
75%    1.0  1.0  3.0
max    1.0  1.0  3.0
"""

df.T:翻转数据的行列,比较常用的地方如果要对行进行索引

sort_index 进行排序并输出:

print(df2.sort_index(axis=1, ascending=False))

数据中的类型用 dtype这个属性:

print(df2.dtypes)

索引的方式

逗号分开行与列, 如果要分别选取多个行和多个列, 使用['col1','col2'] 分别列出需要的行列

1. `['col']` 字典的访问方式和对象访问方式

data['Colorado']字典的访问方式 [] 内为要访问的Key

data.Colorado 对象访问方式

注意: 这两种方式都不可以使用数字访问

2. `iloc`根据行列的位置

data.loc['Colorado', ['two', 'three']]
data.loc[:,['two']] #选出two所在的列

3. `iloc` 根据行列的名称

同iloc实现相同的效果：

data.iloc[2, [3, 0, 1]]

4. `ix` 混合两种方式

Index 和 Column的选取/重命名

第一个参数为内容,

    groupedDF = pd.DataFrame(grouped, columns=['User Id', 'Rating'] , index= [for i in range (len(grouped))])

df.groupby()

根据'Pclass' 求平均

data.groupby('User Id')['Rating'].mean()
data.groupby('User Id').mean()['Rating']

全部评论

推荐最新楼层

昨天 01:31

河南工业大学深度学习

代码随想录第四天刷题

第一题：两两交换链表中的值 class Solution: def swapPairs(self, head: Optional[ListNode]) -> Optional[ListNode]: dummy_head = ListNode(next = head) current = dummy_head while current.next and current.next.next: temp = current.next temp1 = current.next.next.next current.next = current.next.next current.next.nex...

点赞评论收藏

分享

03-16 17:38

郑州大学算法工程师

2026 秋招总结：从实习到转正，一个普通硕士的秋招焦虑与落地

我是一所 211 高校计算机技术专业的一名硕士生，研究方向是稀疏 3DGS 重建。研二下学期过完年，我刚把一篇论文投稿到一个一区期刊。论文投出去之后，我简单改了改简历，就开始尝试投实习，本来只是想看看市场情况，没想到很快就收到了几个 offer。当时比较合适的实习机会有海康威视、赢彻科技以及几家规模不大的公司。综合考虑之后，我选择了海康威视。一方面是因为海康在行业里的认可度比较高，另一方面待遇也不错，公司还提供住宿，整体条件在当时看来已经很让人满意了。于是，我第一次去了杭州。刚到海康的时候，其实挺激动的。公司园区规模很大，那时候确实有一种“原来自己也有机会来这种大公司实习”的感觉。 实习开始之...

不给转正的实习，你还去吗

点赞评论收藏

分享

03-07 01:24

郑州师范学院测试工程师

大佬们帮忙看看简历 孩子约不到面😭全是已读不回 要么就是培训机构的套路我知道是个学院本学历不讨好 真想找口饭吃冲什么岗比较合适呢

27届学院本誓死冲击...：自我评价和校园经历全删了，荣誉经历只留奖学金，项目也全得换都不如外卖

点赞评论收藏

分享

03-12 09:42

韩山师范学院 Java

26二本简历求拷打

不是说金三银四吗投了七十份，交换了7次简历，为啥一次面试也没有呢求大佬帮忙看看简历哪里有问题，拷打一下

今天你投了哪些公司？

点赞评论收藏

分享

03-17 22:30

拼多多集团-PDD_服务端研发工程师(准入职员工)

周会上，我说："这个技术栈，我调研过"

会议室里安静了几秒。 "你调研过？"架构师抬起头，看向坐在角落的我。 我点点头，打开笔记本："上周看到需求文档后，我花了些时间做了个对比分析。" 那是实习第五周的周会，团队在讨论一个新项目的技术选型。会议已经进行了半小时，几位资深工程师各执一词，有人倾向用成熟稳定的方案，有人想尝试新技术。争论陷入僵局时，我在群里发了一句："我这边有份调研报告，要不要看看？" 导师在会上直接说："那让他讲讲。" 我其实没想到会在这种场合发言。入职前几周，我一直在熟悉业务代码，跟着导师做一些模块开发。但我发现，真正让人成长的，不是等着...

拼多多集团-PDD成长空间 1356人发布

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 春招至今，你的战绩如何？ #

7177次浏览 66人参与

# 你的实习产出是真实的还是包装的？ #

1396次浏览 34人参与

# 巨人网络春招 #

11236次浏览 223人参与

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

7186次浏览 38人参与

# 简历第一个项目做什么 #

31388次浏览 317人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

186612次浏览 1116人参与

# MiniMax求职进展汇总 #

23325次浏览 304人参与

# 研究所笔面经互助 #

118806次浏览 577人参与

# 面试紧张时你会有什么表现？ #

30431次浏览 188人参与

# 简历中的项目经历要怎么写？ #

309712次浏览 4171人参与

# AI时代，哪些岗位最容易被淘汰 #

62931次浏览 760人参与

# 职能管理面试记录 #

10749次浏览 59人参与

# 网易游戏笔试 #

6391次浏览 83人参与

# 腾讯音乐求职进展汇总 #

160477次浏览 1107人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

7054次浏览 155人参与

# 正在春招的你，也参与了去年秋招吗？ #

362899次浏览 2633人参与

# 你怎么看待AI面试 #

179553次浏览 1193人参与

# 小红书求职进展汇总 #

226958次浏览 1357人参与

# 你觉得通信/硬件有必要实习吗？ #

155407次浏览 1065人参与

# 从哪些方向判断这个offer值不值得去？ #

56717次浏览 357人参与

# 校招笔试 #

468348次浏览 2957人参与

# 你的房租占工资的比例是多少？ #

92165次浏览 896人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务