pandas常用代码段

pandas

查看基本信息

import pandas as pd

ted = pd.read_csv('ted.csv')
ted.head()
ted.shape

#对每一列数据进行统计,包括计数,均值,std,各个分位数等。
data.describe() 

# 查看数据类型
ted.dtypes

# 查看每列缺失值数量
ted.isna().sum()

# 统计某一列x中各个值出现的次数
data['x'].value_counts()    

# 按某列排序
ted.sort_values('comments').tail()

# correct for this bias by calculating the number of comments pey view
ted['comments_per_view'] = ted.comments / ted.views

读取tsv文件

df = pd.read_csv(file, sep='\t')

# 如果已有表头
df = pd.read_csv(file, header=0)

删除某几列

pd.drop(axis=1, columns=['a', 'b'])

取行取列

1. loc函数

loc是用实际的索引

比如我们现在有这么一个DataFrame

# 取x行数据
df.loc['x']

# 取多行数据
df.loc['x': 'z']
 
# 索引某行某列
df.loc['x', ['b', 'c']]

# 索引某列
df.loc[:, 'b']

注意: DataFrame的索引[1:3]是包含3这个元素的的, 和其他地方有区别

2. iloc函数

iloc是用行号列号来索引(从0开始计数)

# 索引单行
df.iloc[0]

# 索引多行
df.iloc[0:]

# 索引列数据
df.iloc[:, [1]]  
3. ix函数

ix是结合了前两种的混合索引

# 通过行号索引
df.ix[0]

# 通过行标签索引
df.ix['x']

另外, 取列数据的话也可以不用上面函数直接这样取:

# 取a列
df['a']
df.a

第二种有个小问题, 就是列名不能有空格

持续更新…

全部评论

相关推荐

找个工作 学历是要卡的 要求是高的 技能不足是真的 实习经验是0的 简历无处可写是事实的 钱不好赚是真的 想躺平又不敢躺 也不甘心躺 怕自己的灵感和才华被掩埋甚至从未被自己发现 又质疑自己是否真正有才华
码农索隆:你现在啊,你心里都明白咋回事,但是你没办法改变现状,一想到未来,你又没有信心狠下心来在当下努力。 得走出这种状态,不能一直困在那里面,哪不行就去提升哪,你一动不动那指定改变不了未来,动起来,积少成多才能越来越好
点赞 评论 收藏
分享
吴offer选手:HR:我KPI到手了就行,合不合适关我什么事
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务