使用Python的DataFrame处理丢失数据

import numpy as np
from pandas import DataFrame, Series
import pandas as pd

# 处理丢失数据  有两种丢失数据:
''' 
1)None 是Python自带的,其类型为python object。因此,None不能参与到任何计算中
  object类型的运算要比int类型的运算慢的多,计算不同类型数据求和时间
2)np.nan(NaN) 是浮点类型,能参与到计算中。但计算的结果总是NaN。但可以使用np.nan*()函数来计算
  nan,此时视nan为0。
'''
n1 = np.arange(0, 500, dtype=int).sum()   # arange()创建0-500的数据
print(n1)


# pandas中的None和NaN
'''1)pandas中None与np.nan都视为np.nan'''
# 创建DataFrame
df = DataFrame({"age": [18, 16, 20, 22, 24], "salary": [10000, 26555, 20000, 15000, 23000]},
               index=["张三", "李四", "王五", "小赵", "小吕"],
               columns=["age", "salary", "work"])
print(df)

# 使用DataFrame行索引与列索引修改DataFrame数据
df.work["李四":"小赵"] = "Python"
print(df)


'''2)pandas中的None与np.nan的操作
----isnull()
----notnull()
----dropna():过滤丢失数据
----fillna():填充丢失数据
'''


# (1)判断函数  isnull()   notnull()
# 根据获得的数据去除原来数据的空数据
print(df.isnull())

s1 = df.isnull().any(axis=1)   # any只要有一个为空,则返回True
# 有了s1数据,可以获取哪些数据为空
print(df[s1])

# 保留非空数据  notnull():判断数据不为空,限定所有的数据都不为空,all()
s2 = df.notnull().all(axis=1)   # all表示一行数据全部为True,才能返回True
print(df[s2])


# (2)过滤函数  dropna():过滤丢失数据  可以选择过滤的是行还是列(默认是行)
print(df.dropna(axis=1))   # 直接过滤丢失数据
print(df.dropna(axis=0))

# 也可以选择过滤的方式 how = 'all'
df.loc["张三"] = np.nan
df.loc["小吕"] = np.nan
print(df.dropna(how="all"))


# (3)填充函数Series/DataFrame    fillna()
# 对所有的空数据进行了替换
print(df.fillna(value="Java"))

# 可以选择向前填充或者向后填充
print(df.fillna(method="ffill"))    # forward向前填充
print(df.fillna(method="backfill"))    # 向后填充
# inplace=True原来的数据就会发生变化
df.fillna(method="backfill", inplace=True)
print(df)

# 对于DataFrame来说,还要选择填充的轴axis。
全部评论

相关推荐

避坑恶心到我了大家好,今天我想跟大家聊聊我在成都千子成智能科技有限公司(以下简称千子成)的求职经历,希望能给大家一些参考。千子成的母公司是“同创主悦”,主要经营各种产品,比如菜刀、POS机、电话卡等等。听起来是不是有点像地推销售公司?没错,就是那种类型的公司。我当时刚毕业,急需一份临时工作,所以在BOSS上看到了千子成的招聘信息。他们承诺无责底薪5000元,还包住宿,这吸引了我。面试的时候,HR也说了同样的话,感觉挺靠谱的。于是,我满怀期待地等待结果。结果出来后,我通过了面试,第二天就收到了试岗通知。试岗的内容就是地推销售,公司划定一个区域,然后你就得见人就问,问店铺、问路人,一直问到他们有意向为止。如果他们有兴趣,你就得摇同事帮忙推动,促进成交。说说一天的工作安排吧。工作时间是从早上8:30到晚上18:30。早上7点有人叫你起床,收拾后去公司,然后唱歌跳舞(销售公司都这样),7:55早课(类似宣誓),8:05同事间联系销售话术,8:15分享销售技巧,8:30经理训话。9:20左右从公司下市场,公交、地铁、自行车自费。到了市场大概10点左右,开始地推工作。中午吃饭时间大约是12:00,公司附近的路边盖饭面馆店自费AA,吃饭时间大约40分钟左右。吃完饭后继续地推工作,没有所谓的固定中午午休时间。下午6点下班后返回公司,不能直接下班,需要与同事交流话术,经理讲话洗脑。正常情况下9点下班。整个上班的一天中,早上到公司就是站着的,到晚上下班前都是站着。每天步数2万步以上。公司员工没有自己的工位,百来号人挤在一个20平方米的空间里听经理洗脑。白天就在市场上奔波,公司的投入成本几乎只有租金和工资,没有中央空调。早上2小时,晚上加班2小时,纯蒸桑拿。没有任何福利,节假日也没有3倍工资之类的。偶尔会有冲的酸梅汤和西瓜什么的。公司的晋升路径也很有意思:新人—组长—领队—主管—副经理—经理。要求是业绩和团队人数,类似传销模式,把人留下来。新人不能加微信、不能吐槽公司、不能有负面情绪、不能谈恋爱、不能说累。在公司没有任何坐的地方,不能依墙而坐。早上吃早饭在公司外面的安全通道,未到上班时间还会让你吃快些不能磨蹭。总之就是想榨干你。复试的时候,带你的师傅会给你营造一个钱多事少离家近的工作氛围,吹嘘工资有多高、还能吹自己毕业于好大学。然后让你早点来公司、无偿加班、抓住你可能不会走的心思进一步压榨你。总之,大家在找工作的时候一定要擦亮眼睛,避免踩坑!———来自网友
qq乃乃好喝到咩噗茶:不要做没有专业门槛的工作
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务