数据去重的各种方法汇总（三）

Pandas去重DataFrame
接上篇，这篇就剩最后的用Pandas对DataFrame里面的数据去重，这里也有两种方法，可以直接看官方文档（但是掌柜觉得其实就是一种方法，因为第一种只是显示哪些重复。。。）：

使用duplicated方法，它会返回一个布尔向量，其长度为行数，表示行是否重复，但是并不会删除重复数据。来看实例：

import pandas as pd
import numpy as np

df2 = pd.DataFrame({
   'a': ['one', 'one', 'two', 'two', 'two', 'three', 'four'],
                    'b': ['x', 'y', 'x', 'y', 'x', 'x', 'x'],'c': np.random.randn(7)})

df2

然后会得到这样一个表格：

现在使用duplicated方法：

df2.duplicated('a')

会得到这样的结果：

你看，他只是告诉你哪行是重复的数据（True值得就是），但是并没有删除重复数据。当然该方法里面还有一个可选的keep参数，可以设置重复数据的显示规则，具体请看官方文档，掌柜就不多做叙述，下面继续看第二种方法。

使用 drop_duplicates方法，它才是去除重复数据。还是上面的例子，我们使用这个方法：

df2.drop_duplicates('a')

就会得到去重后的数据：

是不是也很简单？😁当然他也有同样的可选参数keep来设置去除重复数据的规则，比如下面这样，保留最后重复的数据，去除前面的重复数据：

然后要去重多列只需要把含有重复数据的列写成列表的形式即可。

PS: Pandas还可以根据索引来去重，具体操作可以看下面这个实例：

使用的是Index.duplicated方法，这里要注意的是如果只是写df3.index.duplicated()方法，返回的是类似解法一的结果，并不去重数据；要像下面这样以切片的形式来写，注意中括号里面的最前面是有个波浪线的才会去重：

df3[~df3.index.duplicated()]

好了，不同工具对数据进行去重的方法掌柜已经总结完毕，希望对大家有用🧐。

全部评论

推荐最新楼层

2025-12-29 15:56

蓝禾技术_电商事业部_电商运营管培生(准入职员工)

蓝禾科技内推，蓝禾科技内推码

面经：蓝禾的流程推得很快，基本上投完两天就接到了hr的初试电话，直接进行了初试。初试全程大概三十分钟，hr小哥态度很和善。主要问了实践经历获奖的情况最有成就感的事情对电商运营的理解选择公司的标准等，都是比较常规的问题。禾你一起，做不可能的事 | 蓝禾26届校招启动啦公司介绍：蓝禾2008年成立于深圳，是一家集产品、设计、研发、品牌、营销、大数据运营于一体的创新型科技公司，旗下拥有图拉斯TORRAS、锐舞RANVOO、卡斯酷CASEKOO等多个品牌招聘岗位：运营(国内)、运营(国外)、营销、设计、研发技术、职能工作地点：深圳内推链接：https://lanhevip.jobs.feishu.cn...

点赞评论收藏

2025-12-29 20:34

清华大学机械设计/制造

机械有35岁危机吗？

大家好，今天给大家分享机械有35岁危机吗。分享一些网友的经历：1、45周岁，一直从事非标机械设计，工资是同行是2-8倍吧，每年研发1-2台无借鉴设备，常见设备不算。2、喝到酒精肝，喝到高血压。 打工尽头是失业。 年轻多攒点钱是王道。3、22 岁入不了行，硕士毕业都 28 了。4、26岁已经干管理了，基层两年，技术四年，边工好酒量，边工好敞亮，我跟供应商说话就是好使。5、我老师公司结构工程师全是40多岁的。6、非标机械工程师，35岁后就没人要了嘛，我感觉只要待遇不太过分，依旧抢着要啊。7、说实话，小公司一般也不会认真教你，甚至还会怕你学会了。因为小公司给不了太高的工资，你都学会了，公司又给不上工...

点赞评论收藏

2025-12-01 15:04

吉首大学后端工程师

666亚信全挂

我说被亚信封杀了吗

冲鸭2024：亚信不去也罢

投递亚信科技（中国）有限公司等公司8个岗位

点赞评论收藏

2025-11-13 14:37

门头沟学院 Java

27java求建议

27届Java后端，11月开始投实习，到现在只有1面，是项目太水了么，加一个简单的ai大模型相关的项目可以么？谢谢各位佬😖

程序员牛肉：是的，我觉得你最先需要的是多接触计算机圈子。我感觉你这个写的太幼稚了，根本没换位思考面试官。你对实习的描述还是我写了前后端，我写了Restful接口，我用了EChatrs。你这让面试官怎么问你？问你什么是前后端？问你什么是Restful？讲真的兄弟，你这个简历在面试官眼里就是啥也不懂的好学生。所以一定要尽快加入一个圈子跟大家多聊聊，看看正儿八经的简历是怎么写的。可以看一下我首页的简历怎么写那篇文章来学一下，你这里面的坑点我那篇文章里面都有讲过。

点赞评论收藏