题解 | #牛客网连续练习题目3天及以上的用户#

# 1、因为每天用户练习次数可能不止一次,所以需要先将用户每天的练习日期去重。
# 2、再将用户id分组,按照练习日期进行排序。
# 3、计算练习日期减去第二步骤得到的结果值,用户连续练习情况下,相减的结果都相同。
# 4、按照id和日期分组并计数,筛选大于等于3的即为连续3天练习的用户。
## 供调试
# nowcoder = pd.DataFrame({'user_id':[3310,3310,3310,3313,3314,3315,3313],'question_id':['110','111','112','113','114','115','116'],'result':['right','right','wrong','wrong','right','right','right'],'date':['2021/12/20 08:00','2021/12/21 08:00','2021/12/22 08:00','2021/12/22 08:00','2021/12/23 08:00','2021/12/20 08:00','2021/12/27 09:00:00']})

import pandas as pd
from datetime import timedelta
nowcoder = pd.read_csv('nowcoder.csv')
nowcoder['date'] = pd.to_datetime(nowcoder['date'],format='%Y-%m-%d').dt.strftime('%Y-%m-%d')
nowcoder['date_m']=pd.to_datetime(nowcoder['date']).dt.strftime('%Y-%m')
data=nowcoder[nowcoder['date_m']>='2021-12']
df=data[['user_id','date']].drop_duplicates(['user_id','date'],inplace=False)
df['date']=pd.to_datetime(df['date'])
df['rank']=pd.to_timedelta(df.groupby(['user_id'])['date'].rank(),unit='d')
df['date_diff']=df['date']-df['rank']
_df=df.groupby(['user_id','date_diff'])['date'].count()
_df=_df.groupby('user_id').max()
print(_df[_df>=3])

全部评论
11,13 行是不是重复了?12行是不是可以变变不用先转化为字符串,然后再由字符串转化为函数?
点赞 回复 分享
发布于 2022-08-28 20:30 北京

相关推荐

03-24 12:55
已编辑
榆林学院 软件测试
点赞 评论 收藏
分享
小厂面经,也是我的处女面(30min)1.自我介绍2.spring boot的自动装配原理(好多类和接口的单词都忘了全称是啥了,就说了记得的单词,流程应该说对了吧)3.有用过redis吗?主要是用在实现什么功能(说了技术派用redis的zset来实现排行榜)5.有了解过Redisson吗?讲一下对于分布式锁的了解以及在什么场景下应用(说了秒杀场景)6.对mysql有了解吗?包括它的索引优化和创建(把想起来的全说了)7.了解设计模式吗?比如单例模式,为什么要使用单例模式,它的优点是什么(昨天刚看的设计模式)8.工厂模式有了解吗?主要的使用场景是?(也是昨天刚看的)9.场景题:有7个服务器,需要在早上十点定时的向数据库中的用户表中的用户发短信,如果做到发送的消息不重复,且如果发送失败了需要知道是到哪个用户失败了,这样下次就直接从这个用户开始(我答了用spring task来实现定时,用分布式锁来保证只有一份服务器可以发送消息,用消息队列来存储消息,然后用消息确认机制来保证错误信息的记录,以及在数据库或者业务层面完成消息消费的幂等性)10.场景题:如果在系统启动的时间就将数据库的所有用户相关的信息都读到一个hashmap中(这个没啥思路,没答好)27届的投了一个星期终于有一个面试了,大部分公司都只招26的
inari233:已oc,拒了
查看9道真题和解析
点赞 评论 收藏
分享
评论
12
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务