首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
不是江小白
获赞
2690
粉丝
77
关注
9
看过 TA
387
女
四川外国语大学成都学院
2013
数据分析师
IP属地:四川
非典型程序猿
私信
关注
拉黑
举报
举报
确定要拉黑不是江小白吗?
发布(146)
评论
刷题
收藏
不是江小白
关注TA,不错过内容更新
关注
2020-12-04 13:42
已编辑
四川外国语大学成都学院 数据分析师
从一道简单的Leetcode 197题 “上升的温度” 看INNER JOIN、CROSS JOIN 和 , (comma 逗号) 连接两表/多表的区别
今天又随手刷了一道Leetcode的197题,此题难点主要在于比较两个日期值 DATEDIFF() 函数的使用,如果你很熟悉这个函数,那么这题对你来说就很简单了! 不过掌柜在解完此题后习惯性地看看别人的解法,因为总有厉害的朋友在下面给出惊喜😀。于是又发现了一个细小的点: 即使用INNER JOIN(或JOIN)、CROSS JOIN和使用逗号(,)来连接两表/多表到底有什么区别? 又开始翻阅查询,在MySQL 8.0的官网看到这么一段话: 翻译一下这里(如果有错误,请谅解并提出来): INNER JOIN 和 ,(逗号)在没有连接条件的情况下语义上是相等的,即在指定的表格之间是进行一个笛卡尔...
0
点赞
评论
收藏
分享
2020-12-04 13:41
四川外国语大学成都学院 数据分析师
调用sklearn模型遇到Unknown label type: continuous 的解决办法
调用sklearn模型的时候 报错“Unknown label type: ‘continuous’ “的解决办法 刚刚掌柜在进行模型预测的时候遇到这样的报错: 为什么会这样呢?掌柜搜过类似问题的解法,发现在StackOverflow上面有个解释的很清楚: 原来是因为目标列是真实地数字,不能作为分类问题的标签进行运算。那么问题又来了:为什么不能作为分类标签呢? 再看下面那句话,其实也是sklearn官方文档中地原话: 哦,原来在用sklearn做分类任务的时候,y 应该是整数或者字符串型的向量。至此,这个问题终于得到解答😀,下面解决的办法就很简单了,直接在y输入变量的后面加上转换数据类型...
0
点赞
评论
收藏
分享
2020-12-04 13:41
已编辑
四川外国语大学成都学院 数据分析师
Leetcode题解之database(七)1179. Reformat Department Table
今天又随手刷了一道力扣题,还是数据库的。这次是 1179题:重写部门表格。又是一道看似简单的题,但不注意还是容易出错😂。 此题主要考察的知识点👉:CASE WHEN/IF 函数的用法以及SQL分组聚合的方法。 解题思路👇: 仔细看题目这里的要求 要求表格以 部门id和每个月的收入 这样的形式来显示,如上。 那么问题来了,第一个:如何统计有哪些部门id? 第二个:如何统计每个月该id部门的收入? 首先第一个问题很好解决,想要统计表格有哪些部门id,很自然就会想到用GROUP BY方法; 第二个问题,要想统计每个月该部门的收入: 那么先要知道该月是几月; 接着找到该月份对应的收入填入即...
0
点赞
评论
收藏
分享
2020-12-04 13:41
四川外国语大学成都学院 数据分析师
Attribute Error :XGBRegressor object has no attribute XGBReressor的解决办法
刚刚掌柜在进行调参的时候遇到这样的报错: 这就奇怪了,明明刚刚Xgboost还能运行,怎么调参就不行了??? 于是掌柜去搜解决办法,十个有九个都是说因为存在有 xgboost.py命名的文件才导致的。但是掌柜明明才开始用这个,也没建过这样名字的Python文件。但是秉着严谨的精神还是去搜了电脑里面的所有文件,结果并没有找到什么。。。 接着又重装了xgboost这个包,但是依然报错如上!正当掌柜要陷入僵局的时候,突然在官网的论坛看到一个类似的疑问,下面有这么一句话: 突然想到一个问题,难道是我一开始在第一个程序的时候用xgb来命名了XGBRegressor对象了。。。马上回看上个程序,结果发现还...
0
点赞
评论
收藏
分享
2020-12-04 13:40
已编辑
四川外国语大学成都学院 数据分析师
如何用sklearn工具包里面的feature_selection模块来进行特征选择/降维(一)
最近在进行一个比赛的时候遇到特征处理的问题,于是就在sklearn官网查了一下,发现有专门的一节来讲关于特征选择的,因此翻译一下主要供自己学习使用,当然如果对你也有帮助,那更好。 sklearn.feature_selection PS:翻译如果觉得有问题,请大佬帮忙纠正!谢谢。 ----------------------------------------------我是一条无感情的分界线--------------------------------------- <mark>1.13. Feature selection</mark> sklearn.fea...
0
点赞
评论
收藏
分享
2020-12-04 13:40
四川外国语大学成都学院 数据分析师
回炉整理《数据分析实战45讲》之基础篇 -- 13.数据变换(一)
(PS: 先跳过十二章,因为那章讲数据集成,这个后面再一起讲,因为要讲的比较多。此外,下文若有错误,请指正,谢谢!😃) 这次是第十三章: 13 | 数据变换:考试成绩要求正态分布合理么? 该章主要讲数据变换的几种方法中的数据规范化是什么,以及如何用sklearn里面的processing包来处理数据。还有其他变换的方法比如 数据平滑; 数据聚集; 数据概化; 属性构造 等方式,它们都可以将(特征)数据转换成适用于数据挖掘的形式。 其实下文谈的几种都属于数据预处理里面数据变换的标准化范畴(或用英文更专业点,叫Feature Scaling,也叫特征缩放,详细解释参见维基百科)。 掌柜这...
0
点赞
评论
收藏
分享
2020-12-04 13:40
已编辑
四川外国语大学成都学院 数据分析师
Jupyter Notebook安装各类包时常见的十种坑坑和解决办法汇总(上)
最近又手贱的升级某个包导致了在使用Jupyter notebook中遇到了各种坑坑😂。。。掌柜可能自带填坑属性👀,所以这里对常见的十种Jupyter坑做个总结! PS:造成同一个报错的原因有很多种,掌柜这里列出的解决办法也不一定对所有场景有效,谢谢理解! PPS: 掌柜这里是Windows10的64位操作系统,且是在Anaconda Prompt中安装各种包的。 Exception: Jupyter command ‘Jupyter notebook’ not found. 这是因为掌柜在卸载某些包的时候Jupyter包也被一起卸载了,结果就出现找不到Jupyter notebook启...
0
点赞
评论
收藏
分享
2020-12-04 13:39
已编辑
四川外国语大学成都学院 数据分析师
回炉整理《数据分析实战45讲》之基础篇 -- 13.数据变换(二)
(接之前的) 下面我们来看分别用Min-Max归一化、Z-Score标准化对Sklearn数据集里面的鸢尾花数据集进行处理的差别: 首先取了原始数据集里面spal length这一特征来进行可视化: 可以看出来是呈正太分布的,均值和中位数都在6附近。 下面掌柜分别用MinMax归一化 、Z-Score标准化来处理鸢尾花数据集, 再次查看第一列特征的可视化图(Min-Max归一化是红色,Z-Score标准化是蓝***r> 由上图可以很明显的看出来,归一化后的数据都落在了[0,1]之间;而使用标准化处理后的数据,中位数和均值都往左偏移了,处于以 0为中心的正态分布状。这也验证了我们上...
0
点赞
评论
收藏
分享
2020-12-04 13:39
已编辑
四川外国语大学成都学院 数据分析师
双峰偏态数据如何转变为正态分布数据
最近掌柜遇到这样一组数据,它呈现出双峰偏态形状: 大家都知道,在构建模型的时候都尽量要让偏态数据转换为正态分布数据。 所以问题又来了?为什么偏态数据要尽量转换为正态分布数据呢? 因为很多模型假设数据服从正态分布后,它的样本均值和方差就相互独立,这样就能更好的进行统计推断和假设验证。比如熟悉的线性回归就是假设误差服从正态分布。 好了,现在回到这里,刚刚上图显示的是双峰偏态数据,掌柜查阅了一下,发现如果要转换成正态分布形式的话,可以使用Sklearn里面的QuantileTransformer方法。具体使用方法如下: from sklearn.preprocessing import Quant...
0
点赞
评论
收藏
分享
2020-12-04 13:38
四川外国语大学成都学院 数据分析师
如何用sklearn工具包里面的feature_selection模块来进行特征选择/降维(二)
(接上篇) <mark>1.13.3. 递归特征消除</mark> 给定一个对特征进行权重分配的外部评估器(比如线性模型里面的系数),递归特征消除(RFE)***通过递归考虑越来越少的特征集来进行特征选择。首先,在初始化的特征集上面已经训练好的评估器要么通过coef_属性,要么通过feature_importances_属性获取每个特征的重要性。接着,最不重要的特征将从当前特征集中删除。然后会在修剪集(即刚才删除最不重要特征后的数据集)上递归地重复这个过程直到最终达到所需要的特征数量。 RFECV则以交叉验证循环的方式执行RFE来找到最佳特征数量。 示例: 递归特...
0
点赞
评论
收藏
分享
2020-12-04 13:38
四川外国语大学成都学院 数据分析师
Leetcode题解之database(八)595. Big Countries -- 浅谈选择Union还是OR
掌柜又随手刷了一道力扣数据库题,这次是595题👉:找大国。相信很多朋友都见过这个题,这题确实很简单,只要你SQL基础过关。 所以掌柜就简单提一下,此题主要考察知识点就是SQL中多条件的过滤。但是掌柜一如既往在自己解答后看其他人的题解时,发现了一个有趣的东西 – 就是大多数题解都写到👇: 这里使用Union连接两个查询语句的效率会优于使用OR方法??? 真的是这样的吗???😮掌柜持怀疑态度❗ --------------------------------------------------------------------------我是一条怀疑分割线-----------------...
0
点赞
评论
收藏
分享
2020-12-04 13:38
已编辑
四川外国语大学成都学院 数据分析师
使用OneHotEncoder进行类别变量转换的时候出现 Could not convert string to float: ‘b‘ 的解决办法
今天在用OneHotEncoder进行数据预处理阶段的类别变量转换时,突然报错: 咦?怎么回事。。。明明掌柜看官方文档说的是可以对类别(字符串)变量进行转换的: 而且示例也是可以的: 怎么到掌柜这里就不行了???掌柜再三确认自己没有写错代码啊,这是怎么回事? 于是掌柜就左翻右翻各种资料,发现都说OneHotEncoder确实是可以对类别变量进行转换的,那这里就没用错。就在掌柜以为又要被困在bug中的时候😂,突然晃了一眼刚刚官方文档那里,发现这里有一排斜体的小字:在0.20版本修改过。。。 所以是不是意味着之前sklearn版本的OneHotEncoder方法是不能直接转换字符串变量...
0
点赞
评论
收藏
分享
2020-12-04 13:37
已编辑
四川外国语大学成都学院 数据分析师
最新版 Windows10上安装Python 3.8.5的步骤/教程/指南
因为旧电脑不幸挂了,所以要在新电脑上面重新安装Python。一看官网发现已经更新到3.8.5+了,乖乖,真是迭代快啊。虽然之前安装过一次,不过也忘得差不多了,正好借这次回顾一下安装步骤(万一以后再次遇到(还是不要了🤣)???也会淡定安装)。废话不多说,直接看下面👇的步骤吧。 首先打开Python官网,直接找到Windows下载安装的界面: Python的Windows下载界面 <stron> </stron> 页面跳转后直接拉到底部Files这里,会看到三个不同版本的文件: 不同版本的区别掌柜已经在图上👆标明了,一般来说都选联网安装版(即最后那个文件安...
0
点赞
评论
收藏
分享
2020-12-04 13:37
已编辑
四川外国语大学成都学院 数据分析师
git clone 仓库很慢,甚至失败的解决办法
今天准备更新思维导图09,想要上传到仓库的时候突然想起来,掌柜还没有把该仓库clone到本地。。。于是打开git,开始clone,接着就出现了标题的情况😂git clone很慢,最后还崩溃了: 一搜发现大家都遇到过git clone很慢的问题,原因是网站github.global.ssl.fastly.net被限制了。。。而解决的办法也很多。试了各种方法后,整理目前还有效的两种: 第一种:GitHub域名映射本地法 首先在Git里面查看这两个网站的ip地址,使用命令: nslookup github.global.ssl.fastly.Net nslookup github.com ...
0
点赞
评论
收藏
分享
2020-12-04 13:37
已编辑
四川外国语大学成都学院 数据分析师
腾讯云的CentOS 7.5 64位系统中安装Anaconda3 报错 [24582] Failed to execute script entry_point 的解决办法
在腾讯云的Centos 7.5 64位操作系统中安装Anaconda3的时候遇到标题报错: 在排查问题的过程中,发现GitHub上有同样问题的朋友,但是他们大部分是因为磁盘空间不足导致的。。。 可是掌柜这里是新的云服务器,还没用过,所以排除是这个原因造成的。 接着再往下看,发现有个朋友这么说: 然后突然想起来,昨晚因为网速太慢,下载被中断了。今早重新再下的脚本文件,难道真的是这个原因? 于是去查root下面的文件有哪些: 果真,因为今早下的文件重复了,所以被系统自动命名为sh.1。。。但是掌柜还是安装的昨晚那个不完整的sh文件。。。 所以才报错了😂,终于找到原因了。那么解决的办法就很...
0
点赞
评论
收藏
分享
1
5
6
7
8
9
10
创作者周榜
更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务