全部评论
python?这俩应用场景都不一样吧pandas主要是面向数据科学的,spark-sql是spark生态的组件,是面向大数据开发的。两者都有dataframe数据结构,但有本质上的区别
pandas没有并行机制parallelism,不支持Hadoop,处理大量数据有瓶颈,没有延迟机制,只能单机缓存。但是它可以通过标签或者位置选择筛选数据,在合并上方法也比较多。。。等
相关推荐
乌卡拉卡波巴卜:投票小红书
点赞 评论 收藏
分享
点赞 评论 收藏
分享
程序员小白条:四段实习+硕士不至于吧,面十来个不是问题
点赞 评论 收藏
分享
点赞 评论 收藏
分享