全部评论
python?这俩应用场景都不一样吧pandas主要是面向数据科学的,spark-sql是spark生态的组件,是面向大数据开发的。两者都有dataframe数据结构,但有本质上的区别
pandas没有并行机制parallelism,不支持Hadoop,处理大量数据有瓶颈,没有延迟机制,只能单机缓存。但是它可以通过标签或者位置选择筛选数据,在合并上方法也比较多。。。等
相关推荐
07-02 16:46
西安邮电大学 网络安全 点赞 评论 收藏
分享
点赞 评论 收藏
分享