全部评论
python?这俩应用场景都不一样吧pandas主要是面向数据科学的,spark-sql是spark生态的组件,是面向大数据开发的。两者都有dataframe数据结构,但有本质上的区别
pandas没有并行机制parallelism,不支持Hadoop,处理大量数据有瓶颈,没有延迟机制,只能单机缓存。但是它可以通过标签或者位置选择筛选数据,在合并上方法也比较多。。。等
相关推荐
06-14 19:09
门头沟学院 Java darius_:给制造业搞的,什么物料管理生产管理,设备管理点检,最最关键的就是一堆报表看板。个人觉得没啥技术含量都是些基本的crud,但是业务很繁琐那种
点赞 评论 收藏
分享