1. Scikit-learn(sklearn)
用途:一个功能强大的机器学习库,提供了各种监督学习和无监督学习算法的实现。

主要功能:

分类、回归、聚类、降维等算法(如 SVM、随机森林、K-Means、PCA)。

数据预处理(标准化、归一化、编码分类变量)。

模型选择与评估(交叉验证、网格搜索、性能指标计算)。

特点:简单易用,适合快速实现机器学习流程。

2. LightGBM
用途:一个高效的梯度提升框架(Gradient Boosting),主要用于机器学习中的分类和回归任务。

主要功能:

基于决策树的高性能梯度提升算法(比 XGBoost 在某些情况下更快、内存占用更低)。

支持并行学习、类别特征自动处理、大规模数据训练。

特点:速度快、内存消耗低,适合处理大数据集。

3. Matplotlib
用途:Python 中最流行的数据可视化库,用于创建各种静态、动态或交互式图表。

主要功能:

绘制折线图、散点图、柱状图、直方图、饼图等。

支持自定义图表样式(颜色、标签、标题、图例等)。

可与 Jupyter Notebook 无缝集成,适合数据探索和结果展示。

特点:灵活且功能强大,是 Python 数据可视化的基础工具。

典型使用场景
数据科学/机器学习流程:

用 matplotlib 可视化数据分布。

用 sklearn 进行数据预处理和模型训练。

用 LightGBM 训练高性能的梯度提升模型(尤其适合结构化数据)
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务