AI-Agent 面试题汇总 - Python数据分析篇
1. Python 数据分析常用库有哪些?各自作用是什么?
NumPy:高性能数值计算、矩阵运算pandas:表格数据处理(DataFrame)matplotlib / seaborn:可视化scikit-learn:特征工程与机器学习工具scipy:科学计算与统计函数
2. 什么是 Series 和 DataFrame?
Series:一维带索引数组DataFrame:二维表格结构(行列索引),是分析工作主力数据结构。
3. 如何将字典创建为 DataFrame?(宝典同类高频)
import pandas as pd
data = {"name": ["Tom", "Bob"], "score": [88, 92]}
df = pd.DataFrame(data)
print(df)
4. 如何查看 DataFrame 的基本信息?
df.head() df.tail() df.shape df.info() df.describe()
5. 如何输出 df 的所有列名?
print(df.columns) # 或 print(df.columns.tolist())
6. 如何修改第二列列名为 popularity?
cols = df.columns.tolist() cols[1] = "popularity" df.columns = cols
7. 如何筛选包含 "Python" 的行?
result = df[df["content"].str.contains("Python", na=False)]
8. 如何统计 grammar 列每种语言出现次数?
df["grammar"].value_counts()
9. loc 和 iloc 的区别是什么?
loc:按标签取值iloc:按位置下标取值
10. 如何新增一列并按条件赋值?
df["level"] = "low" df.loc[df["score"] >= 90, "level"] = "high"
11. apply、map、applymap 区别?
map:Series 元素级映射apply:按行/列应用函数applymap:DataFrame 每个元素应用函数(新版常建议用map/向量化替代)
12. 什么是向量化操作?为什么重要?
向量化是直接对整列/数组运算,避免 Python for 循环,速度更快、代码更简洁。
13. 如何处理缺失值(NaN)?
df.isna().sum() df.dropna() df.fillna(0) df["age"] = df["age"].fillna(df["age"].median())
14. 缺失值填充常见策略有哪些?
- 数值:均值/中位数/分组统计填充
- 类别:众数/“unknown”
- 时间序列:前向填充、后向填充
15. 如何删除重复值?
df.drop_duplicates() df.drop_duplicates(subset=["user_id"], keep="last")
16. groupby 的核心作用是
剩余60%内容,订阅专栏后可继续查看/也可单篇购买
AI-Agent面试实战专栏 文章被收录于专栏
本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.
