岗位职责
1. 参与合成数据的生成与处理,支持构建高质量、可用的训练数据集。
2. 协助进行数据质量分类与评估,确保数据的准确性和完整性。
3. 负责数据标签的构建与管理,确保数据的标注符合项目需求和标准。
4. 支持数据平台的优化与管理,提高数据存储、查询效率与整体性能。
岗位要求
1. 本科及以上学历,计算机、数据科学、人工智能等相关专业。
2. 熟悉 Python(Pandas/Numpy)、SQL、Shell 等编程语言,具备数据处理基础能力。
3. 了解文本预处理、数据标注等常见数据处理方法,能独立完成基础的清洗和标签任务。
4. 对大规模数据处理有一定了解,熟悉大数据平台(如 Hadoop、Spark)及工具者优先。
5. 具备良好的沟通与团队合作能力,能主动参与并推动项目进展。