为什么CDPOS是您的理想之选?

专为开源项目打造的权威资格认证

受国际认可的开源项目专业技能
基于开源项目的职能导向培养方案

灵活的时间与资金投入,以职业发展目标为归宿的个性化设计
以业内最佳实践为指引设计的培养方案

实践与理论结合,强实用性
包含300多个开源项目的成熟认证路径

有利于在大数据领域的进一步职业发展

考试大纲要点

分析流程
• 诊断和预测分析的分析过程

• 数据准备工作-数据收集,数据清理,数据整理和数据可视化

• 建立分析模型-将非结构化数据转换为量化指标
诊断分析基础
• 诊断分析目标、流程、数据准备

•使用Hive,Spark SQL和PySpark为诊断分析的数据建模

• 用于诊断分析的数据可视化-Apache Superset
预测分析基础
• 使用Hive,Spark SQL和PySpark来预测分析目标、最佳实践、流程、数据准备和模型构建

•识别并选择合适的机器学习算法

• 预测建模-决策树、使用Python和Spark MLlib进行集群化

认证技能

  • 为多个数据源上的分析功能创建数据模型
  • 使用SQL Lab准备数据,并使用Superset执行诊断分析
  • 使用MLlib和PySpark API选择合适的机器学习算法

考试: 50 道多选题| 75 分钟 (模块 3)

请点击  链接 获取更多关于教学大纲手册详细内容信息