为什么选择OpenCertHub
领导团队
关于我们
奖项
伙伴网络
解决方案
个人
企业
专业资格
数据公民
公民数据师
公民数据师 (进阶)
数据素养 101
专家影片
活动消息
市场消息
最新活动
登录
ENGLISH
中文
登录
ENGLISH
中文
模块3 - 数据分析基础证书
为什么
CDPOS
是您的理想之选?
专为开源项目打造的权威资格认证
受国际认可的开源项目专业技能
基于开源项目的职能导向培养方案
灵活的时间与资金投入,以职业发展目标为归宿的个性化设计
以业内最佳实践为指引设计的培养方案
实践与理论结合,强实用性
包含300多个开源项目的成熟认证路径
有利于在大数据领域的进一步职业发展
考试大纲要点
分析流程
• 诊断和预测分析的分析过程
• 数据准备工作-数据收集,数据清理,数据整理和数据可视化
• 建立分析模型-将非结构化数据转换为量化指标
诊断分析基础
• 诊断分析目标、流程、数据准备
•使用Hive,Spark SQL和PySpark为诊断分析的数据建模
• 用于诊断分析的数据可视化-Apache Superset
预测分析基础
• 使用Hive,Spark SQL和PySpark来预测分析目标、最佳实践、流程、数据准备和模型构建
•识别并选择合适的机器学习算法
• 预测建模-决策树、使用Python和Spark MLlib进行集群化
认证技能
为多个数据源上的分析功能创建数据模型
使用SQL Lab准备数据,并使用Superset执行诊断分析
使用MLlib和PySpark API选择合适的机器学习算法
考试: 50 道多选题| 75 分钟 (模块 3)
请点击
链接
获取更多关于教学大纲手册详细内容信息