HCIE-Big Data-Data Mining考这些知识点!

[复制链接]
发表于 : 2019-10-22 16:31:58 最新回复:2019-10-23 09:23:12
142 1
本文主要为华为HCIE-Big Data-Data Mining V2.0考试大纲,其它认证项目的考试大纲可参考相应的培训教材或通过华为公司网站获取。华为企业大数据挖掘专家认证 HCIE-Big Data-Data Mining V2.0项目对应的考试、考试代码、考试名称、考试时长信息如下表所示:

001

考试大纲


考试内容

华为企业大数据挖掘专家认证HCIE-Big Data-Data Mining V2.0考试覆盖:数据挖掘介绍、预备知识(数学基础知识、Python基础知识)、数据预处理、特征选择与降维、有监督学习、无监督学习、模型评估与优化、数据挖掘综合应用、Spark MLlib数据挖掘、华为云机器学习服务MLS、FusionInsight Miner、大数据架构和大数据治理、大数据挖掘。

知识点占比
002

笔试 & 实验 & 面试知识点

第一章 数据挖掘介绍 数据挖掘概述
数据挖掘流程数据、属性和度量数据挖掘开发工具数据挖掘学习路径

第二章 预备知识矩阵和线性代数行列式矩阵及其变换矩阵分解奇异值分解特征值分解线性变换向量空间概率论和数理统计随机事件及其概率随机变量及其分布随机向量及其分布随机变量的函数随机变量的数字特征大数定律与中心极限定理参数估计假设检验方差分析和回归分析信息熵与基尼系数最优化无约束最优化问题梯度下降法约束最优化问题拉格朗日乘子法


Python语言基础
什么是PythonPython基础知识Python中的数据类型判断与循环语句函数和面向对象常用标准库常用第三方库正则表达式文件操作


数据采集与爬虫什么是爬虫爬虫的作用及工作流程爬虫常用的工具数据提取与存储常见的反爬机制和应对措施爬虫程序的实现数据可视化什么是数据可视化数据可视化的作用及使用场景数据可视化的常用工具数据可视化的实现流程

第三章 数据预处理数据抽取、转换和加载数据抽取、转换和加载概述数据抽取数据转换数据加载ETL和ELT介绍


数据清洗不均衡数据处理缺失值处理异常值处理


特征处理 特征缩放数值离散化特征编码时间数值转换

第四章 特征选择与降维特征选择特征选择概述FilterWrapperEmbedded其他方法和特征扩增


降维降维导入SVDPCALDALLE

第五章 有监督学习有监督学习的预备知识
机器学习机器学习分类基本术语与概念


线性回归基本概念误差正规方程梯度下降正则化


逻辑回归基本概念目标函数损失函数优化方法


KNN基本概念KNN算法三要素朴素贝叶斯贝叶斯算法朴素贝叶斯分类算法朴素贝叶斯分类算法的优缺点


SVM基本概念线性分类线性SVM非线性分类非线性SVM


决策树基本概念ID3C4.5CART


集成算法基本概念结合策略Bagging随机森林BoostingAdaboostGBDTXGboost

第六章 无监督学习无监督学习无监督学习概念与导入聚类算法聚类分析概念基于原型聚类K-Means算法K-Mediods算法基于层次聚类Hierarchical Clustering算法BIRCH算法基于密度聚类DBSCAN算法关联算法Apriori算法FP-growth算法

第七章 模型评估与优化模型评估与优化预备知识基本术语及概念最优化模型最优化模型的概述凸优化损失函数最优化模型的分类模型评估与选择模型评估概述数据集拆分回归模型评估分类模型评估聚类模型评估正则化

第八章 数据挖掘综合应用数据挖掘的流程数据挖掘流程概述分析需求数据读取数据预处理特征工程特征选择模型选择模型评估综合应用的案例分析

第九章 Spark MLlib数据挖掘Spark MLlib基础入门Spark MLlib简介Spark MLlib矩阵向量Spark MLlib基础统计分析Basic Statistics 简介Summery statistic (汇总统计)Correlations (相关系数)Stratified sampling (分层抽样)Hypothesis Testing (假设检验)Random data generation (随机数生成)Kernel density estimation (核密度估计)Spark MLlib特征提取和转换TF-IDFWord2VecStandardScaler,MinMaxScaler,MaxAbsScalerNormalizerChiSqSelectorElementwiseProductSpark MLlib分类与回归分类和回归简介线性模型决策树模型集成模型朴素贝叶斯模型Spark MLlib聚类与降维聚类算法回顾KMeans算法Spark MLlib降维算法简介SVD算法PCA算法Spark MLlib关联规则与推荐算法关联规则算法回顾Spark MLlib中FP-Growth算法Spark MLlib中PrefixSpan算法协同过滤算法回顾Spark MLlib中协同过滤算法Spark MLlib评估矩阵Spark MLlib模型评估分类模型评估回归模型评估

第十章 华为云机器学习服务MLS华为MLS服务介绍申请华为MLS服务创建华为MLS工作流典型算法的应用机器学习平台FusionInsight Miner

第十一章 大数据架构和大数据治理大数据架构大数据架构概述大数据架构在大数据中的重要性大数据架构师所具备的能力如何构建大数据架构平台大数据业务层通用架构


大数据治理大数据治理概述大数据治理建设背景和目标企业数据规划及治理模型大数据治理案例

第十二章 大数据挖掘数据挖掘背景银行客户精准画像案例提升***安全案例城市环境质量分析挖掘案例

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
  • x
  • 常规:

点评 回复

q:1424150046 wx:yutianeduzs IT认证领先机构
跳转到指定楼层
Becky_2019
Becky_2019  管理员 发表于 2019-10-23 09:23:12 已赞(0) 赞(0)

感谢分享!
  • x
  • 常规:

点评 回复

发表回复
您需要登录后才可以回帖 登录 | 注册

警告 内容安全提示:尊敬的用户您好,为了保障您、社区及第三方的合法权益,请勿发布可能给各方带来法律风险的内容,包括但不限于政治敏感内容,涉黄赌毒内容,泄露、侵犯他人商业秘密的内容,侵犯他人商标、版本、专利等知识产权的内容,侵犯个人隐私的内容等。也请勿向他人共享您的账号及密码,通过您的账号执行的所有操作,将视同您本人的行为,由您本人承担操作后果。详情请参看“隐私声明
如果附件按钮无法使用,请将Adobe Flash Player 更新到最新版本!
登录参与交流分享

登录参与交流分享

登录