华为大数据 HCIE-Big Data

华为大数据 HCIE-Big Data课程介绍

HCIE-Big Data认证定位于大数据分析领域中大型分布式并行处理数据仓库平台的架构原理、优化设计、应用开发和大数据挖掘领域的基础理论、常用挖掘算法、应用设计以及开发,旨在推动业界大数据行业的专家型人才培养。


HCIE-Big Data认证包括但不仅限于:(1)华为企业级的大型并行处理分布式数据仓库平台FusionInsight LibrA的架构、功能特性、数据库设计、数据库数据导入导出、数据库调优及数据库开发等;(2)数据挖掘的理论(包括数据预处理、数据仓库、分类、聚类、关联规则等)以及使用华为企业级大数据挖掘平台FusionInsight Miner和基于华为云的企业智能平台EI (Enterprise Intelligence)的基础服务 - MLS (Machine Learning Service,机器学习服务)进行数据深度分析和挖掘。


通过HCIE-Big Data认证,将证明您系统理解并掌握大型并行处理数据仓库平台的架构原理、分布式关系型数据库的设计和优化及应用开发;掌握大数据挖掘的基本原理,常用算法、常用挖掘方法、对华为大数据挖掘解决方案FusionInsight Miner和华为云机器学习服务MLS的熟练使用,胜任数据仓库开发、大数据分析、大数据数据挖掘和人工智能的相关岗位。 


企业拥有HCIE-Big Data 认证的工程师,意味着企业掌握了运用大数据技术进行大数据分析应用、大数据挖掘应用的能力。


大数据知识点: 

第一章 数据仓库平台FusionInsight LibrA(理论) 

    第一节 分布式数据库架构

    体系架构基本知识

    熟悉MPP架构及优势

    业界产品说明


    第二节 FusionInsight LibrA 基本组件简介

    LibrA逻辑架构

    LibrA物理架构

    LibrA数据库对象


    第三节 FusionInsight LibrA 产品特性和关键技术

    架构和支持的操作系统

    面向应用开发的基本功能

    数据库安全

    图形化工具

    高级特性


    第四节 FusionInsight LibrA 配套工具集

    Database Manager概念与架构

    Database Manager的安装

    Database Manager的使用

    Data Studio概念与架构

    Data Studio的安装与FusionInsight LibrA服务器的配置

    Data Studio工具支持的特性

    Data Studio的使用


    第五节 FusionInsight LibrA 安全管理

    访问控制

    用户管理

    权限管理模型

    对象权限

    安全审计


    第六节 FusionInsight LibrA 数据库管理系统并发控制

    配置负载均衡

    事务与隔离

    LibrA锁机制介绍


    第七节 FusionInsight LibrA 数据库性能监控

    系统资源监控方式

    性能相关视图

    使用命令行监控集群性能

    使用DM工具监控集群性能


    第八节 FusionInsight LibrA 数据迁移

    数据迁移场景划分

    GDS工具适用场景和使用方法

    Copy from/to适用场景和使用方法

    开源ELT工具适用场景和使用方法

    gs_dump/gs_restore适用场景和使用方法

    gsql工具适用场景和使用方法

    Roach工具适用场景和使用方法

    从其他数据库中迁移数据


    第九节 FusionInsight LibrA SQL介绍

    SQL相关机制和原理

    利用EXPLAIN进行SQL调优


    第十节 FusionInsight LibrA 数据库设计

    数据库逻辑设计

    存储模式

    数据分布

    表分区

    索引


    第十一节 FusionInsight LibrA 应用程序开发指导

    FusionInsight LibrA驱动介绍

    ODBC应用程序开发

    JDBC应用程序开发

    基础开发规范


第二章 FusionInsight LibrA(实验)

    FusionInsight LibrA基本操作、语法

    FusionInsight LibrA性能优化

    网络KPI数据栅格化处理

    重点区域数据分析

    流动人口常驻地分析


第三章 大数据挖掘理论

    第一节 预备知识和数据介绍

    数据挖掘的定义

    数据挖掘的流程

    数据挖掘的应用

    数据和属性类型

    数据的统计描述

    数据的邻近性度量


    第二节 数据预处理

    为什么要预处理数据

    数据清理

    数据集成

    数据归约

    数据变换


    第三节 数据仓库介绍

    数据仓库的概念

    数据仓库的体系结构与模型

    多维数据模型

    概念分层

    OLAP与OLTP

    方体物化


    第四节 分类

    分类和回归的概念

    决策树分类

    朴素贝叶斯分类

    组合分类

    后向传播分类

    支持向量机分类

    模型评估与选择


    第五节 聚类

    聚类的定义

    K-均值算法

    k-中心点算法


    第六节 离群点检测

    离群点的概念

    离群点检测的方法


    第七节 关联规则(Association Rule)

    关联规则的定义

    关联规则挖掘步骤及相关概念

    关联规则挖掘方法分类

    Apriori算法


    第八节 FusionInsight Miner 和华为云机器学习服务MLS

    FusionInsight Miner整体介绍

    关系分析

    标签管理

    华为云机器学习服务


第四章 大数据挖掘实战

    银行定期存款业务预测

    客户分群

    鲍鱼生长年龄预测


认证考试

7.JPG



HCIE-Big Data 证书有效期与重认证方式

有效期:二年

重认证项目:在认证过期之前,通过目前提供的任意一门HCIE 笔试或实验或面试。华为重认证项目详情请参考手册中对“华为重认证策略”的说明