大數(shù)據(jù)處理與挖掘

  •  
    •  課程目標(biāo)

      本課程對(duì)大數(shù)據(jù)相關(guān)的主要技術(shù)進(jìn)行了總體講解。包括大數(shù)據(jù)的必備基礎(chǔ)知識(shí);Hadoop生態(tài)相關(guān)的重要知識(shí)比如HDFS/YARN/MapReduce、集群、shell的系統(tǒng)講解;并重點(diǎn)講解了Hive相關(guān)的理論知識(shí)和實(shí)戰(zhàn)講解了操作;講解目前大數(shù)據(jù)領(lǐng)域熱門(mén)、火爆、有前景的技術(shù)——Spark。從淺入深,基于大量案例實(shí)戰(zhàn),深度剖析和講解Spark,并且會(huì)包含完全從企業(yè)真實(shí)復(fù)雜業(yè)務(wù)需求中抽取出的案例實(shí)戰(zhàn);最后講解了數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)。

    •  師資團(tuán)隊(duì)

    • 華清創(chuàng)客企業(yè)內(nèi)訓(xùn)講師,均是來(lái)自各個(gè)領(lǐng)域的資深專(zhuān)家,均擁有6年以上大型項(xiàng)目經(jīng)驗(yàn)。

    •  培養(yǎng)對(duì)象

      學(xué)員學(xué)習(xí)本課程應(yīng)具備下列基礎(chǔ)知識(shí):
      ◆ 具備java\Python等編程語(yǔ)言的基礎(chǔ);
      ◆ 對(duì)大數(shù)據(jù)開(kāi)發(fā)感興趣的學(xué)員;

    •  培訓(xùn)方式

    第一種:華清創(chuàng)客講師面授
    課時(shí):共3天,每天6學(xué)時(shí),總計(jì)18學(xué)時(shí)
    ◆費(fèi)用(含教材費(fèi)):3600元
    ◆外地學(xué)員:代理安排食宿(需提前預(yù)定)

    第二種:線(xiàn)上直播授課
    直播課時(shí):共6天,每天3學(xué)時(shí),總計(jì)18學(xué)時(shí);
    輔導(dǎo):授課期間,輔導(dǎo)老師每天有1小時(shí)的輔導(dǎo)直播
    ◆費(fèi)用(含教材費(fèi)):3600元

    第三種:企業(yè)訂制培訓(xùn)
    課時(shí):根據(jù)定制的大綱確定課時(shí)
    費(fèi)用:根據(jù)課程難度,每課時(shí)1500~3000元

      •  質(zhì)量保證

        1、培訓(xùn)過(guò)程中,如有部分內(nèi)容理解不透或消化不好,可免費(fèi)在下期培訓(xùn)班中重聽(tīng);

        2、培訓(xùn)結(jié)束后免費(fèi)提供一個(gè)月的技術(shù)支持,充分保證培訓(xùn)后出效果;

        3、培訓(xùn)合格學(xué)員可享受免費(fèi)推薦就業(yè)機(jī)會(huì)。

      •  課程大綱

        內(nèi)容簡(jiǎn)介 授課詳細(xì)內(nèi)容


        大數(shù)據(jù)概覽 "1. 大數(shù)據(jù)簡(jiǎn)介

        2. 大數(shù)據(jù)處理流程(采集/傳輸/分析/挖掘)

        3. 大數(shù)據(jù)平臺(tái)有哪些及各自特點(diǎn)

        4. 大數(shù)據(jù)技術(shù)有哪些?各自處理哪些場(chǎng)景?"


        Hadoop實(shí)戰(zhàn) "1. Hadoop簡(jiǎn)介

        2. HDFS/YARN/MapReduce原理簡(jiǎn)單剖析

        3. Hadoop集群配置環(huán)境"

        "4. Hadoop常用Shell操作

        5. MapReduce編程簡(jiǎn)析及平均分統(tǒng)計(jì)操作"


        Hive實(shí)戰(zhàn) "1. Hive數(shù)據(jù)倉(cāng)庫(kù)集群平臺(tái)體系架構(gòu)

        2. Hive原理與工作機(jī)制

        3. Hive安裝配置"

        "4. Hive 應(yīng)用開(kāi)發(fā)技巧及數(shù)據(jù)庫(kù)表設(shè)計(jì)

        5. 基于HiveSogou日志分析"


        Spark實(shí)踐 "1. Spark簡(jiǎn)介

        2. Spark原理深入分析

        3. Spark整合Hadoop安裝配置

        4. Spark整合大數(shù)據(jù)倉(cāng)庫(kù)Hive實(shí)踐"

        "大數(shù)據(jù)數(shù)據(jù)分析與挖掘技術(shù)


        Spark Mllib" "1. 互聯(lián)網(wǎng)金融反欺詐案例分析

        2. Spark RDD編程技巧

        3. 用戶(hù)數(shù)據(jù)特征轉(zhuǎn)換解析及Spark實(shí)現(xiàn)

        4,分類(lèi)挖掘算法實(shí)現(xiàn)及應(yīng)用

          1) 使用Spark Decision Tree實(shí)現(xiàn)金融反欺詐模型

          2) 使用Spark Navie Bayes實(shí)現(xiàn)金融反欺詐模型

          3Spark分類(lèi)算法常用場(chǎng)景及開(kāi)發(fā)流程"




the end

評(píng)論(0)