Python實現(xiàn)大數(shù)據(jù)挖掘技術(shù)培訓(xùn)

  培訓(xùn)講師:傅一航

講師背景:
傅一航,華為系大數(shù)據(jù)專家。傅一航,男,計算機(jī)軟件與理論碩士研究生(研究方向:數(shù)據(jù)挖掘、搜索引擎)。在華為工作十年,五篇國家專利,在華為工作期間獲得華為數(shù)項獎項,曾在英國、日本、荷蘭等國家做項目,對大數(shù)據(jù)有深入的研究。傅老師專注于大數(shù)據(jù)分析與 詳細(xì)>>

傅一航
    課程咨詢電話:

Python實現(xiàn)大數(shù)據(jù)挖掘技術(shù)培訓(xùn)詳細(xì)內(nèi)容

Python實現(xiàn)大數(shù)據(jù)挖掘技術(shù)培訓(xùn)

【課程大綱】

**部分:Python語言基礎(chǔ)

目的:掌握基本的Python編程思想與編程語句,熟悉常用數(shù)據(jù)結(jié)構(gòu)的操作

1、 Python簡介

2、 開發(fā)環(huán)境搭建

? Python的安裝

? 擴(kuò)展庫的安裝

3、 掌握Python的簡單數(shù)據(jù)類型

?  字符串的使用及操作

? 整數(shù)、浮點(diǎn)數(shù)

4、 掌握基本語句:

? if、while、for、print等

? 基本運(yùn)算:

? 函數(shù)定義、參數(shù)傳遞、返回值

5、 掌握復(fù)雜的數(shù)據(jù)類型:列表/元組

? 列表操作:訪問、添加、修改、刪除、排序

? 列表切片、復(fù)制等

? 列表相關(guān)的函數(shù)、方法

? 元組的應(yīng)用

6、 復(fù)雜數(shù)據(jù)類型:字典

? 創(chuàng)建、訪問、修改、刪除、遍歷

? 字典函數(shù)和方法

7、 復(fù)雜數(shù)據(jù)類型:集合

8、 掌握面向?qū)ο缶幊趟枷?/p>

? 創(chuàng)建類、繼承類

? 模塊

9、 函數(shù)定義、參數(shù)傳遞、返回值

10、 標(biāo)準(zhǔn)庫與擴(kuò)展庫的導(dǎo)入

11、 異常處理:try-except塊

演練:基本的Python編程語句


第二部分:Python語言與數(shù)據(jù)挖掘庫

目的:掌握數(shù)據(jù)集結(jié)構(gòu)及基本處理方法,進(jìn)一步鞏固Python語言

1、 數(shù)據(jù)挖掘常用擴(kuò)展庫介紹

? Numpy數(shù)組處理支持

? Scipy矩陣計算模塊

? Matplotlib數(shù)據(jù)可視化工具庫

? Pandas數(shù)據(jù)分析和探索工具

? StatsModels統(tǒng)計建模庫

? Scikit-Learn機(jī)器學(xué)習(xí)庫

? Keras深度學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))庫

? Gensim文本挖掘庫

2、 數(shù)據(jù)集讀取與操作:讀取、寫入

? 讀寫文本文件

? 讀寫CSV文件

? 讀寫Excel文件

? 從數(shù)據(jù)庫獲取數(shù)據(jù)集

3、 數(shù)據(jù)集的核心數(shù)據(jù)結(jié)構(gòu)(Pandas數(shù)據(jù)結(jié)構(gòu))

? DataFrame對象及處理方法

? Series對象及處理方法

演練:用Python實現(xiàn)數(shù)據(jù)的基本統(tǒng)計分析功能


第三部分:數(shù)據(jù)可視化處理

目的:掌握作圖擴(kuò)展庫,實現(xiàn)數(shù)據(jù)可視化

1、 常用的Python作圖庫

? Matplotlib庫

? Pygal庫

2、 實現(xiàn)分類匯總

演練:按性別統(tǒng)計用戶人數(shù)

演練:按產(chǎn)品 日期統(tǒng)計各產(chǎn)品銷售金額

3、 各種圖形的畫法

? 直方圖

? 餅圖

? 折線圖

? 散點(diǎn)圖

4、 繪圖的美化技巧

演練:用Python庫作圖來實現(xiàn)產(chǎn)品銷量分析,并可視化


第四部分:數(shù)據(jù)挖掘基礎(chǔ)

目的:掌握數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程

1、 數(shù)據(jù)挖掘概述

2、 數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程(CRISP-DM)

? 商業(yè)理解

? 數(shù)據(jù)準(zhǔn)備

? 數(shù)據(jù)理解

? 模型建立

? 模型評估

? 模型應(yīng)用

3、 數(shù)據(jù)挖掘常用任務(wù)與算法

案例:用大數(shù)據(jù)實現(xiàn)精準(zhǔn)營銷的項目過程


第五部分:數(shù)據(jù)理解和數(shù)據(jù)準(zhǔn)備

目的:掌握數(shù)據(jù)預(yù)處理的基本環(huán)節(jié),以及Python的實現(xiàn)

1、 數(shù)據(jù)預(yù)處理

? 異常值處理:3σ準(zhǔn)則,IQR準(zhǔn)則

? 缺失值插補(bǔ):均值、拉格朗日插補(bǔ)

? 數(shù)據(jù)篩選/抽樣

? 數(shù)據(jù)的離散化處理

? 變量變換、變量派生

2、 數(shù)據(jù)的基本分析

? 相關(guān)分析:原理、公式、應(yīng)用

? 方差分析:原理、公式、應(yīng)用

? 卡方分析:原理、公式、應(yīng)用

? 主成分分析:降維

案例:用Python實現(xiàn)數(shù)據(jù)預(yù)處理及數(shù)據(jù)準(zhǔn)備


第四部分:分類預(yù)測模型實戰(zhàn)

1、 常見分類預(yù)測的模型與算法

2、 如何評估分類預(yù)測模型的質(zhì)量

? 查準(zhǔn)率

? 查全率

? ROC曲線

3、 邏輯回歸分析模型

? 邏輯回歸的原理

? 邏輯回歸建模的步驟

? 邏輯回歸結(jié)果解讀

案例:用sklearn庫實現(xiàn)銀行貸款違約預(yù)測

4、 決策樹模型

? 決策樹分類的原理

? 決策樹的三個關(guān)鍵問題

? 決策樹算法與實現(xiàn)

案例:電力竊漏用戶自動識別

5、 人工神經(jīng)網(wǎng)絡(luò)模型(ANN)

? 神經(jīng)網(wǎng)絡(luò)概述

? 神經(jīng)元工作原理

? 常見神經(jīng)網(wǎng)絡(luò)算法(BP、LM、RBF、FNN等)

案例:神經(jīng)網(wǎng)絡(luò)預(yù)測產(chǎn)品銷量

6、 支持向量機(jī)(SVM)

? SVM基本原理

? 維災(zāi)難與核心函數(shù)

案例:基于水質(zhì)圖像的水質(zhì)評價

7、 貝葉斯分析

? 條件概率

? 常見貝葉斯網(wǎng)絡(luò)


第五部分:數(shù)值預(yù)測模型實戰(zhàn)

1、 常用數(shù)值預(yù)測的模型

? 通用預(yù)測模型:回歸模型

? 季節(jié)性預(yù)測模型:相加、相乘模型

? 新產(chǎn)品預(yù)測模型:珀爾曲線與龔鉑茲曲線

2、 回歸分析概念

3、 常見回歸分析類別


第六部分:聚類分析(客戶細(xì)分)實戰(zhàn)

1、 客戶細(xì)分常用方法

2、 聚類分析(Clustering)

? 聚類方法原理介紹及適用場景

? 常用聚類分析算法

? 聚類算法的評價

案例:使用SKLearn實現(xiàn)K均值聚類

案例:使用TSNE實現(xiàn)聚類可視化

3、 RFM模型分析

? RFM模型,更深入了解你的客戶價值

? RFM模型與市場策略

案例:航空公司客戶價值分析


第七部分:關(guān)聯(lián)規(guī)則分析實戰(zhàn)

1、 關(guān)聯(lián)規(guī)則概述

2、 常用關(guān)聯(lián)規(guī)則算法

3、 時間序列分析

案例:使用apriori庫實現(xiàn)關(guān)聯(lián)分析

案例:中醫(yī)證型關(guān)聯(lián)規(guī)則挖掘


第八部分:案例實戰(zhàn)(學(xué)員主導(dǎo),老師現(xiàn)場指導(dǎo))

1、 電商用戶行為分析及服務(wù)推薦

2、 基于基站定位數(shù)據(jù)的商圈分析


結(jié)束:課程總結(jié)與問題答疑。



 

傅一航老師的其它課程

數(shù)據(jù)分析方法及生產(chǎn)運(yùn)營實際應(yīng)用【課程目標(biāo)】本課程主要介紹數(shù)據(jù)分析在生產(chǎn)運(yùn)營過程中的應(yīng)用,適用于制造行業(yè)/保險行業(yè)的數(shù)據(jù)分析人員等。本課程的主要目的是,幫助學(xué)員了解大數(shù)據(jù)的本質(zhì),培養(yǎng)學(xué)員的數(shù)據(jù)意識和數(shù)據(jù)思維,掌握常用的統(tǒng)計分析方法和工具,以及生產(chǎn)、運(yùn)營過程中的應(yīng)用,并以概率的方式來進(jìn)行決策,提升學(xué)員的數(shù)據(jù)分析及應(yīng)用能力。本課程具體內(nèi)容包括:數(shù)據(jù)決策邏輯,數(shù)據(jù)決

 講師:傅一航詳情


大數(shù)據(jù)建模大賽輔導(dǎo)實戰(zhàn)【課程目標(biāo)】本課程主要面向?qū)I(yè)人士的大數(shù)據(jù)建模競賽輔導(dǎo)需求(假定學(xué)員已經(jīng)完成Python建模及優(yōu)化--回歸篇/分類篇的學(xué)習(xí))。通過本課程的學(xué)習(xí),達(dá)到如下目的:熟悉大賽常用集成模型掌握模型優(yōu)化常用措施,掌握超參優(yōu)化策略掌握特征工程處理,以及對模型質(zhì)量的影響掌握建模工程管道類(Pipeline,ColumnTransformer)的使用【授

 講師:傅一航詳情


大數(shù)據(jù)時代的精準(zhǔn)營銷【課程目標(biāo)】本課程從實際的市場營銷問題出發(fā),了解大數(shù)據(jù)在市場營銷領(lǐng)域的價值以及應(yīng)用。并對大數(shù)據(jù)分析與挖掘技術(shù)進(jìn)行了介紹,通過從大量的市場營銷數(shù)據(jù)中分析潛在的客戶特征,挖掘客戶行為特點(diǎn),實現(xiàn)精準(zhǔn)營銷,幫助市場營銷團(tuán)隊深入理解業(yè)務(wù)運(yùn)作,支持業(yè)務(wù)策略制定以及營銷決策。通過本課程的學(xué)習(xí),達(dá)到如下目的:了解大數(shù)據(jù)營銷內(nèi)容,掌握大數(shù)據(jù)在營銷中的應(yīng)用。

 講師:傅一航詳情


大數(shù)據(jù)時代的精準(zhǔn)營銷【課程目標(biāo)】本課程從實際的市場營銷問題出發(fā),了解大數(shù)據(jù)在市場營銷領(lǐng)域的價值以及應(yīng)用。并對大數(shù)據(jù)分析與挖掘技術(shù)進(jìn)行了介紹,通過從大量的市場營銷數(shù)據(jù)中分析潛在的客戶特征,挖掘客戶行為特點(diǎn),實現(xiàn)精準(zhǔn)營銷,幫助市場營銷團(tuán)隊深入理解業(yè)務(wù)運(yùn)作,支持業(yè)務(wù)策略制定以及營銷決策。通過本課程的學(xué)習(xí),達(dá)到如下目的:了解大數(shù)據(jù)營銷內(nèi)容,掌握大數(shù)據(jù)在營銷中的應(yīng)用。

 講師:傅一航詳情


大數(shù)據(jù)決策思維與商業(yè)模式創(chuàng)新,賦能企業(yè)增長【課程目標(biāo)】本課程主要幫助大家理解大數(shù)據(jù)的基本概念,著重探索大數(shù)據(jù)的本質(zhì),理解大數(shù)據(jù)的核心價值,以及掌握實現(xiàn)大數(shù)據(jù)價值的三個關(guān)鍵環(huán)節(jié),大數(shù)據(jù)解決業(yè)務(wù)問題的六個步驟,然后聚焦大數(shù)據(jù)的七大核心思維,最后,再用案例說明了大數(shù)據(jù)在各行業(yè)的應(yīng)用場景。大數(shù)據(jù)思維,讓決策更科學(xué)!讓管理更高效!讓營銷更精準(zhǔn)!通過本課程的學(xué)習(xí),達(dá)到如

 講師:傅一航詳情


大數(shù)據(jù)思維與應(yīng)用創(chuàng)新【課程目標(biāo)】本課程主要幫助大家理解大數(shù)據(jù)的基本概念,著重探索大數(shù)據(jù)的本質(zhì),理解大數(shù)據(jù)的核心價值,以及掌握實現(xiàn)大數(shù)據(jù)價值的三個關(guān)鍵環(huán)節(jié),大數(shù)據(jù)解決業(yè)務(wù)問題的六個步驟,然后聚焦大數(shù)據(jù)的七大核心思維,最后,再用案例說明了大數(shù)據(jù)在各行業(yè)的應(yīng)用場景。大數(shù)據(jù)思維,讓決策更科學(xué)!讓管理更高效!讓營銷更精準(zhǔn)!通過本課程的學(xué)習(xí),達(dá)到如下目的:了解大數(shù)據(jù)基本

 講師:傅一航詳情


大數(shù)據(jù)思維與應(yīng)用創(chuàng)新【課程目標(biāo)】本課程主要幫助大家理解大數(shù)據(jù)的基本概念,著重探索大數(shù)據(jù)的本質(zhì),理解大數(shù)據(jù)的核心價值,以及掌握實現(xiàn)大數(shù)據(jù)價值的三個關(guān)鍵環(huán)節(jié),大數(shù)據(jù)解決業(yè)務(wù)問題的六個步驟,然后聚焦大數(shù)據(jù)的七大核心思維,最后,再用案例說明了大數(shù)據(jù)在各行業(yè)的應(yīng)用場景。大數(shù)據(jù)思維,讓決策更科學(xué)!讓管理更高效!讓營銷更精準(zhǔn)!通過本課程的學(xué)習(xí),達(dá)到如下目的:了解大數(shù)據(jù)基本

 講師:傅一航詳情


大數(shù)據(jù)思維與應(yīng)用創(chuàng)新【課程目標(biāo)】本課程主要幫助大家理解大數(shù)據(jù)的基本概念,著重探索大數(shù)據(jù)的本質(zhì),理解大數(shù)據(jù)的核心價值,以及掌握實現(xiàn)大數(shù)據(jù)價值的三個關(guān)鍵環(huán)節(jié),大數(shù)據(jù)解決業(yè)務(wù)問題的六個步驟,然后聚焦大數(shù)據(jù)的七大核心思維,最后,再用案例說明了大數(shù)據(jù)在各行業(yè)的應(yīng)用場景。大數(shù)據(jù)思維,讓決策更科學(xué)!讓管理更高效!讓營銷更精準(zhǔn)!通過本課程的學(xué)習(xí),達(dá)到如下目的:了解大數(shù)據(jù)基本

 講師:傅一航詳情


大數(shù)據(jù)挖掘工具:SPSSStatistics入門與提高【課程目標(biāo)】本課程為數(shù)據(jù)分析和挖掘的工具篇,本課程面向數(shù)據(jù)分析部等專門負(fù)責(zé)數(shù)據(jù)分析與挖掘的人士,專注大數(shù)據(jù)挖掘工具SPSSStatistics的培訓(xùn)。IBMSPSS工具是面向非專業(yè)人士的高級的分析工具(挖掘工具),它提供大量的分析方法和分析模型,能夠解決更復(fù)雜的業(yè)務(wù)問題,比如影響因素分析、客戶行為預(yù)測/精

 講師:傅一航詳情


金融行業(yè)風(fēng)險預(yù)測模型實戰(zhàn)【課程目標(biāo)】本課程專注于金融行業(yè)的風(fēng)控模型,面向數(shù)據(jù)分析部等專門負(fù)責(zé)數(shù)據(jù)分析與建模的人士。本課程的主要目的是,培養(yǎng)學(xué)員的大數(shù)據(jù)意識和大數(shù)據(jù)思維,掌握常用的數(shù)據(jù)分析方法和數(shù)據(jù)分析模型,并能夠用于對客戶行為作分析和預(yù)測,提升學(xué)員的數(shù)據(jù)分析綜合能力。通過本課程的學(xué)習(xí),達(dá)到如下目的:掌握數(shù)據(jù)分析和數(shù)據(jù)建模的基本過程和步驟掌握客戶行為分析中常用

 講師:傅一航詳情


COPYRIGT @ 2001-2018 HTTP://m.fanshiren.cn INC. ALL RIGHTS RESERVED. 管理資源網(wǎng) 版權(quán)所有