1.點擊下面按鈕復(fù)制微信號
點擊復(fù)制微信號
上海威才企業(yè)管理咨詢有限公司
商業(yè)數(shù)據(jù)挖掘分析是通過算法對大量商業(yè)數(shù)據(jù)進行探索并最終找出隱藏于數(shù)據(jù)背后的高價值信息及知識的方法。數(shù)據(jù)挖掘分析方法是一種商業(yè)決策支持過程,它可以高度自動化地對企業(yè)商業(yè)數(shù)據(jù)進行分析,做出歸納性推理,從中挖掘出潛在模式規(guī)律,最終幫助決策者做出正確經(jīng)營決策。
近年來,數(shù)據(jù)挖掘引起了信息產(chǎn)業(yè)界的極大關(guān)注,其主要原因是企業(yè)存在大量可廣泛應(yīng)用的有效數(shù)據(jù),并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識。獲取的信息和知識可以廣泛應(yīng)用于企業(yè)生產(chǎn)經(jīng)營中的各個方面,包括但不限于生產(chǎn)管理、質(zhì)量控制、市場分析、營銷管理、運營管理、財務(wù)管理、人力管理等……學(xué)習(xí)該課程可以系統(tǒng)培養(yǎng)數(shù)據(jù)分析人員的數(shù)據(jù)挖掘分析能力,幫助企業(yè)從數(shù)據(jù)中:
● 發(fā)現(xiàn)數(shù)據(jù)背后深層業(yè)務(wù)問題
● 找到突破業(yè)務(wù)增長瓶頸的突破口
● 找到業(yè)務(wù)行為模式的最優(yōu)解
● 洞察市場先機以及經(jīng)營風(fēng)險,預(yù)測未來經(jīng)營走勢
● 掌握數(shù)據(jù)挖掘分析工具Python的使用方法;
● 掌握Python數(shù)據(jù)清洗方法;
● 掌握統(tǒng)計分析方法;
● 掌握多種算法模型的使用方法;
● 掌握商業(yè)數(shù)據(jù)挖掘分析實戰(zhàn)方法。
Python語言基礎(chǔ):幫助學(xué)員掌握Python語言的基礎(chǔ)編程方法,掌握應(yīng)用Python進行數(shù)據(jù)加載、數(shù)據(jù)整理、數(shù)據(jù)清洗、數(shù)據(jù)可視化等方法,本節(jié)內(nèi)容為后續(xù)內(nèi)容奠定工具應(yīng)用基礎(chǔ);
1. Python編程基礎(chǔ)(Python安裝啟動、數(shù)據(jù)類型、控制流操作、函數(shù)、面向?qū)ο缶幊獭⑽募僮鳎?/span>
2. Python加在數(shù)據(jù)(向量\矩陣\數(shù)組、加在樣本數(shù)據(jù)集、加在數(shù)據(jù)文件數(shù)據(jù)、查詢SQL數(shù)據(jù)庫)
3. Python數(shù)據(jù)整理(創(chuàng)建及瀏覽數(shù)據(jù)幀、處理缺失值、數(shù)據(jù)替換、連接及合并數(shù)據(jù)幀、數(shù)據(jù)分組聚合、更改數(shù)據(jù)類型等)
4. Python數(shù)據(jù)清洗(Numpy應(yīng)用方法、Pandas應(yīng)用方法)
5. Python數(shù)據(jù)可視化(Matplotlib繪圖、Pandas繪圖、Pyecharts交互式圖表繪制)
6. 綜合案例應(yīng)用
時間序列分析:時間序列分析是一種重要的定量預(yù)測分析方法,本節(jié)將幫助學(xué)員系統(tǒng)掌握時間序列分析方法;
1. Pandas時間序列處理
2. 時間序列特征
3. 時間序列模型應(yīng)用(AR、MA、ARMA、ARIMA)
4. 時間序列建模
5. 綜合案例應(yīng)用
機器學(xué)習(xí)與數(shù)據(jù)挖掘基礎(chǔ):本節(jié)內(nèi)容將為大家介紹機器學(xué)習(xí)與數(shù)據(jù)挖掘的基礎(chǔ)理論知識,并針對有監(jiān)督學(xué)習(xí)算法以及無監(jiān)督學(xué)習(xí)算法進行展開介紹;
1. 機器學(xué)習(xí)與數(shù)據(jù)挖掘理論基礎(chǔ)(數(shù)據(jù)挖掘概要,數(shù)據(jù)挖掘方法論,機器學(xué)習(xí)基本思想、常用算法分類、主要解決的問題,機器學(xué)習(xí)流程,模型評價指標,算法庫等)
2. 有監(jiān)督學(xué)習(xí)算法入門(KNN基本原理,函數(shù)詳解,KNN數(shù)據(jù)結(jié)構(gòu)實現(xiàn),KNN算法實例)
3. 無監(jiān)督學(xué)習(xí)算法入門(聚類分析入門,K-Means快速聚類基本原理,K-Means快速聚類手動實現(xiàn),K-Means模型評估指標及穩(wěn)定性討論,輪廓系數(shù))
機器學(xué)習(xí)與數(shù)據(jù)挖掘進階:本節(jié)將為大家進一步介紹機器學(xué)習(xí)與數(shù)據(jù)挖掘的進階算法以及應(yīng)用案例;
1. 常用有監(jiān)督學(xué)習(xí)算法(線性回歸(線性回歸模型的推導(dǎo)和求解,梯度下降法,帶正則項的線性回歸),邏輯回歸(邏輯回歸的引入,sigmoid函數(shù),模型的求解,多分類問題),貝葉斯(樸素貝葉斯,貝葉斯網(wǎng)絡(luò)),SVM支持向量機分類和支持向量機回歸(線性SVM,硬邊距與軟邊距,非線性SVM,核函數(shù)的理解)
2. 有監(jiān)督學(xué)習(xí)算法進階(決策樹模型(C4.5、C5.0和CART樹,決策樹的可視化),集成學(xué)習(xí)基礎(chǔ)(集成學(xué)習(xí)思想,分類,boosting和bagging聯(lián)系與區(qū)別),集成算法之Bagging類算法(Bagging、隨機森林等),集成算法之Boosting類算法(Adaboosting、GBDT梯度提升樹、XgBoost等)
3. 無監(jiān)督學(xué)習(xí)算法進階(聚類分析:DBSCAN密度聚類、層次聚類等,數(shù)據(jù)降維方法(PCA主成分分析和SVD奇異值分解)
4. 特征工程與高級數(shù)據(jù)預(yù)處理(特征工程的目的與重要性,特征預(yù)處理(無量綱化,分析,編碼,統(tǒng)計編號,特征組合),特征構(gòu)造(時間和時間序列特征構(gòu)造,空間特征構(gòu)造,用戶行為特征構(gòu)造,文本特征構(gòu)造,圖像特征構(gòu)造),特征選擇(特征選擇標準,方法分類),特征轉(zhuǎn)換與特征學(xué)習(xí))
文本分析:文本數(shù)據(jù)中包含大量有用信息,使用文本分析方法可以有效提取這部分信息為商業(yè)決策提供幫助。本節(jié)內(nèi)容將幫助學(xué)員系統(tǒng)掌握應(yīng)用Python進行文本分析的方法;
1. 文本分析概述(文本數(shù)據(jù)與文本挖掘,自然語言處理的流派,文本挖掘常見商業(yè)應(yīng)用,自然語言處理的層次,流程與挑戰(zhàn))
2. 獲取文本數(shù)據(jù)(語料和語料庫,常見語料庫,語料庫的獲取,文本的爬取)
3. 文本向量化(離散化表示方法(詞集模型,詞袋模型,TF-IDF),分布式表示方法(word2vec,glove))
4. 文本分類與聚類(百度數(shù)據(jù)聚類,新聞分類,情感分類)
5. 基于深度學(xué)習(xí)的文本分析(深度學(xué)習(xí)在文本分析中的應(yīng)用,基于LSTM的情感分析,基于深度學(xué)習(xí)的新聞分類)
圖像處理與分析:除了文本數(shù)據(jù)之外,圖像數(shù)據(jù)同樣蘊藏了大量有價值的信息與知識,本節(jié)將幫助學(xué)員系統(tǒng)掌握圖像數(shù)據(jù)的處理與分析方法;
1. 圖像處理基本概念(位圖,灰度,通道,深度,色相,色調(diào),圖像分辨率,顏色模型(RGB,HSI,HSV))
2. 基于OpenCV的圖像處理(OpenCV基本介紹,圖像和視頻的獲取,圖像裁剪、通道獲取邊界填充,圖像計算,調(diào)亮圖片,改變圖像大小圖像融合,閾值處理,圖像濾波,圖像運算,圖像金字塔)
3. 圖像特征的理解與計算(顏色特征,形狀特征,LBP特征,HAAR特征,HOG特征)
4. 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理(卷積神經(jīng)網(wǎng)絡(luò)的模型搭建和訓(xùn)練,常見卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分析)
5. 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類實戰(zhàn)(基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識別實戰(zhàn))
綜合應(yīng)用案例(大綱只列舉部分典型案例,可以根據(jù)企業(yè)實際需求進行選擇或定制):本節(jié)通過多個實戰(zhàn)案例將前邊相關(guān)知識進行串聯(lián)、鞏固與提高,幫助學(xué)員將所學(xué)應(yīng)用到實際商業(yè)場景下,掌握商業(yè)數(shù)據(jù)挖掘分析的全流程方法;
1. 電商案例分析(統(tǒng)計描述性,宏觀市場和微觀市場分析,波士頓矩陣分析)
2. 航空客戶價值分析(RFM分析,客戶畫像,聚類分析,精準營銷)
3. 保險行業(yè)用戶畫像,精準營銷(決策樹應(yīng)用)
4. 航班動態(tài)延誤預(yù)測(隨機森林,集成學(xué)習(xí)應(yīng)用)
5. 基于不同場景之下共享單車投放量的精準預(yù)測(嶺回歸,lasso回歸)
6. 京東用戶商品購買預(yù)測(xgboost集成學(xué)習(xí))
7. 電商銷售商品數(shù)據(jù)分析(關(guān)聯(lián)規(guī)則應(yīng)用)
8. 門戶網(wǎng)站新聞分類分析(貝葉斯應(yīng)用)
9. 手寫數(shù)字識別案例(邏輯回歸,knn應(yīng)用)
10. 人臉識別與分類案例(SVM應(yīng)用)
11. 圖像分類(CNN應(yīng)用)
12. 電商文本情感分析(LSTM應(yīng)用)
13. 數(shù)字化人力資源之員工流失風(fēng)險預(yù)警(邏輯回歸應(yīng)用)
14. 基于用于欺詐檢測的綜合財務(wù)數(shù)據(jù)集預(yù)測金融支付服務(wù)中的欺詐行為(集成學(xué)習(xí)應(yīng)用)
15. 信用評分卡案例
例: 講解獲取外部數(shù)據(jù)
例: 講解應(yīng)用文本分析對網(wǎng)站注冊用戶特征需求進行分析
聯(lián)系電話:4006-900-901
微信咨詢:威才客服
企業(yè)郵箱:shwczx@shwczx.com
深耕中國制造業(yè)
助力企業(yè)轉(zhuǎn)型
2021年度咨詢客戶數(shù)
資深實戰(zhàn)導(dǎo)師
客戶滿意度
續(xù)單和轉(zhuǎn)介紹