一、培訓簡述
課程中通過細致講解,使學員掌握該技術的本質。具體收益包括:
1.掌握OpenCV的使用;
2.理解卷積神經網絡;
3.掌握Tensorflow的使用;
4.掌握keras的使用;
5.通過各個應用場景的實際經典項目案例,深入解讀計算機視覺技術的應用。
二、培訓特色
本次培訓從實戰的角度對計算機視覺技術進行了全面的剖析,并結合實際案例分析和探討計算機視覺技術的應用場景,給計算機視覺技術相關從業人員以指導和啟迪。
三、培訓時長
共計3天,每天6課時
四、培訓大綱
日程 |
培訓模塊 |
培訓內容 |
第一天
上午 |
OpenCV使用 |
1.安裝opencv
2.圖像處理基礎
3.圖像運算和轉換
4.圖像平滑處理
5.圖像梯度
6.圖像邊緣檢測
7.圖像金字塔
8.人臉檢測和識別 |
第一天
下午 |
卷積神經網絡介紹 |
1.CNN架構
2.卷積計算
3.卷積的步長
4.池化
5.Padding
6.MNIST網絡結構介紹 |
第二天
上午 |
Tensorflow使用 |
1.深度學習框架介紹
2.Tensorflow安裝
3.Tensorlfow基礎知識
4.Tensorflow線性回歸
5.Tensorflow非線性回歸
6.Mnist數據集合Softmax講解
7.使用BP神經網絡搭建手寫數字識別
8.交叉熵(cross-entropy)講解和使用
9.過擬合,正則化,Dropout
10.各種優化器Optimizer
11.改進手寫數字識別網絡
12.卷積神經網絡CNN的介紹
13.使用CNN解決手寫數字識別 |
第二天
下午 |
keras使用 |
1.實現線性回歸
2.實現非線性回歸
3.MNIST數據集以及Softmax介紹
4.MNIST分類程序
5.交叉熵的應用
6.Dropout應用
7.正則化應用
8.優化器介紹及應用
9.CNN應用于手寫數字識別
10.cifar-10圖片分類
11.模型的保存和載入
12.繪制網絡結構 |
第三天
上午 |
圖像識別項目 |
1.介紹Google圖像識別模型Inception-v3
2.使用Inception-v3做圖像識別 |
貓狗分類項目 |
1.圖像數據預處理
2.貓狗分類-簡單CNN
3.貓狗分類-VGG16-bottleneck
4.貓狗分類-VGG16-Finetune |
驗證碼識別項目 |
1.多任務學習介紹
2.驗證碼識別項目 |
第三天
下午 |
目標檢測項目 |
1.目標檢測任務介紹
2.RCNN/Fast-RCNN/Faster-RCNN算法介紹
3.YOLO算法介紹
4.SSD算法介紹
5.目標檢測項目實戰 |
目標分割項目 |
1.目標分割任務介紹
2.全卷積網絡
3.雙線性上采樣
4.特征金字塔
5.Mask RCNN算法介紹
6.目標分割項目實戰 |
圖像風格遷移項目 |
1.圖像風格遷移介紹
2.圖像風格遷移項目實戰 |
GAN項目 |
1.生成式對抗網絡GAN介紹
2.生成式對抗網絡GAN項目實戰 |
(注:大綱還可根據需求進行調整)
覃棅豐
創業公司技術負責人。機器學習,深度學習領域多年一線開發研究經驗,精通算法原理與編程實踐。曾使用Tensorflow,Caffe,Keras等深度學習框架完成過多項圖像,語音,nlp,搜索相關的人工智能實際項目,研發經驗豐富。擁有兩項國家專利,同時具有多年授課培訓經驗,講課通熟易懂,代碼風格簡潔清晰。
人工智能相關工作經歷:
上海希格斯網絡科技有限公司 數據挖掘工程師
1.負責深度學習NLP算法的研究和實現。
2.負責搜索引擎的實現和優化。
上海索洛信息技術有限公司 高級算法工程師
1.負責深度學習圖像算法的研究和實現。
2.負責深度學習語音算法的研究和實現。
人工智能相關項目經驗:
人崗匹配項目 負責算法實現
● 收集了10萬份JD。
● 基于Tensorflow平臺使用LSTM+Attention算法。
● 使用JD訓練職位推薦模型。訓練好的模型可用于分析簡歷描述,并根據簡歷描述推薦一個或多個適合的職位。
項目關鍵詞提取項目 負責算法實現
● 收集了10萬份項目描述,并標記好項目中的關鍵詞。
● 基于Tensorflow平臺使用seq2seq模型。
● 從簡歷的項目描述中提取出該項目中的重點詞匯。可用于優化簡歷項目搜索結果。
人才搜索引擎項目 負責搜索引擎的實現和優化
● 搭建簡歷搜索引擎服務。
● 完成學校名,專業,公司,行業等模塊的搜索策略
● 完成搜索結果高亮服務。
● 修改搜索bug優化搜索算法。
寵物臉識別項目 負責數據處理,算法實現
● 收集了5萬張狗/貓的照片,并標記好它們臉部的區域。
● 在Linux下基于Caffe平臺使用Faster-rcnn實現狗/貓臉檢測算法。
● 推出了一款在線小游戲,用戶上傳自己家狗/貓的照片,服務器接收到照片之后用訓練好的模型檢測照片中狗/貓的臉,并把狗/貓的臉框出來,給它們的長相打一上個分數,再把處理后的照片反饋給用戶。
寵物品種識別項目 負責數據處理,算法實現
● 收集了19種貓和27種狗的照片,共3萬多張,并做好分類標簽。
● 基于Caffe平臺使用AlexNet,GoogleNet以及自己設計的網絡實現寵物品種分類算法。
● 推出了一款在線小游戲,用戶上傳自己家狗/貓的照片,服務器接收到照片之后用訓練好的模型檢測照片中狗/貓的品種,不同寵物的品種會對應不同明星的臉,再把與寵物品種相似的明星臉反饋給用戶。
寵物叫聲情感分類項目 負責數據處理,算法實現
● 收集了1萬6千條狗叫聲,分成8個類別。
● 基于Tensorflow平臺使用CNN,LSTM實現狗叫聲情感分類算法。
● 將訓練好的模型放到嵌入式設備中,實時判斷當前場景是否有狗叫聲,有狗叫聲的話是屬于什么分類。