課程介紹-資料科學家的工作
機器學習方法介紹-Scikit-Learn、k最近鄰居法、迴歸、決策樹
機器學習方法介紹-隱馬爾科夫模型(Hidden Markov Model, HMM)及循環神經網路(Recurrent Neural Network, RNN)
資料獲取-網路爬蟲
資料獲取-物聯網及API應用操作
資料清理-正則表達式、資料型別轉換、遺漏資料與異常值處理、時間序列資料處理及重塑資料
資料儲存及調用實作-關聯式資料庫及結構化查詢語言,以MySQL為例
資料儲存及調用實作-NoSQL/鍵值(Key-Value)資料庫,以Firebase為例
期中考
自然語言處理-方法、工具介紹與專題分組
自然語言處理-科學運算工具NumPy、Panda
自然語言處理-機器學習工具Scikit-Learn
自然語言處理-資料建模和數據分析競賽平台Kaggle
自然語言處理-全文檢索、文本分詞(Text Segmentation)、建立字典及轉換數字序列
自然語言處理-中文(多)語言處理Stanford CoreNLP, Stanza
資料視覺化-Matplotlib, amCharts
分組報告
期末考