coletangsy
coletangsy

學習 Data Science、Machine Learning 中,透過記錄,一步一步往目標前進。

【本週總結】 Week 29 - 再次更新方向

本週總結

  1. 開始 Deep Learning 
  2. 決定往 Customer Experience, Product Analysis & Marketing 方向走
  3. 新的方向思考 Hypeparameter Tuning




本週回顧

開始Deep Learning

由於日間課程的進度已經走到Deep Learning了,我也只好一邊繼續研究 Machine Learning 一邊學習Deep Learning。本週老師(新老師叫Sat.),主要講解了CNN (卷積神經網路)、RNN(循環神經網路) LSTM。由各個Neural Network 的運算邏輯,Activiation Function、數學運算式、在RNN中 sigmoid, Tanh會引起的Vanishing Gradient &Exploding Gradient Problem, 到Tensorflow 的 code 結構等等都有一一講解。

另外,我也在CSDN上,找到好幾篇寫得很清楚的文章,比如 如何从RNN起步,一步一步通俗理解LSTM_结构之法 這一篇以及作者的其他文章,然後在課上每講完一個 Neural Network,我也會另外上YT,觀看MIT 的 Deep Learning 課程影片 作溫習,穩固知識點。可能是因為這樣,感覺上好像沒有像之前讀 Machine Learning 那麼吃力。


決定 Profolio 方向

在前幾天跟Sat 討論了一下目前方向跟 Profolio,他建議我(們),比起做各類型的 Kaggle 比賽,建立一個專注某個方向的 Profolio 會較有效益,事實上我也認同他的說法。目前我是打算專注在Customer Experience, Product Analysis, Marketing 這個方向去走(我認為這幾項是互相有關連),再加上自己有兩個與這方向有關的簡單EDA,在建立不算由零開始,另外在求職網站上也看到有這方向的需求。

目前關於Profolio的短期目標是完成手上的電信業顧客流失率項目(建立預測模型)、以及完善之前兩個EDA,再按這幾份為基礎,建立Profolio,完成期限先定為八月中,之後再開始 sentiment analysis。


Hyperparameter Tuning

在網上找資料時,剛好發現一個在Medium 分享的文章,這位(他分享的兩個專案 Titanic , KKbox Churn)的方向是先專注在 Features Engineering 上,然後再逐步增加 Features (避免Over-fitting 問題)。當然我也要再多閱讀一些文章,才能判斷這方向是不是針對 Kaggle 比賽,現實上可行性較低,還是說其實沒有太太關係(至少目前我還沒想到比較大的壞處,可能是需時較長嗎?),但是由他的文章以及得到的結果,可以看出Features Engineering 的重要性,這給了我新的方向:與其執著於Hyperparameter Tuning,不如先把 Feature Engineering 做到極致。

然後在他的文章中,也發現了一篇很有用的打底實作文章 Panas 101 Numpy 101 and RegularExpression | by YL-Tsai | Medium ,配合上繼續做hackerrank,希望可以有效提升自己的Coding 水平。




本週日常

這個星期五接種了第二針的復必泰,接種時負責給我注射的男護士再提醒一次可能的副作用,那時候我在怕打針沒在聽啦,然後那一晚我還想著「這次手臂肌肉沒上次痛誒也沒甚麼嘛」,然後下一天也就是昨天就被打臉了。昨天一起床就覺得不對勁,量個體溫就發現發燒(副作用來了)。幸好接種時還記得問說如果發燒可以吃甚麼藥,最後就是吃藥跟睡了一整天,今天起來就沒事了。

只是前幾天看到說打復必泰的之後要接種第三針補足抗體(?)......

CC BY-NC-ND 2.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…
加载中…

发布评论