coletangsy
coletangsy

學習 Data Science、Machine Learning 中,透過記錄,一步一步往目標前進。

【學習記錄】 2021.05.13

今天學習時間為5H 32M,一個不小心就改成隔日更新的學習筆記
小總結
  1. 跑步 
  2. 完成 Google Data Analytics Professional Certificate (5/8)
  3. 溫習 Pandas 寫法


內容及反思

關於跑步,有時候覺得出了一身汗後,頭腦反而更清晰,個人也更有精神。雖然跑的不久,也跑的不快,但是跑步的時候甚麼都不用想,可以放空自己,是在我生活中不可或缺的一小段時間。最近香港天氣很悶熱,反而流更多的汗,回到家立馬洗澡然後涼在空調下,是舒服到坐在椅子都可以立馬睡著的程度。

今天完成了Google Data Analytics Professional Certificate (5/8),這個 (5/8) 其實是指 Google Data Analytics Professional Certificate 總共 8個課程中的第 5個。每完成一個課程都會有一個證書,當你完成整個系列的所有課程,就可以得到一張系列的 Professional Certificate

My Coursera Course Certificate for "Analyze Data to Answer Questions".

事實上需要的時間跟想像中的差不多(也可能是因為我還未到Capstone Project),不過我是算沒有在跟它設計的時間安排去讀,我用一整天去吸收它一個課程內,設計給 2-3 星期的內容。按我這樣子的速度,也剛好今天完結了一個課程,感覺明天得停下來,溫習一下之前所學的內容。不過按目前計劃的進度,感覺可以在下一次收費前完成整個系列,省下了一個月的費用。(按我理解,Coursera 的單一課程收費是:7天免費,然後按月收費,每個月$39 美元。)

Courses: Google v.s. IBM

雖然還未完成整個系列,不過就個人而言,在同一個平台上,我覺得Google 提供的這個數據分析課程比 IBM的要好,當然也有 IBM 的很早就上線;Google 的今年年初才上,有更多優化時間的原因在內。但主要在學習上,我會認為Google 提供的配套資源更好。我的判斷,主要基於我比較看重課程設計跟配套對學習有沒有幫助(/造成額外問題)之上。

首先在平台上,Google 提供的給自家平台的學生帳號上,操作上用戶體驗就很好,不像IBM Cloud 那樣子,花了半天都卡在設定上。而在提供的閱讀材料方面,Google 提供的是可以抄寫的文字內容,IBM 提供是解像度一般的PDF文檔(沒有OCR),在User-friendly上,看不看得清楚跟方不方便做筆記,就已經有一定程度的差別(也可能是我屏幕問題)。另外一點是,在他們的課後小測問題內容上,IBM 的也令人覺得好像有點划水,比如我記得我有遇過問 "以下哪(幾)個程式可以寫R/Python?" 就會覺得沒有必要檢查這種內容吧。最後上完第一個課程彼就停掉,改去Google的懷抱了。

關於 Python Pandas 的寫法,今天在做練習中遇到一條留下印象的題目。是要寫一條Code,找出dataset 中多少人信用卡會在 2025年到期,這部分其實就是要傳回 CC Exp Date (DD/YY) Column 下的最後2個字元 (YY)。

練習用的虛構 Dataset (以防萬一 還是打馬賽克)
import pandas as pd
ecom = pd.read_csv("XX")

## 用 .str[:] 去截取 DD/YY 中的YY (理清邏輯用)
ecom["CC Exp Date"].str[3:]
## 判斷截取 DD/YY 中的YY 是否等於 "25" (理清邏輯用)
ecom["CC Exp Date"].str[3:] == "25"
## 最後再用sum 跟 .value_counts() 去得出符合條件的人數  (答案)
sum(ecom[ecom["CC Exp Date"].str[3:] == "25"].value_counts())

感覺在清洗數據的過程中,會挺常用到這寫法。


至於個人學習計劃,昨天跟今天都花了一點時間整理了一個甘特圖。其實就是將我手上有的網上資源,填進去之前畫的大綱。

My Study Plan (?) - 20210513 Ver1

會看到目前只有排到月中,因為我不希望在一開始就安排一個十分理想的時間分配,然後因為一天沒做到而整個浪費掉。所以我先把最近的一部分計劃好,之後的竟按照之後的情況再去排會更好。


未來幾天計劃

明天一整天應該就會是上面提到的內容覆習,以及完成Bootcamp 中Matplotlib 的部分。還有之前累積下來的 Python Function 練習。

之後周末的部分,也是比較少學習上的安排,因為約了朋友一起去外面走走看日落。另外還想給自己安排一個事情,就是如果走的太累,第二天離不開房間,就打開1984/Understanding Global Conflict And Cooperation,不要刷電話了。每天對著電腦 6, 7 小時,近視都要加深了。


本週目標
  1. 跑步
  2. 完成 Google Data Analytics Professional Certificate (5/8)
  3. 到外邊走走,不要一直關在家中 (週末)
  4. 定下幾個小項目的方向,目前好奇的問題包括:
—香港政府花了多少錢在做文化推廣?(可能周末可以寫寫為甚麼我會有這個問題)
—目前全球潔淨能源生產量及用量?
—運用數據分析不同STAYCATION風格下,哪間酒店是最好的選擇?
—在電競比賽中,舉辦地的選擇多大程度影響收看人數?
—全球樂園的入場率在COVID 下長甚麼樣子?
CC BY-NC-ND 2.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…
加载中…

发布评论