今天的內容會帶大家了解
Dataframe 欄位的資料類型及處理
一般資料的欄位變數可以分為:離散變數、連續變數
Pandas Dataframe 的欄位資料類型可以分為:float64 浮點數、int64 整數、object字串及類型
通常拿到資料的第一步,就是看我們有什麼欄位、欄位代表什麼意義、儲存的資料類型
而資料原本是字串或是類別的話,如果要進一步做分析就必須轉為數值的資料
通常是透過 Label encoding、One Hot encoding 來做轉換
有了大概的理解之後,我們開始今天的學習吧!!!