數據科學 :十二星座跟統計學有一腿!?

歡迎來到數據科學系列,本系列將以生活化的方式介紹什麼是數據科學以及如何取得數據科學相關的學位或認證。


 什麼是數據科學(Data Science)?

數據科學包含的範圍非常的廣大,在不同的領域數據科學包含了千變萬化的知識。

數據科學主要的構成是:

統計學 + 電腦科學 (計算機科學)資訊工程 + 駭客精神


12星座如何應對雾霾天 Credit: 畫星座漫畫的PIEPIE
        Credit: 畫星座漫畫的PIEPIE

十二星座(更準確的說法是占星學)跟統計學有什麼關係?在此之前我們要了解什麼是統計學 (Statistics)

根據MBALIB,統計學是應用數學的一個分支,主要通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,然後進行推斷預測,為相關決策提供依據和參考。它被廣泛的應用在各門學科之上,從物理和社會科學到人文科學,甚至被用來工商業及政府的情報決策之上。

聽起來很複雜但事實上很簡單。我舉幾個日常生活常遇到的“統計結果”:

  • 為什麼好萊塢電影用越來越多特效?
  • 為什麼心理學家知道人的眼球往右上角看是在說謊?
  • 為什麼“瘦”是當今的主流?
  • 為什麼百貨公司要在這一天做促銷?
  • 為什麼20歲的汽車保險比50歲的人高?

 

那統計學跟占星學有什麼關聯?許多人認為在天上運行的星體跟出生日期怎麼會影響到人的性格跟命格,占星學不值得去相信。會有這樣的結果那是因為星座跟性格/命格的因果關係(Correlation)過於薄弱。

為什麼天蠍座會被形容程很有心機? 為什麼魔羯座讓人覺得很木訥? 為什麼雙子座口才好?

這些都是經過長久以來的以經驗法則(Rules of Thumb) 的統計方法不斷向真理逼近整合出來的概率:一個星座比平均值更容易出現一個特徵。所以天蠍座的人比其他星座更容易出現有心機的人,摩羯座普遍比較悶騷…等等的。

有人會說星座又不準,統計學不是百分之百的準確,他只是指出一個參數有多少機率落在這置信區間以內。舉一個經典的統計學例子,扔銅板。一個銅板有正反兩面,以長遠來看正面的機率與背面的機率各是1/2。但是今天你扔10次,結果會剛好正反個五次嗎?你有可能得到正面1次反面9次或是正面4次反面6次。雖然結果跟1/2不同,但是你還是知道正面跟反面的機率各是1/2,而不是你得到的結果。所以說如果你認識10個天蠍座各各都新地善良傻呼傻呼沒心機,這只代表著這10個天蠍人的這個特徵 (參數) 都不落在置信區間內。

信者相信星座與性格/命格有因果關係。反之,不信者懷疑星座跟性格/名閣之間有著無法解釋的因果關係所以不信。現代的占星學帶有太多的主觀意識以及以偏概全的經驗談。實質上探討生日跟性格的關聯應該撇除星座這個會讓人有刻板印象的框框,但是細節就不在統計學的討論範圍內了。

十二星座被關進手機裏的反應 Credit: 畫星座漫畫的PIEPIE

發表迴響