數據科學 :數據科學其實跟買衣服一樣!?

歡迎來到數據科學系列,本系列將以生活化的方式介紹什麼是數據科學以及如何取得數據科學相關的學位或認證。


 

什麼是數據科學(Data Science)?

數據科學包含的範圍非常的廣大,運用在不同的領域數據科學包含了千變萬化的知識。

數據科學主要的構成是:

統計學 + 電腦科學 (計算機科學)資訊工程 + 駭客精神


 

Credit: Utah
Credit: Utah

電腦科學 (計算機科學) 以及資訊工程對數據科學來說是不可或缺的好夥伴,本篇將運用買衣服跟製造衣櫥來解釋什麼是電腦科學跟資訊工程。在介紹的過程中會繁複的出現專有名詞,若不想因此睡著者可以跳過直接看籃字綠字部分。

 

為什麼要學電腦科學 (Computer Science)

根據 Wikipedia,電腦科學是系統性研究訊息與計算的理論基礎以及它們在電腦系統中如何實作與應用的實用技術的學。基本上電腦科學只是一個統稱,它包含了硬體跟軟體,而在軟體分為理論以及應用。理論電腦科學包含計算理論、訊息與編碼、演算、程序設計、形式化方法、並行並列和分部式系統、資料庫和訊息檢索。應用電腦科學包含人工智慧、電腦體系結構與工程、電腦圖形與視覺、電腦保安和密碼、計算科學、訊息科學、軟體工程。

電腦科學精簡解釋就是設計 (Designing)、邊寫 (Writing)、測試(Testing)、調試 (Bebugging)、以及維護 (Maintaining)程序代碼。

 

資訊工程 (Information Engineering / Data Engineering)有什麼關聯?

資訊工程涉及了獲得(Acquiring)、消化(Ingesting)、轉換(Transforming)、儲存(Storing)、取回(Retrieving)資訊。我覺得最簡單的方式來解釋資訊工程是看看資訊工程師常常面臨的問題:

  • 獲取 – 數據是從哪裡來的?數是以什麼形式接受到?要如何獲取到數據?
  • 消化 – 程序要怎麼消化數據?數據有多大?數據以多快的方式進來?數據要怎麼分類?
  • 轉換 – 怎麼把原始數據轉換成有用的數據?
  • 儲存 – 怎麼樣的系統儲存數據最好?系統速度夠快嗎?要如何歸檔?
  • 取回 – 要用什麼形式呈現數據?可以只取回一部分的數據嗎?

數據科學跟衣櫥衣服有什麼關聯?

Credit: I Blog Fashion
Credit: I Blog Fashion

想像你現在需要一個衣櫥,你打算自己徒手做一個。

先根據需求設計出一個框架然後畫設計圖。你深知你是ㄧ個愛買衣服的人,所以當你在設計衣櫥時考量到未來你需要更大的衣櫥時,能不能擴大畫完過後你要選擇用什麼材料來製造衣櫥,是要用柚木還是檜木?哪一個材料比較容易包養跟擴展。製造期間監測實品有沒有跟著設計圖走,有的話穩不穩定。製作完後發現左邊的門比右邊的長,經過分析後決定把左邊的門鋸成跟右邊一樣組裝後再測試。做完衣櫥把衣服收進去後你想買一件外套。

你打算從大商場買還是精品店買?還是說要去實體店面還是電子商城?去實體的精品店的好了。你物色中一件連帽外套大衣,應該要掛起來或收進抽屜裡?收進抽屜理會不會容易皺?看來掛起才不會皺。除非你異於常人,不然外套是需要搭配其他衣服穿戴的。這件外套可以跟其他衣服搭配嗎?當然可以(就算是不行也死都要買)要怎麼搭配呢?冬天配毛衣應該不錯而且超實用,一般出去可以穿,特殊場合也可以穿。既然一般出門可以穿那是不是應該放在顯眼的地方呢?你決定把它跟別的外套掛在一起,但是掛在最容易看到的地方。

你開開心心的把它買回家後的那幾天都是大熱天沒機會穿,兩天後寒流來襲你打算穿它。你站在鏡子在想是要把帽子的部分拆掉搭配還是整件搭配?應該要搭配黑色的長褲還是牛仔褲?你把每件上衣跟褲子都翻出來搭配最後你決定配黑色長褲、白色潮T開心的出門。

半年後為了你心愛的衣服你不忘要定期打蠟保持衣櫥的可用性可是你發現衣櫥太小衣服太多了。所以你決定先來個大掃除把衣服重新整理分類然後把不要的衣服給丟了最後你重覆以上步驟把衣櫥的空間加大了一倍。


 

看完以上的例子再讀一次下列文字:

設計 (Designing)、邊寫 (Writing)、測試(Testing)、調試 (Bebugging)、維護 (Maintaining)程序代碼

獲得(Acquiring)、消化(Ingesting)、轉換(Transforming)、儲存(Storing)、取回(Retrieving)資訊

讀完應該會發現比喻為製造衣櫥是藍字電腦科學的部分,。比喻為買衣服的是綠字的資訊工程。所以在生活上我們都是自己的小小資訊工程師,並選擇使用什麼樣的平台來整理我們身邊的東西。

發表迴響