Posts

Showing posts from February, 2015

《大數據 Big Data:A Revolution That Will Transform How We Live, Work, and Think 》讀書筆記

Image
Big data 已經是所有行動世代耳熟能詳的名詞,即使不曾使用過,也聽聞過。既然大數據的收集與應用門檻已經降低,自然而然在軟體設計工作上,便希望倚賴 big data 來協助,提高身為規劃者做出「有效決定」的機率,因應此,與 team members 共讀摘要《大數據》讀書筆記如下。
Ch. 1第1章 現在 NOW
該讓巨量資料說話了 Big data 需要建基於一定的科技發展,因為「收集大數據」本身便已具備一定的科技門檻Big data 要我們暫時拋下對因果關係的執著 (Why),轉而擁抱簡單的相關性 correlation (What);但我們在做各種設計決策時,若僅考慮 What 而忽略 Why,很可能會做出誤差判斷… 但這本書又叫我們要「容忍誤差」!
原本的抽樣調查誤差可能發生在資料收集的環節,但現在因為資料的量變造成質變,大量收集資料後,不精準的誤差被數據量稀釋了。「當面對極大量的資料時,就不會堅持一切都要作到精準」Open questions:
掌握 Big data 的一方,已經握有科技時代掌舵的鑰匙。例如 Google 開放了熱門關鍵字搜尋,我們才能據此發展設計或創意,但若 Google 不開放?!目前以工作上應用來說,直接面對的問題是:要抓哪些資料?如何分析所得到的資料?如何依據所得 raw data 定義出設計決策?真的可以忽略 why 而僅考慮 what 嗎?Reference尿布、啤酒、星期五─每個人都該懂的Data mining Ch. 2 第2章 更多資料 MORE
「樣本=母體」的時代來臨 過去「隨機抽樣」研究方法的廣泛運用甚至無限上綱,起因於歷史上對於樣本研究的科技限制;然而抽樣資訊必然會有所遺漏,且資料無法重複使用或延續再分析。「使用巨量資料做研究,就像是釣魚,一開始的時候,非但不知是否掉得到東西,連『釣得到什麼』也還在未定之數。」因此我們應用在 App develop 上,採用 GA 收集資料,需要想出「大概可以下釣餌」的地方,但也沒辦法確認是否可以拿到想要、有用的研究結果。Big data: 攝影師可以先照完像,之後再在數位檔案決定要把焦點對焦在哪裡,可以查看細節或是進行新的分析。倚仗高度科技應用的 Big data 可以在「不影響使用者日常習慣」的前提下收集資料,可以較接近真實。Big data 的時代,需要延伸的是 Data min…