暗數據
暗數據¶
全書在講述數據可以說是新世界的石油,雖然科學會強調以數據說話,但要注意到收集與規劃數據的是人、過程使用的機台、結果的歸納解釋都會影響數據,因此在解讀數據時需要多加留意。
作者歸納出幾種暗數據
1.我們知道漏掉的數據:已知的未知,表單有人拒絕回答而留空
2.我們不知道漏掉的數據:未知的未知,例如不知道誰會回答,因此沒注意到有些人根本沒回應
3.選擇部分情況;例如特定時間調查存活率問券,卻調查不到已經去世的人
4.自我選擇:例如患者自我選擇是否要被納入統計(中途離開實驗等)
5.漏掉關鍵因素:因為暗數據,找不到真正的關聯,例如裙子短冰淇淋銷量好
6.隨時間而異:結果會因為時空環境不同而變
7.數據的定義:不同的解讀會導致大相徑庭
8.數據的摘要:當數據聚合後,細節度就不再
9.量測誤差與不確定:誤差值
10.反饋與玩弄:當數據收集程序收到數據影響,例如股價泡沫
11.資訊不對稱:內線等
12.刻意弄暗的數據:刻意操弄數據
13.編造與合成數據:可能存在的詐騙行為
Comments
Loading comments…
Leave a Comment