暗數據

暗數據

暗數據

全書在講述數據可以說是新世界的石油,雖然科學會強調以數據說話,但要注意到收集與規劃數據的是人、過程使用的機台、結果的歸納解釋都會影響數據,因此在解讀數據時需要多加留意。

作者歸納出幾種暗數據

1.我們知道漏掉的數據:已知的未知,表單有人拒絕回答而留空

2.我們不知道漏掉的數據:未知的未知,例如不知道誰會回答,因此沒注意到有些人根本沒回應

3.選擇部分情況;例如特定時間調查存活率問券,卻調查不到已經去世的人

4.自我選擇:例如患者自我選擇是否要被納入統計(中途離開實驗等)

5.漏掉關鍵因素:因為暗數據,找不到真正的關聯,例如裙子短冰淇淋銷量好

6.隨時間而異:結果會因為時空環境不同而變

7.數據的定義:不同的解讀會導致大相徑庭

8.數據的摘要:當數據聚合後,細節度就不再

9.量測誤差與不確定:誤差值

10.反饋與玩弄:當數據收集程序收到數據影響,例如股價泡沫

11.資訊不對稱:內線等

12.刻意弄暗的數據:刻意操弄數據

13.編造與合成數據:可能存在的詐騙行為

程式

Comments

Loading comments…

Leave a Comment