1. 鬼扯的其中一個重要類型是「狡言遁詞」,利用字面與隱含之間的差距來逃避責任。
2.「布蘭多里尼定律」2014年由義大利軟體工程師布蘭多里尼所創,指出「反駁鬼扯所需的力氣,是製造鬼扯所需力氣的十倍」。
3.根據瑞森的研究,最成功的標題不說事實,而是承諾給你一次情感體驗。
4.人們參與社群媒體時,分享新知倒在其次,主要還是為了維持與強化共同的連結。危險的是,在這過程中,曾是全國性的集體對話從此變得支離破碎。人們開始擁抱「部落知識論」,亦即真相本身跟事實與否,或是否為實際經驗等較不相關,而是看那些話是誰說的,以及內容跟所屬群體的世界觀有多吻合。
5.當社群媒體用戶分享所看到的宣傳內容時,即是以自身的社會資本去支持另一人傳播的偽資訊。
6.如果不謹慎,依照時間順序去看事情可能讓你被誤導。只因為甲事比乙事更早發生,甚至就算兩事有關聯,也不代表甲就是造成乙的原因。
7.假如你是測量者,想一想這個測量是否會改變人的行為,進而破壞測量結果的重要性。
8.圖表的重點應該是數據資料而非引人目光的裝飾,違反這個原則的圖表就稱為「鴨子」。
9.百分比的計算碰到牽涉其中的數字為負數時,就可能得出奇怪的答案。當任何一個類別出現減少(負數)的情況時,我們就不該以百分比的方式討論各個類別對總改變量的影響。
10.機器學習領域的重大難題之一就是不透明性。機器學習技術的核心目的就是省去人類告訴電腦要學什麼,以達成目標的麻煩。反過來由機器創造出自己的規則,而做出決定,這些規則對人類而言往往都沒什麼道理。
11.透過訓練,記者學會在碰到任何消息時提出以下問題:1.現在告訴我這件事的人是誰?2.他如何得知此事?3.這個人試圖要賣給我的是什麼?
12.驗證性偏誤是一種相信並分享符合你我既存信念之資訊的傾向。當某種說法肯定我們對世界的信念,我們就會更傾向接受該說法為真,比較不會質疑其可能為假。
心得
本書介紹常見的數據誤導,最常見的是數據分析圖像的誤導。其實真的只要有心,擷取有心人需要的片段,一整個數據海中都可以撈出他想表達的方向,來引導讀者的想法。令我印象最深刻的是某共和黨參議員指出從2005年以來的15年之間平均溫度持平,藉此證出沒有全球暖化的現象。但是事實是2005年前剛好有聖嬰現象,特別高溫,所以後面幾年的增溫反而看不出來。但是就算不懂氣象的前因後果也沒關係,可信的氣溫記錄有將近一百年,為什麼就取15年而已?肯定就是百年的資料不符合他的政治目的,所以取中間符合他的15年這樣。
所以我們在看資料時,一定要看資料的完整性、持續性,不可以隨便看掐中間的數值,才不會容易被誤導。書中的例子很多,長條圖去頭尾、資料去掉前面、去掉零等,可能都是有陷阱的,不得不慎。之前看過另一本書是類似的,統計的藝術?所以看本書大多不訝異。
最後強調小心p值的應用及認知。如同前書所言,p<0.05不是絕對,只是人為設定出來的,意義在於20次裡面有19次為真(95%),算是大家公認可接受的範圍了。所以這並不是100%為真,而且p也可以設定為0.01,它身為0.05並非鐵律。由於我們都關注在顯著性,所以非顯著性的論文幾乎不會發表出來。不知道背後多少未發出的文章下,現行的論文其真實為真就很可疑。另外就是寫論文的動機就是為了發表,所以可能會產生湊資料湊出p0.05的文章,就更是完全失去科學公正性。
總而言之現在社群、媒體氾濫,低劣資訊太多,就算是數據化的資訊也藏有相當多的陷阱,身為現代人不可不慎。就算看到數據信服的文章也不能輕信,最好能先找一下反面的資訊,確定雙方的論點後再評估何者合理。
沒有留言:
張貼留言