於相同的資料,來自相同的居民,根據相同的收入。所有都是相同的,但顯然其中有一個資料令人誤解,足以與彌天大謊相媲美。
我的花招就是兩次分別使用了不同的平均數,“平均數”這個詞寬泛的涵義幫了大忙。當一個傢伙希望用資料影響公眾觀點,或者向其他人推銷廣告版面,平均數便是一個經常被使用的伎倆,雖然偶爾是出於無心,但更多的時候是明知故犯。所以,當你被告知某個數是平均數時,除非能說出它的具體種類——均值,中位數,還是眾數,否則你對它的具體涵義仍知之甚少。
在希望數值較大時,我使用的10000英鎊是均值,也就是附近居民收入的算術平均數。你只要將所有家庭的收入加起來併除以家庭總戶數便可得到這種算術平均數。數值相對較小的是中位數,它告訴我們一半家庭的年收入超過2000英鎊,另一半家庭的年收入不及2000英鎊。我還可以利用眾數——所有家庭收入序列中出現次數最多的那個收入。例如,附近的居民中年收入為3000英鎊的家庭數是最多的,那麼收入的眾數就是一年3000英鎊。
在這個例子中,不合適的“平均數”實際上是毫無意義的,只要碰到關於收入的資料,這種情況就經常出現。還有一個因素會讓我們困惑不已——某種條件下,各種型別平均數的數值十分接近,如果出於一般的目的,根本沒有必要區分它們。
比方說,當你看到某個原始部落男性的平均身高為5英尺時,你對這些人的外形條件就能有很好的瞭解,根本不需要進一步詢問這個平均數是均值、中位數或者眾數,因為此時各種平均數的數值大致相等。(當然,如果你正在為非洲人趕製一批###,那麼就需要比平均數更多的資訊,你要用到全距和標準差,這些我們將在下一章進行介紹。)
在處理諸如人類特徵的資料時,各種平均數的數值十分接近。這些資料具有我們常說的正態分佈的形態特點,在你用###繪製正態分佈時,將看到一根鐘形的###,均值、中位數和眾數都落在相同的點上。書包 網 。 想看書來
精心挑選的平均數(2)
在描述人類身高時,用哪種平均數無關緊要,但在描述他們的錢袋時,卻並不是那麼回事兒了。如果把某個城市所有家庭的年收入都列出來,你會發現,這些數從很小的值變動到很大的數,也許有20000英鎊左右,甚至還能看到少數鉅額收入。年收入低於5000英鎊所佔的比例超過了95%,在收入###上朝左邊拖出了一條長長的尾巴。這種分佈不再像鐘形一樣對稱,而是有偏的,它的形狀類似於孩子玩的滑梯,梯子一側是陡斜地升到頂部,而滑道一側則緩慢向下傾斜。均值與中位數相差甚遠,這樣一來,比較去年的“平均數”(均值)與今年的“平均數”(中位數),這種比較的有效性就不言而喻了。
在我賣給你房子所在的居民區裡,兩個平均數的差距如此之大,因為收入是顯著偏斜的。你的鄰居中大多數都是小農、在附近村莊上班的工薪階層或是靠養老金為生的退休老人,但有3戶鄰居是百萬富翁,他們僅僅是來此度週末。就是這3戶鄰居的收入提高了總收入,相應地抬高了算術平均數。這樣一來,均值達到了絕大多數家庭遙不可及的水平,幾乎每個人都低於平均數。雖然這聽起來像是笑話或者文學修辭,但的確是不爭的事實。
當你聽到公司執行總裁或企業所有者宣稱,在他的企業中員工的平均收入是多少時,你應該好好思考一下其中的原因。如果這個數是中位數,你可以獲得一些顯而易見的資訊:一半員工賺得比它多,一半比它少。但如果是均值(請相信我,沒有確切指出它的種類時,多半是均值),它僅僅是所有者25000英鎊的高收入與全體工人低水平收入的平均數,根本沒有什麼意義。“平均年收入為3800英鎊”既隱瞞了1400英鎊的低收入,又隱瞞了所有者以鉅額薪金形式抽取的高額利潤。
這類似於雙人拉鋸——現實情況越糟,看上去卻越好。在一些公司的宣告中也會採用這種方法。讓我們試著舉個簡單的例子來說明。假設你是某個小型製造企業的3個合夥人之一。這是豐收的一年,到了年底,你給企業的90個職工共發了99000英鎊,他們的工作是生產、運輸椅子,或者你所經營的任何東西。你和其他合夥人每人各獲得5500英鎊的工資;最後還餘下21000英鎊,作為利潤可供你們3個合夥人平分。你將如何說明這種情況呢?為了便於理解,你打算採用平均數的形式。既然所有的職工從事相同的工作,獲得同樣的