資料分析圖表解密的內容

來源:果殼範文吧 2.23W

“字不如表,表不如圖”,這八字訣在資料分析工作者眼中被視為祕籍,各種資料分析圖表,各種“忽悠”,資料會說謊,統計會撒謊,圖表也會騙人。現在資訊視覺化如此流行,不面對圖表都不行。圖表中所包含的資訊量越來越大,讀圖讀什麼,是一個有必要說道說道的話題。

資料分析圖表解密的內容

首先,上一張資料分析圖表,看看怎麼讀,讀什麼?

資料化管理有一篇部落格非常精彩,“資料的忽悠功能”。如上圖所示,左右兩張市場佔有率線圖,發現不同了麼?資料來源是一樣的,佔有率都是05年到10你那增加1.3%。第一張圖乍一看市場佔有率氣勢如虹,第二張卻毫無亮點。是不是被忽悠到了?

因此,我們有必要了解一下如何讀圖表,讀圖讀什麼?我們首先做一下簡單的總結;

【突破點1】看清座標軸刻度尺比例

造成左右兩圖如此詫異的的結果就是出自刻度尺比例的調整,比例跨度較大時顯得高歌猛進,較小時毫無看點。看到圖表後,讀者首先應該看清楚刻度尺比例的安排,防止資料被“放大”或“放小”。

更有欺騙性的是作者直接去掉座標軸,這是不可取的做法,嚴重影響讀者對圖表的理解。如果你是老闆,當然不會允許這樣的圖表出現,適當時要“家法”伺候了,呵呵。

【突破點2】看清圖表的標題

“公司銷售額趨勢變化”,“產品地獄生產力分佈”“資產分配佔比”“僱員年齡分佈”等等這樣的標題,讀後雨裡霧裡一無所獲,趨勢是什麼?如何分佈的?關係是什麼?為什麼不考慮直接報這層結果作為標題呢?

不要猶豫,為了增強圖表的有效性,應該把圖表的主題作為圖表的標題來使喚了。看看上面的例子是不是就明白了呢。

【突破點3】快速識記最大和最小的專案

一張圖表往往含有大量的資訊,大量的數字,讀者您能記住多少呢?我建議,識記最大的和最小的專案,或者與你有關的數字,比如,你部門的,你負責的。

【突破點4】有沒有資料來源,是否可信

一般上,調研機構,市場研究機構或者企業公司,你部門內部的圖表你大概知道資料來源,也可信,可是有些圖表是釋出在網際網路上的,是面對廣大讀者的,這類圖表如果不出具資料來源地說明,其可信性就會大大降低。比如:專家提示你XXX,到底是不是專家,哪裡的專家?誰知道啊。

【突破點5】看清取值分佈的對比結果

這樣的資料分析圖表有很多,一般先做一些簡單的描述統計,看看圖形,看看關係,之後再進行統計假設檢驗,如上圖,從這些圖表上就可以初步判斷存在什麼樣的關係,注意,是初步判斷,如果你為了使結果更可信,則需要進行統計分析。

【突破點6】謹慎看待過於精確的常規數字

有媒體稱:在校大學生每日開銷大約為50元,你信麼?將信將疑吧,如果報道為在校大學生每日開銷51.74元,則看上去更加精確,但這仍然不一定值得信賴。這類數字尤其在電視、網際網路廣告中體現最為明顯,在生活中也能接觸到很多,比如有些領導人在回報工作、演講時振振有詞的數字,脫口而出的數字,連續讀出一長串數字,給聽眾的第一感覺是有氣場,超強自信,例如,某學校領導說該校畢業生就業率高達98.6%,一般人都信了,但如果你真的經歷過高校畢業,經歷過找工作的歷程,你“會心的一笑”、“無奈的搖頭”,因為,你以及同學的就業協議是輔導員幫忙代簽的!

做廣告、做演講現在已經形成這樣的習慣:當客戶不信任你,就用精確資料說服他,當聽眾不信任你,就用一連串精確資料震驚全場,這個習慣是好是壞我們不去評論,但作為聽眾、讀者的您應該對這些精確數字提高警惕!

【突破點7】讀同比資料-看清基數,是否可比,注意轉化指標!

業績同比增長在經營分析中經常用到,而且總是出現在會議一開始。如上圖所示,西北區域同比增長149.4,一枝獨秀,一片大好,一片掌聲,此時,總監坐不住了,指著圖片問,“西北區去年多少?營業網點幾家?”,頓時讓西北區的光環迅速褪去,看下圖吧。

現在知道了吧,西北區前一年沒有經營好,同比資料今年自然就非常好看了。但這是包裹不住的,我們不能總是盯著生意總數的變化來看,而應剖析指標,觀察每單位的增長情況,這樣,就可以將同比資料中的水分都擠掉。

【解密8】相關係數也會騙人

曹政老師:“某同事,名校計算機博士,演算法達人,做了一條曲線,A和B高度相關,得到結論,A會導致B,看一眼結論我就罵人了,狗屎結論,實際上是A和B均受C的`影響,所謂高度相關是C的因素帶來的,這是隻看資料不懂業務的典型。這個不僅僅是不懂業務的典型,統計基礎也不牢靠,親,這個時候該試試偏相關係數。”今天小博就此做一個簡單的案例展示,主要目的在於呈現這個騙局以及解密的方法。

假如你是某汽車供應商的業務人員,收集到一批汽車資料,很快,你發現上圖所示的關係,然後興奮的去找boss彙報,你猜結果會怎樣呢?如果在一個相對陌生的領域內,在處理簡單相關分析時希望能夠保持冷靜,多思考再下結論。

不要為了資料分析而分析,我們所有的分析專案最重要的遵旨:發現業務問題,解決業務問題。

我們分析的目的是找到是找到本質而拒絕假象,在判斷兩個變數之間的關係時,只有充分考慮到其他變數對二者之間的影響,才可能正確還原兩個變數的關係。在一個未知領域本身就是一種探索,而角度思考,多嘗試是尋找解決辦法的一個方法。



熱門標籤