常用的資料分析工具有那些?

來源:果殼範文吧 2.29W

本文觀點最初來源於百度知道:資料處理軟體有那些?百度知道的推薦答案是mathlab SPSSDIMENSION QUANTUM SASSurveycraft 等軟體,這些讓小編想起了大學時代的一些資料處理軟體包,比如計量經濟學中用到的eviews,但是這些遠不夠詳細,本想自己寫一篇資料分析相關軟體的文章,谷歌一下卻發現沈浩老師在幾年前就有過這樣的總結。沈浩老師介紹全文如下:

常用的資料分析工具有那些?

工欲善其事,必先利其器!

資料分析也好,統計分析也好,資料探勘也好、商業智慧也好都需要在學習的時候掌握各種分析手段和技能,特別是要掌握分析軟體工具!我曾經說過,沈老師的學習方法,一般是先學軟體開始,再去應用,再學會理論和原理,因為是老師,再去教給別人!沒有軟體的方法就不去學了,因為學了也不能做,除非你自己會程式設計序。

那麼在資料分析領域,都有哪些軟體分析工具呢?如何選擇呢?其實很多領域或者說分析方法都有相應的軟體工具,只要你想找就應該能夠找到!

這裡我把軟體分成縱橫四個層次的的象限圖來表達!

第一維度:資料儲存層>資料報表層>資料分析層>資料展現層

第二維度:使用者級>部門級>企業級>BI級

首先,儲存層:

我們必須能夠儲存資料,對個人來講至少應該掌握一種資料庫技術,當然也不一定要熟練操作,但至少要能夠理解資料的儲存和資料的基本結構和資料型別,比如資料的安全性、唯一性、冗餘性,表的關係,粒度,容量等,最好能夠理解SQL查詢語言的基本結構和讀取等等!

Access2003、Access07等:這是最基本的個人資料庫,經常用於個人或部分基本的資料儲存;

MySQL資料庫,這個對於部門級或者網際網路的資料庫應用是必要的,這個時候關鍵掌握資料庫的庫結構和SQL語言的資料查詢能力;

SQL Server 2005或更高版本,對中小企業,一些大型企業也可以採用SQL Server資料庫,其實這個時候本身除了資料儲存,也包括了資料報表和資料分析了,甚至資料探勘工具都在其中了;

DB2,Oracle資料庫都是大型資料庫了,主要是企業級,特別是大型企業或者對資料海量儲存需求的就是必須的了,一般大型資料庫公司都提供非常好的資料整合應用平臺;

BI級,實際上這個不是資料庫,而是建立在前面資料庫基礎上的,這個主要是資料庫的企業應用級了,一般這個時候的資料庫都叫資料倉庫了,Data Warehouse,建立在DW級上的資料儲存基本上都是商業智慧平臺,或許整合了各種資料分析,報表、分析和展現!

第二:報表層

當企業儲存了資料後,首先要解決的報表,還不是分析問題,是要能夠看到,看到報表,各種各樣的報表!國內外有專門提供報表分析服務的企業和軟體。

Crystal Report水晶報表,Bill報表,這都是全球最流行的報表工具,非常規範的報表設計思想,早期商業智慧其實大部分人的'理解就是報表系統,不借助IT技術人員就可以獲取企業各種資訊報表。而且很多資料庫內建的報表也是採用CR報表的開發版嵌入的!

Tableau軟體,這個軟體是近年來非常棒的一個軟體,當然它已經不是單純的資料報表軟體了,而是更為視覺化的資料分析軟體,因為我經常用它來從資料庫中進行報表和視覺化分析,先暫列在報表層;

這個軟體從3.0開始,現在已經有了5.1版本,兩年的時間已經到了伺服器和Web方式了!

當然,如果企業有上萬張報表,需要好好管理起來,還有安全性,併發請求等,就需要有Server版;

博易智訊公司專門提供Crystal Report和Crystal Report Server版銷售和軟體服務;

第三:資料分析層

這個層其實有很多分析工具,當然我們最常用的就是Excel,我經常用的就是統計分析和資料探勘工具;

Excel軟體,首先版本越高越好用這是肯定的;當然對Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟體;

SPSS軟體:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下程式設計分析,到現在版本的變遷也可以看出SPSS社會科學統計軟體包的變化,從重視醫學、化學等開始越來越重視商業分析,現在已經成為了預測分析軟體。

Clementine軟體:當前版本13.0,資料探勘工具,我從6.0開始用,到了13版,已經越來越多的提高了更多有好的建模工具,現在改名叫PASW Modeler 13建模器了。而且與SPSS統計功能有了更多的整合,資料處理也更加靈活和好用。

SAS軟體:SAS相對SPSS其實功能更強大,SAS是平臺化的,EM挖掘模組平臺整合,相對來講,SAS比較難學些,但如果掌握了SAS會更有價值,比如離散選擇模型,抽樣問題,正交實驗設計等還是SAS比較好用,另外,SAS的學習材料比較多,也公開,會有收穫的!

當然,我主要是採用SPSS和Clementine,有時候就是習慣,當然會了一種軟體在學其他的也不是很困難!

JMP分析:SAS的一個分析分支

XLstat:Excel的外掛,可以完成大部分SPSS統計分析功能

Ucinet社會網分析軟體:SNA社會網路分析是非常流行和有價值的分析工具和方法,特別是從關係角度進行分析社會網路,關係分析非常重要,過去我們都是屬性資料分析

大家如果有需要試用版,可以聯絡博易智訊,他們可以提供SPSS和Clementine軟體版本的諮詢。

第四:表現層

最近我一直在研究資料視覺化技術,一方面是因為Excel大家有需求,另一方面就是我第一個購買了Xcelsius,也寫了《Excel高階應用與資料分析》和《資料展現的藝術Xcelsius》。這個領域的軟體,特別是一些小工具非常有價值!

PowerPoint軟體:這個沒得說了,大部分人都是用PPT寫報告;

Visio、SmartDraw軟體:這些都是非常好用的流程圖、營銷圖表、地圖等,而且從這裡可以得到很多零件;

Swiff Chart軟體:製作圖表的軟體,生成的是Flash;

Color Wheel軟體:配色軟體

Yed軟體:網路關係圖、流程圖和圖形分析軟體,類似SNA分析,我經常用來設計流程圖,還有就是分析優化關係圖;

Netdraw軟體:這是社會網路分析展現軟體,主要是視覺化網路關係圖的,讀取Ucinet軟體;

Mindmanager軟體:思維導圖,非常好的軟體,可以把非線性思維很快構建起來,並且專案組織管理、報告設計構想都可以應用,直接生成PPT等,當然這個軟體功能非常強大,我的學生都用它來做筆記和會議記錄;

Xcelsius軟體:Dashboard製作和資料視覺化報表工具,可以直接讀取資料庫,在Excel裡建模,網際網路展現,最大特色還是可以在PPT中實現動態報表;這個是我最希望應用的一個軟體工具,非常有價值!

最後,需要說明的是,我這樣的分層分類並不是區分軟體,只是想說明軟體的應用,其實每個層次的軟體都是相互融合的,追求:平臺化,整合化,智慧化,視覺化,專業化,都是各有特色;價格也不同,有免費的,有上百萬的;有單機版的,有伺服器版的;有正版的,有盜版的!

有時候我們把資料庫就用來進行報表分析,有時候報表就是分析,有時候分析就是展現;當然有時候展現就是分析,分析也是報表,報表就是資料儲存了!沒有最好,只有更好,適合你的就是最好的!

其實還有很多資料分析軟體:

AMOS軟體:結構方程式模型SEM,實證研究和理論模型的重要分析工具,從事學術研究的人,特別是社會科學工作者應該掌握;

Lisrel軟體:結構方程式模型SEM,同上!

HLM軟體:分層線性模型;

熱門標籤