相對於直接操作資料庫分析,hadoop和SPSS等分析軟體的作用

來源:果殼範文吧 1.95W

可能我的標題會讓專業人士有些鄙視,我是作為一個基本小白的角度提出這個問題的.

我目前在某國企的基層分公司從事資料統計工作,具體的工作就是按照市場分析人員的要求,每天從oracle資料庫裡寫SQL或儲存過程,調取相應的資料,製成excel表格給市場分析人員進行二次加工或分析. 簡單來說,算是個人肉資料提取器.

一晃工作已經快十年了,感覺每天做的工作已經從新奇變成低階的重複勞動,技術上已經處於半荒廢狀態,只對oracle有個大致的瞭解,對資料倉庫的最簡單應用有個大概的認識.對於未來還是越來越惶恐,所以想學習一些新的知識來勉強跟上時代.

(我們常用的一個數據倉庫簡略來說是這樣的,若干個系統蒐集的底層資料經過清洗放在DW層,進過二次加工的原始資料放在一箇中間層MID層,最終系統級的展現及前臺應用放在DM層; 而我們是通過這三層資料用SQL語句進行一些系統外的整理加工. 一般的表日全量資料大約一千萬到1億行不等,常用的基礎表大約百來個)

由於一直從事的是資料探勘(勉強算吧)工作,我們一直以來都是直接通過sql語句操作進行過清洗的底層資料.在網上搜索資料分析相關的知識,大部分的答案都指向SPSS及hadoop等資料探勘軟體. 大概搜尋了一下這些軟體的概況,可能我比較笨或是很久沒有學習專業知識了,很難看懂它們的作用.

說了那麼多,主要想請問下從事這個行業的牛人們,

1,假設我學習hadoop或SPSS,對我目前從事的資料統計分析工作有什麼幫助?
2,相對於直接用sql操作資料庫,hadoop和SPSS可以更便捷的實現哪些方面的功能?
3,這些軟體的學習週期大致是個什麼情況?
4,在拋開主題,我上面提到的資料倉庫的規模下,擴充套件學習哪些技能能起到最快的幫助.

期待專業人士的回答我這個開始有些中年危機的小白,萬分感謝. 可能我的標題會讓專業人士有些鄙視,我是作為一個基本小白的角度提出這個問題的..

我目前在某國企的基層分公司從事資料統計工作,具體的工作就是按照市場分析人員的要求,每天從oracle資料庫裡寫SQL或儲存過程,調取相應的資料,製成excel表格給市場分析人員進行二次加工或分析. 簡單來說,算是個人肉資料提取器.

一晃工作已經快十年了,感覺每天做的工作已經從新奇變成低階的重複勞動,技術上已經處於半荒廢狀態,只對oracle有個大致的瞭解,對資料倉庫的最簡單應用有個大概的認識.對於未來還是越來越惶恐,所以想學習一些新的知識來勉強跟上時代.

(我們常用的一個數據倉庫簡略來說是這樣的,若干個系統蒐集的底層資料經過清洗放在DW層,進過二次加工的原始資料放在一箇中間層MID層,最終系統級的展現及前臺應用放在DM層; 而我們是通過這三層資料用SQL語句進行一些系統外的整理加工. 一般的表日全量資料大約一千萬到1億行不等,常用的基礎表大約百來個)

由於一直從事的是資料探勘(勉強算吧)工作,我們一直以來都是直接通過sql語句操作進行過清洗的底層資料.在網上搜索資料分析相關的知識,大部分的答案都指向SPSS及hadoop等資料探勘軟體. 大概搜尋了一下這些軟體的概況,可能我比較笨或是很久沒有學習專業知識了,很難看懂它們的作用.

說了那麼多,主要想請問下從事這個行業的牛人們,
… 顯示全部

相對於直接操作資料庫分析,hadoop和SPSS等分析軟體的作用
熱門標籤