百度資料分析員面試測試題

來源:果殼範文吧 1.82W

大概一個月前,筆者接到百度的面試電話,去應試資料分析員的工作。儘管無意去工作,但是還是希望能看看他們的測試題到底是怎麼樣的。於是接觸到了一下的題目:

百度資料分析員面試測試題

總共十個題目(當然全是excel函式題):

1、根據員工的身份證號,統計員工的生日。眾所周知,我國居民身份證號有18位和15位數之分。對於同樣位數的身份證號統計想必不是很難,但是混雜了兩種情況的統計怎麼來做呢?

背景材料:

15位的身份證號碼:450104771010156

(1)1~6位為地區程式碼

(2)7~8位為出生年份(2位),9~10位為出生月份,11~12位為出生日期

(3)第13~15位為順序號,並能夠判斷性別,奇數為男,偶數為女。

18位的身份證號碼:450104197710101516

(1)1~6位為地區程式碼,

(2)7~10位為出生年份(4位),如1977

(3)11~12位為出生月份,如10

(4)13~14位為出生日期,如10

(5)第15~17位為順序號

2、從備註材料中抽提其中的物料程式碼,程式碼的格式是“0000-00000”,備註是文字和數字的混合。如“某某客戶投訴0000-00000產品有質量問題,香氣偏淡”。讓你寫出函式從中提取出物料程式碼。

3、AB列各有N多個單位元組文字,但其中個別單元格有空白。要求:B3單元格有文字就顯示B3單元格,若B3無文字而A3有,則顯示A3單元格文字,如果A3也沒有文字,則顯示“濟南”。

4.有個物料庫存區域,有諸多原料進倉資料,單個原料有多次進倉記錄的,讓統計部分原料的庫存總數量。

5、考勤情況統計。A代表上班,K曠工,S遲到,B病假,W出差

按照日期記錄每個員工的考勤情況。月底對員工考勤情況進行統計。

6、小數點的取捨。保留小數點後兩位,和截留取整。

7、有一副用數字0填充單元格組成的圖畫,讓改變該副圖畫的背景顏色。

還有三個題時隔久遠,一時想不起了,抱歉,只能發這幾個題了。

知道答案的可以在隨後的評論中寫出,猜不出的可以問我。

--

--以下為本人收集的幾種資料分析工具--

T

QUEST是IBM公司Almaden研究中心開發的一個多工資料探勘系統,目的是為新一代決策支援系統的應用開發提供高效的資料開採基本構件。系統具有如下特點:

提供了專門在大型資料庫上進行各種開採的功能:關聯規則發現、序列模式發現、時間序列聚類、決策樹分類、遞增式主動開採等。

各種開採演算法具有近似線性(O(n))計算複雜度,可適用於任意大小的資料庫。

演算法具有找全性,即能將所有滿足指定型別的模式全部尋找出來。

為各種發現功能設計了相應的並行演算法。

Set

MineSet是由SGI公司和美國Standford大學聯合開發的多工資料探勘系統。MineSet整合多種資料探勘演算法和視覺化工具,幫助使用者直觀地、實時地發掘、理解大量資料背後的知識。MineSet有如下特點:

MineSet以先進的視覺化顯示方法聞名於世。

提供多種 萃誥蚰J健0 ǚ擲嗥鰲⒒毓檳J健⒐亓 嬖頡⒕劾喙欏⑴卸狹兄匾 取?br>

支援多種關係資料庫。可以直接從Oracle、Informix、Sybase的表讀取資料,也可以通過SQL命令執行查詢。

多種資料轉換功能。在進行挖掘前,MineSet可以去除不必要的資料項,統計、集合、分組資料,轉換資料型別,構造表示式由已有資料項生成新的資料項,對資料取樣等。

操作簡單、支援國際字元、可以直接釋出到Web。

ner

DBMiner是加拿大SimonFraser大學開發的一個多工資料探勘系統,它的前身是DBLearn。該系統設計的目的是把關係資料庫和資料開採整合在一起,以面向屬性的.多級概念為基礎發現各種知識。DBMiner系統具有如下特色:

能完成多種知識的發現:泛化規則、特性規則、關聯規則、分類規則、演化知識、偏離知識等。

綜合了多種資料開採技術:面向屬性的歸納、統計分析、逐級深化發現多級規則、元規則引導發現等方法。

提出了一種互動式的類SQL語言資料開採查詢語言DMQL。

能與關係資料庫平滑整合。

實現了基於客戶/伺服器體系結構的Unix和pC(Windows/NT)版本的系統。

L MATLAB Origin 等等

當前流行的圖形視覺化和資料分析軟體有Matlab,Mathmatica和Maple等。這些軟體功能強大,可滿足科技工作中的許多需要,但使用這些軟體需要一定的計算機程式設計知識和矩陣知識,並熟悉其中大量的函式和命令。而使用Origin就像使用Excel和Word那樣簡單,只需點選滑鼠,選擇選單命令就可以完成大部分工作,獲得滿意的結果。 但它又比excel要強大些。一般日常的話可以用Excel,然後載入巨集,裡面有一些分析工具,不過有時需要資料庫軟體支援。


熱門標籤