資料在經融證券中的地位和作用論文

來源:果殼範文吧 1.78W

1我國企業資訊系統建設的資料基礎薄弱

資料在經融證券中的地位和作用論文

1.1我國企業的資訊系統建設處在初級階段

XX新聞社網站20XX年6月1日報道,資訊產業部電子資訊中心和藍田市場研究公司雙方合作進行了首次全國範圍的資訊產業大型調查活動,獲得了全面的基礎資料報告(簡稱ITD20XX)。調查結果顯示,我國80%以上國家重點企業已建立辦公自動化系統和管理資訊系統,70%以上接入網際網路,50%以上建立了內部區域網。企業已不同程度地在日常管理和決策環節上應用了資訊科技。部分企業已經開始藉助網際網路開展商務活動。金融行業(包括證券)發展較快,對計算機資訊系統和網路的依賴是百分之百的,我國資料通訊網路中60%~70%的資訊量是金融電子化資訊。

中國經貿委、資訊產業部和科技部共同發起了“企業資訊化工程“,企業上網是該工程的組成部分。根據2001年9月初國家經貿委經濟資訊中心對551家國家重點企業及試點企業集團網站建設情況的調查,當前這些企業“觸網”呈現出三個特點:一是大部分企業已“觸網”,74%的企業已在網際網路上建立網站或設有主頁;二是不同地區的企業網站建設不平衡,中西部地區企業相對薄弱;三是網站質量良莠不齊。從上述內容可以得出一個結論,90年代以來,我國企業的資訊系統建設,已經獲得了長足的發展,這是不容置疑的。但是也要看到,這個最具升值潛力的資訊行業,同世界上其他國家相比,我國還處在相當低的層次。

國家統計局國際統計資訊中心的研究人員,對世界二十個主要國家和地區(包括髮達國家和發展中國家)的資訊能力進行了測算和比較,結果顯示中國資訊能力處於最低水平之列。測算和比較是從資訊科技和資訊科技裝置利用能力、資訊資源開發與利用能力、資訊化人才與人口素質以及國家對資訊產業發展的支援狀況等四個方面,選取了二十九個指標編制了資訊能力指數來測算資訊能力大小。結果第一是美國,資訊能力評分是71.76,日本第二69.97,澳大利亞65.59居第三。

中國只有6.17,是韓國的15.3%,是巴西的40.2%。美國哈佛大學理查德?諾蘭(RichardNolan)教授提出了企業資訊系統建設六個階段劃分理論,即初始階段、擴充套件階段、控制階段、統一階段、資料管理階段和成熟階段,該理論通稱“諾蘭模型”。按此理論,我國大部分企業處於前三個階段。從上述的資料和國內外的比較,從諾蘭模型理論,從到處都可以看到的全國企業資訊系統建設的現狀,從應用的廣度與深度,得出我國企業資訊系統建設處在初級階段的結論應該是毫無疑義的。

1.2我國企業的資訊系統建設存在著資料基礎薄弱問題

按照諾蘭模型,資訊系統建設的第五階段是資料管理階段,其核心內容是“建立統一的資料管理體系”,“真正做到對整個機構的資料進行統一的規劃和應用”。可見,資料基礎建設已經是國際上衡量資訊系統發展水平的一項重要標誌,是我國企業資訊系統建設脫離初級階段向高階階段邁進的關鍵一步。資料基礎薄弱是我國企業資訊系統建設存在著的一個非常普遍的問題。為了說明我國企業資訊化建設中資料問題的嚴重性,特舉《XXwanbao》20XX年10月16日報導的一個例子。今年“五一”黃金週,出遊人數出奇地火爆,以致一些景區人滿為患,一些地方住宿、餐飲、交通全面緊張。

針對這種情況,從今年“十一”黃金週開始,國務院實行旅遊預警制,也就是建立黃金週旅遊資訊統計制度和預報體系,通過媒體向全社會發布重點旅遊城市住宿、旅遊社接待、交通客運和景區等環節上的飽和情況,讓消費者更加明智地安排旅遊行程。旅遊預警制本來是運用資訊科技解決全國性問題的非常好的措施,但結果是:三大“致命傷”制約旅遊預警。資訊預報不夠準確是此次旅遊預警制的首個要害。一些景區在節前就已釋出“飽和”、“客滿”的資訊,讓想去那裡遊玩的遊客都打了“退堂鼓”。而實際上,許多景區的實際進場遊客只有其接待能力的一半甚至更少,生意反落得不如平常。如九寨溝、峨眉山、武夷山、黃山等。

今年國慶,九寨溝就過高估計自己的遊客量,在9月20日就提出“四限”遊客的措施,廣東的一些大旅行社聞訊立即搶訂了九寨溝賓館3000多間客房,但實際報名人數只達到預期中的1/10。下了訂金的旅行社因此叫苦不迭,而九寨溝也唱起了“空城計”,從而造成了“有人唱戲,無人看戲”的局面。旅遊預報資訊的滯後性是此次旅遊預警制的第二個要害。資訊釋出未趕上游客行程,夜間活動未列入統計資料。第一次預報到9月21日晚才公佈,但很多打算出遠門的人早在預報公佈之前就已定好了計劃和車票;旅行社方面其收客也已近尾聲,他們都不會因為資訊預報而取消行程。在“十一”期間,每天的資訊都在下午5時之前統計出來了,對一些活動主要在夜間進行的景區如深圳的世界之窗來講,這些資訊就無法計算在內了。我國資訊傳送缺乏科學、準確,容易失真無法跟進是此次旅遊預警制的第三個要害。據悉,旅遊預警制並不是中國首創的,在一些歐洲國家,還有日本,早有類似的預警制度。

他們在節假日中往各地派駐記者進行現場報道,並通過媒體不斷地播放關於預訂機票和住宿等旅遊資源的資訊,從而起到了很好的效果。但是它們一般都是發達國家,資訊傳送作到科學、準確、快速,遊客往往能夠根據預報的資訊做出最佳決定。而中國的旅遊資訊預報因為裝置等方面的侷限,無法隨時隨地進行傳送、及時跟進,因而操作起來比較困難。建立旅遊預警制是發展我國旅遊事業的一個非常好的措施,但由於資料基礎問題,當前預警制在我國沒有取得成功。

旅遊資料問題並非是個別例子,即使全國經濟資料也存在資料基礎問題。國家經貿委資訊中心劉力主任講,國家重點企業向國家經貿委上報資料的工作迄今已有四年。在國家經貿委上報中辦、國辦的各項資訊中,重點企業資訊採用率是最高的。但由於企業資訊管理水平低,常有一些企業上報資料不完整、不及時、不準確,這些都嚴重影響了國家對重點企業情況的及時掌握。我國企業資訊系統的資料基礎問題集中體現在四個方面:(1)資訊基礎建設薄弱。其後果集中表現為:企業的基本資料和主要資料不全面、不準確,造成基礎決策資料貧乏,影響各層機構的管理和決策。

其原因在於,企業領導和建設者們,對我國企業面臨的最迫切問題是資訊基礎建設,缺乏認識和重視,往往是好高務遠;企業資訊化建設中存在著技術因素,更存在著非技術因素,但對技術因素考慮得過多,對非技術因素估計不足,這裡面非技術的因素卻在起著主要作用。(2)企業資訊管理水平低,資料管理混亂。其後果集中表現為:需要資料時難於檢索,急用時查不到,只好重複向下面索要資料,反覆編制報表。(3)資料處理和資料交換的規範和標準嚴重缺乏或者有而沒有執行。其後果集中表現為:資訊交流過程中,內部的資料不統一,交換的資料不能用,報表的資料格式不符合標準,影響企業、行業、地區直到全國資訊統計的準確性。(4)缺乏企業內、企業間資訊化的統一規劃。

其後果集中表現為:企業資訊化各自為政,造成本來統一和一致的資訊人為分割,資料共享程度很低,難以實現資源共享,無法開展電子商務。可見,我國企業的資訊系統建設存在著普遍性的、嚴重的、不下大力氣難於解決的資料基礎問題,這是一個明顯的不爭的事實。

2資料在資訊系統建設中的地位和作用

當前我國資訊系統水平很低的主要原因之一是對資料在資訊系統建設中的地位和作用認識不夠。因此,首先應該從理論上、認識上解決問題。

2.1資料是資訊系統的原料、食糧、內容,是資訊系統應用的前提,是資訊系統價值之所在

當前,我們大力提倡和發展資訊科技,目的是什麼呢?目的是為了快速、高效地處理和獲取資訊,為社會的發展服務。資訊來自被資訊科技處理了的資料。資料經過資訊加工廠的加工,變成可以排序、可以統計、可以幫助決策的資訊,才能真正實現它的價值,這便是資訊化的作用,使其真正地產生經濟效益。因此,資料是所有資訊產生的基礎,同樣也是資訊系統的基礎,更是內容產業的基礎。

2.2資料是資訊系統建設的中心、核心從資訊系統的組成和處理流程

可以明顯看到,以資料為基礎的資料庫是構成資訊系統諸要素的核心,資訊系統都是以資料庫為基礎實現的;在系統的處理過程中,由各種資料組成的資料流,貫穿於整個處理流程的始終,一直處於中心位置。基於資料的這種特殊地位,美國學者馬丁提出了以資料為中心的開發思想和以資料平臺為核心的系統結構。資料平臺不僅是系統實現各種功能的核心,也是系統可以長期穩定存在的基礎。資料處於資訊系統中心地位的另一原因是資料的穩定性,具有一個穩定的資料基礎是建設資訊系統最本質的問題。計算機硬體和軟體由於裝置的升級被更換,企業的資料處理過程在變化,工作人員不斷流動,系統所開發的功能也會由於管理工作的變化而更換,但是其基本的資料卻是穩定不變的。例如,對於電廠來說,無論管理方式如何變化,汽機、鍋爐、人事、燃料、物資等部門的基礎資料型別卻是穩定不變的。穩定的資料基礎對一個企業來講還具備行業共性,對同行業的其它企業有參考和資料共享的作用。資料平臺不僅是系統實現各種功能的核心,也是系統可以長期穩定存在的基礎。

2.3規範化與標準化是資訊資源共享的必要條件

規範化的資料及與之相關聯的標準化的規定(編碼、格式、詞表、描述語言、置標語言等)、規則化的處理(流程、作業),是整個企業、全行業、全社會資訊資源共享的必要條件。企業從生產到銷售本來是一個有機結合的整體,但在非資訊化的企業,其資訊卻處在一種孤立的、分散的、不連線、不一致、不統一的資訊隔斷的狀態,資訊不能共享。計算機技術提供了改變這種狀態的可能和手段。利用資訊科技,可以將企業的業務流程緊密地連線在一起,但要真正改變這種狀態,則需要從資料著手,從資料同計算機技術的結合著手。目前,惠普擁有全球最大的企業內部網,12萬5千名員工都可以通過網路取得統一的、標準化的資訊和知識。規範化的資料及與之相關聯的標準化的資料規定(編碼、詞表、格式、描述語言、置標語言等)、規則化的處理流程和作業,三者嚴密地組織起來,實行企業一體化的整合管理,使生產系統的介面資料和終端使用者檢視的交流資訊,達到一致,實現設計人員、企業內部、企業間、企業與使用者等相互之間資訊的統一。實現異地、異構資料共享,避免大量重複性工作。實現多型別資料、多型別文獻、多媒體資訊、電子資訊資源與網上資訊資源共享。在網路環境下,使企業真正運作在一個Intranet-Internet-Extranet無縫連線的網路整合環境中,構造一個企業內、外資訊共享和融合的環境。

2.4全面、準確、規範的資料基礎是進行深度的資料探勘的前提條件

目前在很多領域,資料探勘都是一個很時髦的詞,尤其是在如銀行、電信、證券、保險、交通、零售(如超級市場)等商業領域。資料探勘其實是一種深層次的資料分析方法。過去資料收集和分析的目的是用於科學研究,現在,更主要是為商業決策提供真正有價值的資訊,進而獲得利潤。所有企業面臨的一個共同問題是:企業資料量非常大,而其中真正有價值的資訊卻很少,因此從大量的資料中經過深層分析,獲得有利於商業運作、提高競爭力的資訊,就像從礦石中淘金一樣。

因此,資料探勘是指:按企業既定業務目標,對大量的企業資料進行探索和分析,揭示隱藏的、未知的或驗證已知的規律性,並進一步將其模型化的先進有效的方法。資料探勘應從以下三方面加以考慮,一是用資料探勘解決什麼樣的商業問題,二是為進行資料探勘所做的資料準備,三是資料探勘的各種分析演算法。做資料探勘研究的人,往往把主要的精力用於改進現有演算法和研究新演算法上。人們都知道資料準備是必不可少的一步,但很少有人去真正花時間和精力去研究。

其實資料探勘最後成功與失敗,是否有經濟效益,資料準備起到了至關重要的作用。資料準備包含很多方面:一是從多種資料來源去綜合資料探勘所需要的資料,保證資料的綜合性、易用性、資料的質量和資料的時效性,這有可能要用到資料倉庫的思想和技術;另一方面就是如何從現有資料中衍生出所需要的指標,這主要取決於資料探勘者的分析經驗和工具的方便性。資料探勘需要資料的全面和準確,資料分析演算法要求資料具有一定的格式和規範性。無疑,全面、準確、規範的資料基礎是進行深度的資料探勘的前提條件。

3巨靈公司在資料基礎建設方面的實踐

為了夯實資料基礎建設,20XX年巨靈公司花大力氣對高新技術產品——金融證券期貨類報刊檢索系統主題詞表和主題標引規則,進行了全面修訂。經過半年的艱苦工作,現已修訂出了《金融證券期貨資訊主題標引規則》和《金融證券期貨專業主題詞表》。同時與之相配合,編制了若干詞表:資訊型別詞表、關鍵詞表、人物詞表、機構詞表、上市公司詞表(包括上市公司關聯公司詞表、公司更名情況表、易混淆公司表)和地區詞表;相應,編制了若干標引細則:資訊型別標引細則、人物標引細則、機構標引細則、審校工作細則和詞表維護細則等。從而,形成了一整套主題詞表和主題標引規則產品。在實踐中,我們遵循瞭如下的一些原則:

3.1以系統工程作為指導思想資訊系統建設是一項複雜的系統工程。

資訊系統由5個系統組成,即:硬體系統、軟體系統、資料庫、規程和人員。資料庫是資訊系統的核心,計算機硬體系統和軟體系統是資訊系統的執行環境,人員和規程是資訊系統的開發與使用的環境。對於這樣一項複雜的系統工程,人們的認識是有一個過程的,我國企業資訊系統建設的實踐恰切地說明了這一認識過程。人們最早注意的僅僅是看得見、摸得著的計算機硬體;而後才瞭解到需要軟體,進一步知道需要構成一個整體的計算機應用系統;再後體會到更需要既懂計算機又懂本專業的複合型人才;當資訊系統投入使用之後,發現了過去沒有或不大重視的資料和規程出了問題,成為系統真正實用的攔路虎,而且資料和規程問題既廣泛存在又繁瑣,同過去手工系統的'工作攪和在一起,處理起來比購買計算機系統更難、更要花時間。巨靈人在實踐中認識到了作為一項複雜的系統工程的資訊系統建設,必須重視資料的重要性,認為資料就是系統的生命。

為此,有三條系統建設的具體指導思想是公司領導一直強調的:(1)資料庫是系統的核心,要求資料庫的設計能支援公司產品的可持續發展;(2)主題詞表和主題標引是報刊網路系統的生命線,要求研究所配合報刊部,一定要搞好主題詞表的更新和標引規則的制定;(3)資訊系統一般都從單項應用系統開始,逐步向綜合應用系統過渡,這是一個從量變到質變的過程,我們不能用專案級或程式級的經驗去指導系統級的建設。組成資訊系統的5個系統既涉及技術系統又踏足社會系統。計算機硬體系統和軟體系統作為執行環境,強調了資訊系統是一種技術系統的特徵;人員和規程作為開發與使用環境,則強調了資訊系統是一種社會系統的特徵。長期以來的偏向是,人們往往只注意到資訊系統的技術系統特徵,而沒有注意到資訊系統的社會系統特徵。為此,公司強調:(1)系統設計必須有專家和相應業務人員的參加和評議;(2)吸收終端使用者的意見;(3)在實際使用中不斷資訊反饋和改進系統。

3.2資料的總體設計

在進行資料的總體設計時,資料被作為一種獨立的資源來對待,並被看作是支援所有應用專案的基石,以系統的整體最優為目標。在金融證券期貨主題詞表經過一年多的試用和主題標引經過一年多的實踐後,我們收集了各方面的反映,並試圖採用總體設計的原則,進行全方位的修訂和制定,以達到系統的整體最優目標。修訂的做法和過程是:(1)對原系統進行總體上的調研和評估:經過對原系統的全面而實際的瞭解,特別是徵求從事實際工作的員工們的意見,認為報刊檢索系統的總體設計是合理的,系統實施的進度較快,目前已初步實現了規模性生產。但是,在某些環節上存在有問題,這些環節主要是:各種詞表(主題詞表、關鍵詞表、機構詞表和人物詞表等)、標引規則、標引方法、人員培訓等方面。

這些問題反映在實際工作中表現為:主題詞表選詞不當、不規範、不完善;標引工作缺乏共同遵循的規則;資訊加工耗費人力和時間過多,必須儘快發展系統的自動化;系統實施的正規化和規範化程度較低,急需改進和提高。(2)狠抓影響全域性的關鍵環節:金融證券報刊資料庫建設首先必須夯實資料基礎,鑑於當前各種詞表、標引規則和標引方法問題,已經成為了影響系統全域性的關鍵環節,我們重點抓了主題詞表和標引規則的修訂和制定。(3)從整體上設計和修訂主題詞表:以金融證券專業主題詞表的修訂為主,作為專業詞表整體,同時設計和修訂關鍵詞表、機構詞表、人物詞表和系統專用的資訊型別詞表。這多種詞表應構成為一體化的、有機結合的一整套金融證券專業性的主題詞表。(4)從整體上考慮和制定標引規則:以金融證券專業主題詞的標引為主,作為標引工作整體,同時考慮和制定關鍵詞、機構、人物和系統專用的資訊型別的標引規則。這多種標引規則應構成為一體化的、有機結合的一整套金融證券專業性的主題標引規則。(5)建立詞表和標引規則的不斷更新機制:制定了《詞表維護細則》,規定了詞表和標引規則的維護措施,以確保未來詞表和標引規則的不斷更新。這樣,不僅在空間而且在時間的延續上保證了詞表和標引規則的新穎性。

3.3資料規範化及其處理的規則化

(1)詞表和標引規則的修訂遵循和參照國家標準:按照國家標準規定的文獻主題結構模式,從主體、通用、空間、時間和資訊型別等五項因素,全面反映金融證券報刊文獻的內容主題;同時,又結合金融證券專業的特點,加強機構,特別是上市公司的揭示和資訊披露,使修訂工作既符合總的標引原則又結合報刊檢索系統實際,使報刊系統能夠同全國的資訊系統並軌,又有自己的特點。

(2)形成全公司的資訊工作標準:作為一個專業性很強的資訊公司,詞表和標引規則是可以通用的,因此修訂的詞表和標引規則將逐步成為全公司的資訊加工工作標準。

(3)修訂的詞表可供全行業參考:在金融證券行業目前沒有可供使用的專業主題詞表情況下,巨靈公司編制出的主題詞表可供金融證券整個行業參考和使用。

3.4詞表和標引規則的系統化和可操作性

(1)詞表和標引規則的系統化:修訂的詞表和制定的標引規則不是個別的、孤立的,而是主題詞表和其它相應的多種詞表相互結合,標引總則、分則和多個細則的有機配合,形成了系統化,構成了實用的詞表和標引規則體系。

(2)確立了詞表維護體系:作為標引總則的補充和細化,編制了《詞表維護細則》。在《細則》中說明,詞表維護是指“對本系統現有的各種詞表,為保證其新穎性、正確性和權威性,進行增加、修改、刪除以及調整主題詞之間關係的不斷進行的過程”;具體規定了對新增、修改和刪除主題詞的處理方法、審定許可權和詞表更新辦法,即“分別按各自的詞表編制規則,處理、編排和匯入到相應的詞表中去,完成了一次各種詞表的修訂工作”,永葆主題詞表的新穎性。

(3)強化詞表和標引規則的可操作性:為了在全公司推行標準化,必須使主題詞表和標引規則具有可操作性。為此,在修訂和制定中,對需要進一步說明的各項操作細節,均要求以附件(細則)的形式一一列出。配合標引總則,我們編制了以下幾方面細則:資訊型別標引細則、人物標引細則、機構標引細則、審校工作細則和詞表維護細則。

3.5手工與自動化規範保持一致性和可過度性

在標引規則中,規定了手工與自動化兩種標引規範必須保持一致性和可過渡性,統一手工和自動化兩種標引方式的主題標引規則,為報刊系統逐步過渡到自動化標引,提供了統一的規則和過渡的條件

熱門標籤