淺析數(shù)據(jù)挖掘技術在企業(yè)職工培訓中的應用論文
從現(xiàn)狀看,數(shù)據(jù)挖掘范疇內的技術,慣常用于金融、大規(guī)模特性的商業(yè)之中。然而,企業(yè)預設的職員培訓,較少采納這一技術。對于搜集得來的培訓信息,仍停留于建構某一數(shù)據(jù)庫、單一情形下的數(shù)據(jù)查驗。數(shù)據(jù)信息特有的決策價值,沒能充分被發(fā)覺。本文依循數(shù)據(jù)挖掘的本源原理,創(chuàng)設了新穎情形下的數(shù)據(jù)庫。采納挖掘手段,予以深入調研。數(shù)據(jù)挖掘得來的適宜結論,能為后續(xù)時段的培訓規(guī)劃,提供最佳指引。

1新穎技術的特性
搜集得來的初始數(shù)據(jù)通常數(shù)目偏多,數(shù)據(jù)表征出來的不完整傾向應當被注重。原初的數(shù)據(jù)夾帶著噪聲,且?guī)в心:匦约半S機特性。數(shù)據(jù)挖掘依托著的手段,是從搜集得來的最初數(shù)據(jù)以內提煉出潛藏著的、不被知曉的、帶有高層級價值這樣的信息、關聯(lián)著的知識等。慣用的挖掘方式包含關聯(lián)規(guī)則、建構好的決策樹、神經(jīng)網(wǎng)絡及特有的貝葉斯、建構的粗糙集、對應著的模糊集、挖掘流程內的聚類分析。細分出來的挖掘步驟整合了初始時段的數(shù)據(jù)預備、數(shù)值的選取、預處理特有的流程、側重的挖掘流程、模型更替及轉變、后續(xù)時段的挖掘評價。
數(shù)據(jù)挖掘概念。數(shù)據(jù)挖掘是從大量的、不完整的、有噪聲的、模糊的和隨即的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、潛在的和有價值的信息和知識的過程。數(shù)據(jù)挖掘的技術最常用的數(shù)據(jù)挖掘技術主要有決策樹、關聯(lián)規(guī)則、貝葉斯、神經(jīng)網(wǎng)絡、聚類分析、模糊集和粗糙集等。數(shù)據(jù)挖掘的步驟數(shù)據(jù)的挖掘過程主要包括5個階段:數(shù)據(jù)準備、數(shù)據(jù)選擇、數(shù)據(jù)預處理、數(shù)據(jù)挖掘、轉換模型及模式評價。
2構建數(shù)據(jù)庫
數(shù)據(jù)挖掘特性的新穎技術不能脫離建構起來的數(shù)據(jù)庫。它能從數(shù)目偏多的信息之內提煉得來可用的數(shù)值。職員培訓特有的領域以內,數(shù)據(jù)庫可以歸整在冊范疇的一切職員,對于獲取到的關聯(lián)結果予以辨識解析。數(shù)據(jù)庫存留著的信息之內涵蓋基礎數(shù)據(jù)、培訓得來的真正結果。
2. 1擬定物理框架
職員培訓特有的數(shù)據(jù)庫,應設定適宜情形下的物理模型。擬定好的物理模型是數(shù)據(jù)特有的存留方式、多層級的數(shù)據(jù)組織。例如:某企業(yè)篩選出來的數(shù)據(jù)庫,帶有關系型這樣的特性。搭配的管理系統(tǒng)設定成SQL架構下的server。
2. 2擬定概念模型
職員培訓關涉的概念模型能夠明晰預設的系統(tǒng)界限,擬定根本主題。數(shù)據(jù)庫涵蓋著的根本信息是職員固有的自身信息、這一時段的培訓成績。歸整好的這些信息凸顯了單一性,但又潛藏著某些關聯(lián)。采納數(shù)據(jù)倉庫,提煉并歸整這樣的數(shù)值,以便提煉得來決策依憑的可用信息。依循細分出來的職員特性、建構的主題,把總體范疇內的培訓結果,分成多個層級,并歸入數(shù)據(jù)庫。
3選出來的運用實例
3. 1采納的關聯(lián)規(guī)則
依循的評判指標,是體系架構中的置信度、對應著的支持度。必備的概率信息包含物品集特有的出現(xiàn)頻次。最小數(shù)值的支持度表征著篩選出來的這一項目,在統(tǒng)計之中凸顯了最低層級的重要價值。最小數(shù)值的置信度表征著設定好的這類規(guī)則,凸顯了不可靠的傾向。采納關聯(lián)規(guī)則,建構精準模型,以便解析某一時段的培訓狀態(tài)。
3. 2采納的模型
抽取出來的數(shù)值涵蓋固有的職員信息、測試得來的成績等。采納預設的規(guī)則,操作這些數(shù)值。這樣做能夠明晰數(shù)值潛藏著的彼此關聯(lián),抽取得來的字段含有單位稱呼、職員個體姓名、微機處理特有的等級。
3. 3具體的挖掘步驟
預處理特有的時段中,為了辨識設定好的關聯(lián)規(guī)則,對于初始數(shù)據(jù)予以概念化。采納A這樣的符號來表征職員固有的年齡。這種情形之下,A (1)特有的信J息,表T年齡沒能達到25歲;A (2)表征著年齡涵蓋在25歲至35歲;A (3)表征著年齡超出了35歲。采納H這一符號,表明測試特有的通過狀態(tài)。H (1)涵蓋著沒能通過的職員,H (2)涵蓋著通過的職員。經(jīng)山離散化特有的處理以后,得來最終結果。
3. 4后續(xù)的挖掘步驟
在測試之中,職員特有的通過人數(shù),總和5910;沒能通過的人數(shù),總和1810。沒能通過的概率,占到了22%。采納預定的關聯(lián)規(guī)則來挖掘這樣的數(shù)據(jù)。體系范疇內的每類行為都設定了這一規(guī)則。這就表明輸入數(shù)值及對應著的輸出之間帶有偏強的關聯(lián)。
3. 5解析得來的結論
數(shù)據(jù)特有的重要性,也即興趣度,能夠辨識頻繁項、設定好的規(guī)則等。依循降序排列可以獲取明晰的規(guī)則列表。例如某次解析得來這種結論:年齡超出50這樣的職員、工齡超出25這樣的職員或者高級別范疇內的職員通過培訓概率還是偏大的。與此同時,學歷層級偏低的職員,通過等級與特有的學歷,凸顯了相關的傾向,這樣的對應符合慣常的認知。
由此可見,學歷層級偏低這樣的職員在接納新認知時能力是偏弱的。針對企業(yè)以內的這類職員,在接續(xù)的培訓之中應多加注重。設定出來的培訓形式,應符合帶有差異特性的職員群體;劃分的培訓時段應傾向于認知偏弱的職工。例如:可以添加課時,調整預設的培訓時段,保障體系以內的這些職員,能參與擬定好的培訓規(guī)劃。此外,對于接納能力偏強這樣的職工,可適當縮減原有的課時,縮減設定好的多樣科目。這樣做可縮減耗費掉的培訓經(jīng)費,并創(chuàng)設最優(yōu)情形下的整體效益。離散化情形下的數(shù)值處理驗證了歸結出來的這一結論。
4結語
數(shù)據(jù)庫建構依循的根本原理不能脫離數(shù)據(jù)挖據(jù)。企業(yè)培訓之中,借助挖掘得來的多重信息,能夠解析各時段的培訓成果。連續(xù)值固有的屬性,在設定好的挖掘流程內得以離散化,這就為接續(xù)的深入挖掘提供了基礎。調整擬定好的培訓規(guī)劃,確保預設的新規(guī)劃,符合職員培訓特有的真實狀態(tài)。
【淺析數(shù)據(jù)挖掘技術在企業(yè)職工培訓中的應用論文】相關文章:
數(shù)據(jù)挖掘技術在Web信息檢索中的應用研究論文12-01
數(shù)據(jù)挖掘在電力企業(yè)中的應用論文12-13
數(shù)據(jù)挖掘技術的教學輔助系統(tǒng)應用論文03-16
數(shù)據(jù)挖掘技術在就業(yè)指導的應用論文02-27
數(shù)據(jù)挖掘在現(xiàn)代遠程教育中的應用論文11-22
數(shù)據(jù)挖掘技術在高校學生成績分析中的應用研究論文03-15
網(wǎng)絡編碼中數(shù)據(jù)通信技術的應用論文03-17
淺析現(xiàn)代測繪技術在水利工程中的應用論文12-03
油田井場監(jiān)測中數(shù)據(jù)通信技術的應用論文03-16
- 相關推薦