數據挖掘技術深化數據采集應用系統
時間:2022-10-08 05:53:16
導語:數據挖掘技術深化數據采集應用系統一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要:大數據使現代化信息技術實現了高速發展,利用現代化信息技術建立狀態數據采集系統進行院校評估,是院校管理的發展方向。數據采集系統不應只注重平臺服務而忽視了功能的挖掘與發揮。數據挖掘技術對高職狀態數據采集的應用系統建設方法應注重關聯規則方法和聚類分析方法的構建與使用。
關鍵詞:數據挖掘技術;狀態數據;數據采集;應用系統
數據采集應用系統又被稱之為高職院校人才培養工作狀態數據采集應用系統,該數據采集應用系統在2008年得到教育部門批準并公布實施,這使數據采集應用系統成為高職院校進行方案評估的重要組成部分,并越來越受到各個高職院校的關注與重視。不過,由于數據采集應用系統出現的時間較短,各個高職院校還沒有真正認識到數據采集應用系統的作用,對數據采集應用系統的框架體系與邏輯關系的理解仍舊需要一段時間,對應用系統中相關聯的數據進行聚合,使其成為一種能夠幫助學院進行教學決策與管理的價值信息,更需要探索一種新的數據分析方法,再加上高職院校只注重系統的服務評估功能而忽視了其他功能的挖掘與應用,這就造成許多高職院校只是在填報時才會用到該系統,而在填報過后便成為了擺設,這使數據采集應用系統的作用未得到真正發揮,利用率較低。為此,針對以上問題,通過數據挖掘技術對高職狀態數據采集應用系統進行深化分析。
1數據挖掘技術
大數據具有增長速度快、海量、多樣、真實、價值密度低五大特點,從數據本身進行分析,所謂數據挖掘技術便是通過算法搜索,從海量的大數據中對價值密度低的價值數據進行挖掘與收集的過程。數據挖掘技術和計算機科學有著緊密的聯系,通過數據的統計、處理、機器學習、模式識別、情報檢索等諸多手段來達成價值數據挖掘目的。這些手段能使企業決策者根據價值數據來對策略進行調整,以此降低風險,并做出正確決策。數據挖掘由三個階段構成:數據準備、數據挖掘、結果表達。
高職狀態數據采集應用系統屬于一種數據倉庫,該系統每進行一次數據采集便會采集到超過50萬條的數據,通過將狀態數據采集應用系統與互聯網技術進行結合,還能使數據采集應用系統一次性采集到的數據量更多。以知識管理理論對數據進行分析,數據自身是不會提供太多價值信息的,因此,需要將這些采集到的數據進行轉化,使其成為有效信息,并利用科學的數據分析方法,通過關聯、聚類、聚合等方法來對這些海量的數據進行分析?,F如今,數據分析在各行各業中發揮越來越重要的作用,數據挖掘技術的相關理論與方法也使數據采集應用系統具備極高的應用價值與意義??梢哉f,數據挖掘技術作為一種新型信息處理技術,能對大量數據中人們所不知道而又潛在的有用信候進行提取,屬于一種更深層次化的數據分析方式,其與傳統分析方法的最大不同是傳統分析方法具備非常明顯的指向性特征,而其目的是通過結果來對預設命題的正確性進行驗證,或是通過對預設模型的機理進行量化分析。而數據挖掘技術則是在沒有任何比較明確的假設情況下對信息進行挖掘,找出信息的關聯性,并獲得那些難以通過直覺,甚至會違背直覺的相關信息,這樣挖掘出的信息極有可能出人意料而又富有價值,可以說,數據挖掘技術是傳統分析方法不斷變革后的結晶。
事實上,經過教育界諸多專家對數據采集應用系統的不斷完善,在數據采集應用系統頒布應用的三年里,系統結構與信息的采集量都發生了極大改變,以版本來說,最初的數據采集應用系統是08c版的,之后經過不斷的改進已經成為現今的10a001版,原有采集字段僅為594字段,現如今已經增長到了750個字段,采集字段的大幅增加,也使數據采集應用系統的信息容量得到了大幅度擴充,其數據倉庫特征也越來越明顯,尤為重要的是數據間的關聯度不斷增加,使其成為數據挖掘技術的深化基礎,從客觀上來說,通過數據挖掘技術的應用來進行數據分析,能為數據采集應用系統創造更加有利便捷的條件。
3數據挖掘技術深化高職狀態數據采集的應用系統分析
數據挖掘技術在高職狀態數據采集應用系統中的應用方法主要有關聯、分類、聚類、估計、細分或預測等,數據挖掘技術的自身理論與思維方式給數據采集應用系統帶來了廣闊的發展空間。在這些應用方法中,以聚類分析方法和關聯規則分析方法最為易于理解和實施,以下便對這種主要方法在高職狀態數據采集應用系統中的深化應用進行探討。
3.1關聯規則分析
在關聯規則方法中,數據是以孤立、單獨的形式分散存在的,這也使單獨的數據不能形成信息,不過將這些單獨、分散而又相互關聯的信息數據收集起來,則能多角度、全方位地對某一對象進行高效的價值辨別。而對于剛開始接觸數據采集應用系統的用戶來說,在數據采集應用系統使用過程中,應以海量信息數據作為依據來對高職院校在人才培養過程中的各個方面進行判斷與價值辨別,這就造成系統用戶往往感覺無從下手,只會對各個表格中的數據進行割裂而孤立地分析,更加難以找出數據之間的關聯性與內在規律,同樣難以對這些相互關聯的數據進行聚合,這使高職院校難以將人才培養工作過程中的關鍵要素進行全面呈現,以此幫助管理人員進行工作決策。而通過關聯規則挖掘方法的應用,則由數據采集應用系統提供數據,并對人才培養工作的所有關鍵要素進行分析,通過挖掘與之相關的所有數據,能更加清晰地呈現數據與指標間的相關關系及關聯規則。例如,在對高職院校的“兼職教師隊伍”建設現狀進行分析時,利用數據挖掘技術中的關聯規則分析方法,能將兼職教師的人數和整個高職院校的教師總數量進行對比,能清楚地知道兼職教師在整個高職院校的教師隊伍中占據的比例,再將兼職教師數量和高職院校所設置的專業數量進行對比,還可清楚地知道各個專業所安排的平均兼職教師數量等等。這些與之對比的數據均分散在整個系統中,但它們都和兼職教師隊伍有著很強的內在關聯,通過對這些與之關聯的數據進行采集,能非常直觀地對某個方面的具體工作情況進行真實反映。通過將這些數據進行聚合,還能非常直觀地反映高職院校對專業教師隊伍建設的重視程度及總體規則,并將其與預期的高職院校教師隊伍規劃進行比較,能清楚地知道當前教師隊伍建設能否滿足學校師資建設的發展需要,具體的實施情況如何等問題。
3.2聚類分析
在聚類分析中,對于不同的數據,通過關聯規則分析,能獲得大量的價值信息。而對于同一類的數據,則將這些數據利用聚類分析思路進行相應整合,這樣能使信息的呈現更加豐富,并能對某項工作的進程及各個部門間的差異進行真實可靠的反映。例如,在對高職院校的師生比情況進行分析時,利用聚類分析將歷年的院校招生情況及教師人數情況進行對比,能非常直觀地對院校在歷年中的師生比情況進行衡量,當發現每一年的學生數量都有所增長,而教師數量增長不大時,則可以通過師生比來衡量院校的教師增長數量難以滿足學院的教學要求,應加強師資隊伍建設。
3.3聚合分析
對于不同系數中的同類數據來說,可以通過聚合分析的方法來對系部間的差距進行直觀衡量與觀察,僅僅對同一系部中的數據進行分析,是難以獲得較多有價值信息的,而通過聚合分析方法將不同系部中的同類數據進行聚合,則能使數據信息變得更加豐富,進而可以非常直觀地了解到不同系部在相同工作之間的差距,從而使院校管理人員能根據這種差距來對工作差距較大的系部進行加強。
4結語
綜上所述,數據挖掘技術在高職院校狀態數據采集應用系統中的應用案例比比皆是,這也證明了數據挖掘技術能使院校狀態數據采集系統的作用得到更進一步的發揮,使數據采集應用系統能對各類數據進行有效挖掘與轉化,并將其應用到高職院校的管理與教學工作中,提高了高職院校的管理服務水平,為高職院校管理人員提供大量的有效信息??梢哉f,數據挖掘技術在很大程度上促進了高職院校狀態數據采集系統的深化應用。
參考文獻:
[1]張曉蕾.基于Android平臺的人才培養工作狀態數據采集管理系統的設計與實現[D].成都:電子科技大學碩士論文,2014.
[2]蘇世文,王國慶.高職院校人才培養工作狀態數據采集平臺的柔性UML模型設計[J].江蘇經貿職業技術學院學報,2013(2).
[3]伍丹.高職院校信息化管理系統建設與應用的思考——以網絡版《高等職業院校人才培養工作狀態數據采集平臺》為例[J].中國信息技術教育,2010(2).
作者:畢誠 單位:安徽國際商務職業學院
- 上一篇:數據挖掘在煙草行業質量管理中應用
- 下一篇:大數據分析智慧倉儲運營支撐平臺設計