基于數據挖掘技術學情分析
時間:2022-02-20 10:37:23
導語:基于數據挖掘技術學情分析一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要:近年來數據挖掘技術被廣泛應用在數據分析中,大大提高了數據分析的質量。提出將數據挖掘技術應用到學情分析系統中,改變以往學情的片面分析狀況,深層次挖掘教育數據中的不可見信息,發現教育過程中存在的問題和隱含的教育教學規律,從而為學校管理者提供良好的決策支持并制定科學合理的改革策略,更好地滿足學生需求和科學地指導教師教學
關鍵詞:學情分析;需求分析;數據采集;數據挖掘
隨著信息技術的發展,數據的產生速度加快,數據的規模也變得日益龐大,依據行業的不同,分為金融、醫療、電信、教育等數據,而教育數據的研究和應用還屬于起步階段。學情分析正是針對教育數據開展的,利用數據挖掘技術進行學情分析能夠深層次挖掘教育數據中的不可見信息,發現教育過程中存在的問題和隱含的教育教學規律,從而優化教育管理、促進和完善教育教學改革、加快學校信息化建設、提升教學質量。
1學情分析概述
1.1基本概念?!皩W情”最早出現在20世紀80年代初,當時“學情”是指對學生學習情況的了解,進而指導學生的學習方法,這是一種靜態的描述。隨著學情研究的深入,有專家指出,學情應該是指學生的知識基礎、學習方法、心理狀態、理解能力、學習興趣等[1]。學情研究,這一概念體現出學情組成因素由單一向多樣轉變?!皩W情分析”概念最初出現在教學設計理論中,在國外主要用“學習者分析”、“學生特征分析”、“學生特點分析”等概念。目前,學情分析的定義沒有形成科學的、統一的界定,一般廣義的“學情分析”是指把學生作為“人”做全面分析,涉及生理、心理、社會因素等多個維度,包括個性特征、心理狀態、學習方式、成長環境等各方面的研究。狹義的“學情分析”是指對學生的學習情況進行分析。1.2學情分析的傳統方法。目前,傳統的學情分析方法主要有調查法、觀察法、測試法、實驗法、材料分析法、個案分析法、經驗梳理法及訪談法等。其中調查法是使用最多的一種量化研究方法,也是目前學校普遍采用的方法。隨著網絡的快速發展,調查法主要采用問卷調查,其特點是問卷的發放和回收方便,統計分析能夠自動化,能更及時捕捉學生的狀態信息。觀察法主要是基于量規的課堂觀察法;材料分析法是通過學生課堂回答問題、課程相關成績、課后作業等相關材料,深入了解學生學習狀態;訪談法是通過與教師和學生進行交流,了解真實學情、分析的思路和方法、具體實踐行為,以便及時調整教學的實施行為。
2學情分析系統的目標
為全面、客觀、科學、實時地分析學情,系統擬對學生的知識儲備、學習需要、學習狀態、學習能力、學習結果和生活環境等方面了解和分析,即展開廣義的學情分析。這里的部分數據可以通過學校相關信息系統獲得,例如學習結果可以用出勤情況、作業成績、測試成績等來量化體現,但類似知識儲備、學習需要等情況都沒有現成的數據,或者沒有量化的數據。由于學校的學生人數龐大,要獲得這些情況,采用問卷調查方法是最合適的方法。調查問卷包括學生和教師評價問卷、心理健康問卷、課程相關調查問卷、生活相關調查問卷、畢業生就業調查問卷等,問卷種類較多、調查人員范圍不同。因此采用網絡在線問卷調查是現在最便捷的方法,能夠得到全面、合理、客觀的學情數據,實現數據收集的信息化、自動化、網絡化,也為以后的學情分析提供詳細數據支持。系統作為一個學情分析的有力工具,通過對學情數據的深度分析挖掘有價值的信息是主要目標,目前數據挖掘技術是最科學、合理的分析方法,也是公認的智能分析最有效的方法。該技術就是利用存儲的數據進行挖掘計算,通過計算機應用程序,把復雜的統計技術、挖掘算法封裝起來[2]?;谝陨戏治觯鞠到y整體目標是通過網絡問卷并結合學校相關信息系統已存儲的信息收集學情數據,再對這些基礎數據進行深度挖掘,挖掘得到的信息將幫助學校有針對性、實時地了解學生具體情況和發展變化,從而為學校管理者提供良好的決策支持并制定科學合理的改革策略,更好地滿足學生需求和科學地指導教師教學。
3需求分析
需求分析是進行系統設計的基礎,主要確定系統擬發揮的作用,以及要實現的具體操作。系統旨在將學生和教師的客觀和主觀數據進行收集和深度分析,以便全方位地了解學情。3.1數據來源。該系統所有學情數據主要來源于學校相關信息系統和調查問卷,具體如下:(1)學校已有的信息系統主要有教學管理系統、學生管理系統、一卡通系統、圖書管理系統等。這些系統已經存儲了大量關于學生、教師的數據,包括學生的基本信息、課程、成績、在校表現情況,教師的基本信息、教學安排和教學效果信息等[3],這些數據通過校園網絡進行整體導出并存儲在學情分析系統。因為這些系統數據隨時有更新,可以設置定時導入學情分析系統。(2)調查問卷這里把教學人員和教輔人員都歸為教師。為實現全面的學情分析,不同工作職責的教師都需要了解自己負責的相關信息,所以他們設計的問卷內容是不同的,調查的對象也是不同的。按照學校的情況,具體的調查問卷內容大致涉及以下3個方面:1)負責教學的教師需要了解所授課班級的學生情況。問卷調查的內容主要是學生已經具備的知識和技能、課程學習中對知識的理解和掌握程度、學習中存在的疑問和困難、學習的收獲和體驗等。2)教務管理的教師需要針對不同系部、專業或班級學生及教師進行調查。針對學生的問卷內容主要涉及學生對所學專業的課程設置、授課教師的教學能力和教學效果、整體的教學管理等方面的意見;針對教師的問卷內容涉及教師對人才培養、課程設置、教學安排、教學管理的意見,以及教學中存在的問題。3)事務管理的教師根據管理職責范圍不同,會對學生進行調查。問卷內容主要是關于學生的心理健康和日常生活管理、圖書服務、學校環境、其他事務管理的滿意度和意見。3.2系統用戶。系統主要供教師和學生使用,系統的維護和管理也由教師負責,為方便區分,這些教師被稱為系統管理員。所以系統共設置3類用戶,分別是系統管理員、教師、學生,他們的權限各有區別。系統管理員權限最大,擁有系統所有數據的管理和操作權利;學生操作最少,只參與填寫問卷和查詢自己可見的問卷;教師主要是問卷的設計、發放、回收問卷并分析結果。3.3關鍵功能。依據以上系統目標的分析,本系統中應該包括收集數據、管理數據和分析數據3部分,所以應該具備具體的功能如下:(1)數據采集功能:一部分從學校相關信息系統導入數據,另一方面采集問卷數據。問卷數據的采集包括問卷內容的參考數據收集,問卷數據的回收和爬取。問卷內容的設計可以參考學校的校園論壇等交流平臺的內容,這就需要對交流平臺的數據進行收集和分類匯總,以便制定科學合理的問卷。問卷回收歸入在問卷管理。(2)數據管理功能:數據包括學生和教師的基本信息,學生成績等信息系統的已有數據和問卷數據。學生和教師的基本信息歸為用戶數據,學生成績等信息系統的已有數據和問卷數據歸為學情行為數據。所以數據管理包括用戶管理和學情行為數據的管理。1)用戶管理:實現用戶基本信息的增加、修改、刪除和權限控制的功能。2)學情行為數據管理:包括數據存儲和數據編輯。學生成績等已有數據直接存儲;但問卷數據需要編輯,包括問卷增加和修改、問卷審核、問卷發放、問卷填寫、問卷查詢、問卷自動回收。問卷增加和修改部分包括問卷的內容設計、生成新問卷、刪除、修改問卷、問卷導入和導出。為保證問卷內容的合理合法,問卷需要經過審核后才可以發放。為保障問卷數據的合法性、準確性,已經審核通過的問卷將會被凍結修改操作。發放問卷時要注明填寫的截止時間和調查對象,到截止時間就自動回收問卷。為保證問卷的質量,限制同一問卷每人只能提交一次。對于發放和填寫問卷的用戶,可以查看自己操作過的問卷。(3)數據分析功能:對信息系統導入的數據和回收的問卷數據先分別處理和分析,再聯合分析。問卷數據先篩選有效問卷,然后對有效問卷的結果依據指定的范圍進行分析,以此滿足不同需要。最后對分析結果進行存儲和反饋,采用數據可視化技術按照要求繪制不同類型的統計圖表,供相關人員查看。3.4系統的非功能性需求。系統的非功能性需求無法直觀表現,而通過一定的指標如穩定性、安全性、可靠性、可適應性等表現出來[4]。系統只供學校內部使用,系統使用者數量大,使用頻率高,涉及用戶的隱私數據,所以主要考慮穩定性、方便性、安全性、擴展性,以便為用戶提供友好的使用界面,保證系統保持平穩、無誤地運行,保證數據的安全,容易維護和擴展功能
4系統整體設計
根據以上分析,學情分析系統需要具備數據采集、數據管理、數據分析、登錄管理4個功能模塊,每個模塊的作用設計如下:(1)登錄管理:包括身份信息的驗證和登錄界面的展示。為保證數據的安全和用戶的合法性,登錄系統需提供用戶名和密碼,驗證通過后,依據用戶身份分配訪問權限,進入相應的主界面。(2)數據采集:主要是相關信息系統的數據導入和已有問卷的導入,問卷數據的爬取,相關交流平臺的數據采集。(3)數據管理:包括問卷管理、用戶管理、角色管理、數據庫管理。問卷管理實現調查問卷相關的系列功能。用戶管理用于設置和維護用戶信息,包括角色設置和用戶所屬部門設置。角色管理用于規劃角色、權限和設置角色的權限。數據庫管理實現數據的存儲、備份和恢復。(4)數據分析:包括對各種數據的處理和單獨分析,相關數據的關聯分析。
5關鍵技術
為實現系統的目標,本系統中采用的關鍵技術主要是數據采集、分析和反饋方面的技術。5.1數據采集。在保證校園網暢通的情況下,與相關信息系統對接并整體導入數據,這里主要是類似學生成績的結構化數據。而在線網絡問卷的數據和交流平臺的數據大多是文本數據,而文本數據正是非結構化數據的代表[5]。使用Python網絡爬蟲技術采集相關數據。5.2數據挖掘和文本挖掘。像學生成績等結構化數據采用關聯技術和聚類技術可以進行分析;文本數據處理需采用文本挖掘的相關技術進行分析。文本挖掘包括文本預處理和文本分析,預處理主要包括分句、分詞、特征表示和提取等。文本分析采用文本聚類和分類方法。5.3數據可視化。數據可視化是數據挖掘結果的直觀呈現,可以將數據間的復雜關系形象地表示出來,是一種非常實用的結果反饋方法。而統計圖表是數據可視化中不可缺少的基本組成元素,在很多大型的復雜可視化系統中仍然被廣泛使用[6]。系統中主要對分析結果進行圖形化的呈現,使得使用者對結果容易理解,并方便總結。
6結語
主要研究利用數據挖掘技術開發學情分析系統,從系統的需求分析設計系統整體功能,為系統的詳細設計和開發實現奠定基礎。該系統的開發體現了教育數據挖掘的發展和應用,改變以往學情的片面分析狀況,能夠促進和深化學校學生學習、教師教學實踐及幫助相關部門提供合理的計劃和建議[7]。
參考文獻
[1]馬文杰.鮑建生.“學情分析”:功能、內容和方法[J].教育科學研究,2013,(9):52-57.
[2]白雪.高校教學質量評估數據的分析挖掘系統[D].太原理工大學,2007.
[3]劉娜.基于數據分析的高校教學管理決策支持方法研究[D].浙江大學,2019.
[4]劉凱寧.山東省胸科醫院體檢管理系統的設計與實現[D].山東大學,2012.
[5]張波.高校貼吧中學生行為數據的文本聚類應用及研究[D].西華師范大學,2017.
[6]陳為,沈則潛,陶煜波.數據可視化[M].電子工業出版社,2013.
[7]李強,趙晨杰,羅先錄.基于大數據應用技術的學情分析系統架構分析與設計[J].軟件工程,2018,21(05):34-37.
作者:宋煥林 單位:河套學院
- 上一篇:數據挖掘在計算機網絡病毒的應用
- 下一篇:智能刷卡機飯堂數據挖掘系統分析