戚萬學 中國教育大數(shù)據(jù)研究院院長,曲阜師范大學校長,教育學博士,教授,博士生導師?!靶率兰o百千萬人才工程”國家級人選,中宣部“文化名家和四個一批理論人才”,教育部“新世紀優(yōu)秀人才支持計劃”資助專家。
江青 中國統(tǒng)計信息服務中心(國家統(tǒng)計局社情民意調查中心)大數(shù)據(jù)研究實驗室主任,帶領團隊基于大數(shù)據(jù)技術及方法承擔了多個重要的國家級項目,是國內(nèi)最早從事大數(shù)據(jù)研究應用的實踐者之一。
近年來,“大數(shù)據(jù)”成了人們口中的一個“熱詞”,“大數(shù)據(jù)告訴你……”也成了眾多用以吸引眼球、增強權威性的文章標題。大數(shù)據(jù)對社會生產(chǎn)和生活的影響,在教育以外的行業(yè)已經(jīng)非常明顯,但在教育領域還處于起步階段。
教育關乎國計民生,教育問題又異常復雜,大數(shù)據(jù)在重塑教育方面具有無限的潛能。那么,大數(shù)據(jù)怎樣才能有效驅動教育改革?大數(shù)據(jù)進入教育領域面臨著哪些困難與挑戰(zhàn)?為此,中國教育報記者專訪了中國教育大數(shù)據(jù)研究院院長、曲阜師范大學校長戚萬學,中國統(tǒng)計信息服務中心大數(shù)據(jù)研究實驗室主任江青。
我國教育大數(shù)據(jù)發(fā)展尚處于基礎期
記者:自從2011年美國著名的咨詢公司麥肯錫發(fā)布《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿領域》的研究報告以來,“大數(shù)據(jù)”便成為近年來對人類思維和社會各領域沖擊最為強烈的一個“熱詞”。但是,許多人對何為數(shù)據(jù)卻一知半解。那么,數(shù)據(jù)是什么?教育小數(shù)據(jù)與教育大數(shù)據(jù)之間有什么聯(lián)系與區(qū)別?
戚萬學:提到數(shù)據(jù)時,我們首先想到的會是數(shù)字,但數(shù)據(jù)并不限于數(shù)字,視頻、文本、圖像、音頻等都可以是數(shù)據(jù)。
數(shù)據(jù)的發(fā)展,經(jīng)歷了從微數(shù)據(jù)到小數(shù)據(jù)再向大數(shù)據(jù)的轉變歷程,教育大數(shù)據(jù)是大數(shù)據(jù)的一個子集。在教育領域,時時刻刻產(chǎn)生著各種數(shù)據(jù),無論是教師和學生的一言一行、學校里所發(fā)生的種種現(xiàn)象,還是學生通過計算機終端進行的上課、做作業(yè)、發(fā)微博、討論問題等,都可以轉化為數(shù)據(jù),這些都成為教育大數(shù)據(jù)的來源。
江青:無論大數(shù)據(jù)還是教育大數(shù)據(jù),都不僅僅是數(shù)據(jù)本身的大小描述,而是由數(shù)據(jù)引發(fā)的各種關聯(lián)工作和解決方案。教育大數(shù)據(jù)就是教育統(tǒng)計插上了信息化的翅膀,變得比統(tǒng)計和信息化本身對人類更有價值。教育小數(shù)據(jù)是指沒有信息化關聯(lián)的一個個數(shù)據(jù)集,或者說教育數(shù)據(jù)孤島,這些獨立的數(shù)據(jù)不是沒有作用,而是相對大數(shù)據(jù)來說,其分析結果和價值很多時候不如大數(shù)據(jù)客觀和強大。
記者:大數(shù)據(jù)對社會生產(chǎn)和生活的影響,在教育以外的行業(yè)已經(jīng)非常明顯,但在教育領域還處于起步階段。教育大數(shù)據(jù)會給教育改革與發(fā)展帶來哪些影響?
江青:我國教育大數(shù)據(jù)發(fā)展尚處于基礎期。大數(shù)據(jù)對于教育改革和發(fā)展帶來的將是傳統(tǒng)思維的顛覆、教學效率的提升和教育科研的有效性,甚至會帶來教育的終身個性化匹配。除了在線學習,大數(shù)據(jù)可以用在招生、預算和學生服務等方面以確保透明度,將對學生學習、教師教學、教學科研、校園治理、家校互動、教育決策、就業(yè)管理、招生管理、學生成長等方方面面帶來很大影響。
戚萬學:的確,與其他行業(yè)相比,教育界對大數(shù)據(jù)的廣泛接納還是近期的事。但可喜的是,我們看到大數(shù)據(jù)正在走進教育的領地、走進學校的大門、走進教師和學生的生活。可以預期的是,一個屬于教育的大數(shù)據(jù)時代即將到來,它不僅影響學校內(nèi)部治理的改革,而且會驅動整個教育領域的變革,它使我們照顧學生的個性化需求、關愛每一個孩子成為可能。但從整體上看,目前教育大數(shù)據(jù)的采集網(wǎng)絡仍處于布局和建構的初級階段,大數(shù)據(jù)在教育決策、教學過程中的運用還處于摸索和起步階段,大數(shù)據(jù)人才培養(yǎng)的完善體系還沒有建立起來。倒是一些企業(yè)集團較早看到了大數(shù)據(jù)帶來的應用前景和巨大商機,以至于大數(shù)據(jù)在教育領域的應用總體上呈現(xiàn)出“產(chǎn)業(yè)應用的成熟度大于學校應用的成熟度”的態(tài)勢。
實現(xiàn)真正的“因材施教”離不開教育大數(shù)據(jù)
記者:一般來說,數(shù)據(jù)是冰冷的,是抽離了鮮活之后的抽象。而教育面對的是活生生的有個性的人,需要因材施教,大數(shù)據(jù)能否克服傳統(tǒng)數(shù)據(jù)的缺陷,從而關注到學生的個性發(fā)展?
戚萬學:與傳統(tǒng)數(shù)據(jù)、有限數(shù)據(jù)或小數(shù)據(jù)相比,教育大數(shù)據(jù)的獨特優(yōu)勢就在于,通過對教育活動或行為數(shù)據(jù)的收集、分析和反饋,可以不斷改變、調整我們的教育計劃,從而實現(xiàn)真正的“因材施教”,使我們能夠關注到每一個學生的成長。
大數(shù)據(jù)研究專家舍恩伯格指出,“個性化建立在大數(shù)據(jù)反饋的基礎上”,“在學習的環(huán)境下,大規(guī)模個性化的實現(xiàn),需要有更豐富的反饋數(shù)據(jù)流向教師和管理人員”。教育大數(shù)據(jù)的分析能夠給學習者發(fā)現(xiàn)自身學習規(guī)律的機會,給教育者和研究者提供每個學習個體在學習過程中的態(tài)度、模式、需求、風格等信息,從而提供有針對性的學習內(nèi)容與指導。
江青:大數(shù)據(jù)分析已經(jīng)被應用到美國公共教育中,成為教學改革的重要力量。美國聯(lián)邦政府教育部2012年參與了一項耗資2億美元的公共教育中的大數(shù)據(jù)計劃。這一計劃旨在通過運用大數(shù)據(jù)分析來改善教育。聯(lián)邦教育部從財政預算中支出2500萬美元,用于了解學生在個性化層面是怎樣學習的。
記者:在關注學生個性化發(fā)展方面,教育大數(shù)據(jù)可以提供什么樣的服務?
戚萬學:在大數(shù)據(jù)時代,研究者通過學習者在學習系統(tǒng)中產(chǎn)生諸多數(shù)字碎片的分析,會發(fā)現(xiàn)其學習行為的模式與特點,從而為學習者提供個性化的學習建議;教育者借助強大的大數(shù)據(jù)實證工具,能夠了解如何教、如何學是最有效的,從而制定個性化教學和課程計劃;學習者可以通過數(shù)據(jù)從原有的依賴教師的有限理性判斷發(fā)展為對自己學習的數(shù)據(jù)化分析;而評價者則可以通過對學習者學習過程的關注與跟蹤,在大數(shù)據(jù)技術的支持下提供最客觀、直接和準確的學習分析和教育評價,使傳統(tǒng)的經(jīng)驗式評價轉向基于據(jù)數(shù)據(jù)的過程性評價。
江青:教育工作者和研究者已經(jīng)開發(fā)出從大數(shù)據(jù)中提取價值的5種主要的技術:預測,預知事實的可能性;聚類,發(fā)現(xiàn)自然集中的數(shù)據(jù)點;相關性挖掘,發(fā)現(xiàn)各種變量之間的關系,并對其進行解碼以便今后使用它們;升華人的判斷,建立可視的機器學習模式;用模式進行發(fā)現(xiàn),使用通過大數(shù)據(jù)分析開發(fā)出的模式進行“元學習”。實施這些技術,就能夠通過大數(shù)據(jù)來創(chuàng)建為提高學生成績提供支持的學習分析系統(tǒng)。這些技術將幫助教育工作者更加有效地指導學生朝著更加個性化的學習進程邁進。
數(shù)據(jù)的失真失實是大數(shù)據(jù)時代必須面對的問題
記者:人們經(jīng)常說:用事實說話,用數(shù)據(jù)說話。但是,數(shù)據(jù)等于事實嗎?教育大數(shù)據(jù)和教育事實是什么關系?
江青:教育大數(shù)據(jù)是對教育客觀的邏輯歸納,是對與之相關的未經(jīng)加工的原始素材進行采集、處理、研究、應用的一系列工作。教育大數(shù)據(jù)做好了,可以客觀反映教育事實,呈現(xiàn)教育現(xiàn)象,給教育改革提供決策參考。
戚萬學:數(shù)據(jù)與事實并非是完全一一對應的,它們可能有一致性,也可能存在相悖的結果。著名的辛普森悖論就啟示我們,數(shù)據(jù)有時候并不能反映事實。教育大數(shù)據(jù)是從教育實踐中搜集的有關教育活動、現(xiàn)象等原始材料,根據(jù)使用數(shù)據(jù)人的目的按一定的形式加以處理,找出其中的內(nèi)在聯(lián)系,從而反映教育事實。相比傳統(tǒng)“小”數(shù)據(jù),教育大數(shù)據(jù)在大規(guī)模在線學習、學習者模型、教學者模型等研究中,體現(xiàn)出更加貼近事實的優(yōu)勢。應該說,隨著更多數(shù)據(jù)的收集、處理和分析,我們對世界的認識將更趨復雜、更加精確。
記者:前不久,“今日頭條創(chuàng)始人張一鳴炮轟艾瑞數(shù)據(jù)失實”的事件引起了人們的關注。怎樣才能保證教育數(shù)據(jù)采集的數(shù)據(jù)客觀、不失實?
江青:應該說,獲得相關數(shù)據(jù)并不是一件容易的事。對于大學階段的學生而言,數(shù)據(jù)的收集并不是主要問題。然而,對于中小學階段的學生而言,挑戰(zhàn)卻很大,因為有些數(shù)據(jù)的收集存在法律問題,有的則存在倫理道德(隱私)的問題。
數(shù)據(jù)收集者的人數(shù)和技能也是一個問題。數(shù)據(jù)的采集需要通過特定的渠道,互聯(lián)網(wǎng)數(shù)據(jù)需要用技術手段獲取,通常通過網(wǎng)絡上的小型文本文件來收集用戶的相關信息,但是對于教育部門而言,則需要依賴于全國眾多學區(qū)和研究者的網(wǎng)絡來提煉和確認數(shù)據(jù)。
戚萬學:數(shù)據(jù)的失真、失實是大數(shù)據(jù)時代必須面對的問題。對科學研究來說,數(shù)據(jù)的真實可靠是研究的生命和價值之所在。數(shù)據(jù)在采集的過程中,會由于教育數(shù)據(jù)的層次不同而發(fā)生變化。根據(jù)數(shù)據(jù)采集手段的不同,可以把教育大數(shù)據(jù)分為基礎層數(shù)據(jù)(如每年的學校招生情況、教育經(jīng)費情況等)、狀態(tài)層數(shù)據(jù)、資源層數(shù)據(jù)(非結構化數(shù)據(jù))、行為層數(shù)據(jù)(財務報銷、學生寫作業(yè)等)。這些數(shù)據(jù)大部分是在教育過程中自動生成并被記錄下來的。
與基于有限數(shù)據(jù)的小數(shù)據(jù)預測本身存在的不確定性相比,大數(shù)據(jù)時代的預測精確度要遠遠超過現(xiàn)在。同時,大數(shù)據(jù)技術下數(shù)據(jù)的自然生成、對數(shù)據(jù)的全樣本采集、傳感器收取、射頻識別等全新采集手段的應用,也都可以保證研究者所獲得的信息更加真實。但相比精確度,大數(shù)據(jù)更加追求的是效率,在海量的數(shù)據(jù)面前,放棄一些微觀層面的精確,會得到宏觀層面更高的效率。
核心挑戰(zhàn)在于數(shù)據(jù)分析處理及結果的可視化呈現(xiàn)
記者:在這些數(shù)據(jù)采集的過程中,如何保護被采集對象的個人隱私?
戚萬學:有時候,通知被采集對象會導致一些人為的、刻意的裝飾,反而會影響數(shù)據(jù)的真實性。教育大數(shù)據(jù)和其他領域大數(shù)據(jù)的區(qū)別在于,它們涉及的更多是教育環(huán)境下教師和學生個人發(fā)展和專業(yè)成長的一些信息,因此,不征得數(shù)據(jù)采集對象的允許并不意味著數(shù)據(jù)亂用,在數(shù)據(jù)運用的過程中,我們要特別注意保護被采集對象的隱私。大數(shù)據(jù)這種對學生隱私的挑戰(zhàn),需要在數(shù)據(jù)采集過程中保護被采集人的敏感信息,使其保護自身隱私的權利得以行使。美國聯(lián)邦政府2014年推出的《在線教育服務指導》提出,只有在滿足《學生權利保護修正案》和《家庭教育權利與隱私法》的情況下,學生的數(shù)據(jù)才能被學校和學區(qū)所采集。所以,借鑒美國的做法,我國可以出臺涉及教育大數(shù)據(jù)的隱私安全的相關政策或法律法規(guī)。
江青:數(shù)據(jù)采集的過程會涉及方方面面,對事關隱私的數(shù)據(jù)當然要考慮當事人的意愿,我們提倡對于收集到的數(shù)據(jù)進行加工,生產(chǎn)出具體數(shù)據(jù)產(chǎn)品,而不是直接將教育具體數(shù)據(jù)對外公開。當然,采集和擁有數(shù)據(jù)的機構也需要加強法律意識,加強技術保護措施。
記者:對采集到的教育大數(shù)據(jù),應該怎樣進行科學分析、應用?
戚萬學:在教育大數(shù)據(jù)應用方面,其核心挑戰(zhàn)就在于數(shù)據(jù)的分析處理及結果的可視化呈現(xiàn)等方面。教育大數(shù)據(jù)是客觀的,而分析與應用是主觀的,在數(shù)據(jù)的分析與應用中如何平衡兩者的關系是一個十分關鍵的問題。
對教育大數(shù)據(jù)進行分析,需要從大量數(shù)據(jù)中進行提取與挖掘。在這個過程中包括數(shù)據(jù)的清理、數(shù)據(jù)選擇、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估和知識表示等。這些分析環(huán)節(jié)的每個構成都應成為數(shù)據(jù)分析研究的重要內(nèi)容,從而最大限度地保持與還原客觀事實。
江青:過去十幾年里,教育領域的技術發(fā)展陷入了停滯,研發(fā)投入遠遠不夠。教育技術未來發(fā)展的關鍵在于數(shù)據(jù)。美國教育部門對大數(shù)據(jù)的運用主要是創(chuàng)造了“學習分析系統(tǒng)”,旨在向教育工作者提供學生到底是“怎樣”學習的更多、更好、更精確的信息。
教育大數(shù)據(jù)一定要落地應用。例如,根據(jù)不同的需求調用某教育部門各套系統(tǒng)的數(shù)據(jù),結合外部其他單位的數(shù)據(jù),教育管理部門可以利用大數(shù)據(jù)優(yōu)化教育資源配置,提高教育水平,引導學生成長,共享學習資源。教育大數(shù)據(jù)可以幫助教育管理部門建立“數(shù)字教育地圖”,助力教育資源布局優(yōu)化;建立“智慧教育平臺”,助力教育成果管理;建立“績效評價系統(tǒng)”,提升教育科研創(chuàng)新力。
不加約束地使用教育大數(shù)據(jù)一定會產(chǎn)生風險
記者:當前,似乎有一種將大數(shù)據(jù)神話的傾向,但教育大數(shù)據(jù)不是萬能的,人的成長遠比我們想象的要復雜的多。在教育領域,是否也有一些方面是大數(shù)據(jù)不能解釋和預測的?
江青:教育大數(shù)據(jù)可以修正教育過程,使之更加符合教育的本質,但教育大數(shù)據(jù)的確不是萬能的。大數(shù)據(jù)可以很好地展現(xiàn)一個人的學習過往,也可以預測未來該學生的成長軌跡,但大數(shù)據(jù)預測他可能會成為一名科學家,可這名學生長大后卻有可能走上演藝的道路。作為個人,我們不斷地成長、發(fā)展、變化,而那些多年來全面收集的教育數(shù)據(jù)卻始終保持不變。
戚萬學:作為資源與工具的教育大數(shù)據(jù),其往往體現(xiàn)的是對信息的告知而非解釋。數(shù)據(jù)一方面在引導人們的理解,但同時也可能導致誤解的出現(xiàn),所以正確使用是教育大數(shù)據(jù)解釋與預測的關鍵。而且,教育大數(shù)據(jù)的獲取,多數(shù)情況下還依賴于互聯(lián)網(wǎng)這一平臺,“離線”或“線下”教育環(huán)境中同樣存在大數(shù)據(jù),但數(shù)據(jù)獲取的時效性、便捷性往往會受到很大影響。與此同時,數(shù)據(jù)對事物的分析也并非萬能,不能說任何事物都能夠通過數(shù)據(jù)準確反映出來。例如,教育組織氛圍、文化,學校的學術精神、德育實效性,學生的智慧、創(chuàng)造力、想象力等,則很難通過數(shù)據(jù)加以描述和統(tǒng)計。
記者:舍恩伯格認為:“我們對潛在后果和概率性結果的預測有加大教育不平等的可能。全面教育數(shù)據(jù)帶來的首個重大威脅,并不是信息的發(fā)布不當,而是束縛于我們的過去,否定我們進步、成長和改變的能力?!睂Υ?,您怎么看?
戚萬學:如果教育大數(shù)據(jù)被不加約束地使用,則一定會產(chǎn)生風險。人是發(fā)展性的、具有能動性的物種。過去的選擇是清晰的、決定性的、不可更改的,但今天我們會做出什么樣的選擇則充滿了無限的可能性,有無限的變數(shù),這些變數(shù)是大數(shù)據(jù)決定不了的,是不可預測的。這些不可預測的選擇和既定的現(xiàn)實,將我們引向可知又充滿變數(shù)的未來。大數(shù)據(jù)預測不是占卦算命,一切皆在這變與不變之中。
江青:學生家長,教育專家長期以來對未成年人的隱私保護問題和對學生的學業(yè)追蹤帶來的后果憂心忡忡,因為這是限制學生未來發(fā)展機遇的潛在威脅。大數(shù)據(jù)不但會放大這些問題,還會改變他們的本質。隨著時間的推移,我們會改變看法,調整觀點甚至重塑我們的價值觀。大數(shù)據(jù)結果需要結合行業(yè)經(jīng)驗才能發(fā)揮出巨大的價值,否則將加大因為數(shù)據(jù)結果的不準確而帶來的決策風險。
教育大數(shù)據(jù)科學發(fā)展還需邁過多道“坎”
記者:當前,我國教育大數(shù)據(jù)發(fā)展前景如何?當前主要面臨哪些困難?
戚萬學:隨著我國“以教育信息化帶動教育現(xiàn)代化”方針的確立,《教育信息化十年發(fā)展規(guī)劃(2010-2020)》的順利推進,特別是大數(shù)據(jù)發(fā)展上升為國家戰(zhàn)略,教育大數(shù)據(jù)的開發(fā)與應用將迎來一個全新的時代。但是,我國教育大數(shù)據(jù)的科學發(fā)展,還面臨著觀念層面、實踐層面、技術層面等方面的困難。
江青:國家政策已經(jīng)將我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展定為國家戰(zhàn)略,對一系列的政策措施都給出了產(chǎn)業(yè)引導和支撐。教育領域在應用大數(shù)據(jù)上也會面臨大數(shù)據(jù)產(chǎn)業(yè)發(fā)展中存在的共同問題:大數(shù)據(jù)思維亟待培育、大數(shù)據(jù)人才亟待培養(yǎng)、大數(shù)據(jù)相關標準亟待制定、大數(shù)據(jù)法律法規(guī)亟待建立。
記者:如何克服這些困難?
江青:要克服這些困難,需要教育部門、社會針對性地采取必要的對應措施,例如,針對思維問題,可以由教育主管部門組織行業(yè)培訓,出臺相應政策措施,組織相關活動會議,展示推廣大數(shù)據(jù)在教育領域的應用案例;針對人才問題,清華大學、復旦大學、北京大學、中國教育大數(shù)據(jù)研究院等一些高校及研究機構已開始啟動人才培養(yǎng),但除高校培養(yǎng)培訓之外,還應對在職的統(tǒng)計、信息工作人員進行專業(yè)性的培養(yǎng);針對大數(shù)據(jù)相關標準制定,標準制定機構需要大數(shù)據(jù)從業(yè)機構的配合,更需要大數(shù)據(jù)應用對象的配合,凡事預則立,標準制定是大數(shù)據(jù)產(chǎn)業(yè)有序健康發(fā)展的基礎要件;無規(guī)矩不成方圓,大數(shù)據(jù)產(chǎn)業(yè)發(fā)展過程中逐漸暴露的問題,如隱私等,都需要有相應的法律法規(guī)制約,否則,教育大數(shù)據(jù)產(chǎn)業(yè)談不上良性發(fā)展。
戚萬學:要真正實現(xiàn)教育大數(shù)據(jù)科學發(fā)展,尚需多方努力。首先是要有接納大數(shù)據(jù)的態(tài)度,這是前提。政府、教育主管部門、教育機構要強化大數(shù)據(jù)意識,形成大數(shù)據(jù)思維,自覺運用大數(shù)據(jù)思維和技術解決教育的問題;二是要加強大數(shù)據(jù)系統(tǒng)建設的頂層設計,國家教育主管部門應統(tǒng)籌制定教育大數(shù)據(jù)系統(tǒng)的規(guī)劃與建設的規(guī)范,為各級政府和教育機構提供大數(shù)據(jù)集成和共享平臺,實現(xiàn)數(shù)據(jù)的流動、互通和共享;三是政府要出臺相關支持性政策,鼓勵研究機構、高等院校、各種社會力量開展教育大數(shù)據(jù)技術和資源的研發(fā)與合作;四是加強大數(shù)據(jù)領域人才的培養(yǎng),我國教育大數(shù)據(jù)的發(fā)展才剛剛起步,人才的缺乏將是一個嚴重的限制。教育主管部門應盡快將大數(shù)據(jù)列入高等教育的專業(yè)目錄,盡快完善本科、研究生完整的人才培養(yǎng)體系,高等學校也應自覺承擔起培養(yǎng)大數(shù)據(jù)專業(yè)人才的重任。
相關新聞
更多>>