核心提示
如何科學合理使用高考機器人的核心在于是否滿足未來教育需要,是否強調了認知的過程,是否發展了學生的高階思維能力,從而落實學生核心素養的發展。而非簡單的作為批改作業、提高效率、提高分數的工具,通過試題背后規律的訓練、記憶、理解強化應試教育,把應試教育做到極致的錯誤路徑。加強機器人在教育過程中應用的研究任重而道遠。
2017年6月7日下午,在高考數學考試結束后,在成都和北京兩臺人工智能高考機器人AI-MATHS和Aidam參加了數學考試,分別在使用22分鐘、7分49秒的時間獲得了105分、134分的成績。教育圈被機器人之戰持續刷屏,這是國內機器人首次舉行公開測試,是當前教育評價進入新范式的標志性事件之一,對反思我國當前教育評價和教育改革都有十分重要的意義。記者日前就此專訪了中國基礎教育質量監測協同創新中心網絡部主任、中國教育技術協會教育測量與評價專業委員會秘書長張生。
記者:您如何看待高考機器人在大數據、人工智能技術和教育評價中的應用?
張生:高考機器人是國家863計劃信息技術領域“基于大數據的類人智能關鍵技術與系統”項目的重要研究目標之一,是教育大數據、人工智能和教育評價的完美結合,是從教育數據、信息到智慧的一個重要過程,更重要的是看機器能達到一個什么樣的人工智能水平,然后在更多領域去應用這些成果。隨著互聯網的發展,學生利用網絡平臺進行學習、答題,產生了大量的過程性數據,包括試卷、試題、解題過程等多種學習數據。這些多維度、大規模數據的背后隱藏的是人類學習、認知的規律,讓機器挖掘、學習人類的作答規律和認知方式,通過建立模型和算法,從而具備邏輯推理能力,形成智慧。高考機器人答題,需要解決蘊含人工智能方面經典且困難的問題,包括了題目理解(自然語言理解)、知識表現、邏輯推理、人機互助方式、獲得知識、表達符號邏輯等,是衡量機器人知識水平、理解能力、推理能力等相關智能水平的一種方法。
記者:為什么您堅信未來教育評價會更加關注學生高階思維能力?
張生:隨著AI+時代的來臨,人類的生活生產方式發生了重大變化,人類賴以生存的知識和技能以及某些單一領域的創新已經被人工智能所取代,呼喚評價復合創新能力等高階思維能力的新工具、新模式新方法。為了應對這種變化,培養符合未來社會發展的人才,各國以不同形式紛紛提出了相關計劃。2011年,美國21世紀技能合作聯盟提出了《21世紀技能》,其主要思想是:21世紀的學校需要整合3個“R”(即核心課程)和4個“C”,即批判性思維與問題解決、交流合作、創造與創新。2016年9月,《中國學生發展核心素養》總體框架正式發布,其提出了六大素養并細化為18個基本要點,包括理性思維、批判質疑、勇于探究、勤于反思、問題解決、自我管理等。由此可見,不管是美國還是中國,均將高階思維認知能力列為未來人才的必備技能。因此,未來教育評價的核心是測量學生的高階思維能力,比如批判性思維能力、合作能力、反省能力、問題解決能力、創新能力等多種目標,為未來社會提供足夠的創新型人才。
記者:如何判定科學合理使用高考機器人的核心價值?
張生:心理學上有一個詞叫“元認知”,是不同于認知的另一種現象,又稱反省認知、監控認知、超認知、反審認知等,是指人對自己的認知過程的認知。學習者可以通過元認知來了解、檢驗、評估和調整自己的認知活動,是整合、評價、創造等高層認知、高階思維能力的核心,它獲得的重點在于經歷這個過程、在過程中進行反省和監控等,強調的是對認知過程的再認識。傳統的教育尤其是工業時代大家教育是以知識、技能等認知對象的獲得為主要目標的,更加強調知識的掌握,而忽略對認知過程的再認識過程,因此對認知的訓練、評價尤為強調和突出。當前高考中記憶、理解、簡單應用等低層認知的題目還大量存在,這也是當前高考機器人最容易得分的類型。
因此,如何評價高階思維能力的發展是當前測量與評價中的難點,不僅體現在如何命題,如何獲取認知過程的數據,如何進行過程性數據的分析、計分、分數合成,如何解釋分數等諸多難點,更多的困難還體現在如何在成本可控的情況下大規模、高效率應用。這也是新高考中強調綜合素質等學習過程評價的重要原因。
更多資訊請關注機器視覺頻道