刘益东 | AI教育革命加快拔尖创新人才培养与评价

发表日期: 2024-09-02

2019年中共中央、国务院印发的《中国教育现代化2035》提出,到2035年,我国要迈入教育强国行列[1]。如何高标准、严要求地建成教育强国,是科教界面临的重大挑战。近两年AI大爆发对社会各个方面产生巨大冲击,在教育领域引发AI教育革命,可谓百年未有之教育大变局,将在人类历史上首次实现精英教育普惠化,为在短时间内建成教育强国提供了新机遇。在此形势和背景下,如何加强拔尖创新人才的培养与评价,是摆在我们面前的重要议题。笔者认为,AI教育革命的核心是实现精英教育普惠化,推动我国从人口大国向人才强国跃升,实现人口红利向人才红利转变。关于AI教育革命,当前人们讨论最多的是AI在传授知识方面发挥的重要作用,如GPT-4o所展现的教授数学的能力令人印象深刻,AI助教将越来越多地参与教学活动。实际上,AI对教育的影响主要体现在两个方面:一是AI助力教学,可以做到一对一、因材施教、私人定制,大幅提升知识传授的效率与品质;二是AI评价学习者的能力,由于AI掌握所有学科知识,可以系统准确地测试出学习者的有关能力,给予定级,真正实现从学历教育向能力教育的转变。AI教育革命将从教学及教学效果评价等方面全面推动精英教育普惠化的实现,其变革范围之广、程度之深、进度之快,前所未有,从根本上改变培养、评价拔尖创新人才的方式方法,让我国的世界一流学者主导一流人才自主培养,集中力量办大事,切实加快教育强国建设。


为此,本文探讨如何通过AI教育革命加快拔尖创新人才培养与评价:一是在观念诉求上,学习者向一流教师学习,这是从以教师为中心转变为以学习者为中心的根本所在,AI教育让学习者不再受制于所在学校的师资限制。二是AI测评系统化、客观化,推动学历教育向能力教育转变。AI能力测评客观准确,直接反映学习者的能力水平;提高学习者能力成为核心目标,学生为先、实效为王,一流大学、一流学科将重新洗牌。三是在组织保障上,从目前单一的集中式学校形态转变为分布式“主题名师+AI助教”网络形态与集中式学校形态并存,让学习者拥有更多选择,让一流教师充分发挥作用。本文所述一流教师(学者、人才)、一流成果、一流学科、一流大学均指世界一流。



一、向一流教师学习:

从以教师为中心转变为以学习者为中心的根本所在


(一)“钱学森之问”与“二流教育陷阱”


为什么我们的学校总是培养不出杰出人才?这是著名的“钱学森之问”。对此,已有大量解释,如我们的教育过于注重知识积累、过窄的专业教育、过强的功利主义、过弱的文化底蕴、缺乏创新教育、缺乏好奇心与想象力的培养等,这些分析都有道理,但是忽视了一个更为重要的原因——一流教师的匮乏。实际上,即使是发达国家的学校,相比毕业生数量而言,培养出的杰出人才也很少。可见,“钱学森之问”不仅针对国内教育,在发达国家乃至世界范围内同样适用,此为广义“钱学森之问”,即为什么众多学校培养出的杰出人才却如此之少?笔者认为,除天赋异禀的学生为数不多之外,最重要的原因是大部分学生都没有机会向一流教师学习;向二、三流教师学习的结果是在学习知识的同时,形成了二、三流的知识结构、思维方式、学习习惯和价值观,再也没有机会成为一流人才了,也可以说是学“夹生”了。特别是研究生教育,如果硕士生导师、博士生导师是二三流学者,研究生基本就无法成为一流人才,这也是武汉大学原校长刘道玉强调“真正的人才都是自学成才的”[2]的原因。笔者将这一现象称为“二流教育陷阱”和“夹生学习陷阱”[3]


需要强调的是,就培养杰出人才而言,二流教育也许已成为最大阻碍,因为它看上去无害,迷惑性较强。一方面,二流大学的教授也有不少在国际顶级刊物发表论文,有一定知名度,使得学生误以为这就是顶级教育;另一方面,二流大学的量化指标往往很好,如自然指数(Nature Index)世界大学50强排名中二流教育名列前茅,鱼龙混杂。与此同时,教育内卷化又强化了二流教育。在吉尔茨(Clifford Geertz)看来,内卷化是指一种社会或文化模式在某一发展阶段达到一种确定的形式后,便停滞不前或无法转化为另一种高级模式[4]。国内长期“五唯”盛行,以发表SCI论文、国际顶刊论文为目标,据此胜出者占据学界高位。这些中材大用者的最大短板是做不出原始创新,做不出世界一流工作,甚至出现劣币驱逐良币的情况,严重阻碍教育强国建设[5]


教育内卷化凸显“二流教育陷阱”“夹生学习陷阱”的巨大危害。2021年3月,由斯坦福大学、莫斯科国立高等经济学院、美国教育考试服务中心(ETS)以及北京大学、清华大学和印度的合作大学共同发起的Supertest测试报告发布,结果显示在经过大学阶段学习后,中国学生的批判性思维能力和学术技能水平均出现下降,在中美俄印大学生中垫底[6]。显然这与多年来以效仿西方学术为荣、擅长迎合式国际合作、安于在科学上做西方的“外包工”、缺乏批判精神有一定关系。二流人才的特点是擅长精致的跟踪跟进。汪品先院士指出:“从外国文献里找到题目,买来外国仪器进行分析,然后将取得的结果用外文在国外发表,这当然是我国科学的进步,但也可以说这是一种科学上的外包工。”[7]破解“钱学森之问”的根本解决方案,是以学习者为中心,让学习者向一流教师、一流学者学习。博士级智能AI(GPT-5等)即将问世,此举尤为必要。


(二)何谓一流教师、一流学者


好的教育包括好的知识传授与好的研究引导:前者依靠擅长讲课与启发的教师,如创办可汗学院(Khan Academy)的萨尔曼·可汗(Salman Khan);后者依靠擅长研究和激励的学者,如培养出79位院士的叶企孙。通过口碑、精品课、公开课等,可以比较容易地确定哪些教师是擅长讲课的一流教师;但是,在长期“五唯”和官本位的环境下,在国内很难用“帽子”、头衔、名气去衡量一位学者的真实学术水平。甄别出擅长研究的一流学者,需要一套新的标准与方法。


首先,术业有专攻。专家、学者(统称学者)是某一主题的专门研究者。笔者提出,用“主题学者”来界定在某一主题研究领域居于国际前沿、在国内名列前茅的学者。研究主题分为一级主题、二级主题、三级主题。例如,“创新”是一级主题,“技术创新”是二级主题,“人工智能创新”“纳米技术创新”是三级主题。通常,只有开山鼻祖覆盖一级主题,如约瑟夫·熊比特(Joseph Schumpeter)开辟了“创新”研究领域。一流学者、资深学者覆盖二级主题,如成为“技术创新”的专家、权威,他们往往也同时聚焦于一两个三级主题。主题学者之所以研究水平高,一是由于自己术业有专攻、长期积累钻研,二是经常参加相关学术活动、学术会议,有主题共同体、学术共同体的支持,凝聚个人智慧与集体智慧。


其次,主题学者在某一主题探究中(通常是二级主题)做到在国际上与众不同,在国内名列前茅。高端主题学者则被称为“主题名师”,是在国际上与众不同、在国内达到首屈一指或最好之一、广受认可或应该广受认可的杰出学者。主题名师在国际上该主题领域居于前沿或引领发展,包括三类学者:一是作出原始创新成果者,如诺贝尔奖、图灵奖、国家自然科学奖一等奖、陈嘉庚科学奖的得主等;二是系统精深者,如“三农”问题专家温铁军;三是奇艺绝学者,如古文字通才李学勤。系统精深者、奇艺绝学者须经横向比较,出类拔萃。主题名师处于国际学术前沿,掌握最新进展,参与前沿推进乃至引领发展,在拔尖创新人才的培养中发挥关键作用,可谓集中主题名师的力量办培养拔尖创新人才之大事。


最后,转变教育观念至关重要。从以教师为中心转变为以学习者为中心,核心是强调向一流教师与一流学者(统称主题名师)学习,强调通过AI、互联网等信息技术赋能主题名师,让更多的学习者得到主题名师的引导,实现精英教育普惠化。长期以来,教育从教师的角度出发——教师要有课讲、有研究生带,即使教师并不那么优秀;学习者则希望向一流教师学习,向主题名师学习。以学习者为中心与精英教育普惠化是相互支持、高度一致的。精英教育普惠化的实质是实现教育面前人人平等、优质教育资源人人有份,这是继法律面前人人平等之后人类社会的又一次巨大进步。表1列出以教师为中心与以学习者为中心两种教育模式的区别。可以看到,两者在多个方面存在明显差别。


图片




二、AI测评客观化:

推动学历教育向能力教育转变


迄今为止,讨论AI对教育的影响时,人们大多考虑AI如何提升知识传授、课堂教学、实验实习等方面的效率与品质,考虑如何因材施教、一对一私人定制等。AI的这些影响还是比较温和的,只是量变;而AI对学习者的能力测评能做到系统全面、客观准确,才是对教育(特别是高等教育)的颠覆性冲击,将从根本上改变现行教育体系和学校形态。AI测评主要包括教学成效测评和毕业生能力测评。前者已有所实践,如通过自动评分、抄袭检测、预测分析、评估分析和项目分析等应用对教育评估产生影响。自动评分节省了教师时间,并确保了评估的一致性和客观性[8]。毕业生能力测评是对教学总效果的测评,出具学习者能力测评证书,是对学习者能力的直接反映。而学历学位证书从某种程度上只是借助毕业院校的声望和校友群体的成就,间接反映毕业生的能力。一旦AI能力测试能够做到全面系统和客观准确,在用人单位那里,AI能力测评证书必然替代学历证书和学位证书。当然,这需要AI进一步有序发展,需要AI能力测评系统不断完善,还需要避免AI风险,方能彻底实现。从目前AI爆发式发展的趋势来看,上述设想几年之内就可能变成现实。


以往,在某些技能领域,能力证书(如外语水平证书、职业资格证书等)的含金量胜过学历证书和学位证书。在一些领域,能力测评是用人单位招聘员工的主要依据。例如,美国的力扣(LeetCode)平台为全球程序员提供专业的IT技术职业化提升途径,使用该平台的应聘者已经遍布各大公司和众多优秀创业团队。该平台题目资源充足,能够帮助企业寻找、培养技术人才。力扣在线面试工具为企业提供技术面试、能力评估、招聘等全方位专业化服务。


随着AI等信息技术的发展,智能化技术在教育评价领域的研究与应用已初步展开,AI和教育测量研究的结合催生了智能化测评这一新兴领域。智能化测评将AI应用于能力评估、人格评估、课程风险评估、学习过程评估等评价任务中,提高了评估的效率和准确性。智能化测评整合多维度信息,对学生个体进行全面评估,有力地推进了我国智能化教育发展。智能化测评结果的准确性与可解释性是最重要的评价指标——准确性要求尽可能降低测评的误差,可解释性是测评结果可以被理解的程度,要能够清楚解释测评分数是如何得到的[9]


随着人工智能快速发展,智能化测评的水平与质量将大幅度提高。目前,AI已通过图灵测试,智能水平节节攀升。斯坦福大学以人为本人工智能研究院(Institute for Human-Centered AI)发布的《人工智能指数报告2024》(Artificial Intelligence Index Report 2024)指出,AI在图像分类、基础阅读理解、视觉推理和自然语言推理等基准测试上超越了人类的表现,但仍然难以应对高级数学问题等复杂的认知任务[10]。这表明,人工智能将不断发展,继续缩小与人类的差距。可以预见,再过两年左右,GPT-5、GPT-6等问世,AI将实现对学习者能力(包括基础知识、专业知识、实验技能、学习能力、批判能力、研究能力、跨学科研究能力、创新能力、交往能力、合作能力、领导能力等)全面准确、可解释的测评。AI不仅可以测评学习者的技能水平,还可以测评其知识素养、研究能力、领导能力等;相较于学历学位证书,AI能力测评所反映的能力要全面准确得多。


教育测评与教学关系密切,两者相辅相成。迄今为止,教育测评领域已发生三次范式变革。第一次是20世纪五六十年代大规模推进的“测评学习”(assessment of learning),即测评是对学习和教学外在的、刚性的评价;第二次发生于21世纪,在课堂、区域、国家等层面,许多国家积极倡导“以评促学”(assessment for learning),即测评要有助于教学改进,能够促进教育质量的提升;第三次则发生于三年疫情防控期间,大规模线上和线下教学与学习的混合式教育环境快速形成,“学评融合”(assessment as learning)迅速兴起,成为个性化学习的有机组成部分,能够进行实时的学习反馈和调整,适应以学习者为中心的教育生态转型[11-12]。三次教育测评范式变革,都是为了促进教学、提升教育质量,引发教育供给侧改革。AI测评对教育更大的冲击发生在需求侧,即AI测评的系统化、客观化导致用人单位招聘标准与方式的深刻变化,可谓需求侧改革,即用人单位不再看重学历学位证书,而更看重能力证书。因此,学习者求学的目的就是提升能力,提升学习、创新、发现问题、解决问题等各种能力。如此,求教于名师就成为头等大事,就如同运动员的目标是提高体能与成绩,拜师金牌教练就是头等大事。


从以教师为中心到以学习者为中心的转变绝非易事,因为以学习者为中心的核心是让学习者向一流教师学习。这一转变受限于一流教师稀缺,优质教育资源集中在少数顶尖大学;由于与高校庞大的行政体系和教师体系的利益相冲突,即使借助AI、互联网、虚拟技术等信息技术和开放教育资源及教学方式创新,所谓以学习者为中心也只能是表面的、非实质性的,学习者的核心诉求(向一流教师学习、优质教育资源人人有份)仍然无法实现。只有AI测评实现对学习者能力系统化、客观化的评定,选人用人主要依据AI能力测评结果而非毕业院校等级及学历学位证书,教育改革才能冲破重重阻力,实现需求侧改革,真正实现以学习者为中心,让更多的学习者向一流教师学习,实现精英教育普惠化。可以说,AI教育革命带来的教学方式变革和教育质量提升仅为量变,只是诱致性变革,对现有教育体系的影响较为有限;唯有AI测评的成功与推广才为质变,才是强制性变革,才会对教育体系与教育评价产生颠覆性影响,才能极大加快我国教育强国建设的进程。


高校教学包括两部分。一是本科教育,其课程、实验、实习等可以通过公开课、精品课、慕课等开放教育资源与AI助教加以完成。借助AI助教(如可汗学院的Khanmigo),可以实现个性化学习、虚拟实验与实践探索等。有了优质教育资源和合理的教学辅导及一流教师的点拨,本科生可以在一定程度上不受本校师资的限制,可获得较多向一流教师学习的机会。二是研究生教育,其教学涉及前沿研究,公开课与AI助教只能满足部分学习需求,指导硕士生、博士生的工作仍然主要由主题学者、主题名师提供承担,一流教师需求量较大,是真正阻碍实现精英教育普惠化的瓶颈,也是构建“主题名师+AI助教”网络所要解决的首要难题。




三、组织保障:

构建“主题名师+AI助教”网络,实现精英教育普惠化


“主题名师+AI助教”网络构建涉及四个要素:一是主题名师的甄选与认定,二是辅助主题名师工作的AI助教的研制,三是以AI测评作为学习者能力的评价工具,四是优质的开放教育资源的支持。


(一)主题名师的甄选与认定


主题名师是一流人才。以成果论英雄,一流人才就是做出一流成果的杰出人才。一流成果包括三类:一是原始创新成果,二是系统精深、蔚为大观的硕果,三是冷门绝学的奇艺秘技。三类成果均可谓标志性代表作。系统精深、奇艺绝学者往往易于判定,较难认定的是原始创新成果。


有关原始创新的论述已有很多,但对原始创新的定义往往比较模糊。按百度百科给出的定义,原始创新是“前所未有的重大科学发现、技术发明、原理性主导技术等创新成果”[13]。据此定义,许多新成果都可被认为或自认为是从0到1的原始创新。实际上,原始创新是取得突破性进展,进而开辟新领域、引领新方向的重大创新,是源头活水,是从0到1,但这个“1”须为新领域、新方向。我国“973”计划基础研究共性重大问题战略研究组认为,原始创新是指开拓新领域、引领新方向和孕育新学科的重大创新[14]。对原始创新的这种理解是国际学术界的共识[15]


原始创新主要有三个特点。其一,完成原始创新包括三个环节,即做出—发表—承认。在得到承认之前,它不是原始创新,只是普通成果,甚至有可能是一个“错误”。其二,依据权威大奖认定原始创新固然有效,但仍有三点不足,即获奖时间滞后、大奖覆盖面窄(不少交叉学科、新兴学科等并未设置大奖)、我国学者在国际上缺少公平获奖机会(尤其在人文社科与交叉学科领域)。其三,做出原始创新者与擅长发表国际顶刊论文者(除少数重叠外),不是一回事,是“两条道上跑的车”。原始创新是拥有卓越创造力的一流人才的作品,曲高和寡。一流人才在“五唯”环境中可能属于弱势群体,他们十年磨一剑,追求重大突破、重大发现,不会把在国际顶级期刊上发表论文作为首要工作,有时会因不屑于或不擅于凑论文、拼关系、争帽子而被边缘化,正如徐匡迪院士指出:“中国颠覆性技术被投票‘投’没了。”[16]

为克服通过权威大奖认定原始创新的不足,笔者提出依据“原创成果四要点”来认定原始创新,以避免一次性同行评议存在的主观性、同行相轻等弊端。原创成果四要点包括:1)突破点四要素,包括突破什么、怎么突破、突破开辟的新领域、新方向以及能用一句话概括核心贡献;2)发表同题系列论文论著或专利清单;3)获奖、转载、引用、受邀报告等学界好评;4)国际国内同类工作的盘点比较及优势。这相当于经历了长期的同行评议,公平公正、高效合理。真正的原创成果,特征鲜明,高下立判。


认定与盘点原创成果包括三点:1)注明原始创新是开辟新领域、引领新方向的重大创新,杜绝包装假冒;2)填报原创成果四要点,使原始创新成果表述规范,有据可查;3)原创成果包括A+和A两类:A+类已获得权威大奖,如国家自然科学奖一等奖、陈嘉庚科学奖及国际权威大奖,用获奖理由和成果简介展示即可;A类已得到学界好评,能够展示原创成果四要点,优势一目了然[15]


基于对原始创新的定义和认定,笔者提出认定主题名师的“1+N”甄别法——以“1”为主,以“N”为辅,让主题名师一目了然。其中,“1”是一件标志性代表作,包括原始创新成果或系统精深、蔚为大观的硕果或冷门绝学的奇艺秘技,特征鲜明,辨识度高;“N”能够反映名师在该研究主题领域获得的成就、荣誉等,如获奖、获得项目资助、在专业学术团体中任职、获得荣誉头衔等,这些均与研究主题直接相关,能够辅助说明主题名师的学术贡献、影响与地位。


(二)研制AI助教,加快实现精英教育普惠化


AI助教是AI赋能教育领域的热点。2018年,网龙率先推出AI助教;此后,学霸君的智能教育机器人Aidam、爱乐奇的AI助教、百度的小度安全AI助教等相继推出[17]。在国际上,可汗学院较早致力于利用AI探索个性化教育。自2022年8月,可汗学院与GPT-4合作,利用GPT-4能力为教学者提供教学资源辅助,整合GPT-4推出AI助手Khanmigo。Khanmigo帮助学生掌握各种学科和技能——可以充当虚拟导师,可以解释概念,还可以提供提示并检查答案[18]。2024年5月,微软和可汗学院宣布建立多元合作伙伴关系,微软将协助可汗学院为美国所有K12教育者免费提供Khanmigo for Teachers。这款AI助教节约了教师备课时间,让老师们专注于最重要的事情——与学生互动并提供支持[18]。显然,可汗学院开发的AI助教集成了一流教育资源,使用AI助教,学习者实现了向一流教师学习的愿望。然而,在师生互动环节还不能实现与一流教师互动,因为一流教师毕竟是稀缺的。


目前“AI助教+教师”中的教师多是普通教师。也就是说,并没有考虑如何使研制的AI助教与一流教师相互配合。尽管在AI助教层面实现了精英教育普惠化,但作为一个整体,“AI助教+教师”仍不能实现学习者向一流教师学习。因此,今后需要研发与一流教师(主题名师)相互配合的AI助教。要与一流教师(主题名师)互动、问答,需要解决五个问题,以克服一流教师稀缺的问题。一是建立互动数据库。AI助教应收集学习者与一流教师真实互动及对话集锦,形成内部数据库并实时更新。就像积累围棋名局棋谱一样,高质量的内容(包括常见问题)积累越多,其效能越强。学习者提问与数据库内容重合或接近时,通过AI助教可实现相当于与一流教师的互动。二是实时联网,利用AI的强大功能,让学习者与一流教师实现对话或虚拟对话。学习者提出的问题,要么从互动数据库或网上得到答案,要么在网上等待回答。AI的作用是搜索、匹配问答,包括拆解问题、组合问题、整合答案。三是师生匹配。利用聚类分析等方法,将知识结构、专业诉求、研究方向、思维方式、职业规划等方面较为类似的学习者组织起来,与一流教师进行匹配。在AI、互联网、虚拟技术等信息技术的助力下,一位一流教师可以指导许多学习者。四是改进模型。关于信息技术在教育教学领域中的应用已经有多种模型,如SAMR模型、TIM模型、TPACK模型等,均是解决技术支持下改进教学方法的工具。为实现精英教育普惠化,需要在此基础上,考虑AI等技术支持下向一流教师学习所需要的教学方法,提出相应的模型。五是训练AI替身。让一流教师拥有自己的AI替身,是解决精英教育普惠化的根本方案,目前已有初步探索。例如,美国塔夫茨大学教授、哲学家丹尼尔·丹尼特(Daniel Dennett)使用自己关于各种哲学主题的数以百万字的材料训练、建立了自己的AI替身。该AI替身的一些问答表现已与丹尼特本人无异[19]。随着AI技术不断发展,AI替身与学者本人的思维已越来越接近。由于可以得到本人及时核验、校对、改进,教师、学者的AI替身的质量日益提高,优于AI创制的虚拟教师、虚拟学者。


(三)“主题名师+AI助教”网络将成为AI教育的主流组织方式


实现精英教育普惠化,除了需要解决主题名师甄选、AI助教研发、优质开放教育资源的支持、AI测评客观化等问题,还需要教育组织方式的变革。目前,在互联网、人工智能、数字技术、虚拟技术等的应用推动下,高等教育组织方式出现新趋势。早在1997年,管理大师彼得·德鲁克(Peter Drucker)宣称,30年内庞大的校园即将作古,大学将无法生存,其原因包括传统大学运作成本过高、教育模式缺乏灵活性、不能满足终身学习的需求、在线教育和远程学习变得更加普及和便捷以及市场需求的变化和全球化的影响[20]。慕课引发人们对大学未来形态的思考。例如,戴维·斯特利(David Staley)提出平台大学、微学院、人文智库、游学大学、博雅学院、接口大学、人体大学、高级游戏研究院、博识大学和未来大学十种“明日大学”的模型[21]。朱永新教授强调,今天的学校会被未来的学习中心取代[22]。余胜泉教授提出,未来将出现一些从根本上重新设计的学校,教育通过网络实现不受地理位置和主体限制的教育功能,形成需求个性化、资源协同化、角色多样化的自组织形态的学习社区[23]。劳伦斯·布罗克利斯(Laurence Brocliss)在《牛津大学史》一书中指出,在新技术的影响下,牛津大学迟早会变得多余,网络教育取代高校只是时间问题[24]。湖南师范大学校长刘仲华院士认为,师生关系将逐渐由传统的权威服从转变为独立平等,以师生为主的二元主体关系将被“教师—学生—AI”的新型多元主体的交互结构取而代之;技术革命正在重新定义学校,只要具备课程、测量、评估三个要素,有对学习者和学习成果的统一标准评价,任何地方都可以称为学校[25]


精英教育普惠化需要线下线上结合,这需要克服新的挑战。早在疫情防控期间,线上教学就已暴露出一些问题。例如,在纯粹的在线环境中,学生缺乏自我组织能力,难以保持注意力,容易产生无聊、孤独感;教师的困难则主要是缺乏在线环境的特定沟通能力,不能正确使用计算机等各种教学工具等。因此,需要为在线教学创建合适的物理环境,重新设计课程的具体内容,也可以引入小组活动来激励和吸引学生,鼓励协作学习[26]


“主题名师+AI助教”是以人为本的系统,AI助教只起辅助作用。人工智能解决方案具有结构性地改变大学行政管理和教学的潜力,高等教育教学需要重新考虑教师的角色。人工智能解决方案为全民教育提供了新的机会,同时促进了终身学习。教育应以人为中心,而不是以技术为中心;尽管人工智能取得了飞速发展,完全依赖技术却是危险和错误的[27]。因此,“主题名师+AI助教”网络以主题名师为主,以AI助教为辅;AI助教的功能是充分利用AI、互联网、虚拟技术与开放教育资源等,让更多学习者得到求教主题名师的机会。博士级智能AI即将问世,越来越多的工作岗位被AI替代,精英教育普惠化迫在眉睫。


需要指出的是,精英教育普惠化的形式多种多样,本文提出的“主题名师+AI助教”只是其中一种。其优势在于利用新标准、新方法及时甄选出主题名师,其意义表现在四个方面:一是破“五唯”、立新标,确立一流人才的新标准,甄选出主题名师;二是让主题名师担任培养拔尖创新人才的主持人,让精英培育精英,精英教育普惠化;三是让主题名师担任一流学科的学术带头人,加快一流学科建设;四是让主题名师提供一流的知识服务,大幅提高智库水平。智库咨询应该对接术业有专攻的杰出专家,而非对接机构;让主题名师提供相关主题领域的咨询与建议,可以显著提升知识服务水平。




四、主要结论与政策建议


本文探讨AI大爆发与AI教育革命有可能在人类历史上首次实现精英教育普惠化,加快拔尖创新人才培养与评价,为早日实现教育强国目标提供了新机遇。围绕如何通过AI教育革命实现精英教育普惠化,得出四项主要观点或结论。第一,让广大学习者向一流教师学习是从以教师为中心转变为以学习者为中心的根本所在,AI教育革命可实现精英教育普惠化,使学习者愿望成真,同时成为拔尖创新人才培养的新方式。第二,AI测评系统化客观化,推动从学历教育向能力教育转变,提高学习者能力成为核心目标。AI能力测评结果将替代学历学位证书,成为选人用人的主要依据,这将对高等教育体系与大学形态产生颠覆性影响,一流大学、一流学科或将重新洗牌。第三,目前单一的集中式学校形态将转变为分布式“主题名师+AI助教”网络形态与集中式学校形态并存,让学习者拥有更多选择,让一流教师充分发挥作用。第四,目前先进的AI助教实现了AI助教层面的精英教育普惠化,但仅有“AI助教+教师”还不够,只有“主题名师+AI助教”网络才能攻克这一难关。运用“1+N”甄选法可以及时甄选、认定主题名师;通过建立互动数据库、实时联网、采用聚类分析等方法与一流教师进行匹配,改进模型,训练一流教师的AI替身等,研发与一流教师(主题名师)配合的AI助教,以克服一流教师稀缺的问题。


在政策实施层面,笔者建议抓好四个方面的工作:第一,利用新标准、新方法及时甄选出主题名师,实现破“五唯”、立新标;第二,让主题名师担任培养拔尖创新人才的主持人,让我国的世界一流学者主导一流人才自主培养,集中主题名师的力量办大事,提升人才培养质量,实现精英教育普惠化;第三,让主题名师担任一流学科的学术带头人,加快一流学科建设;第四,让主题名师提供一流的知识服务,大幅提高智库实力与水平。


总之,AI教育革命与精英教育普惠化将从根本上改变拔尖创新人才培养、评价的方式方法,切实加快教育强国建设进程,助力我国早日实现从人口大国到人才强国的跃升。2019年中共中央、国务院印发的《中国教育现代化2035》提出,到2035年,我国要迈入教育强国行列[1]。如何高标准、严要求地建成教育强国,是科教界面临的重大挑战。近两年AI大爆发对社会各个方面产生巨大冲击,在教育领域引发AI教育革命,可谓百年未有之教育大变局,将在人类历史上首次实现精英教育普惠化,为在短时间内建成教育强国提供了新机遇。在此形势和背景下,如何加强拔尖创新人才的培养与评价,是摆在我们面前的重要议题。笔者认为,AI教育革命的核心是实现精英教育普惠化,推动我国从人口大国向人才强国跃升,实现人口红利向人才红利转变。关于AI教育革命,当前人们讨论最多的是AI在传授知识方面发挥的重要作用,如GPT-4o所展现的教授数学的能力令人印象深刻,AI助教将越来越多地参与教学活动。实际上,AI对教育的影响主要体现在两个方面:一是AI助力教学,可以做到一对一、因材施教、私人定制,大幅提升知识传授的效率与品质;二是AI评价学习者的能力,由于AI掌握所有学科知识,可以系统准确地测试出学习者的有关能力,给予定级,真正实现从学历教育向能力教育的转变。AI教育革命将从教学及教学效果评价等方面全面推动精英教育普惠化的实现,其变革范围之广、程度之深、进度之快,前所未有,从根本上改变培养、评价拔尖创新人才的方式方法,让我国的世界一流学者主导一流人才自主培养,集中力量办大事,切实加快教育强国建设。


为此,本文探讨如何通过AI教育革命加快拔尖创新人才培养与评价:一是在观念诉求上,学习者向一流教师学习,这是从以教师为中心转变为以学习者为中心的根本所在,AI教育让学习者不再受制于所在学校的师资限制。二是AI测评系统化、客观化,推动学历教育向能力教育转变。AI能力测评客观准确,直接反映学习者的能力水平;提高学习者能力成为核心目标,学生为先、实效为王,一流大学、一流学科将重新洗牌。三是在组织保障上,从目前单一的集中式学校形态转变为分布式“主题名师+AI助教”网络形态与集中式学校形态并存,让学习者拥有更多选择,让一流教师充分发挥作用。本文所述一流教师(学者、人才)、一流成果、一流学科、一流大学均指世界一流。


一、向一流教师学习:

从以教师为中心转变为以学习者为中心的根本所在


(一)“钱学森之问”与“二流教育陷阱”


为什么我们的学校总是培养不出杰出人才?这是著名的“钱学森之问”。对此,已有大量解释,如我们的教育过于注重知识积累、过窄的专业教育、过强的功利主义、过弱的文化底蕴、缺乏创新教育、缺乏好奇心与想象力的培养等,这些分析都有道理,但是忽视了一个更为重要的原因——一流教师的匮乏。实际上,即使是发达国家的学校,相比毕业生数量而言,培养出的杰出人才也很少。可见,“钱学森之问”不仅针对国内教育,在发达国家乃至世界范围内同样适用,此为广义“钱学森之问”,即为什么众多学校培养出的杰出人才却如此之少?笔者认为,除天赋异禀的学生为数不多之外,最重要的原因是大部分学生都没有机会向一流教师学习;向二、三流教师学习的结果是在学习知识的同时,形成了二、三流的知识结构、思维方式、学习习惯和价值观,再也没有机会成为一流人才了,也可以说是学“夹生”了。特别是研究生教育,如果硕士生导师、博士生导师是二三流学者,研究生基本就无法成为一流人才,这也是武汉大学原校长刘道玉强调“真正的人才都是自学成才的”[2]的原因。笔者将这一现象称为“二流教育陷阱”和“夹生学习陷阱”[3]


需要强调的是,就培养杰出人才而言,二流教育也许已成为最大阻碍,因为它看上去无害,迷惑性较强。一方面,二流大学的教授也有不少在国际顶级刊物发表论文,有一定知名度,使得学生误以为这就是顶级教育;另一方面,二流大学的量化指标往往很好,如自然指数(Nature Index)世界大学50强排名中二流教育名列前茅,鱼龙混杂。与此同时,教育内卷化又强化了二流教育。在吉尔茨(Clifford Geertz)看来,内卷化是指一种社会或文化模式在某一发展阶段达到一种确定的形式后,便停滞不前或无法转化为另一种高级模式[4]。国内长期“五唯”盛行,以发表SCI论文、国际顶刊论文为目标,据此胜出者占据学界高位。这些中材大用者的最大短板是做不出原始创新,做不出世界一流工作,甚至出现劣币驱逐良币的情况,严重阻碍教育强国建设[5]


教育内卷化凸显“二流教育陷阱”“夹生学习陷阱”的巨大危害。2021年3月,由斯坦福大学、莫斯科国立高等经济学院、美国教育考试服务中心(ETS)以及北京大学、清华大学和印度的合作大学共同发起的Supertest测试报告发布,结果显示在经过大学阶段学习后,中国学生的批判性思维能力和学术技能水平均出现下降,在中美俄印大学生中垫底[6]。显然这与多年来以效仿西方学术为荣、擅长迎合式国际合作、安于在科学上做西方的“外包工”、缺乏批判精神有一定关系。二流人才的特点是擅长精致的跟踪跟进。汪品先院士指出:“从外国文献里找到题目,买来外国仪器进行分析,然后将取得的结果用外文在国外发表,这当然是我国科学的进步,但也可以说这是一种科学上的外包工。”[7]破解“钱学森之问”的根本解决方案,是以学习者为中心,让学习者向一流教师、一流学者学习。博士级智能AI(GPT-5等)即将问世,此举尤为必要。


(二)何谓一流教师、一流学者


好的教育包括好的知识传授与好的研究引导:前者依靠擅长讲课与启发的教师,如创办可汗学院(Khan Academy)的萨尔曼·可汗(Salman Khan);后者依靠擅长研究和激励的学者,如培养出79位院士的叶企孙。通过口碑、精品课、公开课等,可以比较容易地确定哪些教师是擅长讲课的一流教师;但是,在长期“五唯”和官本位的环境下,在国内很难用“帽子”、头衔、名气去衡量一位学者的真实学术水平。甄别出擅长研究的一流学者,需要一套新的标准与方法。


首先,术业有专攻。专家、学者(统称学者)是某一主题的专门研究者。笔者提出,用“主题学者”来界定在某一主题研究领域居于国际前沿、在国内名列前茅的学者。研究主题分为一级主题、二级主题、三级主题。例如,“创新”是一级主题,“技术创新”是二级主题,“人工智能创新”“纳米技术创新”是三级主题。通常,只有开山鼻祖覆盖一级主题,如约瑟夫·熊比特(Joseph Schumpeter)开辟了“创新”研究领域。一流学者、资深学者覆盖二级主题,如成为“技术创新”的专家、权威,他们往往也同时聚焦于一两个三级主题。主题学者之所以研究水平高,一是由于自己术业有专攻、长期积累钻研,二是经常参加相关学术活动、学术会议,有主题共同体、学术共同体的支持,凝聚个人智慧与集体智慧。


其次,主题学者在某一主题探究中(通常是二级主题)做到在国际上与众不同,在国内名列前茅。高端主题学者则被称为“主题名师”,是在国际上与众不同、在国内达到首屈一指或最好之一、广受认可或应该广受认可的杰出学者。主题名师在国际上该主题领域居于前沿或引领发展,包括三类学者:一是作出原始创新成果者,如诺贝尔奖、图灵奖、国家自然科学奖一等奖、陈嘉庚科学奖的得主等;二是系统精深者,如“三农”问题专家温铁军;三是奇艺绝学者,如古文字通才李学勤。系统精深者、奇艺绝学者须经横向比较,出类拔萃。主题名师处于国际学术前沿,掌握最新进展,参与前沿推进乃至引领发展,在拔尖创新人才的培养中发挥关键作用,可谓集中主题名师的力量办培养拔尖创新人才之大事。


最后,转变教育观念至关重要。从以教师为中心转变为以学习者为中心,核心是强调向一流教师与一流学者(统称主题名师)学习,强调通过AI、互联网等信息技术赋能主题名师,让更多的学习者得到主题名师的引导,实现精英教育普惠化。长期以来,教育从教师的角度出发——教师要有课讲、有研究生带,即使教师并不那么优秀;学习者则希望向一流教师学习,向主题名师学习。以学习者为中心与精英教育普惠化是相互支持、高度一致的。精英教育普惠化的实质是实现教育面前人人平等、优质教育资源人人有份,这是继法律面前人人平等之后人类社会的又一次巨大进步。表1列出以教师为中心与以学习者为中心两种教育模式的区别。可以看到,两者在多个方面存在明显差别。


图片


二、AI测评客观化:

推动学历教育向能力教育转变


迄今为止,讨论AI对教育的影响时,人们大多考虑AI如何提升知识传授、课堂教学、实验实习等方面的效率与品质,考虑如何因材施教、一对一私人定制等。AI的这些影响还是比较温和的,只是量变;而AI对学习者的能力测评能做到系统全面、客观准确,才是对教育(特别是高等教育)的颠覆性冲击,将从根本上改变现行教育体系和学校形态。AI测评主要包括教学成效测评和毕业生能力测评。前者已有所实践,如通过自动评分、抄袭检测、预测分析、评估分析和项目分析等应用对教育评估产生影响。自动评分节省了教师时间,并确保了评估的一致性和客观性[8]。毕业生能力测评是对教学总效果的测评,出具学习者能力测评证书,是对学习者能力的直接反映。而学历学位证书从某种程度上只是借助毕业院校的声望和校友群体的成就,间接反映毕业生的能力。一旦AI能力测试能够做到全面系统和客观准确,在用人单位那里,AI能力测评证书必然替代学历证书和学位证书。当然,这需要AI进一步有序发展,需要AI能力测评系统不断完善,还需要避免AI风险,方能彻底实现。从目前AI爆发式发展的趋势来看,上述设想几年之内就可能变成现实。


以往,在某些技能领域,能力证书(如外语水平证书、职业资格证书等)的含金量胜过学历证书和学位证书。在一些领域,能力测评是用人单位招聘员工的主要依据。例如,美国的力扣(LeetCode)平台为全球程序员提供专业的IT技术职业化提升途径,使用该平台的应聘者已经遍布各大公司和众多优秀创业团队。该平台题目资源充足,能够帮助企业寻找、培养技术人才。力扣在线面试工具为企业提供技术面试、能力评估、招聘等全方位专业化服务。


随着AI等信息技术的发展,智能化技术在教育评价领域的研究与应用已初步展开,AI和教育测量研究的结合催生了智能化测评这一新兴领域。智能化测评将AI应用于能力评估、人格评估、课程风险评估、学习过程评估等评价任务中,提高了评估的效率和准确性。智能化测评整合多维度信息,对学生个体进行全面评估,有力地推进了我国智能化教育发展。智能化测评结果的准确性与可解释性是最重要的评价指标——准确性要求尽可能降低测评的误差,可解释性是测评结果可以被理解的程度,要能够清楚解释测评分数是如何得到的[9]


随着人工智能快速发展,智能化测评的水平与质量将大幅度提高。目前,AI已通过图灵测试,智能水平节节攀升。斯坦福大学以人为本人工智能研究院(Institute for Human-Centered AI)发布的《人工智能指数报告2024》(Artificial Intelligence Index Report 2024)指出,AI在图像分类、基础阅读理解、视觉推理和自然语言推理等基准测试上超越了人类的表现,但仍然难以应对高级数学问题等复杂的认知任务[10]。这表明,人工智能将不断发展,继续缩小与人类的差距。可以预见,再过两年左右,GPT-5、GPT-6等问世,AI将实现对学习者能力(包括基础知识、专业知识、实验技能、学习能力、批判能力、研究能力、跨学科研究能力、创新能力、交往能力、合作能力、领导能力等)全面准确、可解释的测评。AI不仅可以测评学习者的技能水平,还可以测评其知识素养、研究能力、领导能力等;相较于学历学位证书,AI能力测评所反映的能力要全面准确得多。


教育测评与教学关系密切,两者相辅相成。迄今为止,教育测评领域已发生三次范式变革。第一次是20世纪五六十年代大规模推进的“测评学习”(assessment of learning),即测评是对学习和教学外在的、刚性的评价;第二次发生于21世纪,在课堂、区域、国家等层面,许多国家积极倡导“以评促学”(assessment for learning),即测评要有助于教学改进,能够促进教育质量的提升;第三次则发生于三年疫情防控期间,大规模线上和线下教学与学习的混合式教育环境快速形成,“学评融合”(assessment as learning)迅速兴起,成为个性化学习的有机组成部分,能够进行实时的学习反馈和调整,适应以学习者为中心的教育生态转型[11-12]。三次教育测评范式变革,都是为了促进教学、提升教育质量,引发教育供给侧改革。AI测评对教育更大的冲击发生在需求侧,即AI测评的系统化、客观化导致用人单位招聘标准与方式的深刻变化,可谓需求侧改革,即用人单位不再看重学历学位证书,而更看重能力证书。因此,学习者求学的目的就是提升能力,提升学习、创新、发现问题、解决问题等各种能力。如此,求教于名师就成为头等大事,就如同运动员的目标是提高体能与成绩,拜师金牌教练就是头等大事。


从以教师为中心到以学习者为中心的转变绝非易事,因为以学习者为中心的核心是让学习者向一流教师学习。这一转变受限于一流教师稀缺,优质教育资源集中在少数顶尖大学;由于与高校庞大的行政体系和教师体系的利益相冲突,即使借助AI、互联网、虚拟技术等信息技术和开放教育资源及教学方式创新,所谓以学习者为中心也只能是表面的、非实质性的,学习者的核心诉求(向一流教师学习、优质教育资源人人有份)仍然无法实现。只有AI测评实现对学习者能力系统化、客观化的评定,选人用人主要依据AI能力测评结果而非毕业院校等级及学历学位证书,教育改革才能冲破重重阻力,实现需求侧改革,真正实现以学习者为中心,让更多的学习者向一流教师学习,实现精英教育普惠化。可以说,AI教育革命带来的教学方式变革和教育质量提升仅为量变,只是诱致性变革,对现有教育体系的影响较为有限;唯有AI测评的成功与推广才为质变,才是强制性变革,才会对教育体系与教育评价产生颠覆性影响,才能极大加快我国教育强国建设的进程。


高校教学包括两部分。一是本科教育,其课程、实验、实习等可以通过公开课、精品课、慕课等开放教育资源与AI助教加以完成。借助AI助教(如可汗学院的Khanmigo),可以实现个性化学习、虚拟实验与实践探索等。有了优质教育资源和合理的教学辅导及一流教师的点拨,本科生可以在一定程度上不受本校师资的限制,可获得较多向一流教师学习的机会。二是研究生教育,其教学涉及前沿研究,公开课与AI助教只能满足部分学习需求,指导硕士生、博士生的工作仍然主要由主题学者、主题名师提供承担,一流教师需求量较大,是真正阻碍实现精英教育普惠化的瓶颈,也是构建“主题名师+AI助教”网络所要解决的首要难题。


三、组织保障:

构建“主题名师+AI助教”网络,实现精英教育普惠化


“主题名师+AI助教”网络构建涉及四个要素:一是主题名师的甄选与认定,二是辅助主题名师工作的AI助教的研制,三是以AI测评作为学习者能力的评价工具,四是优质的开放教育资源的支持。


(一)主题名师的甄选与认定


主题名师是一流人才。以成果论英雄,一流人才就是做出一流成果的杰出人才。一流成果包括三类:一是原始创新成果,二是系统精深、蔚为大观的硕果,三是冷门绝学的奇艺秘技。三类成果均可谓标志性代表作。系统精深、奇艺绝学者往往易于判定,较难认定的是原始创新成果。


有关原始创新的论述已有很多,但对原始创新的定义往往比较模糊。按百度百科给出的定义,原始创新是“前所未有的重大科学发现、技术发明、原理性主导技术等创新成果”[13]。据此定义,许多新成果都可被认为或自认为是从0到1的原始创新。实际上,原始创新是取得突破性进展,进而开辟新领域、引领新方向的重大创新,是源头活水,是从0到1,但这个“1”须为新领域、新方向。我国“973”计划基础研究共性重大问题战略研究组认为,原始创新是指开拓新领域、引领新方向和孕育新学科的重大创新[14]。对原始创新的这种理解是国际学术界的共识[15]


原始创新主要有三个特点。其一,完成原始创新包括三个环节,即做出—发表—承认。在得到承认之前,它不是原始创新,只是普通成果,甚至有可能是一个“错误”。其二,依据权威大奖认定原始创新固然有效,但仍有三点不足,即获奖时间滞后、大奖覆盖面窄(不少交叉学科、新兴学科等并未设置大奖)、我国学者在国际上缺少公平获奖机会(尤其在人文社科与交叉学科领域)。其三,做出原始创新者与擅长发表国际顶刊论文者(除少数重叠外),不是一回事,是“两条道上跑的车”。原始创新是拥有卓越创造力的一流人才的作品,曲高和寡。一流人才在“五唯”环境中可能属于弱势群体,他们十年磨一剑,追求重大突破、重大发现,不会把在国际顶级期刊上发表论文作为首要工作,有时会因不屑于或不擅于凑论文、拼关系、争帽子而被边缘化,正如徐匡迪院士指出:“中国颠覆性技术被投票‘投’没了。”[16]

为克服通过权威大奖认定原始创新的不足,笔者提出依据“原创成果四要点”来认定原始创新,以避免一次性同行评议存在的主观性、同行相轻等弊端。原创成果四要点包括:1)突破点四要素,包括突破什么、怎么突破、突破开辟的新领域、新方向以及能用一句话概括核心贡献;2)发表同题系列论文论著或专利清单;3)获奖、转载、引用、受邀报告等学界好评;4)国际国内同类工作的盘点比较及优势。这相当于经历了长期的同行评议,公平公正、高效合理。真正的原创成果,特征鲜明,高下立判。


认定与盘点原创成果包括三点:1)注明原始创新是开辟新领域、引领新方向的重大创新,杜绝包装假冒;2)填报原创成果四要点,使原始创新成果表述规范,有据可查;3)原创成果包括A+和A两类:A+类已获得权威大奖,如国家自然科学奖一等奖、陈嘉庚科学奖及国际权威大奖,用获奖理由和成果简介展示即可;A类已得到学界好评,能够展示原创成果四要点,优势一目了然[15]


基于对原始创新的定义和认定,笔者提出认定主题名师的“1+N”甄别法——以“1”为主,以“N”为辅,让主题名师一目了然。其中,“1”是一件标志性代表作,包括原始创新成果或系统精深、蔚为大观的硕果或冷门绝学的奇艺秘技,特征鲜明,辨识度高;“N”能够反映名师在该研究主题领域获得的成就、荣誉等,如获奖、获得项目资助、在专业学术团体中任职、获得荣誉头衔等,这些均与研究主题直接相关,能够辅助说明主题名师的学术贡献、影响与地位。


(二)研制AI助教,加快实现精英教育普惠化


AI助教是AI赋能教育领域的热点。2018年,网龙率先推出AI助教;此后,学霸君的智能教育机器人Aidam、爱乐奇的AI助教、百度的小度安全AI助教等相继推出[17]。在国际上,可汗学院较早致力于利用AI探索个性化教育。自2022年8月,可汗学院与GPT-4合作,利用GPT-4能力为教学者提供教学资源辅助,整合GPT-4推出AI助手Khanmigo。Khanmigo帮助学生掌握各种学科和技能——可以充当虚拟导师,可以解释概念,还可以提供提示并检查答案[18]。2024年5月,微软和可汗学院宣布建立多元合作伙伴关系,微软将协助可汗学院为美国所有K12教育者免费提供Khanmigo for Teachers。这款AI助教节约了教师备课时间,让老师们专注于最重要的事情——与学生互动并提供支持[18]。显然,可汗学院开发的AI助教集成了一流教育资源,使用AI助教,学习者实现了向一流教师学习的愿望。然而,在师生互动环节还不能实现与一流教师互动,因为一流教师毕竟是稀缺的。


目前“AI助教+教师”中的教师多是普通教师。也就是说,并没有考虑如何使研制的AI助教与一流教师相互配合。尽管在AI助教层面实现了精英教育普惠化,但作为一个整体,“AI助教+教师”仍不能实现学习者向一流教师学习。因此,今后需要研发与一流教师(主题名师)相互配合的AI助教。要与一流教师(主题名师)互动、问答,需要解决五个问题,以克服一流教师稀缺的问题。一是建立互动数据库。AI助教应收集学习者与一流教师真实互动及对话集锦,形成内部数据库并实时更新。就像积累围棋名局棋谱一样,高质量的内容(包括常见问题)积累越多,其效能越强。学习者提问与数据库内容重合或接近时,通过AI助教可实现相当于与一流教师的互动。二是实时联网,利用AI的强大功能,让学习者与一流教师实现对话或虚拟对话。学习者提出的问题,要么从互动数据库或网上得到答案,要么在网上等待回答。AI的作用是搜索、匹配问答,包括拆解问题、组合问题、整合答案。三是师生匹配。利用聚类分析等方法,将知识结构、专业诉求、研究方向、思维方式、职业规划等方面较为类似的学习者组织起来,与一流教师进行匹配。在AI、互联网、虚拟技术等信息技术的助力下,一位一流教师可以指导许多学习者。四是改进模型。关于信息技术在教育教学领域中的应用已经有多种模型,如SAMR模型、TIM模型、TPACK模型等,均是解决技术支持下改进教学方法的工具。为实现精英教育普惠化,需要在此基础上,考虑AI等技术支持下向一流教师学习所需要的教学方法,提出相应的模型。五是训练AI替身。让一流教师拥有自己的AI替身,是解决精英教育普惠化的根本方案,目前已有初步探索。例如,美国塔夫茨大学教授、哲学家丹尼尔·丹尼特(Daniel Dennett)使用自己关于各种哲学主题的数以百万字的材料训练、建立了自己的AI替身。该AI替身的一些问答表现已与丹尼特本人无异[19]。随着AI技术不断发展,AI替身与学者本人的思维已越来越接近。由于可以得到本人及时核验、校对、改进,教师、学者的AI替身的质量日益提高,优于AI创制的虚拟教师、虚拟学者。


(三)“主题名师+AI助教”网络将成为AI教育的主流组织方式


实现精英教育普惠化,除了需要解决主题名师甄选、AI助教研发、优质开放教育资源的支持、AI测评客观化等问题,还需要教育组织方式的变革。目前,在互联网、人工智能、数字技术、虚拟技术等的应用推动下,高等教育组织方式出现新趋势。早在1997年,管理大师彼得·德鲁克(Peter Drucker)宣称,30年内庞大的校园即将作古,大学将无法生存,其原因包括传统大学运作成本过高、教育模式缺乏灵活性、不能满足终身学习的需求、在线教育和远程学习变得更加普及和便捷以及市场需求的变化和全球化的影响[20]。慕课引发人们对大学未来形态的思考。例如,戴维·斯特利(David Staley)提出平台大学、微学院、人文智库、游学大学、博雅学院、接口大学、人体大学、高级游戏研究院、博识大学和未来大学十种“明日大学”的模型[21]。朱永新教授强调,今天的学校会被未来的学习中心取代[22]。余胜泉教授提出,未来将出现一些从根本上重新设计的学校,教育通过网络实现不受地理位置和主体限制的教育功能,形成需求个性化、资源协同化、角色多样化的自组织形态的学习社区[23]。劳伦斯·布罗克利斯(Laurence Brocliss)在《牛津大学史》一书中指出,在新技术的影响下,牛津大学迟早会变得多余,网络教育取代高校只是时间问题[24]。湖南师范大学校长刘仲华院士认为,师生关系将逐渐由传统的权威服从转变为独立平等,以师生为主的二元主体关系将被“教师—学生—AI”的新型多元主体的交互结构取而代之;技术革命正在重新定义学校,只要具备课程、测量、评估三个要素,有对学习者和学习成果的统一标准评价,任何地方都可以称为学校[25]


精英教育普惠化需要线下线上结合,这需要克服新的挑战。早在疫情防控期间,线上教学就已暴露出一些问题。例如,在纯粹的在线环境中,学生缺乏自我组织能力,难以保持注意力,容易产生无聊、孤独感;教师的困难则主要是缺乏在线环境的特定沟通能力,不能正确使用计算机等各种教学工具等。因此,需要为在线教学创建合适的物理环境,重新设计课程的具体内容,也可以引入小组活动来激励和吸引学生,鼓励协作学习[26]


“主题名师+AI助教”是以人为本的系统,AI助教只起辅助作用。人工智能解决方案具有结构性地改变大学行政管理和教学的潜力,高等教育教学需要重新考虑教师的角色。人工智能解决方案为全民教育提供了新的机会,同时促进了终身学习。教育应以人为中心,而不是以技术为中心;尽管人工智能取得了飞速发展,完全依赖技术却是危险和错误的[27]。因此,“主题名师+AI助教”网络以主题名师为主,以AI助教为辅;AI助教的功能是充分利用AI、互联网、虚拟技术与开放教育资源等,让更多学习者得到求教主题名师的机会。博士级智能AI即将问世,越来越多的工作岗位被AI替代,精英教育普惠化迫在眉睫。


需要指出的是,精英教育普惠化的形式多种多样,本文提出的“主题名师+AI助教”只是其中一种。其优势在于利用新标准、新方法及时甄选出主题名师,其意义表现在四个方面:一是破“五唯”、立新标,确立一流人才的新标准,甄选出主题名师;二是让主题名师担任培养拔尖创新人才的主持人,让精英培育精英,精英教育普惠化;三是让主题名师担任一流学科的学术带头人,加快一流学科建设;四是让主题名师提供一流的知识服务,大幅提高智库水平。智库咨询应该对接术业有专攻的杰出专家,而非对接机构;让主题名师提供相关主题领域的咨询与建议,可以显著提升知识服务水平。


四、主要结论与政策建议


本文探讨AI大爆发与AI教育革命有可能在人类历史上首次实现精英教育普惠化,加快拔尖创新人才培养与评价,为早日实现教育强国目标提供了新机遇。围绕如何通过AI教育革命实现精英教育普惠化,得出四项主要观点或结论。第一,让广大学习者向一流教师学习是从以教师为中心转变为以学习者为中心的根本所在,AI教育革命可实现精英教育普惠化,使学习者愿望成真,同时成为拔尖创新人才培养的新方式。第二,AI测评系统化客观化,推动从学历教育向能力教育转变,提高学习者能力成为核心目标。AI能力测评结果将替代学历学位证书,成为选人用人的主要依据,这将对高等教育体系与大学形态产生颠覆性影响,一流大学、一流学科或将重新洗牌。第三,目前单一的集中式学校形态将转变为分布式“主题名师+AI助教”网络形态与集中式学校形态并存,让学习者拥有更多选择,让一流教师充分发挥作用。第四,目前先进的AI助教实现了AI助教层面的精英教育普惠化,但仅有“AI助教+教师”还不够,只有“主题名师+AI助教”网络才能攻克这一难关。运用“1+N”甄选法可以及时甄选、认定主题名师;通过建立互动数据库、实时联网、采用聚类分析等方法与一流教师进行匹配,改进模型,训练一流教师的AI替身等,研发与一流教师(主题名师)配合的AI助教,以克服一流教师稀缺的问题。


在政策实施层面,笔者建议抓好四个方面的工作:第一,利用新标准、新方法及时甄选出主题名师,实现破“五唯”、立新标;第二,让主题名师担任培养拔尖创新人才的主持人,让我国的世界一流学者主导一流人才自主培养,集中主题名师的力量办大事,提升人才培养质量,实现精英教育普惠化;第三,让主题名师担任一流学科的学术带头人,加快一流学科建设;第四,让主题名师提供一流的知识服务,大幅提高智库实力与水平。


总之,AI教育革命与精英教育普惠化将从根本上改变拔尖创新人才培养、评价的方式方法,切实加快教育强国建设进程,助力我国早日实现从人口大国到人才强国的跃升。




来源 | 《中国考试》