学生为何不学——动机、留存、辍学的学习科学

原始调研报告 · 2026-06-15-学生为何不学-动机留存辍学学习科学.md

↩ 这是原始调研报告。返回综述首页

调研报告:学生为何不学——动机、留存、辍学的学习科学

日期: 2026-06-15 任务: 系统梳理"为什么自学/在线学习平台留不住学生、学生不主动学"的学习科学与实证证据,为"AI 版可汗学院"提供战略级风险参照与干预依据。 适用子领域(C): 动机科学、MOOC留存、自我调节学习、游戏化双刃剑、新颖性效应


调研摘要

在线自学平台的留存危机是有充分实证基础的结构性问题,而非个别产品的失误。MOOC 完成率长期徘徊在 3-15%(中位数 12.6%)、六年未改善;最需要帮助的低自律学生从在线学习获益最少(马太效应);初高中生自我调节能力尚未成熟,无督促环境下的自学尤为困难。但学习科学同样揭示了明确可行的干预手段:归属感干预、苏格拉底式护栏 AI 辅导、脚手架支持和社交临场感设计,均有随机对照实验(RCT)级别的证据支持。


第一部分:MOOC 与在线自学的辍学/低完成率

1.1 数据全景

来源 结论 证据强度
Jordan (2015) 221个MOOC汇总数据集 完成率中位数 12.6%,范围 0.7%–52.1% 已验证事实
Deshpande & Chukhlomin 2017;Jordan 2014;Liyanagunawardena 2013 MOOC 留存率普遍在 3%–15% 区间 已验证事实(多重来源)
Eriksson et al. 2017;Narayanasamy & Elçi 2020 超过 90% 的注册者从未完成课程 已验证事实
Reich & Ruipérez-Valiente (2019, Science) 分析 2012-2018 年 edX 全部课程:完成率六年无改善;52% 注册者从未开始学习;增长几乎全部来自富裕国家 已验证事实(大规模纵向数据)
Coursera Coursera 早期数据 Coursera 平均完成率约 6.1% 已验证事实

关键数据点:52% 注册者注册后从未开始学习(Reich & Ruipérez-Valiente 2019)。这意味着问题甚至在"坚持"之前就出现在"启动"阶段。

1.2 MOOC 元年炒作与幻灭

2012 年《纽约时报》称为"MOOC 元年",Coursera(2012年1月)、edX(2012年5月)、Udacity 同年相继推出。斯坦福校长 John Hennessy 警告"海啸",Sebastian Thrun 预测"仅 10 所大学能存活"。但 2013 年起幻灭: - Udacity(2013):Sebastian Thrun 公开承认原模式失败,转向职场技能"纳米学位"。 - Coursera(2016):明确转向企业/B2B 模式,建起付费墙,创始人 Daphne Koller 离开。 - edX(2018):最后一家宣布转向在线硕士学位项目,此后被 2U 收购。

Reich & Ruipérez-Valiente (2019) 在 Science 上指出:MOOC 的增长从未兑现"民主化教育"的承诺,反而集中于最富裕国家的最优特权学习者。

来源:The MOOC pivot - Science 2019What Happened to the MOOC? - Zocalo Public Square 2022

1.3 辍学归因研究

Dalipi et al. (2018) 系统综述发现辍学两大类因素: 1. 学习者因素:缺乏动机、时间不足、背景知识不足。 2. 平台/课程因素:课程设计模糊、缺乏互动、孤独感、隐性成本。

斯坦福 CEPA Working Paper(2015,分析 2.1 百万学生、44门课程):参与度在第一周急剧下降,之后趋于平稳——第一、二周是留住学生的决定性窗口。

来源:PMC - Take a MOOC and then dropCEPA Stanford Working Paper


第二部分:自我调节学习(SRL)与马太效应

2.1 SRL 的核心问题

自我调节学习(Self-Regulated Learning, SRL)是在线自学的基础能力,包括:目标设定、时间规划、元认知监控、策略调整。在线学习相比面授课堂,对 SRL 的依赖更高,因为: - 没有外部时间结构(下课铃/课表) - 没有教师实时督促 - 没有同伴即时问责

关键实证(Sanna Oinas 2025,混合方法研究,N=29,863): - SRL 最高的学生(31%):在网课中开发了新的学习策略、元认知能力; - SRL 最低的学生(21%):一半声称"什么都没学到",且往往缺乏家长支持。

结论:即使设备获取机会均等,学习体验也高度分化——分化主要由 SRL 能力决定而非设备。

来源:Sanna Oinas 2025, isidore.science

2.2 马太效应(Matthew Effect)

Saleh & Sanders(RISE Journal)明确论证:在线教育中,"拥有者"(高 SRL、高 SES、已有优质教育背景)从在线学习中获益更多,"匮乏者"则更少获益,不平等反被放大。

2025 年澳大利亚 ITS 平台研究(66,451 名高中生,结构方程建模): - 富裕和城市学校的学生更早使用 ITS、使用更多年、学习效果更好; - ITS 使用对学业成果的影响被社会经济背景放大——贫困农村学生使用 ITS 反而扩大了与优势群体的差距。

结论(已验证):如果没有针对性的人工干预,技术工具往往充当不平等的放大器而非均衡器。这对"面向教育资源缺乏孩子"的 AI 版可汗学院具有直接警示意义。

来源:ITS Matthew Effect - eprints.soton.ac.uk 2025Matthew Effect in Online Education - Saleh & Sanders

2.3 青少年 SRL 发展不成熟

多项发展心理学研究证明初高中阶段 SRL 的特殊性:

实际含义:要求 12-16 岁的孩子在无人督促的环境下自主持续学习,从神经发育角度看就是强人所难。

来源:Springer Current Psychology 2023 - SRL and EF adolescentsPMC - Metacognitive self-regulation age differences


第三部分:动机科学——自我决定理论(SDT)

3.1 SDT 三需要模型

Ryan & Deci 的自我决定理论(SDT)是在线学习动机研究中引用最广泛的理论框架(Springer Nature 2022 系统综述确认)。三个核心心理需要:

需要 含义 在线学习中的破坏因素
自主(Autonomy) 感到自己是学习的主动选择者 被迫学习、无选择权
胜任(Competence) 感到自己有能力完成任务 内容太难/太易、无及时反馈
归属(Relatedness) 感到与他人连结 孤独、无社交、无人在意自己

关键元分析(Wang et al. 2024,36项SDT干预研究,N=11,792): - 自主支持干预效果量 g=1.14(实验/准实验设计); - 胜任感干预效果量 g=0.48; - 内在动机提升效果量 g=0.58; - 归属感干预效果不显著(g=0.44,p>0.05)——这一点是反证,暗示归属感难以通过简单干预提升。

来源:SDT Meta-Analysis 2024 - selfdeterminationtheory.org

3.2 "一个人学"为什么失败

社交临场感(Social Presence)的缺失是在线学习低留存的核心机制之一:

RCT 级别证据:社交互动的因果效应 - 一项 30,317 名学生(183国)参与的 MOOC 三项随机实验(SSRN): - 被鼓励访问讨论版的学生,下周完成测验的概率提升 4.3%; - 完成一对一同步讨论的学生,次周测验完成率和分数提升 10%。

人类问责(accountability)的因果效应(RCT): - 德国大学 RCT(COVID 期间,online):同伴导师(每周 1 对 1 讨论自我管理技能)显著提升动机、学习行为、考试报名率,对优等生效果尤为强烈。来源:Erlangen RCT - laser.uni-erlangen.de

注意:一项 MOOC 问责实验(J-线 OLJ)发现课外问责(accountability-outside)对美国学习者的评论数提升有效,但整体完成率无显著提升——说明问责干预效果具有情境依赖性(条件成立才有效)。

来源:Does Social Interaction Improve Learning Outcomes - SSRN


第四部分:游戏化的双刃剑

4.1 过度理由效应(Overjustification Effect)

Lepper et al. (1973) 最早提出:对原本内在驱动的行为施加外在奖励,会把内在动机替换为外在动机。外在奖励撤除后,动机不复存在。

Duolingo 的教训: - 连续打卡(streak)机制:长期用户的核心动机从"学语言"漂移到"不断条"——这是 SDT 所说的"控制性动机"取代"自主性动机"。 - 用户反馈研究(Hkust 2022,Duolingo 论坛内容分析 + 15 人访谈):游戏化误用的三大原因——竞争性、过度沉迷于娱乐性、从众(herding)。 - "最短可行课程"问题:连续打卡激励下,理性策略是每天完成最短最容易的课——维持打卡但无学习价值。 - 研究发现:以维持 streak 为主要动机的用户,六个月后学习留存显著低于以真实语言兴趣为驱动的用户(控制总使用时间后该差异依然显著)。

来源:When Gamification Spoils Your Learning - arxiv 2203.16175Datafield.dev Case Study Duolingo

4.2 游戏化何时有效(正向反证)

结论:表扬/进度反馈有效;竞争性排行榜、连续打卡等控制性机制长期有害。重点是"游戏化什么"和"如何退出"。

来源:Springer gamification novelty effect longitudinal 2022


第五部分:新颖性效应(Novelty Effect)

5.1 EdTech 的"蜜月期"

几乎所有教育技术创新都伴随新颖性效应: - 引入后 2-4 周内,参与度和热情显著高于基准; - 随后开始衰减,通常在 4-10 周内效果减半甚至归零(Springer Nature gamification 14周研究,2022);

这直接导致 RCT 结果被污染:如果研究期短于 3-4 个月,正效应可能只是新鲜感,而非真实学习效果。

5.2 对 AI 学习产品的含义(推测)

推测(尚无直接 RCT 证据): - AI 原生教育产品(包括生成式 AI 辅导)极可能出现同样的新颖性效应。 - 建议:AI 版可汗学院早期 DAU/留存数据需谨慎解读,至少跟踪 3 个月以上才能区分新颖性与真实留存。

来源:Springer novelty effect gamification 2022Frontiers Education gamification novelty 2023


第六部分:AI 不加护栏会直接伤害学习(Bastani et al. 2024/2025 PNAS)

这是对本项目最直接的已验证实证:

实验设计:约 1000 名高中生数学课,随机分配到三组: 1. 控制组(无 AI) 2. GPT Base(类 ChatGPT 界面,无限制) 3. GPT Tutor(加了"给提示而非直接答案"护栏)

结果: - 练习时表现:GPT Base +48%,GPT Tutor +127%(vs 控制组)——AI 确实大幅提升即时表现。 - 考试时(无 AI 辅助):GPT Base 比控制组 低 17%;GPT Tutor 与控制组无显著差异。 - 学生行为分析:GPT Base 学生直接索取并抄写答案;GPT Tutor 学生更多独立尝试然后要求帮助。 - 学生自我认知盲区:GPT Base 学生不认为自己学习受损——他们不知道自己在走捷径。

结论(已验证):"护栏式解题流"(AI 不直接给答案、给提示、引导思考)是必须的设计约束,不是可选的特性。

来源:Bastani et al. PNAS 2025SSRN 2024 Working Paper*


第七部分:行为科学干预在规模化时的效果衰减

Reich et al. (2020, PNAS) 在 247 门 Harvard/MIT/Stanford 课程、25万名学生上测试多种行为科学干预(自我调节提醒、价值相关性信息等): - 自我调节干预:提升了前几周参与度,但不影响最终完成率。 - 价值相关性干预:仅在存在"全球差距"的课程中、面向发展中国家学生时有效;一旦情境不匹配,效果消失。 - 核心结论:在多样化情境中规模化时,平均效果比单一研究小 10 倍(数量级差距)。

来源:Scaling behavioral science interventions - PNAS 2020


综合分析:根因清单与有效干预清单

A. 学生不学的根因清单

# 根因 机制 证据强度
R1 低自我调节能力(SRL) 缺乏目标设定、时间管理、元认知监控,在无结构环境中迅速放弃 强(多项 RCT 和大样本研究)
R2 动机三需要未满足(SDT) 感知不到自主感(被迫学)、胜任感(太难/太易)、归属感(孤独)→ 动机外化或消失 强(SDT 体系有大量 RCT)
R3 社交孤立与无问责 一个人学没有问责闭环,孤独触发倦怠,无教师关注 → 退出 强(多项 RCT)
R4 青少年认知/元认知尚未成熟 12-16 岁延迟满足、目标坚持等执行功能尚在发育,无外部结构容易放弃 强(发展心理学实证)
R5 马太效应——弱势学生获益最少 高 SRL 学习者越学越强,低 SRL/弱势学习者越学越迷失 强(大样本纵向+准实验)
R6 启动失败(52%注册者从未开始) 注册与学习之间的冷启动门槛极高,意向与行动存在巨大"意图-行为鸿沟" 强(edX 6年数据)
R7 游戏化走向反噬 连续打卡等控制性机制侵蚀内在动机,学生为打卡而学,内在兴趣消亡 中-强(SDT 实验+用户行为分析)
R8 新颖性效应掩盖真实留存 初期高参与度来自新鲜感,4-10 周后迅速衰减,产品误判真实效果 中(纵向设计研究)
R9 AI 直接给答案制造学习幻觉 学生即时表现好,但真实学习受损(-17%),且学生无自我察觉 强(PNAS RCT,~1000 人)
R10 行为干预规模化效果衰减 10 倍 单一情境有效的干预在多元情境下效果骤降 中-强(25万学生跨 247 门课)

B. 已被证明能提升坚持度的有效干预清单

# 干预手段 效果 证据强度 最佳设计原则
I1 脚手架支持(Scaffolding) 在线学习表现总体效果量 ES=0.53(meta分析,32项研究) 提供引导结构,逐步撤退
I2 SRL 干预(目标设定、自我监控、策略反馈) 学业成绩效果量 ES=0.69(meta分析,在线+混合场景) 明确学习目标和进度可视化
I3 归属感/社交连结干预 RCT:弱势学生两年持续就读率显著提升(Science Advances,N=1063) 定制化、具体化地传递"你属于这里"
I4 社交互动设计(讨论板、一对一交流) 一对一讨论后次周完成率+10%(N=30,317,3项随机实验) 同伴互动质量高于数量
I5 护栏式 AI 辅导(提示而非答案) 练习+127%、考试与控制组无显著差异(GPT Tutor vs GPT Base -17%) 强(PNAS RCT) 禁止直接给答案,必须给提示
I6 教师临场感(个性化消息/存在感) 满意度和感知学习显著提升,建立师生联结 中(部分研究存在感知vs真实差异) 个人化、定期、真实
I7 成长型思维与自我效能干预 对弱势学生 GPA 提升有帮助(密歇根州立 RCT);但规模化效果衰减 中(情境依赖) 需配合具体学科内容
I8 同伴导师(Peer Mentoring) RCT:提升动机、学习行为、考试报名;优等生效果最强 中-强(德国大学 RCT) 聚焦自我管理而非知识本身
I9 价值相关性干预(告知知识的现实意义) 在"存在全球学习差距"的课程中,对发展中国家学生完成率有效 中(情境依赖) 必须真实相关,不能泛泛
I10 积极反馈/进度可视化(非竞争性) 增强胜任感,维持内在动机,避免过度理由效应 中-强 反馈聚焦进步而非排名

正向反证:哪些设计确实留住了学生?

综合有效设计特征(跨多项 RCT):

  1. "高科技 + 高温情"(High Tech, High Touch):Project COMPASS RCT 证明,在线课程加入教学临场感、社交临场感、认知临场感的综合重设计,少数族裔学生通过率显著提升,且提高了下一年留存。来源:Sci-Direct High Tech High Touch RCT

  2. 第一、二周是关键:参与度下滑主要在第一周,第一二周留住学生后曲线趋于平稳(斯坦福 CEPA)。→ 冷启动设计极为关键。

  3. 早期结构化承诺:事先填写"何时学习"的学生持续率显著更高(J-PAL 研究)。

  4. 归属感来自具体而真实的联结:抽象的"欢迎语"无效;个人化消息、连接课程内容与学生生活经历的周度沟通有效(Sara Avila Forcada 实验,AEA P&P 2023,改善成绩和评价)。

  5. 掌握式学习(Mastery Learning)的胜任感效应:当学生感到"我真的会了",内在动机得到强化,这是与打卡留存(空洞留存)根本不同的良性循环。


对"AI 版可汗学院"的具体风险与设计启示

核心风险点

  1. 目标群体(低自律/弱势初高中生)是最脆弱群体:SRL 最弱、最需要帮助的孩子,恰恰是从自学平台获益最少的人(马太效应)——这是本项目必须系统性破解的结构矛盾。

  2. 冷启动问题:52% 注册者从未开始。产品第一周的设计如同急诊室:必须极快建立连结和胜任感。

  3. 游戏化陷阱:若以"连续打卡/积分/排行榜"作为主要留存手段,3-6 个月后将面临内在动机被消费殆尽的问题(Duolingo 案例)。

  4. AI 直接答题风险:如不做护栏,学生会把 AI 当抄答案机器,练习表现好但真实学力受损(Bastani PNAS)。

  5. 新颖性效应掩盖真实留存:前 4-8 周数据可能虚高,需要至少 3 个月跟踪才能看到真实留存曲线。

  6. 规模化干预效果衰减:有效的个性化干预在规模化时平均效果降为 1/10(Reich et al. PNAS 2020),需持续 A/B 测试和分人群迭代。

设计建议(基于实证)

  1. 护栏式解题流是非可选项:苏格拉底式追问 → 提示 → 步骤分解,禁止直答。这既是学习科学要求,也有 PNAS 级别 RCT 支撑。
  2. 第一周留存设计:快速建立胜任感(调适内容难度至成功体验)+ 人工问候/教师 touch(哪怕是半自动化)。
  3. 社交化问责闭环:引入同伴学习小组或家长可见进度报告,提供外部问责锚点(尤其对低 SRL 学生)。
  4. SRL 脚手架内嵌:目标设定向导、每周学习计划、反思提示——不能假设学生有 SRL,必须在产品里教。
  5. 反竞争游戏化:避免排行榜、避免破损 streak 惩罚感,改用进步可视化(展示"我比自己上周好了多少")。
  6. 归属感设计:具体、真实、定期的个人化连结(展示"像你一样的同学也在学"),比通用"欢迎"语有效。

不确定项与推测说明

项目 状态 说明
AI 原生教育产品的新颖性效应持续时长 推测 尚无专门 RCT 数据,推测与其他EdTech类似,需产品自行追踪
中国初高中特定人群的 SRL 基线数据 数据有限 中文文献多为疫情期间数据,代表性有待确认
"掌握式学习 + AI"组合对留存的长期效果 尚无高质量 RCT Khanmigo 等产品早期数据乐观但样本小、周期短
同伴导师(Peer Mentoring)对初高中生(vs大学生)的效果迁移 推测 目前 RCT 主要在大学生群体,初高中迁移有待验证
行为干预在中国教育文化情境下的效果差异 未知 西方研究为主,文化适配尚需在地化 RCT

参考来源

  1. Jordan (2015). MOOC completion rates data visualization — 支撑 MOOC 完成率 ~15% 结论

  2. Jordan (2014/2015). MOOC Completion Rates Revisited - ERIC EJ1067937 — 支撑中位数 12.6%、0.7%-52.1% 区间

  3. Reich & Ruipérez-Valiente (2019). The MOOC Pivot. Science 363(6423) — 支撑"52%注册者从未开始"、"完成率六年无改善"、"富裕国家集中"等核心结论

  4. Springer Nature (2022). Role of motivation in MOOCs' retention rates: systematic review — 支撑 SDT 是最广泛使用的 MOOC 动机理论框架

  5. Wang et al. (2024). SDT-based interventions meta-analysis. selfdeterminationtheory.org — 支撑 SDT 干预效果量数据

  6. PMC (2022). Take a MOOC and then drop: systematic review — 支撑辍学归因两大类因素

  7. CEPA Stanford Working Paper No.15-09 (2015) — 支撑第一二周是关键留存窗口

  8. Bastani et al. (2024/2025 PNAS). Generative AI Can Harm Learning — 支撑 AI 无护栏 -17%、护栏消除伤害的核心结论

  9. Saleh & Sanders. The Wolf in Sheep's Clothing: Matthew Effect in Online Education — 支撑在线教育马太效应论证

  10. ITS AdaptiveMath Australia 2025 (eprints.soton.ac.uk) — 支撑 ITS 平台可能放大不平等的大样本实证

  11. Sanna Oinas (2025). Self-Regulation of E-learning: Mixed Method Study — 支撑 SRL 最低组 50% "什么都没学到"结论,N=29,863

  12. Arxiv 2203.16175 (2022). When Gamification Spoils Your Learning — 支撑游戏化误用与过度理由效应

  13. Springer gamification novelty effect longitudinal 14-week study (2022) — 支撑新颖性效应 4-10 周内衰减

  14. Social Presence meta-analysis - Computers in Human Behavior (2017) — 支撑社交临场感与满意度和学习的相关性

  15. SSRN - Social Interaction MOOC RCT (30,317 students) — 支撑一对一讨论提升完成率 10%

  16. Reich et al. (2020, PNAS). Scaling behavioral science interventions — 支撑规模化后效果衰减 10 倍

  17. Springer Current Psychology (2023). SRL, metacognition, EF transitions — 支撑初高中阶段 SRL 和 EF 发展不成熟

  18. Science Advances (2020). Belonging intervention improves retention — 支撑归属感干预提升两年持续就读率

  19. High Tech High Touch RCT (2020, SciDirect) — 支撑综合临场感重设计 RCT

  20. Scaffolding meta-analysis MDPI (2023, 32项研究 ES=0.53) — 支撑脚手架对在线学习的效果

  21. SRL interventions meta-analysis online/blended K-12 & HE (ResearchGate, ES=0.69) — 支撑 SRL 干预效果量

  22. Erlangen peer mentoring RCT (laser.uni-erlangen.de) — 支撑同伴导师提升动机与学习行为

↩ 这是原始调研报告。返回综述首页