自适应/个性化学习平台失败案例深挖——坟场复盘

原始调研报告 · 2026-06-15-自适应学习平台失败案例-坟场复盘.md

↩ 这是原始调研报告。返回综述首页

调研报告:自适应/个性化学习平台失败案例深挖——坟场复盘

日期:2026-06-15 任务:深挖自适应/个性化学习平台的历史失败案例,提炼失败模式,兼顾反驳视角,为"AI版可汗学院"项目提供战略参考。 时间范围:2010–2026(重点关注有定论案例)


调研摘要

自适应学习平台在过去15年经历了一轮完整的"炒作-幻灭-清算"周期。Knewton的崩盘($182M融资,最终以低于$17M贱卖)成为这轮泡沫的标志性事件;AltSchool烧掉$174M后缩减为教育咨询公司;Summit Learning引发多地学生罢课。盖茨基金会投入逾$3亿后,RAND的多轮评估结论从"有希望"降温到"谨慎的故事"(仅+3百分位的效益,且在区立学校出现下降)。失败的根本原因并非技术本身,而是过度承诺、黑盒不透明、教师抵触、商业模式不可持续、以及把"学生使用平台"错当成"学生在学习"。有证据的成功案例存在——Carnegie Learning MATHia(高中第二年有显著效果)、ALEKS(补充教学时效果g=0.43)、DreamBox(可能是正向效果)——但普遍规律是:作为补充工具时有效,试图替代教师时崩溃。Bastani等2024/2025年PNAS研究进一步证实:无护栏的AI辅助提升了练习成绩但使独立考试成绩下降17%,有护栏版本则缓解了伤害。


一、案例深挖

1. Knewton(2008–2019):自适应引擎标杆的崩塌

背景与巅峰

Knewton由Jose Ferreira于2008年创立于纽约,融资$182M(投资方包括Accel、Atomico、Founders Fund、Pearson等)。其核心pitch是为教材出版商提供自适应引擎,声称可以"半读懂学生的思维",像"天空中的机器人导师"一样实现超级个性化学习。Pearson是最早、最高知名度的合作伙伴,2011年共同领投$33M。

声明(已验证):Knewton创始人Ferreira公开宣称,Knewton技术能精确到百分位地了解学生的强弱项,并在Time杂志(2013年)称"我认为这个领域将只有一家公司能成功,那就是我们,因为我们现在已经遥遥领先了。" 来源:Explaining the shakeout in the adaptive learning market

怎么失败的

声明(已验证):没有行业分析师认为收购价接近Knewton的融资额;据EdSurge消息,成交价在$10M区间。 来源:Knewton Was Acquired For Less Than $17M

根因分析

根因1:技术过度承诺,无法兑现 Michael Feldstein(e-Literate博客)将Knewton称为"卖假药"(snake oil)。核心批评是:Knewton声称的能力(精确到百分位读懂每个学生)在技术上是夸大的,相关疗效研究无法将Knewton的贡献与Pearson产品本身的贡献区分开来。 来源:Yes, I did say that Knewton is "selling snake oil"

根因2:黑盒不透明,失去信任 Kim Thanos(Lumen Learning CEO)总结:"Knewton试图在其解决方案上制造神秘感,让教育者感到公司缺乏透明度。自适应学习变成了一种不应该被信任的黑箱方法。没有人想要那些不透明的、看似神奇的、用学生学习数据做交易的解决方案。" 来源:Wiley buys Knewton

根因3:商业模式脆弱 Knewton的CEO Kibby本人后来承认,最初的许可策略是"有缺陷的"——大型出版商不会永远允许外部公司插入其核心产品。Knewton的客户实际上是风险资本家,不是有真实教师和学生的学术项目。(Hill, e-Literate评论)

根因4:行业连带伤害 Knewton的崩塌对整个自适应学习赛道产生了负面外部效应。Thanos说:"这让试图获得真正有趣、有前景解决方案的自适应提供商很难吸引到投资者。它对下一波自适应提供商的融资产生了负面影响。"

反驳视角(Knewton哪里做对了/被误解了)

⚠️推测:一些分析师指出,Knewton的最终产品Alta(开放教育资源+自适应技术,售价$49.99/门课)实际上是当时最实惠的数字课件之一,可能在某些课程上确实有效果;失败更多是商业模式而非技术本身。Kibby的Alta战略被批评为"太少太晚",但如果更早转型,结果可能不同。此外,Knewton的失败也迫使行业提高了对证据和透明度的要求——这被一些人视为行业进步。


2. AltSchool → Altitude Learning(2013–2021):硅谷个性化学校实验

背景与巅峰

AltSchool由前Google个性化负责人Max Ventilla于2013年创立,开设小型私立"微学校"(lab schools),学费$25,000+/年,将其作为测试自研软件平台的实验室。融资$174M,投资方包括Mark Zuckerberg(通过Zuckerberg Education Ventures和Chan Zuckerberg Initiative)、Peter Thiel、Laurene Powell Jobs等硅谷顶级名字。公司同时运营学校与开发软件,年支出约$4,000万。

怎么失败的

声明(已验证):AltSchool在鼎盛时期年支出约$4000万,2018年营收约$700万,绝大多数来自工具销售。 来源:The Edtech Company Formerly Known as AltSchool Sold Its Tech

根因分析

根因1:双线并行,两线都崩 同时运营学校(每年$4000万支出)又做软件开发,对于一家VC支持的创业公司来说,这两件事单独做都很难,同时做等于同时分散了资源和注意力。

根因2:学校作为"试验品"的伦理困境 家长和教育者发现孩子的学习体验是为公司产品迭代服务的,而非以孩子为本。当公司宣布关闭学校时,家长感到被背叛。

根因3:商业模式不可持续 软件产品定价$150–$500/学生/年,对公立学校过于昂贵。公司一直未能找到既能盈利又能服务目标群体(需要个性化教育的学生)的商业模式。

根因4:过度依赖科技解决教育的复杂性 教育者批评指出,免费工具(如Future Ready提供的工具)已经能实现类似的个性化。AltSchool的问题不是技术不够好,而是没有证明技术在复杂教育生态中能创造独特价值。

反驳视角

AltSchool最终服务了40个学区/学校、约30万名学生(2019年数据),并在实践中真正测试了项目式学习、能力制进阶等先进教学理念。Altitude Learning的继任者Devin Vodicka(前Vista Unified学区教育长)是真正深厚教育背景的人,他的转型方向(以学生为中心的学习系统变革咨询)被许多教育者视为更接地气的路径。该公司积累的教育学知识和模型,并非完全白费。


3. Summit Learning(2015–至今):罢课、抗议与退出风波

背景

Summit Learning脱胎于加州/华盛顿州的Summit公立学校网络(11所特许学校),Facebook工程师团队帮助构建了软件平台,后由Chan Zuckerberg Initiative(CZI)持续资助和支持。平台免费向全美学校开放(CZI资助),实质是以"个性化学习"为名、让学生在平台上自主学习的模式。至2018年已在全美约380所学校使用。

怎么"失败"的(实际是部分反弹)

反弹浪潮1 — 康涅狄格州Cheshire(2017年底) 家长以请愿书反对平台,理由:孩子在网上花太多时间、内容与课程标准不对齐、课件中出现了不当内容(古罗马性行为相关图文)、对Facebook数据隐私的担忧。学区撤出Summit Learning。 来源:School ditches online learning program after parents revolt

反弹浪潮2 — 宾夕法尼亚州Indiana Area(2017年底) 6年级家长发现学习材料与平台内嵌评估不对齐,学生得不到足够的一对一教师辅导。学区撤出。

反弹浪潮3 — 纽约布鲁克林(2018年11月) Secondary School for Journalism约100名高中生走出教室罢课,喊出"SUMMIT WILL PLUMMET"(Summit 将崩溃)的口号。学生向Zuckerberg本人写公开信,投诉:整天盯屏幕、自学所有内容、内容太简单/容易作弊、技术故障和Wi-Fi失效。Summit随即建议学校停止在11–12年级实施,该校和另一所Bronx学校随后退出。 来源:Brooklyn Students Protest Use of Online Learning Platform

反弹浪潮4 — 堪萨斯州Santa Fe Trail(2020年) 教师因反对Summit Learning项目集体退休/辞职,学生家长和学生随之组织罢课,支持老师、反对学区强推该平台。教师称:"我教的孩子们已经说了。他们恨它。当孩子们拒绝学习时,无论你多好的老师都没法教。" 来源:Santa Fe Trail High School students receive no punishment for organized walkout

根因分析

根因1:执行保真度问题 Summit自己的解释是,学校在没有满足前提条件(足够设备、可靠网络、充分教师培训)的情况下就强推平台。Summit本身在运营良好的Summit特许学校里效果是不同的。这表明实施失败不等于产品设计失败,但也暴露了可复制性的根本缺陷。

根因2:数据隐私的政治敏感性 Facebook/CZI的品牌关联让家长对数据安全高度警惕。无论Summit实际如何处理数据,"Facebook帮着做的"这个标签就足以引发强烈的负面反应。Summit平台当时与19家第三方公司(包括Amazon、Microsoft)共享数据,虽然是教育目的,但在Facebook数据丑闻(Cambridge Analytica)发酵的背景下,政治敏感性极高。

根因3:削减了人际互动 学生和老师的核心投诉一致:太多屏幕时间,太少人际互动、太少老师讲解和同伴讨论。而这些正是批判性思维发展的核心——这与教育学研究一致。

根因4:内容质量参差 平台整合了第三方内容,导致出现不当内容(含性意味的图片和参考资料),严重破坏了信任。

反驳视角

93%使用Summit的学校在第一年后仍继续使用。Summit Learning在实际运营良好的学校(足够设备、培训、教师投入)里,确实产生了学生成果的提升——这是Summit官方数据,尚缺独立RCT验证。但New York Magazine采访指出,"满意率没有经验性研究,成果数据有限",使得全面客观的评估很难做到。⚠️推测:问题可能更多在于大规模推广时缺乏实施质量保障,而非核心教学法本身。


4. Gates基金会个性化学习大规模资助 + RAND评估

资助规模(已验证事实)

自2009年起,Bill & Melinda Gates基金会向个性化学习的研究和开发投入逾$3亿,资助范围包括Next Generation Learning Challenges(NGLC)、Next Generation Systems Initiative(NGSI)、以及多项课程/技术项目。美国教育部也通过i3(Investing in Innovation)项目投入约$14亿。 来源:Personalized Learning: What Does the Research Say?

RAND三轮评估结果:从"有希望"到"谨慎的故事"

第一轮(2015年,"Continued Progress"):研究了62所采用个性化学习的公立特许/区立学校,与对照组相比,学生在数学和阅读上有更大进步,且实施时间越长效果越明显。结论偏乐观。 来源:Continued Progress: Promising Evidence on Personalized Learning, RAND 2015

第二轮(2017年,"Informing Progress"):研究40所NGLC学校。学生数学成绩平均仅比对照组高约3个百分点,阅读方向类似但无统计显著性。研究者将此描述为"谨慎的故事",指出实施最困难的策略(如能力制进阶)几乎没有学校真正在做。区立(非特许)学校实施个性化学习后,学生成绩出现了下降。 来源:Personalized Learning: Modest Gains, Big Challenges, RAND Study Finds

独立批评(National Education Policy Center,NEPC 2016):RAND 2015年的研究样本高度偏向高质量特许学校,不能代表普通学校;研究没有明确"个性化学习"的最低实施门槛;真正激进的个性化策略(如能力制进阶)在被研究学校中极为罕见,因此研究无法为"技术驱动个性化学习"提供有力证据。 来源:NEPC Review of RAND 2015 Report

Gates资助的特定项目失败案例

Lake County, Florida(2017年) 获Gates基金会NGSI $310万三年资助,实施个性化学习。新任教育长接手后,估算继续项目需要学区自掏$200万,且没有足够的成果证据支撑,宣布撤出。 来源:Central Florida school district changes course on personalized learning

Hillsborough County, Florida(更早) 获Gates基金会$1亿教师评估改革资助,六年后拆解项目,最终支出超过资助金额,学区学业表现无改善,毕业率停滞。

"Teach to One: Math"(联邦i3评估,2019年) 哥伦比亚大学研究团队进行随机对照试验,结论:"没有因果证据显示Teach to One对学生成绩有正向或负向效果"(无统计显著性)。同期Gates资助的相关性研究显示了23%的数学成绩增长,但研究设计较弱,不能归因于该项目。 来源:'Teach to One' Personalized-Learning Model Has No Effect on Students' Math Scores

反驳视角

Gates基金会投资并非全部失败——它资助了目前最完整的大规模个性化学习研究(RAND系列),厘清了哪些实践有效、哪些无效。基金会官员Brad Bernatek的评价很诚实:"结果是令人鼓舞的、有希望的,对这些学校的学生有学术意义——但绝非定论。"这种透明度本身是值得肯定的,而非简单的失败。


5. 自适应数学工具的证据光谱:DreamBox / ALEKS / Carnegie / Pearson

Carnegie Learning MATHia(前身Cognitive Tutor)

结论:Carnegie/MATHia是少数有可复现RCT证据的自适应系统,但证据是有条件的——需要第二年以上的实施、在高中代数效果最明确,其他科目和年级则结论不一。

ALEKS(Assessment and LEarning in Knowledge Spaces)

DreamBox Learning

关于Pearson

Pearson在数字化转型上的失败相当彻底:2016年记录史上最大亏损($32亿),通过多次大规模裁员和剥离资产重组。其自适应学习策略从"与Knewton合作"转为"自研",但自研进展缓慢,产品竞争力未显著提升。核心问题是:从卖实体教材的B2B模式转向卖数字体验的B2C/SaaS模式,但内部文化和流程都没有根本改变。 来源:Pearson: Always Learning…Except in Digital Transformation, Harvard Business School Digital


二、共同失败模式归纳

失败模式1:过度承诺(Over-claim)——承诺了技术做不到的事

Knewton声称"精确到百分位读懂学生思维";AltSchool声称可以"为每个孩子实时定制化";Summit声称学生可以完全自主学习。这些承诺制造了不可及的期望,最终使整个品类陷入不信任。

这是技术问题与人/动机问题的交叉点:技术能力本就有限(Springer Nature 2024论文详述了自适应学习模型的内在挑战),但公司又选择了极度夸大的营销叙事。

失败模式2:黑盒算法——信任的致命伤

当自适应系统不透明时(不解释"为什么给你这道题"),教师和学生都无法建立信任。Knewton的"神秘感"战略直接导致教师不愿采用。ITS研究也发现,智能辅导系统创造了教师层面的五类矛盾(可预测性、劳动分工、个体vs.集体学习、问责、期望vs.体验),教师最终选择放弃系统。 来源:Intelligent Tutoring Systems: Why Teachers Abandoned a Technology

失败模式3:教师被边缘化——最核心的失败

Summit Learning最直接的投诉就是"消除了人际互动"。大量研究(包括RAND系列)显示,教师是实施效果最关键的变量,而多数自适应学习产品是为了减少对教师的依赖而设计的。Khan Academy 2026年大规模研究(200,000+学生)也发现:最大差异来自教师层面的实施(有没有达到推荐使用量),而非平台本身。 来源:Computer-assisted learning in the real world: How Khan Academy influences student math learning, PNAS 2026

失败模式4:商业模式不可持续——VC资金逻辑与教育逻辑冲突

教育市场的付费能力低、决策周期长、实施成本高。Knewton的B2B许可模式依赖大型出版商永远不自建能力;AltSchool的双线模式年烧$4000万;Summit依赖无限期慈善资金。一旦VC或慈善资金停止,模式即崩溃。

Gates基金会资助的案例反复出现"资助结束,项目停止"的模式——Lake County等学区没有内化个性化学习实践,只是在花外部资金。

失败模式5:伪个性化——把"技术路径选择"当成"教育个性化"

许多"个性化"平台做的只是:根据学生答题结果,从内容库里选择下一道题目。这只是路径分支,不是真正意义上的个性化(了解学生的学习风格、认知模型、动机状态、情感因素)。NEPC批评RAND研究时指出,真正激进的个性化策略(能力制进阶)在被研究的学校里几乎没有实施,而相关研究却声称证明了"个性化学习"的效果。

失败模式6:Matthew效应——强者愈强,弱者愈弱

Justin Reich在《Failure to Disrupt》(MIT Press, 2020)中系统归纳了"EdTech Matthew效应":学习技术往往最惠及那些已经在学习的学生(本已有动机、有资源的学生),而最需要帮助的学生反而从中受益最少。Khan Academy 2026年研究明确证实:高成就学生获益更多,低成就学生使用平台时间更短、进阶更慢。 来源:Failure to Disrupt: Why Technology Alone Can't Transform Education

失败模式7:实施保真度问题——好产品被劣质实施所杀

Summit Learning的案例极好地说明了这一点:Summit在其自有特许学校里运作良好,但在缺乏设备、网络、教师培训的学校里一败涂地。许多"失败"的个性化学习项目,实际是实施失败,而非产品失败。但这本身就是可扩展性(scalability)的核心风险。

失败模式8:数据隐私——结构性政治风险

在K-12公立学校领域,学生数据隐私不仅是合规问题,更是政治问题。Summit Learning与19家第三方共享数据(合法教育目的),但在Facebook数据丑闻背景下,这足以引发大规模家长恐慌。任何涉及大规模学生数据的EdTech产品,都必须把隐私架构作为一等公民。


三、Bastani等 PNAS 研究——AI护栏的直接证据

研究(已验证事实):Hamsa Bastani等,"Generative AI without guardrails can harm learning: Evidence from high school mathematics",PNAS,2024年(工作论文)/2025年(正式发表)。 近1,000名高中生数学课随机对照实验,土耳其: - GPT Base组(类ChatGPT界面):练习期间成绩提升48%,但独立考试时成绩比从未使用AI的对照组低17%。 - GPT Tutor组(有护栏的版本,引导学生而非给答案):练习期间成绩提升127%,考试时负面效应基本消除。 - 学生行为分析:GPT Base组倾向于"要答案、复制答案";GPT Tutor组倾向于"要提示、自己作答"。 - 关键发现:学生不自知AI伤害了自己的学习(即使是高成就学生也过度乐观)。

来源:Generative AI without guardrails can harm learning: Evidence from high school mathematics, PNAS 2025

对本项目的直接意义:AI原生学习平台如果直接给答案,其短期表现会很漂亮(用户"觉得"学会了),但会实质性损害真实学习。"护栏式解题流"(永不直接给答案)是有RCT级别证据支撑的设计原则,不是"保守主义",而是科学防线。


四、炒作曲线——自适应/个性化学习的历史弧线

时期 阶段 标志事件
2008–2013 技术触发 / 期望膨胀峰值 Knewton成立、融资,Coursera/MOOCs崛起,"大数据将革命化教育"
2013–2016 期望膨胀顶峰 AltSchool融资$174M,CZI成立,Gates $3亿投入,RAND 2015乐观报告
2016–2019 幻灭低谷 Pearson退出Knewton,Summit反弹,RAND 2017"谨慎的故事",Knewton贱卖,AltSchool缩水
2019–2022 清算与反思 Reich《Failure to Disrupt》,多地撤出个性化平台,行业整合
2022–至今 重新起步(GenAI) ChatGPT冲击,Khan Academy + GPT-4 Khanmigo,Bastani研究警告护栏必要性,新一轮期望形成

Christensen Institute指出,在Gartner炒作曲线上,"个性化学习"已在教育评论圈进入幻灭期,但一线教师却仍更多谈"混合学习"(可落地的具体工具)。 来源:Finding 'personalized learning' on the Gartner Hype Cycle


五、哪些失败是技术问题,哪些是人/动机/商业问题?

失败类型 典型案例 对本项目的启示
技术局限(真实) Knewton"精确到百分位"无法实现;ITS对学习过程建模依然浅层 不要过度承诺AI能力;保持技术声明的可验证性
过度承诺(营销选择) Knewton "robot tutor in the sky";AltSchool"为每个孩子实时定制" 永远不做无法兑现的承诺;建立透明的效果追踪
商业模式(设计缺陷) Knewton B2B许可;AltSchool双线运营 开源+非营利模式规避VC压力;早期明确可持续路径
教师抵触(人的问题) Summit Learning;ITS被教师放弃 将教师纳入设计而非边缘化;提供教师面板和控制权
学生动机(人的问题) Summit学生罢课;DreamBox用量不足 游戏化、正反馈循环、真实进步感;不依赖纯自律
实施失败(执行问题) Summit无Wi-Fi、无设备、无培训 公益项目更要降低实施门槛;无设备时的降级方案
数据隐私(政治/监管) Summit数据共享 + Facebook品牌联结 最小化数据收集;开源透明;避免大厂品牌强关联

六、反驳/平衡视角汇总

以下是对"自适应学习全部失败"这一单一叙事的反驳(多视角保障):

  1. Carnegie Learning MATHia:RAND RCT证明高中代数在第二年实施后有显著效果;这是少数有可复现、严格证据的自适应系统之一。

  2. ALEKS作为补充:元分析显示作为补充教学工具时效果size为0.43,是合理有效的学习辅助手段。

  3. DreamBox早期数学:WWC认定"可能正向效果",独立RCT g=0.32(对于补充工具而言是可观的数值)。

  4. Khan Academy + 教师支持:2026年200,000+学生大规模研究表明,达到30分钟/周的使用量时,可产生0.085 SD的数学成绩提升;关键变量是教师执行,而非平台。

  5. RAND 2015研究:62所学校的研究确实显示了统计显著的正向效果,尤其对初始落后学生的提升效果更大。但该研究的样本是精英特许学校,不代表普通公立学校。

  6. AI元分析(2024):45项独立研究的元分析发现,AI驱动的自适应学习系统对认知学习成果有中大效果(g=0.70)——远高于人们对这类系统的预期;但发表偏差和研究质量问题使这一数字需要审慎对待。

  7. Bastani 2025 GPT Tutor:有护栏的AI导师不仅消除了学习伤害,练习提升幅度(127%)也远超无护栏版本(48%)。这说明设计选择比技术本身更重要


七、对"AI版可汗学院"的战略性启示

  1. 永远有护栏,永远不给答案:Bastani PNAS 2025是铁证,不做任何妥协。这不是保守主义,是防止产品"杀死"自己要帮助的学生。

  2. 作为补充,不作为替代:所有有效的自适应工具(ALEKS、DreamBox、MATHia)都是在辅助教学,不是替代教学。不要宣称可以取代老师或系统课程。

  3. 透明算法,可解释:不要做黑盒。给学生和家长解释"为什么推送这道题",降低信任摩擦。

  4. 从数学/STEM做起:有可验证性的科目(数学)更适合"护栏式"AI辅导;有符号计算引擎校验答案正确性。文科/写作类科目AI幻觉风险更高。

  5. 实施保真度是产品问题:不要以"学校没按我们说的做"来解释失败。在有限资源(低带宽、共享设备)下的降级方案,必须是产品设计的一部分。

  6. 针对有自学意愿的孩子:Matthew效应是结构性问题。针对"想自学但缺资源"的孩子(本项目目标群体),与"没有学习动机"的学生相比,自适应工具更容易奏效。

  7. 开源+非营利是差异化护城河:不受VC"快速增长"压力,不需要用数据换商业价值,这解决了多个失败案例的根因——商业目标与教育目标冲突。

  8. 别承诺"革命":每一轮EdTech炒作都从"将革命化教育"的承诺开始。本项目可以承诺"让有自学意愿的孩子以更低成本学到更多"——这是可验证的、诚实的承诺。


参考来源

以下来源均为本报告正文中声明的直接依据,标注了支撑哪些结论。

主要来源(失败案例支撑)

研究证据来源

宏观分析来源


报告生成日期:2026-06-15。来源搜索工具:Exa Web Search(主力,×12次调用)。本报告区分已验证事实与⚠️推测,所有关键声明均附来源URL。

↩ 这是原始调研报告。返回综述首页