领跑智慧教育，好未来千亿参数大模型构建背后

发布日期：2024-06-24 16:13 点击次数：86

你理想中的学校到底是何种模样？相信，每个孩子的心里都住着一个“巴学园”！

《在窗边的小豆豆》这本书中，巴学园与传统填鸭式办学方式不同，校门由两棵树围成，教室是用电车改造，学生可以根据自己的兴趣选择课程，学校对孩子的天性充分包容和尊重……然而，从可操作性和实际落地的角度来看，把每个学校都变成“巴学园”，根本不现实；但幸运的是，我们迎来了人工智能时代，大模型正在与云计算、大数据等诸多技术形成合力，促进教育产业实现智能化升级。

那么，大模型正在如何改变教育行业？在好未来智慧教育背后，九章大模型和AI Tutor等产品，正在借助哪些优秀的工具与平台，满足学校、老师和学生的多样化教学与学习需求？在Microsoft AI Day活动中，我们不仅见证了微软的诸多新发布，更进一步了解到好未来构建大模型的全部过程。

　大模型部署之初

▲北京世纪好未来教育科技有限公司CTO 田密

“好未来教育集团率先为上千位研发人员配备了GitHub Copilot 智能副驾驶®。据统计，其开发人员与Copilot 智能副驾驶®的月均交互接近2万次，AI辅助编写代码的平均采纳率达到33%，每月总采纳代码总数大约有25万行。” 北京世纪好未来教育科技有限公司 CTO田密在媒体采访中表示，Chat交互方式在公司内部越来越受欢迎，极大地提升了工作效率。

GitHub Copilot，是微软旗下AI驱动的开发者智能副驾驶，经过两年的发展，已拥有超过180万付费用户；而主打智慧教育的“好未来”，是中国第一批使用GitHub Copilot 智能副驾驶®的用户。

向所有开发者一样，当生成式AI技术浪潮席卷全世界，好未来的研发小伙伴们，首先想到的一个问题是：AI会不会替代自己？田密的一个观点，改变了大家的认知！那就是AI不会取代人类，但可能会被能使用AI的人类取代。因为，在今天这种盛大的智能化升级时代，无论是工程师、设计师还是其他各种岗位，都面临同样一种选择——要么用AI让自己变得更高效，要么落后于时代。

如今，好未来的开发者对于大模型的态度已发生180度大转弯，从最开始的抵触转变为现在的积极拥抱。当然，这种转变的直接动力，不仅仅是认知问题，更源于大模型应用本身的能力升级，Chat功能变得越来越好用。

“代码的平均采纳率是33%，而在工作整体层面，这个比例是15%左右。” 田密强调，可别小看这15%，如果一家企业有1000人的工程团队，相当于多增加了200多个工程师，一年能节省很多成本。

好未来九章大模型，是国内首个千亿级别的数学大模型，也是首批通过备案的教育大模型。这款产品以生成式人工智能技术为基础，通过启发引导的方式帮助学生解决数学难题，旨在培养学生的解题思维，提升数学学习能力。以大语言模型为基础的“九章随时问”为例，该应用不再只是一个答案提供者，而是一名“学习导师”，先分析题目考察的知识点和形式，再引导学生思考，一步步解决问题，帮助他们在探索中获得灵感。

好未来在 “九章大模型”自研过程中，使用了Azure AI服务，将数据标注的效率提升了35%，实现了客观题评估、主观题评估等多个任务的自动化评估。此外，好未来基于九章大模型研发的AI Tutor产品中，广泛采用了微软Azure提供的高精准ASR和超拟人TTS技术。

AI+教育激发个人学习潜能

“AI和设备结合是天然的，落在硬件上，家长觉得看得见、摸得着，这就是很好的落地场景。”在田密看来，AI和教育结合是大势所趋，所以好未来在大模型的最初部署落在学而思的学习机上，但未来会尝试独立的APP或小程序服务。

目前，好未来和微软的很多合作主要集中在Azure AI，除了自动评估、高精准ASR和超拟人TTS技术，很多创新场景也在深度沟通，进入头脑风暴阶段。

整体来看，在标注、生成，用于训练数据时，采用的都是Azure AI能力。好未来大模型的训练还是在自己的机器上，比如：通过A800上去训练。但是，用来做训练的数据标注这件事情，会采用微软Azure AI做提效，数据标注本身的环境是好未来自己开发。之前，做数据标注从头到尾都是由人工来执行，现在基于Azure AI先AI预标注一下，人工只需要修改和审核，所以效率会大幅提升，大概提升35%以上。

在大模型如火如荼的一年多时间里，全世界企业都在拥抱AI浪潮。所以， Azure AI能力不是微软一方在推动，而是用户确实有场景需要。正是因为大量用户在使用，才让用户和微软的合作更加频繁和紧密。微软也因此坐上了时代的顺风车，进入高速增长阶段。在微软最近两个季度的财报中，云业务的很多收入都来自AI。虽然，大模型在中国本地还未引进，但在算力以及更贴近场景的应用层面，都有着强大的吸引力。

▲微软 Azure 产品事业部总经理李冕

“在智能化升级过程中，企业更愿意选择微软，是因为我们把安全看作是重中之重。” 微软 Azure 产品事业部总经理李冕表示，Responsible AI（负责任的AI）有很多标准，比如透明、安全、负责任监管的框架等，微软在此标准下，构建了负责任的流程和工具。以Content Safety工具为例，可以过滤掉不符合标准的内容，这是由微软内部应用最终演进为外部服务的一个重要工具。与此同时，微软不仅有很多优秀的自研产品和方案，还鼓励开发者拥抱开源的其他方案。

针对教育场景，过去的“教”和“育”是分开的。但是，在5-10年之后，智慧教育会迎来重要拐点。未来，大部分“教”的工作可以由AI老师完成；而在“育”的方面，真人老师将发挥关键作用，更多的工作是怎么激发、唤醒、鼓舞孩子，让孩子对学习保持热情。

　写在最后：

AI听写、AI背诵、AI批改作业……我们喊了很多年的个性化学习、智慧教育，终于在生成式AI时代变成现实。在数字世界里，大模型正在为每个孩子构筑一所理想中的“巴学园”。AI设备可以根据学生学习状态评估学习情况，比如：通过观看视频的停顿点、做题的反应时间等数据，评估一个知识点是否学会了，哪些还不懂。最终，学习设备可以根据学生的学习画像确定下一步的学习计划，能够更个性化地指导教学。

上一篇：斯卡洛尼: 梅西身体没问题就会上场这次决定名单是最困难的
下一篇：三星2024上半年手机和平板产量将增长13%，达1亿1440万台