领跑智慧教育,好未来千亿参数大模型构建背后

发布日期:2024-06-24 16:13    点击次数:67

你理想中的学校到底是何种模样?相信,每个孩子的心里都住着一个“巴学园”!

《在窗边的小豆豆》这本书中,巴学园与传统填鸭式办学方式不同,校门由两棵树围成,教室是用电车改造,学生可以根据自己的兴趣选择课程,学校对孩子的天性充分包容和尊重……然而,从可操作性和实际落地的角度来看,把每个学校都变成“巴学园”,根本不现实;但幸运的是,我们迎来了人工智能时代,大模型正在与云计算、大数据等诸多技术形成合力,促进教育产业实现智能化升级。

那么,大模型正在如何改变教育行业?在好未来智慧教育背后,九章大模型和AI Tutor等产品,正在借助哪些优秀的工具与平台,满足学校、老师和学生的多样化教学与学习需求?在Microsoft AI Day活动中,我们不仅见证了微软的诸多新发布,更进一步了解到好未来构建大模型的全部过程。

 大模型部署之初

▲北京世纪好未来教育科技有限公司CTO 田密

“好未来教育集团率先为上千位研发人员配备了GitHub Copilot 智能副驾驶®。据统计,其开发人员与Copilot 智能副驾驶®的月均交互接近2万次,AI辅助编写代码的平均采纳率达到33%,每月总采纳代码总数大约有25万行。” 北京世纪好未来教育科技有限公司 CTO田密 在媒体采访中表示,Chat交互方式在公司内部越来越受欢迎,极大地提升了工作效率。

GitHub Copilot,是微软旗下AI驱动的开发者智能副驾驶,经过两年的发展,已拥有超过180万付费用户;而主打智慧教育的“好未来”,是中国 第一批使用GitHub Copilot 智能副驾驶®的用户。

向所有开发者一样,当生成式AI技术浪潮席卷全世界,好未来的研发小伙伴们,首先想到的一个问题是:AI会不会替代自己?田密的一个观点,改变了大家的认知!那就是AI不会取代人类,但可能会被能使用AI的人类取代。因为,在今天这种盛大的智能化升级时代,无论是工程师、设计师还是其他各种岗位,都面临同样一种选择——要么用AI让自己变得更高效,要么落后于时代。

如今,好未来的开发者对于大模型的态度已发生180度大转弯,从最开始的抵触转变为现在的积极拥抱。当然,这种转变的直接动力,不仅仅是认知问题,更源于大模型应用本身的能力升级,Chat功能变得越来越好用。

“代码的平均采纳率是33%,而在工作整体层面,这个比例是15%左右。” 田密强调,可别小看这15%,如果一家企业有1000人的工程团队 ,相当于多增加了200多个工程师,一年能节省很多成本。

好未来九章大模型,是国内首个千亿级别的数学大模型,也是首批通过备案的教育大模型。这款产品以生成式人工智能技术为基础,通过启发引导的方式帮助学生解决数学难题,旨在培养学生的解题思维,提升数学学习能力。以大语言模型为基础的“九章随时问”为例,该应用不再只是一个答案提供者,而是一名“学习导师”,先分析题目考察的知识点和形式,再引导学生思考,一步步解决问题,帮助他们在探索中获得灵感。

好未来在 “九章大模型”自研过程中,使用了Azure AI服务,将数据标注的效率提升了35%,实现了客观题评估、主观题评估等多个任务的自动化评估。此外,好未来基于九章大模型研发的AI Tutor产品中,广泛采用了微软Azure提供的高精准ASR和超拟人TTS技术。

AI+教育激发个人学习潜能

“AI和设备结合是天然的,落在硬件上,家长觉得看得见、摸得着,这就是很好的落地场景。”在田密看来,AI和教育结合是大势所趋,所以好未来在大模型的最初部署落在学而思的学习机上,但未来会尝试独立的APP或小程序服务。

目前,好未来和微软的很多合作主要集中在Azure AI,除了自动评估、高精准ASR和超拟人TTS技术,很多创新场景也在深度沟通,进入头脑风暴阶段。

整体来看,在标注、生成,用于训练数据时,采用的都是Azure AI能力。好未来大模型的训练还是在自己的机器上,比如:通过A800上去训练。但是,用来做训练的数据标注这件事情,会采用微软Azure AI做提效,数据标注本身的环境是好未来自己开发。之前,做数据标注从头到尾都是由人工来执行,现在基于Azure AI先AI预标注一下,人工只需要修改和审核,所以效率会大幅提升,大概提升35%以上。

在大模型如火如荼的一年多时间里,全世界企业都在拥抱AI浪潮。所以, Azure AI能力不是微软一方在推动,而是用户确实有场景需要。正是因为大量用户在使用,才让用户和微软的合作更加频繁和紧密。微软也因此坐上了时代的顺风车,进入高速增长阶段。在微软最近两个季度的财报中,云业务的很多收入都来自AI。虽然,大模型在中国本地还未引进,但在算力以及更贴近场景的应用层面,都有着强大的吸引力。

▲微软 Azure 产品事业部总经理 李冕

“在智能化升级过程中,企业更愿意选择微软,是因为我们把安全看作是重中之重。” 微软 Azure 产品事业部总经理李冕表示,Responsible AI(负责任的AI)有很多标准,比如透明、安全、负责任监管的框架等,微软在此标准下,构建了负责任的流程和工具。以Content Safety工具为例,可以过滤掉不符合标准的内容,这是由微软内部应用最终演进为外部服务的一个重要工具。与此同时,微软不仅有很多优秀的自研产品和方案,还鼓励开发者拥抱开源的其他方案。

针对教育场景,过去的“教”和“育”是分开的。但是, 在5-10年之后,智慧教育会迎来重要拐点。未来,大部分“教”的工作可以由AI老师完成;而在“育”的方面,真人老师将发挥关键作用,更多的工作是怎么激发、唤醒、鼓舞孩子,让孩子对学习保持热情。

 写在最后:

AI听写、AI背诵、AI批改作业……我们喊了很多年的个性化学习、智慧教育,终于在生成式AI时代变成现实。在数字世界里,大模型正在为每个孩子构筑一所理想中的“巴学园”。AI设备可以根据学生学习状态评估学习情况,比如:通过观看视频的停顿点、做题的反应时间等数据,评估一个知识点是否学会了,哪些还不懂。最终,学习设备可以根据学生的学习画像确定下一步的学习计划,能够更个性化地指导教学。