概述
人工智能 (AI) 技术的广泛应用深度改变了教育的形态,催生了蓬勃发展的智慧教育。得益于数据的不断积累、算力的不断突破、以及算法的持续创新,基于AI的计算机视觉、语音交互、自然语言理解等应用在教育行业得到了快速发展,能够通过深入挖掘端到端的海量教育数据价值,为教学工作提供出色支持,从而显著降低教师的教学负担,提升教学的精准性、有效性、针对性。
一起教育科技近年来持续强化“AI+教育”的融合,并在旗下的免费学习工具“一起作业”中推出了应用 AI 技术、可以对学生英语口语水平进行准确测评的一起作业 AI 口语测评平台,致力于为老师们提供更加精准的分数评判体系,为学生们提供更加有效的学情反馈。为提升基础设施平台对于海量业务的支撑能力,为师生提供更高效的智能口语测评服务,一起教育科技使用第二代英特尔 至强 可扩展处理器搭建了 AI 服务器,显著提升了性能表现,不仅能够支撑亿级日均调用量的需求,而且在总体拥有成本 (TCO) 方面具备出色优势。
背景:AI 技术助力降低口语学习门槛,提升学习效果
在英语学习过程中,口语是非常重要的一部分,为提升英语口语水平,全国诸多地区在中考英语中增加口语测试,各个学校作为英语教学的主体,广泛强化了英语口语学习,并通过口语教学、口语测评、口语纠正等方式来提升学生的口语能力。在传统口语学习场景中,要评判口语水平,往往需要师生以“一对一”的方式来进行,教师有限的时间和精力与学生大量的口语评判需求之间形成了尖锐的矛盾,学校需要能够智能、准确地测评学生口语的平台,以满足口语学习的旺盛需求。
在此背景下,利用 AI 技术的口语测评平台应运而生。此类平台能够利用计算机辅助语言学习(Computer Assisted Language Learning)等技术,将用户口语发音所形成的音频数据进行特征提取,并输入到声学模型。随后,平台会将声学模型与语言模型进行融合计算,最终对于用户的发音进行评分。其评测维度包括发音准确度、流畅度、自然度、完整度等,能够帮助学生智能检测口语学习成果。
一起教育科技AI Lab负责人饶丰指出:“AI 口语测评平台的重要意义不仅在于其能够提供一套高效、智能化、随取随用的口语评测能力,显著降低学校与老师的教学负担,还有利于弥补区域之间的教育质量鸿沟,推动教育公平。由于经济发达区域与落后区域在口语教学资源方面存在巨大差异,导致大量三四线城市以及乡村的中小学生难以获得高质量的口语教育,口语评测的质量难以保证,而 AI 口语测评与在线教育的结合,能够通过标准化、普适化的服务,让偏远地区的学生也能够享受到优秀的教育资源。”
基于在 AI 等技术方面的长期积累与创新,一起教育科技推出了搭载智能引擎的一起作业 AI 口语测评平台,该平台在评测准确性、评测效率等方面都实现了突破,能够真实地反映出学生当前口语的真实水平,并给出纠错建议。目前,一起作业AI 口语测评平台已经累计了千万级用户,日均服务调用量达到亿级。
图1. 一起作业 AI 口语测评平台
如此巨大的服务规模给后端基础设施带来了沉重的压力。由于中小学口语教育的特殊性,每天的 19:00-21:00 是学生在线进行口语学习与测评的高峰期,服务瞬时并发量极高,一旦后端的 AI 基础设施平台无法承载如此巨大的服务并发量,可能导致服务速度变慢。此外,用户对于 AI 口语测评的性能正在提出越来越高的要求,高实时性与低延迟正在成为用户体验的重要组成部分,一起教育科技希望能够降低口语测评系统的实时率(RTF, Real Time Factor)1,以提升用户体验和服务吞吐率。
除了性能之外,总体拥有成本(TCO)也是重要的考量因素。虽然基于 GPU 的 AI 服务器能够在性能上满足声学训练与推理的需求,但是采购、部署与运维成本较高,而且其较为复杂的采购流程意味着较高的时间成本,难以实现快速的敏捷扩展。相较之下,基于 CPU 的 AI 服务器能够高效利用已有硬件的基础设施,在大量应用场景下有着更高的 TCO 优势。
解决方案:一起教育科技基于英特尔架构优化 AI 处理能力
为了向师生提供更卓越的口语教育服务,一起教育科技从应用与基础设施两个方面进行了针对性的设计与优化。从应用层面来看,为了给各地的教师和学生提供一套符合课标、以及地方考试统一要求的评分标准,满足日常练习、课后作业、形成性和过程性评价、以及考试评测等各个场景下的英语口语活动需求,一起教育科技认真研究分析了全国近三十个省市的英语口语考试评测标准和《中学英语课程标准》,制订了一套具有普适性的通用评分标准。
一起作业 AI 口语测评平台能够严格按照这一通用打分标准对学生的作答进行评判,其使用了全国各地的题型对此套标准进行了检验,并运用技术手段和大批量数据统计的方式进行复核,证明其在对各式题型、各地区评分要求的适应,以及运用分数手段明确显示学生口语水准方面都有着良好的效果。
在基础设施层面,一起教育科技采用了搭载英特尔 至强 金牌 6230 处理器的 AI 服务器来承载智能口语测评服务。英特尔 至强 金牌 6230 处理器属于第二代英特尔 至强 可扩展处理器家族,为计算密集型工作负载提供了高性能和可扩展性。该处理器集成了英特尔 超级通道互联(英特尔 UPI)、英特尔 Infrastructure Management 技术(英特尔 IMT)和英特尔 高级矢量扩展指令集512(英特尔 AVX-512)等领先功能,可满足严苛的 I/O 密集型工作负载的需求。
尤为重要的是,第二代英特尔 至强 可扩展处理器还内置人工智能加速功能,并已针对工作负载进行优化,能够为各种高性能计算工作负载、AI应用以及高密度基础设施带来一流的性能和内存带宽。同时,采用矢量神经网络指令(VNNI)的英特尔 深度学习加速(英特尔 DL Boost)显著提高了人工智能推理的表现,这使其成为一起教育科技在云平台上拓展 AI 应用的卓越基础设施。
为了验证基于英特尔 至强 金牌 6230 处理器的 AI 服务器带来的性能提升,一起教育科技搭建了测试环境,测试配置如表 1 所示:
一起作业 AI 口语测评平台的工作流包含多个模块,一起教育科技联合英特尔使用英特尔 VTune™ Profiler可视化性能分析器工具分析计算热点,引入VNNI指令集优化热点函数,再将GCC更换成英特尔 C++ 编译器,进行重新编译。完成优化后,测试人员在一颗英特尔 至强 金牌 6230 处理器上并发处理40路推理线程,发现整个工作流的实时率下降了 12.7%2,优化后和优化前的性能对比如图 2 所示:
一起教育科技还将口语评测的优化方法迁移到语音识别上,即便之前已经做了重构和深度优化,VNNI指令集和英特尔 C++ 编译器仍然带来了一定的性能提升,同时最大程度地发挥了CPU的算力。在同样40路并发的情况下,整个工作流的实时率比优化前下降了5%3,优化前后的性能对比如图 3 所示:
语音合成是用于教学场景的一种重要的工作负载,该业务包含前端,声学模型和声码器。声码器用的是LPCNet,该声码器是一个C语言版本,在不改变代码的情况下,使用英特尔编译器的高级选项来进行优化,使整个工作流的实时率比优化前降低了72.1%,处理效率提升了2.58倍4,优化前后的性能对比如图 4 所示。
成果:助力学生高效提升英语口语水平
一起教育科技与英特尔的合作为 AI 口语测评平台奠定了坚实的基础,不仅有效降低了实时率,满足了口语测评服务实时响应的需求,还能够支撑业务高峰期海量的服务请求,降低基础设施压力。具体而言,双方的合作实现了如下成果:
口语测评结果“秒速”提供:由于口语评测实时率的降低,学生在进行口语练习并提交平台评测之后,平台能够近即时地将评测结果反馈给学生,以便其进行针对性的纠正与学习。而语音识别与语音合成性能的提升,则为用户的口语学习提供了更高效的跟读训练、智能对话等服务。
口语测评服务始终稳定如一:得益于第二代英特尔 至强 可扩展处理器的高性能,以及一起教育科技在混合云架构与服务方面的创新,一起教育科技可以确保在高峰期也能为用户提供稳定高效的评测服务,避免响应缓慢等问题。
TCO 得到显著控制:相较于 GPU 服务器,基于第二代英特尔 至强 可扩展处理器的 AI 服务器有着更为显著的 TCO 优势,能够帮助一起教育科技在业务的快速扩展过程中,提升投资回报率,为师生带来更具价值的服务。
一起教育科技AI Lab负责人饶丰指出:“我们与英特尔建立了良好的合作关系,推动了 AI 口语测评平台的性能持续优化。基于该基础设施平台,我们时刻跟随各地区教学实践要求的变化,为老师们提供更加精准的分数评判体系,为学子们提供更加有效的学情反馈,为推动全国各地区英语口语教学的不断进步而贡献力量。”
未来展望:加速智慧教育革新
一起教育科技透露,其未来将在三个方向推动口语评测平台的优化与革新:首先是全开放口语题的评测支持;其次是中小学生口语能力水平的评定,从多个维度评价口语的应用能力,更契合教育部的中小学学科核心素养的评价;第三个方向是提供满足地区化差异的评测方案,实现语音评测的本地化,根据地区教育水平的差异进行本地化的适配。
为了支撑以上三大目标的实现,一起教育科技将与英特尔围绕创新硬件选型、AI 性能优化等方面进行更加深入的合作,发挥英特尔在端到端 AI 产品与技术方面的优势,从而为 AI教育应用提供强大的算力支持,实现跨架构的算法移植与优化,进而赋能智慧教育,提供高效、公平、个性化的教育服务。
关于一起教育科技
一起教育科技(NASDAQ: YQ)是全球领先的K12智能教育平台。怀着“让学习成为美好体验”的使命,一起教育科技致力于用先进的教育科技、优质的教育内容和持续的教育热情,为K12阶段的学校、家庭、社会教育场景,提供更为高效、美好的产品和体验,开启了智能教育新时代。
关于英特尔
英特尔(NASDAQ: INTC)作为行业引领者,创造改变世界的技术,推动全球进步并让生活丰富多彩。在摩尔定律的启迪下,我们不断致力于推进半导体设计与制造,帮助我们的客户应对最重大的挑战。通过将智能融入云、网络、边缘和各种计算设备,我们释放数据潜能,助力商业和社会变得更美好。如需了解英特尔创新的更多信息,请访问英特尔中国新闻中心newsroom.intel.cn以及官方网站intel.cn。
1 实时率(RTF,Real Time Factor)是一个常用于度量自动语音识别系统解码速度的值。它也可以用在以近似恒定速率处理视频或音频信号的处理中(比方说从CD中读音乐)。如果处理一段长度为a的音频信号需要花费时间b,则实时率为b/a。如果,如果处理一段长度为2小时的音频花了8个小时,则实时率为8/2=4。当实时率等于或小于1时通常认为该处理是实时的。
2,3,4 测试数据由一起教育科技测试得出。测试配置:英特尔至强 金牌 6230 处理器 @ 2.10GHz,192G DDR4 2933*6,CentOS Linux 8 (Core),Kernel 4.18.0-193.19.1.el8_2.x86_64,英特尔 C++ 编译器v19.1,GUN 编译器套件v7.3,Python v3.6
英特尔并不控制或审计第三方数据。请您自行审核该等内容、咨询其他来源,并确认提及数据是否准确。
性能结果因使用方式、配置和其他因素而异。更多信息敬请登陆 www.Intel.com/PerformanceIndex。
本文并未(明示或默示、或通过禁止反言或以其他方式)授予任何知识产权许可。英特尔未做出任何明示和默示的保证,包括但不限于,关于适销性、适合特定目的及不侵权的默示保证,以及在履约过程、交易过程或贸易惯例中引起的任何保证。
英特尔运营所需的任何商品和服务预测仅供讨论。就与本文中公布的预测,英特尔不负有任何购买责任。本文中提供的所有信息可在不通知的情况下随时发生变更。关于英特尔最新的产品规格和路线图,请联系您的英特尔代表。
英特尔技术特性和优势取决于系统配置,并可能需要支持的硬件、软件或服务得以激活。产品性能会基于系统配置有所变化。没有任何产品或组件是绝对安全的。更多信息请从原始设备制造商或零售商处获得,或请见 intel.com
在特定系统的特殊测试中测试组件性能。硬件、软件或配置的差异将影响实际性能。当您考虑采购时,请查阅其他信息来源评估性能。关于性能和基准测试程序结果的更多信息,请访问:www.intel.com/benchmarks
英特尔、英特尔标识以及其他英特尔商标是英特尔公司或其子公司在美国和/或其他国家的商标。文中涉及的其它名称及品牌属于各自所有者资产。
© 英特尔公司版权所有
特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。