2020 年是不平凡的一年,突如其来的疫情,虽然改变了人们的生活方式,但却为人工智能的发展按下了加速键,语音的「非接触」交互优势被充分的挖掘和放大,语音 AI 也迎来了行业红利期。
在经历了上半年的「沉寂」后,语音 AI 企业在下半年集体「蓄势待发」了。
语音 AI 的「多事」之秋
8 月,思必驰完成数亿元 Pre-IPO 轮融资,距离上一轮 4.1 亿人民币融资仅五个月。思必驰旗下芯片设计公司深聪半导体,则于 12 月获得数千万元人民币的 Pre-A 轮融资,或将推出下一代语音 AI 芯片。
9 月,百度宣布小度科技独立融资,百度依然保持了对小度科技的绝对控制权,投后估值达约 200 亿元。继智能音箱取得多项全国第一后,小度发布首款「破圈」产品小度真无线智能耳机。
10 月,声智完成 B+ 轮融资,加速远场语音交互和人工智能操作系统的应用场景落地,同时面向 C 端发布首款支持免唤醒智能语音交互的耳机。
10 月,杭州国芯科技完成数亿元 C 轮融资,三个月前,杭州国芯发布了首款超低功耗的应用在可穿戴领域的 AI 芯片,开启了全新的基于「人-车-家」全场景的落地之路。
11 月,云知声获得科创板上市受理,招股书显示,司最近三年营业收入复合增长率为 89.37%、超过 20%。
12 月,传闻称 Rokid 已完成新一轮融资(未被披露),正拟拆 VIE 架构,准备登陆科创板。
语音 AI 作为人机交互的新希望,激励了众多随风起舞的独角兽,政策、资本的利好,让这些快速成长的企业直指一个目标——科创板上市。
闯关科创板
12 月 7 日,科创板迎来了自 2019 年 7 月 22 日开市以来,第 200 家上市公司。
据统计,这 200 家上市公司所处的行业高度集中在高新技术产业和战略新兴产业。其中,新一代信息技术领域的企业有 65 家。虽然其中聚焦 AI 的企业并不多,但每一家都受到了广泛的关注。
而作为科创板首个递交招股书的语音 AI 企业,云知声能否成为继 2008 年科大讯飞深交所上市后,第二家上市的语音 AI 企业,一时间也成为人们关注的焦点。
云知声定义为一家为企业和用户提供智能语音技术和综合解决方案的人工智能企业,主营业务包括提供智能语音交互产品、智慧物联解决方案、以及人工智能技术服务。
人工智能行业正处于高速发展阶段,而公司作为行业内极具竞争力的厂商,云知声经营规模和资产规模不断扩大,主营业务收入呈逐年增长的趋势,从 2017 年的 6114.07 万元,增长至 2019 年的 2.19 亿元,年均复合增长率达 89.14%。主营业务占总营收 99.87%,主营业务毛利率为 31.66%。
从盈利能力和经营风险的角度来看,云知声的核心技术的商业化探索仍在持续进行,营业收入规模较小。与此同时,为持续构建核心技术和产品体系、保持竞争力,公司持续加大研发投入。公司目前仍在不断探索新的业务方向并相应适当调整经营策略,预计公司在短期内仍无法实现盈利。
基于此,云知声选择适用《上海证券交易所科创板股票上市规则》第 2.1.2 条第一款第二项的上市标准:预计市值不低于人民币 15 亿元,最近一年营业收入不低于人民币 2 亿元,且最近三年累计研发投入占最近三年累计营业收入的比例不低于 15%。
目前在已上市的 200 家上市公司中,有 10 家企业选择第二套上市标准。
这是语音 AI 企业递交科创板的首份招股书,它映射了云知声和很多其他语音 AI 企业在主营业务上的商业化探索。
商业化探索之路
云知声创立于 2012 年,从创立之初就围绕智能语音市场需求,为企业和用户提供智能语音技术和综合解决方案。
2012 年仍是语音 AI 商业化的萌芽阶段。在此之前的 2011 年,苹果 Siri 随 iPhone 4s 初次亮相;随后的 2012 年,Google Now 出现在安卓 4.1 和 Nexus 手机上;2013 年,微软 Cortana 语音助手在年度 Build 开发者大会上首次亮相;直到 2014 年 11 月,亚马逊 Alexa 语音助手和 Echo 智能音箱在黑五促销季亮相,从而引爆整个语音 AI 产业。
这一期间,海外的语音 AI 的商业化之路仍在探索,国内的语音 AI 几乎还是一片空白。
云知声较早的发现商机并持续围绕着「算力+算法+数据」构建基础架构,完善技术体系,打造独特的「云-端-芯」产品中台,对核心技术进行了模块化梳理和整合,从而具备面向市场需求的快速产品化能力,支撑公司以丰富的产品组合为众多知名企业提供服务。
2012 年,云知声率先将深度神经网络(DNN)应用于商业语音识别系统,例如,后来涌现的卷积神经网络(CNN)、回归神经网络(RNN)、端到端序列建模、生成对抗网络(GAN)等主流技术方法,云知声都是业界最早的产业实践者之一,这也让云知声在算法方面有了坚实的根基,并在后来始终保持高效的演进速度。
2012 年 9 月份,云知声率先推出免费的语音云平台,允许各类应用开发者免费在线实时调用公司基础智能语音服务。
2014 年初,云知声亦是行业率先,提出了面向物联网的「云-端-芯」核心战略,将三个模块不断整合,形成了面向市场需求的快速产品化能力。
从 2015 年开始,云知声启动了造芯计划。通过设计专用的 AI 加速器并重组芯片架构来支持密集的边缘计算任务,打造语音 AI 核心 IP,让各项人工智能核心技术具备运算密集型的特性,对硬件算力有刚性需求。
也是从 2015 年开始,云知声的智能语音交互产品也日渐丰富起来,包括以软硬一体形式为主进行交付的物联网语音交互产品,和以软件形式为主进行交付的智能语音工具产品两类。
与此同时,以家居、医疗场景为突破口,率先完成智能语音解决方案的商业化落地。
在家电领域,云知声的智能语音交互方案已被格力等家电龙头采用;在酒店、商业地产和住宅领域,世茂集团与云知声成立合资公司,落地整屋和全场景的智能化;在医疗领域,公司相关产品得到北京协和医院等近百家医院的高度认可,此外,公司与平安好医生成立合资公司,试水医疗领域智能硬件产品的开发;在汽车领域,公司与亿咖通成立合资公司,为戴姆勒奔驰等整车厂提供车载语音解决方案,并携手探索基于自研车规级人工智能语音芯片「雪豹」的车载语音解决方案的应用。
云知声的主要盈利模式包括三类:
1、向客户销售标准化程度较高的智能语音交互产品,以软硬一体、软件或云服务形式交付为主;
2、为客户提供具有一定定制化成分的场景智能化解决方案,交付内容通常包含硬件、软件和服务;
3、面向部分细分行业龙头客户所提供的定制化人工智能技术服务。
为持续提升技术领先性和加速技术产业化,云知声计划将募集资金投资于下列项目:人工智能技术中台建设项目;面向物联网边缘计算的人工智能芯片研发平台建设项目;基于人工智能技术的智慧医院解决方案建设项目。
在技术层面,将夯实硬核技术实力和全栈技术体系。
在产品层面,将进一步完善及提升「云-端-芯」产品中台能力,以完备的产品技术组合、统一的解决方案、开放的平台能力,夯实支持「万物智联」的落地能力。
在商业层面,将持续打造「U(云知声)+X(场景)」智慧商业生态,形成科技驱动的运营服务和产品增长的良性闭环。
语音 AI 的希望
语言,是人类最自然、最便捷、使用频率最高的沟通方式,也是未来人机交互最重要的方式。
在人工智能发展的 60 余年中,智能语音是发展最早、最重要、发展最成熟的技术方向之一。同时,因为语言天然附带的思维属性和应用复杂性,也是人工智能的技术制高点,行业成熟度高、市场潜力巨大。
伴随智能音箱和语音助手在家庭、出行等领域的不断渗透,语音 AI 在离大众最近的消费级 IoT 领域,正在成为各种终端设备至关重要的入口。尤其是在 5G 推动万物互联的关键时刻,语音 AI 在物联网场景中将极大受益。人机交互模式也进入了语音交互、键盘输入、屏幕触摸等多模态融合的万物互联新时代。
据市场调研机构 Juniper Research 预测,到 2023 年,全球语音助手的使用量将达到 80 亿,而智能音箱和智能可穿戴设备端的语音助手使用量将有超过 40% 的增长。
与此同时,语音 AI 的相关技术正处于爆发期:深度学习利用深层模型替换声学模型中的混合高斯模型,颠覆语音领域的算法设计思路,使得语音识别领域实现了有效突破,性能得到快速提升;而海量真实语音数据又为深度学习算法提供基础原材料,成为深度学习突破声纹识别的关键因素,有效降低识别错误率;云计算与高性能计算机则为深度学习提供强大的运算能力和服务能力。
尽管具备语音交互能力的设备量正在井喷,但用户对于交互效率的期待一直很高。据调查,对于语音和语义识别准确度的关注比例高达 84.2%。可以预见,在三大技术的助力下,语音识别准确率将逐步上升,用户满意度也将不断提高,从而为智能语音行业的发展打下坚实的技术基础。
在商用场景,随着各垂直行业的信息化建设基本完成,智能化建设方兴未艾。
以医疗场景为例,在 21 世纪的前 20 年基本完成了医疗信息化的初步改造,如办公自动化、数据数字化等智能化改造的前置条件基本完成,为进一步的人工智能场景化应用,如就诊流程智能化、诊治手段智能化、空间场景智能化等提供了巨大的行业发展机会。其他垂直领域如金融、交通、生产制造、行政管理等也存在类似的信息化建设基础 和智能化建设机会,人工智能技术的场景化应用将成为大势所趋。
据 Meticulous Research 发布的报告,预计到 2025 年,全球语音和语音识别市场的规模将达到 268 亿美元。
云知声只是行业的一个缩影。放眼全球,Nuance、Cerence、科大讯飞、思必驰、出门问问等各家在语音 AI 领域耕耘的智能语音技术公司,以及 Google、苹果、亚马逊、百度、小米等国内外互联网科技巨头,正在竞争与合作、以及不断的跨界和破圈中,推动着语音 AI 在更广阔的商业化应用场景,落地、生根、发芽。
微信号:shenzhenware
主笔:周森 / 深圳湾
编辑:陈述 / 深圳湾
插图制作:达达 / 深圳湾
题图说明:电影《人工智能》,2001 年上映。
特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。