-
深耕汽车行业20年的讯飞语音:飞鱼音效,开启整车智能的大局
老范说评 / 2021-11-22 17:27 发布
1 智能汽车是 AIoT 时代最重要的终端之一
目前计算机行业最重要的“天下大势”是:
我们正从移动互联网时代进入AIoT(万物智联)的时代,其中最重要的就是计算终端将从标准化统一的平台走向碎片化非标准化场景,而智能汽车是AIoT时代最重要的终端之一。
在标准化终端PC、手机上靠“杀手级”应用“一招鲜”就能够通吃天下的时代已经过去,无论是基础软硬件、应用场景甚至到业务架构,都要适应从“一统天下”到“合久必分”的碎片化智能物联时代的需求。
进入AIoT时代的最大红利也对企业提出了不同于移动互联网时代的要求:
1、软硬结合或者云-端-芯全方位布局,才能使得终端与业务能够覆盖不同类型的碎片化场景;
2、企业架构与业务能力要能够适应跨行业的碎片化场景落地;
3、具备能够高效复用的技术平台,赋能各碎片化场景的同时,形成数据反馈的正循环。
科大讯飞无疑符合以上三大要求,而汽车场景因为其限定空间的交互范围、限制双手的交互要求以及复杂抗噪所需要的极高AI技术门槛,成为科大讯飞大显身手的重要AIoT市场。
2 深耕汽车行业20年的讯飞语音
公司于2011年以量产第一代智能语音车载产品为起始,开启了与汽车行业深度交融的20年 历程。
根据公司官网数据,目前总体交付超1000多个车型项目,同时与90%以上的中国自主车企和 合资车企进行合作,覆盖2900万辆及以上汽车前装搭载。
公司的产品迭代和布局其实是核心技术的不断演进的缩影。
根据公司的核心技术:语音合成、识别、认知智能等,可以清晰地将车载交互分为三代,目前仍处于第二代末及第三代萌芽阶段:
第一代的形态是以基础的语音控制功能实现以命令词识别交互的状态为主,公司于2014年 完成全产品线支持;
第二代于2017年开始转向面向内容搜索的多维交互,从而识别上下文进行多轮交互的识别,同时进入到音场领域,通过软件的提升模拟声音音场的效果,从而提升用户声音的感知能力;而经历两代的发展之后的第三代车内语音的交互必将是往多模态、多区域、多乘客的角度发展,同时通过高阶声场区和独立听觉分区达到高阶的体验感。
3 车载音响——补足整车智能的新一块拼图
汽车智能化的最终形态是全方位、全模态的智能交互。
目前伴随着车机系统和自动驾驶等相关技术的逐步落地,智能屏和L2及L3的自动驾驶体验也触手可及。
而延续数十年的配件体系并无过多更新,整体与智能化呈现互不匹配的格局。公司于11月18 日发布的“飞鱼音效”,旨在为相关配件开启智能化先河。
公司通过自身技术平台+赛道的模式形成在汽车智能座舱全产业链技术优势与积累,最终赋能飞鱼音频管理系统,确保音乐元素分离技术实现智能声场效果。
依托公司对语音以及车联操作系统的深耕,公司在汽车领域的业务处于稳步上升之势,2019 年汽车总营收为3.71亿元,2020年在全球汽车销量及产量双重挫的情况下,仍能确保相同量级的营收。
而此次发布会的产品将音频落实于车内、行车场景下,实现多重体验功能,整体汽车领域布局进一步完善。
软硬件实现双轮驱动,映射至讯飞音响的“皇帝位”听音。
传统的车载音频系统发展尚不及智能化的需求,目前主要存在三个问题:
1)由于车内空间较小,不足以产生混响效果,导致声音比较局促;
2)由于车辆内部结构限制,车内扬声器的安放并不能实现最优方案,声场较为杂乱;
3)车内扬声器与乘客的相对位置并非为最佳匹配。
而解决三大痛点的飞鱼系统通过先进的软硬件配置形成7大功能:声景空间、虚拟现场音效、品牌声浪、专属音频、车内降噪、聊天优化、声学空间。
通过音频系统、调音能力以及算法能力三管齐下之势,满足用户日益严格的听觉需求。
硬件方面,公司通过飞鱼智能音频管理系统内置自研的音频计算平台。
该计算平台使用高性能浮点DSP处理器,相较于传统的定点DSP处理器,高性能浮点DSP处理器具有1GHZ高速音频处理加速器、128通道数字音频处理能力以及支持高达24bit、96kHZ 的高清晰音频,更是让其性能远超行业主流的定点DSP处理器性能的十倍。
软件算法层面,飞鱼智能音频管理系统依赖AUTOSAR结构和公司专精的音效及语音质量评级标准,可实现全车独立声场分区,实现主驾、副驾、后排乘客互不干扰的语音交互模式。
同时,全自主知识产权的3D沉浸环绕音等高级音效算法可对音频进行即时的高质量还原,具有虚拟声学空间、发动机主动降噪、车内交流补偿等高级智能车载音响系统的高精尖技术,能够为每一辆车营造出广阔无垠的声场空间。
独木成林,“讯飞开放平台”加速商业化落地,全方位助力产品生态圈形成。
2010年,讯飞开放者平台正式上线,经过10年的培育和发展,开发者伙伴基于讯飞开放平台开发的应用和智能硬件规模不断扩大,开发者伙伴的“端”、“芯”与讯飞开放平台的“云”已实现一体化,并形成了可以共同运营的流量。开放者平台的布局使得智能语音的发展空间已远远不止下游 B 端品牌设备商在设备开发过程中支付的技术付费。
一方面,技术提供方可以通过提供芯片、麦克风阵列解决方案、AI算法的全链方案,增加技术输出的“厚度”;另一层面,开放者平台令使研发环节的模块标准化成为可能,开发配置的门槛得以进一步降低。
技术层面的“解压”让公司更加注重应用场景的理解与用户交互体验感的优化。
公司已形成“云-芯-端”的AIoT生态圈。开发者伙伴基于讯飞开放平台开发的应用和智能硬件规模不断扩大,开发者伙伴的“端”、“芯”与讯飞开放平台的“云”已实现一体化,并形成了可以共同运营的流量。
目前,“云-芯-端”的生态圈已成功应用在To C产品线中。
C端产品中,讯飞翻译机、讯飞智能会议系统、讯飞录音笔等智能硬件设备底层采用AI芯片,顶层嵌入打包好的AI算法,能够使用户离线使用;
讯飞有声、讯飞输入法及讯飞智能转写等软件服务主要采用深度全序列卷积神经网络,研发出高精度的记忆增强式多通道端到端语音识别技术,从而落地语音输入、语音交互、语音记录等典型应用场景;
讯飞开放平台主要为用户提供自主软件开发平台,并利用开发用户所形成的产业生态,持续地从终端使用中提供其未来发展战略决策的一线数据支撑。
根据讯飞开放平台官网数据,讯飞开放平台已拥有396项AI产品及方案,合计链接200万+合作伙伴共建人工智能生态。
受益于开放者平台,公司成立“科大讯飞智能音效生态联盟”,进一步整合行业资源。
本次活动上,科大讯飞与广播电视总台云听、喜马拉雅、爱奇艺、芒果动听、雷石、酷我等音效合作伙伴以及讯飞音乐、讯飞听见等集团内部生态资源形成联盟之势。
在首批生态伙伴中,作为国内优质的音频内容生产和分发平台,喜马拉雅为飞鱼系统提供包 含98个品类的2.9亿条音频,可以满足不同场景的驾乘声乐需求;
而作为国家级5G声音新媒体平台,云听在车载领域开创了“场景化+智能电台流”的应用,可以根据用户收听行为及喜好,针对不同的出行场景,基于移动端800多套广播频率、300万小时有声内容,按需推送音乐、新闻、娱乐、电影、旅游、科技等优质丰富的节目。
多家合作伙伴在不同细分音频领域持续提供海量数据,为公司坚持数据反哺核心技术迭代的战略布局形成有力支撑。
4 报告总结
公司作为国内人工智能龙头企业,正进入人工智能2.0阶段。
公司自身在AI赛道的车载智能音响补足整车智能的的发布展现公司AI全产业链覆盖的野望,同时伴随着汽车智能化行业的高景气度,有望进一步扩大市场份额。
预计公司21-23年实现营收169.3/226.9/299.5亿元,实现归母净利润20.8/27.0/30.9亿元,当前市值对应22/23年PE分别为47/41倍。
5 风险提示
1.市场竞争风险:
整车智能交互是汽车智能化的终极格局所在,各Tier1也在逐步推出相关产品,公司面临产品同质化和竞争加剧等风险;
2.新业务推进不及预期的风险:
车载音响与自动驾驶的定位不同,相比较自动驾驶,配件智能化的推进速度有可能不及预期;
3. 用户增长不及预期风险:
智能化汽车增长不及预期有可能导致公司产品推广受限的风险。
详细操作策略可以添加本人薇,搜索本作者名字的拼音即可