不知道大家有没有想过这样一个问题:智能手机可以用手和眼的配合精准触控输入,但是到了车上,手需要握着方向盘,眼睛要看着前方的路,这时候怎么办?当前最优秀的解决方案就是智能语音交互,它可以代替你开车时的触控操作。
根据盖世汽车的统计数据,至今年 4 月,思必驰成功跻身语音供应商市场装机量榜单 TOP 2。而在去年年初,思必驰的排名还是第五, 一年时间内,市场占有率增长到了 15.9%,迈入头部阵营。
2025 年再谈车载语音,汽车厂商和用户的期待可以用两个词来总结,一个是智能,另一个是深度融合。特别是 AI 大模型时代来临,汽车语音到底能为车内的乘员做哪些有意义的事,依然是值得深度探讨的话题,而思必驰恰好就是这一领域技术落地的先行者。
最近,我们与思必驰智能汽车事业部副总经理曾春华进行了一次深度对话,让我们找到了过去一年时间思必驰高速增长的秘诀。思必驰正乘着 AI 的东风,让智能语音真正成为车里可以信赖的伙伴。
01全链路语音方案,车企可灵活配置
当我们回到语音交互的起点,就能发现早期的语音交互更像是个「对讲机」。按下按钮唤醒,讲完一句话,对方才能回复。这其中,只有单轮命令,且只能处理简单的指令。
而如今,智能语音已经进化到类似于人与人面对面对话的能力,不需要唤醒,能够连续交互,还有上下文的理解,能够处理口语语境下复杂和模糊的指令。
作为行业内核心的汽车语音系统供应商,思必驰就拥有全链路的语音交互技术。
公开信息显示,目前 思必驰的智能语音方案已深度应用于梅赛德斯-奔驰、奥迪、捷豹路虎、比亚迪、上汽通用五菱等 60 多家汽车品牌的 200 多款量产车型。
不过,这么多车企与车型,一定会有各不相同的产品定义,而对于思必驰而言,既可以给车企全套的语音交互能力,也能够根据车企需求提供部分能力,当然还能够按需定制。
在开发语音功能之前,思必驰的出发点其实有两个,其一是便捷,第二是安全。根据曾春华的介绍,车企端和用户端的需求也会被充分考虑。
比如,车企希望语音助手能够实现差异化,思必驰就能在其中部分能力中,与车企共同研发。
发掘用户的需求其实相对困难。比如智能汽车用户早已熟知的可见即可说功能,其实最早就是车企发现,很多用户对着车机屏幕显示的文字说话,这才有了可见即可说的能力。根据曾春华的介绍,类似这样源于用户的需求,思必驰会与车企联合定义,确定产品需求后,会先在内部做先行概念版本的验证,之后进行灰度测试,最后量产搭载。
02AI 时代的变革
如今,AI 已经深入了我们的工作、生活的每一个角落,也包括汽车。语音作为智能座舱交互的重要入口,自然也成为了 AI 大模型上车的一个重要载体,车载语音交互进入了新一轮的升级。
思必驰于 2023 年 7 月发布了 DFM-2 东风大模型——拥有百亿参数量。根据曾春华透露,基于 DFM-2 的天琴语音助手已经应用于上汽通用五菱、北汽、长城、一汽奔腾等多家车企的车型中,未来还会有更多车型量产应用。
思必驰的东风大模型既有通用能力,同时也是一个具有通用智能、针对垂域的行业语言大模型。它可以实现通用人工智能的柔性定制,开展大规模、高质量、个性化的人工智能系统定制。
大模型与汽车的智能座舱的究竟要以怎样的方式结合?思必驰率先给出了六种核心能力。
规划定制能力:为用户的旅程或日常活动提供时间或序列维度的规划建议。
创作内容能力: 为用户带来情感化和个性化的内容创作体验,还有为儿童设计的游戏和互动内容。
知识渊博助手: 通用知识、百科常识,车载助理都能提供丰富信息。
多维数据整合: 车载助理可以提供城市限行、新闻、餐厅推荐、地图导航等信息,也能调取车控系统、车辆说明书等封闭领域数据。
高级语义解析: 车载助理具备全场景、跨领域的多意图多轮对话交互能力。可以实现任务回溯跟踪、任务穿插、泛化解析等高级功能。
文档与知识管理: 车载助理能够进行知识归纳、分类和总结。可以提供用车介绍、故障检测、维护保养等信息。
与此同时,为了打造更全能的车载助手, 思必驰给出的解决方案是「1 + N 中枢大模型」,其中「1」负责使用包括大模型在内的各种外部资源,「N」则是N个特定领域的「专家」,用于完成专业性强的任务。
2024 年,思必驰推出了千亿参数量的大模型 DFM-3,曾春华介绍,随着技术能力的迭代,千亿参数的 DFM-3 在深度推理能力上有大幅度的提升。它能够结合 Agent(智能体)相关的功能,甚至联合多个 Agent 的功能做推理,做联合调度。也就是说,DFM-3 在能力上有了大幅升级。
实际上,大模型不仅仅能用于智能助手的服务,思必驰还拥有端到端的大模型能力,相对传统的智能语音链路更高效。
而端到端的 TTS 则是从多段式变成了一段式,当这个端到端模型接收到了人类的声音,可以综合进一个模型处理, 从技术上实现「音频进,TTS 出」的能力,从效果上语音助手可以融合更多维的信号,有更即时和更多情感化的反馈。
AI 大模型的这一阵东风,几乎改变了所有行业,而 AI 恰好是思必驰的看家本领。谈到过去一年时间市场占有率的快速增长,曾春华说:「我们在 AI 行业布局了很多年,在持续深挖 AI 场景的同时,我们也在探索垂直领域应用场景。在智能汽车领域,我们和车厂共同推动产品落地。」
在曾春华看来,未来汽车上的 AI 发展主要有这样几个层面:其一是技术层面,包括多模态交互,端到端的语音技术、大模型的端云协同等。其二是用户体验层面,语音交互将由工具化属性慢慢转变为情感化的伴侣,也可能变成生活管家,实现人与车、环境的深度融合。第三是当前有太多的 AI 工具,AI 生态也会走向融合,让车内有更多可操作、可玩性高的功能。
03增长新引擎,车载方案正在出海
与此同时,思必驰正积极推进出海战略。
目前,思必驰天琴语音助手已经集成自研的 AI 多语种语音交互系统,支持英语、泰语、法语、德语、日语、韩语、越南语、俄语、西班牙语、挪威语、印尼语等 20 多种语言,适配不同区域的方言和文化习惯。在 ICASPP 2023 国际多说话人多语种语音合成挑战赛中,思必驰荣获两个赛道的冠军,MOS 分数达 4.77。
根据曾春华介绍,思必驰智能汽车业务出海将是三个维度的策略。
其一,思必驰将助力自主品牌汽车出海,将智能语音方案搭载到出口车型中。
其二,思必驰与海外品牌及合资品牌合作,一方面在中国市场落地智能语音技术,目前包括奔驰、保时捷等品牌都已经有合作进展。另一方面,基于中国市场的合作关系,逐步将智能语音技术拓展至海外市场。
其三,与纯海外市场车企进行合作,从全球视角正向扩大海外市场。
曾春华介绍:「目前,前一两步我们已经有很多车型在开发了,已在计划中, 可能在今年的下半年就有大量的车出口落地,第三点会在今年到明年重点去做计划和行动。」
04写在最后
思必驰能在竞争激烈的车载语音市场实现快速跃升,并支撑起全面的技术落地与全球化布局,其背后倚仗的正是三大核心能力。
一方面是贯穿技术研发全链条的「硬实力」——全栈自研的深厚积累与优秀的工程化落地能力,这确保了从底层算法到上层应用的关键技术自主可控,并能转化为满足汽车智能座舱要求的稳定产品。另一方面是思必驰深入理解并满足车企和用户需求的「软实力」——产品支持定制化,无论是提供全链路方案还是模块化服务,都能灵活适配不同品牌、不同车型的差异化定位与功能需求。第三,是面向未来智能生态的「开放力」——产品架构的高度开放性,这不仅体现在「1 + N」多模型融合之中,也体现在智能语音解决方案能接入并赋能更广泛的智能场景。正是这三者的有机结合,驱动着思必驰持续处于行业前列。
因此,当我们探寻「动动嘴就能让汽车完成复杂任务」背后的奥秘时,思必驰全栈自研的硬核技术、深度定制的产品策略与开放融合的生态架构,共同构成了最有力的答案。这三大核心能力,不仅定义了思必驰的现在,还将引领其驶向智能语音交互更广阔的未来,让语音助手真正成为每一位驾乘者车内不可或缺的智慧伙伴。
撰文:James
编辑:James