能听懂人类“弦外之音”,阶跃星辰再开源端到端语音大模型
创始人
2025-09-01 12:16:22
0

9月 1 日,“多模态卷王”阶跃星辰正式发布开源端到端语音大模型Step-Audio 2 mini,在多个国际基准测试集上取得SOTA(State-of-The-Art,当前最佳水平)成绩,在大部分任务上超越GPT-4o-audio。

技术层面,Step-Audio 2 mini采用了端到端多模态架构,将语音理解、音频推理与生成统一建模,时延更低、输出更快,还能更加精准地理解副语言信息、非人声信号等语音要素。Step-Audio 2 mini首创的音频推理能力,能对情绪、语调、音乐等副语言和非语音信号进行精细理解、推理并自然回应。

同时,该模型支持语音原生的Tool Calling能力可实现联网搜索等操作,有效解决幻觉问题,并让语音模型具有知识储备和推理能力。

目前,Step-Audio 2 mini已在GitHub、Hugging Face等平台发布。(澎湃新闻记者 秦盛)

相关内容

最新资讯

安卓原生系统怎么改为小米系统,... 你有没有想过,你的安卓手机里装的不是小米系统,而是其他品牌的原生系统?别急,今天就来手把手教你,如何...
wps打印不受支持安卓系统,W... 最近是不是有很多小伙伴在用安卓手机办公,发现WPS打印功能突然不灵光了?别急,今天就来给你详细说说这...
安卓11桌面系统,桌面系统革新... 亲爱的读者们,你是否也像我一样,对安卓系统的每一次更新都充满期待?今天,就让我带你一起探索一下安卓1...
安卓系统会员免费领取,轻松解锁... 你知道吗?最近在安卓系统上有个超级福利活动,那就是会员免费领取!是不是听起来就心动了呢?别急,让我带...
冒菜安卓收银系统免费,免费打造... 你有没有想过,在繁忙的冒菜店里,如何让收银工作变得更加轻松高效呢?现在,就让我来给你介绍一款特别棒的...
安卓系统免费时代终结,付费应用... 你知道吗?那个曾经让我们免费畅游安卓世界的时代,好像就要画上句号了!是的,你没听错,安卓系统免费时代...
痛!10名教师落聘,老教师垫底... “县管校聘”政策在各个学校激起了层层涟漪。这一次,在某所学校里,一场激烈的竞争正在悄然上演,而结果是...
方程豹钛3「变脸计划」:支持新... 2025年成都车展,方程豹钛3「变脸计划」首发:星战都市前脸上线,技术、审美、合规支撑换脸自由。 ...
看到大伯一家付出悲惨的代价,才... 我一走出考场,爸妈立马就接我去了医院。 两人都蒙了,完全搞不懂怎么回事。 我的成绩一塌糊涂,本来考试...
社团招新 | 叮咚~您收到了一... -思源读书会- 招新啦! 刚入大学的小萌新们看过来呀 你现在是否怀着憧憬期待又忐忑不安的心 希望自我...