在文化交流的浪潮中,国产剧展现出了强大的影响力。一位 80 后小伙凭借将国产剧卖到非洲的卓越成就,成功冲进福布斯榜。他敏锐地捕捉到非洲市场对优质国产剧的需求,通过不懈努力,搭建起了中非文化贸易的桥梁。他精选各类精彩国产剧,让非洲观众领略到中国文化的魅力。在这个过程中,他不仅实现了个人价值的突破,也为促进中外文化交流做出了重要贡献,成为了连接两国文化的纽带,书写了属于自己的传奇篇章。
作者 | 向治霖
编辑 | 谢奕秋
新媒体编辑 | 宝珠
视觉 | 诺言
5月,2025福布斯中国人工智能科技企业TOP50榜单发布,“趣丸科技”在其中的显眼,不单单因为它是广州唯一一家上榜的企业,还因为它很“脸生”。搜索这家公司,它更被熟悉的身份,是以兴趣(游戏)社交、电竞为招牌的一家互联网“中厂”。
实际上,趣丸科技在AI领域动作频频。
去年,趣丸先后推出“音频大模型”MaskGCT和“音乐大模型”天谱乐,两个模型初步证明了趣丸的AI能力。今年,趣丸在社交大模型上也有所探索,预备在“AI+社交”的赛道上拿出“杀手锏”。
AI领域高手如云,一家多年耕耘细分领域的互联网公司何以闯入,以至“榜上有名”?
趣丸科技/受访者供图
南风窗近日专访了趣丸科技创始人宋克,他讲述的,不只是一个互联网公司“转型”的故事,更是一个有十多年履历的创业老兵对AI时代的理解与思考。
不难发现,趣丸推出的模型,针对的依然是细分领域,音频、音乐、社交等等。比起那些高呼生产力、扬言要“颠覆底层逻辑”的大模型公司或者“AI原生”公司,似乎是不务正业。宋克告诉南风窗,这背后关系到对AI能力及其商业化逻辑的思考,趣丸的“玩物丧志”,是有意而为。
AI必然要改变世界,但改变的方式还不一定。风起至今,“小龙”“小虎”们几起几落,市场冷静后,发现追求“革命性的颠覆”既非坦途,也不是唯一的路。
从X到AI
中国大部分AI创企的故事,要从2023年前后、也即ChatGPT“出圈”后讲起,但趣丸的“转型”时间更早。
2021年,在“语音+社交”领域站稳的趣丸,一度陷入焦虑。“我们在移动互联网的新产品,都败了。”宋克直白地说,那个时期,公司发现不管哪一个赛道,都已经有巨头把持,难再入局。因此,趣丸内部开会探讨,要做一家怎样的公司并持续创新?
宋克平头,微胖,“80后”,曾经是个“网瘾少年”。趣丸做兴趣(游戏)社交,拥有四支电竞队伍,用他的话说,是“把兴趣做成了事业”。
追问他自认为的高光时刻,他说出两个,都与游戏相关:一个是在2013年9月到10月,他刚到广州创业一两个月,在第一个月赚到29万,“真的是(靠)打游戏赚到了钱啊”,他加重语气强调;另一个仍是创业初期,那是趣丸的游戏社交应用“TT语音”用户达到30万人的一刻,从此团战叫人不再麻烦,也不用多花短信费用,“太开心了”,宋克讲道。
TT语音曾经的品牌代言人为杨超越
有这样的经历,宋克把“兴趣创造价值”作为了趣丸的价值主张;他也会在公司里强调,时下年轻人流行什么,大家就一定要去研究和尝试,“用好奇心保持活力”。
回到2021年,趣丸内部讨论过后,成立了一个叫“X”的项目组。宋克说,这是个探索技术的团队,对他们没有KPI及任何的考核,也不设置盈利目标,任务只是去调研市场上最新的技术,项目组有十几个人,“不能说是技术很牛的人,但一定是对技术很有兴趣和追求的人”。
宋克的想法是,既然用户的需求已经被解决了,那么趣丸能做的,是找到新的技术再“反攻”。这表明,趣丸针对的还是“老的”互联网市场,只是在探索过程中,发现一些需求只能由AI来满足,或者AI能够更好地满足。
2021年,OpenAI的GPT-3已经震惊AI圈内,但大模型还不是一门显学。趣丸一开始的探索,也不是冲着AI去的。
OpenAI的GPT-4o模型评估
“大事都是从一个很小的点开始。”宋克说。趣丸拿住了语音赛道,但短视频明显正在升温,宋克想到,很多声音好听的人,不一定希望以真人形象出镜,“我们当时想到直播时,把主播的脸换成动漫脸这样的技术”。2021年、2022年,“换脸”还不像今天这样普遍。
但是技术攻克下来,产品上线以后,用户不买账。用户会觉得,换脸的主播一定不好看,不然为什么换脸呢?于是,这项技术就被搁置起来。
2023年,元宇宙爆火,让宋克灵光一闪。元宇宙打造的“数字孪生”,把真人数字化,实质也是换脸,只不过是把真人脸换成同一张数字人脸。“我们储备好了这项能力,甚至所有工程都不用再开发。”宋克说,于是趣丸快速切入,成为美团数字人直播的第一家技术提供商。
入局以后,关于声音的技术问题自然浮出。
数字人直播早期,可选音色少,语音复制也很粗糙,更关键的是,虚拟的声音“机器味”太重,“说话没有人味”,观众自然不爱看。
数字人直播早期并不受欢迎
此时,大模型已凭借对自然语言的理解能力大为火热,宋克想到,越过“恐怖谷”的最好办法,可能是将大模型对文本的理解与输出能力,平移到语音领域。
这就是趣丸“音频大模型”MaskGCT的序章,也是趣丸转型AI的脉络。如今的X项目组改名为人工智能事业部。宋克在采访中一直强调,趣丸不是为了AI而AI,而是在发现用户需求与解决问题的逻辑下,顺其自然。
AI前后,同与不同
宋克还记得ChatGPT带来的震撼,它把AI分出前后两个时代。趣丸最开始做数字人的时候,用的是传统建模技术,“特别麻烦”。宋克说,过程中用到很多相机,对一个人拍个半天,这人还要说很多的话,才能做出来。
类似的效果,在大模型时代只需说一句话。
ChatGPT以前也有AI,“那时候算法+规则,我们就叫AI了”。宋克用趣丸旗下产品“唱鸭”的歌曲生成为例,“算法+规则”时期,和今天一样输入歌词,也能得到一首歌,但“生成”过程由编程好的规则来定,什么曲风,用什么调,供用户挑选,“真的是人工加智能”。宋克笑道。
接触了ChatGPT不久,宋克认为,生成式AI是未来最大的一个机会,趣丸要变了。
生成式AI将会是未来最大的一个机会
“生成式AI不是每一首歌都比算法+规则机制的好,但是它的上限很高、下限很低,这是最大的不同。”宋克说。趣丸意识到,趣丸一定要变化,一定要开始去积累数据,要自己下手训大模型。
公司一把手的“行动力”和“决心”,要从预算上来体现。宋克介绍,趣丸并不是一家激进的公司,主营业务的成本很高,但这成本投下去,看得到营收。“平时团队花钱是很抠门的,预算的审批也很慢。”他坦言道。
但他这次变了风格。“我当时逼着团队报预算。”宋克回忆说,每个部门都要报预算,要多少张卡、多少机器,“一次性批掉”,接着公司去找各个云算力厂商谈档期,争取算力。
因为反应快,2023年后一段时间显卡与算力的紧张,没对趣丸造成什么影响。
宋克列举了一项数据,“2024年,花在(训模型)这方面的预算就有1.45亿”,这对趣丸来说是一笔很大的花销。
趣丸科技数字人/受访者供图
砸下重金,宋克看中的是大模型与应用的先发优势。数字人直播卖货,其效果受制于它的数据积累。“大家都做数字人直播,技术很快就能追平,但是我的数字人已经卖了几年的货,数据积累多,销售数据高,对一个商家来说该选择谁,这是很明显的。”宋克说。
数据的“护城河”,叠加强化学习带来的先发优势,是AI与移动互联网时代的一大区别。宋克表示,在过去,产品可以直接抄袭,比拼财力、规模,比讲故事的能力,但这在AI时代就不一定行得通了。
下了决心,不代表没有煎熬。作为“创业老兵”的宋克,也不住地感叹创业难。训模型需要时间,做产品也需要时间,而且加起来时间不短,“重金”砸下去了,听不见响。
“又激动又焦虑,(创业)就是这个状态。”模型能不能训出来,训出来后好不好用,应用侧能不能挣到钱……没有答案。趣丸作为老牌“中厂”,天然倾向于确定性高的事情,但宋克认为:“闯入AI,一切是未知的,可能会死。但你自己知道,如果不去做,你将来就等死。”
把国产短剧搬到非洲
2024年,趣丸的音频大模型MaskGCT和音乐大模型 “天谱乐”问世。宋克说,趣丸是幸运的,训出的模型能用、好用,如天谱乐,在当时已经十分接近行业领先的Suno的模型能力。
在MaskGCT项目立项前半年,2024年初,宋克已经想好模型的定位,七个字“情感情绪多语种”。这七个字的意思是,模型输出的声音有感情,能理解并表现情绪,而“多语种”是考虑到未来的出海,比如短剧的出海,把中文改为多语种,更适应海外传播。
宋克没有把这解释成自己的洞见,他解释说,这背后其实是老老实实的互联网思维——去发现用户的需求。七个字代表的,就是他们当时看到的用户痛点。
而创业有未知的风险,也有未知的惊喜。宋克介绍,有在非洲做影视发行的中国商人找上来,表示有一个需求,在当前的中国其他公司可能解决不了。在非洲通用两个语种,英语和法语,但是非洲人爱看韩剧,于是发行人把韩剧“搬”到非洲,中间还需要跨越韩语到中文,中文再翻成英、法文,效率不高,成本不低。
非洲人爱看韩剧和中国短剧
刚好,这事儿MaskGCT能做。
“他们也没想到,把韩语台词直接改为英语、法语的需求,居然可以由一家中国公司解决。”宋克说。
强调解决需求的“产品力”,超过了强调大模型的能力,是趣丸与一众AI公司的不同。这可能跟趣丸的 “出身”是互联网有关。
天谱乐大模型就是一个典型例子。去年9月,趣丸推出天谱乐,公司高层介绍时,对天谱乐的一句话生成、图片及视频生成配乐等“普通人玩法”面面点到,但更大篇幅介绍的是MidiRender,一种针对音乐人严肃创作的“专业玩法”。
宋克介绍天谱乐时也提到MidiRender,它能以音乐人创造的旋律为底本,在生成时接受严格控制,并且是在音轨、音阶、采样率等方面的精细化控制。效果上,“音乐人可能以前要用一个月制作的歌,现在一个小时可能就出来了”。
天谱乐AI
宋克的逻辑清楚明了:“小白要玩音乐,天谱乐的能力也是有的、可以满足,但普通人更多是尝鲜玩下,尝过以后就算了,是低频的。对音乐人来说,这是他的工作,他才是高频用户。”宋克解释,因此在商业化的角度,应该围绕音乐人、创作者去打造产品。
了解用户是谁、发现用户需求,再去为他们提供辅助、解决问题,这是宋克的思维习惯。
这习惯的另一面是,他对一款应用是否是“AI原生”,或者趣丸是不是一家AI公司的问题,并无执着。
作为互联网创业者,宋克懂得“行规”,一些酷炫的概念或材料,比如“超强AI”“原生AI”,又或是“勤于打榜”,前缀定语很长的某个“第一”,其实目的很“复杂”。他特别提到,“很多早期的模型公司,我很不认可他们讲的这个那个模型的能力有多强,就能够挣多少多少钱”。
模型能力与盈利收入不一定成正比
讲模型能力的有很多,但很少有人讲的是,这个产品是给谁、提供了什么样的价值,以及基于这个价值的商业化该怎么做,那么,其实“从模型到所有的前置设定,都是不成立的”。
模型能力与价值、商业化,混为一谈是不行的,这是宋克作为商人的基本嗅觉。
价值主张上,趣丸团队也有明显的不同,即不追求“AI替代人类”。从天谱乐到MaskGCT的主打功能上,其实不难发现这一取向。宋克承认了这一点,并称一位趣丸同事的话很让他认同,这句话是“AI时代,算法是犀利,但重要的是人,因为洞察与热爱永远不会被替代”。
在硬科技领域,这句话显得“鸡汤”,但是不妨一尝。
元年之年
AI会怎样改变人类社会呢?宋克也想知道答案。
对于趣丸的定位,他想得很清楚,“趣丸是一家拥有AI能力的公司”,以人的需求为核心,提供辅助,也提供娱乐消遣。度过了互联网时代,对趣丸能否在AI时代“活下来”的问题,他倒回答得很豁达,自称对过程在意,对结果不在意。无论结果,“至少不要在30年之后,说什么当年我要是去干了AI会怎么怎么样这样的话题”。
AI圈内喜欢“元年”的说法。2023年是“大模型元年”,2024年是“智能体元年”,2025年则被称为“应用元年”。今年元旦,宋克是在美国硅谷度过的,他笑道,当天喝了点酒,他也发了个“应用元年”云云的朋友圈。
“应用元年”过半,AI元年真的遍地开花了吗?宋克认为,是的。他的依据是,当下大模型概念已经足够普及,其实圈内也不会再在模型层面去强调能力了。人们已经在大量地使用AI工具和产品,而这一趋势正在扩大AI公司的营收。
AI音乐创作秀《谱梦行》通过“天谱乐AI”与两位唱作型歌手ICE杨长青、上上的精彩合作/受访者供图
应用元年的关键,在于怎么理解 “应用”。宋克的思维并不 “守旧”,他认为,“应用”在AI时代并不是指APP,“应用元年”的意思是,AI的能力真的被拿到各行各业、并且被大量的人使用。这个角度上,应用元年已经成了。
一个明显趋势是,使用AI的人越来越多。宋克带有玩笑性质地说,到2026年,可能是应用爆发年,各家做成了产品商业化的公司,开始有更多的收入,布局更多的场景,良性循环起来。
这样的元年是宋克所期待的。此次采访的第一个问题是,“福布斯中国”的榜单上,趣丸何以成为唯一上榜的广州公司?宋克回答,不是趣丸做得多好,是广州创业者的气质相对务实,所以在强调大模型的时期显得低调。
但是,“应用端慢慢爆发的时候,广州上榜的企业会越来越多,因为我们这里做的事更偏向于用户端、应用端,务实的事情。我觉得这个时间窗口已经非常临近了”。