AI疯了!这个模型让所有IP角色同台飙戏
创始人
2025-10-10 22:47:12
0

近日,有开发团队开源了一款全新的角色混合生成模型——MIMIX,实现了不同角色在场景中的自然交互与融合。

现阶段,文生视频已经较为成熟,Veo 3、Sora 等视频模型都能较好地完成文字到视频的转变,并实现简单的交互。

而 MIMIX 模型的出发点则是希望实现角色在不同的世界中自然互动,例如猫和老鼠进入憨豆先生的世界。其中的关键挑战就是在保持每个角色的身份和行为的同时,实现连贯的跨情境交互。既需要保证猫和老鼠的角色行为不变,又需要和憨豆先生在场景中发生自然且符合逻辑的交互。

不仅如此,现有 AI 存在的另一个问题,就是不同角色的混合很容易让 AI产生幻觉,导致风格发生变化,例如憨豆先生变成了猫和老鼠的动画风格。

为了解决这些问题,开发团队引入了一个框架,通过跨角色嵌入(CCE)来解决这些问题,它通过多模态来源学习身份和行为逻辑,以及跨角色增强(CCA),它通过合成共存和混合风格数据丰富训练。

为了让角色保持风格,AI 需要学习大量的数据,要学习角色的外观形象、运动模式以及不同场景下的习惯,同时团队还设计了一套全新的格式来记录角色的身份,让角色和场景区分开来。有了这一全新的格式,在后续的推理过程中,AI 能够识别并维持角色的身份和行为习惯,而不受场景的影响。

据了解,团队采集了4 部影视作品《憨豆先生》《汤姆和杰瑞》《我们裸熊》《小谢尔顿》81 小时的视频建立了数据集,对 52000 个片段、10 个角色进行了深度学习,通过标注角色和风格标签,实现了可控的多角色混合视频生成。

MIMIX 的出现,为影视作品的二次创作乃至原创内容的生成开启了无限的可能性。理论上,只要为模型提供足够的高质量训练数据,创作者就可以生成出媲美原作的高保真度二创视频,实现“关公战秦琼”式的奇妙构想。

当然,正如所有新兴技术一样,MIMIX 目前也面临着挑战。其效果在很大程度上依赖于大规模、精标注的训练数据。当可用的训练素材稀少时,其生成效果的稳定性是否会打折扣?此外,未来的发展方向必然是如何降低数据门槛。模型能否进化到直接从网络上的海量在线素材中进行自主学习和标注,从而实现多角色混合视频的快速、低成本生成?

我们有理由保持乐观。或许在不远的将来,随着模型的不断迭代与优化,普通用户将能够仅凭几张照片或一段简短的视频,就能让自己喜爱的角色出现在任何经典的影视场景中,甚至创造出一部完全由 AI 生成的、多角色互动的全新作品。MIMIX 已经为我们揭开了这扇大门的缝隙,门后的世界,值得我们共同期待。

相关内容

最新资讯

埃基蒂克:利物浦的未来之星,为... 在这个充满竞争的足球世界里,球员的选择往往决定了球队的命运。你有没有想过,为什么某些球员总能在关键时...
审题立意小纸条训练(三):25... 高 考 真 题 版 今天,推出“审题立意训练小纸条”特别版:25年高考全国卷真题版(教师版)。需要的...
鲁教版九年级下册数学电子课本教... 如需全套各科电子课本PDF版(可下载打印) 请关注公众号“禾沐教辅网”( ID: hemujiaof...
深耕华东市场 中国重汽首批黄河... 中国山东网•新感知10月10日讯 金秋时节的合肥,巢湖之畔清风送爽,科创之都活力涌动。近日,“驾黄河...
两度播报|比亚迪第1400万辆... 巴西巴伊亚州卡马萨里—10月9日,比亚迪第1400万辆新能源汽车在巴西乘用车工厂正式下线,标志着比亚...
比亚迪第 1400 万辆新能源... 消息,据比亚迪汽车官微,比亚迪第 1400 万辆新能源汽车在巴西工厂下线,巴西总统卢拉莅临见证,并成...
新赛季争冠棋局:火箭快船各展锋... 新赛季的NBA争冠战役已经悄然拉开帷幕,休斯顿火箭与洛杉矶快船这两支劲旅成为了大家关注的焦点。你是否...
巴西总统成为比亚迪第1400万... 不得不说,最近这几年国产新能源汽车的发展势头是比较迅猛的,与合资新能源汽车相比,国产新能源汽车目前在...
公关媒体发稿:精准传播,塑造品... 在信息洪流奔涌的数字时代,品牌与受众的对话方式正经历着深刻变革。品达发稿作为专业级公关媒体发稿服务平...
消息:宗馥莉已辞任娃哈哈集团董... 刚有消息指,中国饮料巨头娃哈哈集团董事长宗馥莉在国庆长假结束后的首个工作日正常上班。中国媒体引述知情...