热门搜索

搜索历史清空

自由量级「音潮」音乐大模型独立全栈完成WAIC 2025大会主题曲

IPO早知道 2025-07-27 00:42 7890阅读


全链路自研。


本文为IPO早知道原创

作者|Stone Jin

据IPO早知道消息,自由量级自主研发的“音潮”音乐大模型独立全栈完成了WAIC 2025英文主题曲《AI For Good》,作品以“科技向善”为核心,通过音乐语言传递AI与人类共生的未来愿景。

具体来讲,“音潮”音乐大模型采用行业领先的AR+NAR架构,拥有强大的多模态表征能力和创新的重建模型——前者能够捕捉全局动态变化并进行高保真重建。后者则深入学习了音乐信号与其他信息的结构性差异,对信号中的音乐特征独立建模,建立复合评价维度,克服了传统方案在处理时所遇到的音乐细节丢失难题。这也让“音潮”音乐大模型生成具有丰富编曲层次、工业级制作听感的高质量音乐。

同时,为了让生成的效果从“平面”走向“沉浸”,团队还专门研发了能直接对双声道信号进行联合建模的Diffusion Transformer(DiT)。该模型的核心在于其独特的注意力机制,能有效捕捉并同步左右声道间的相位、强度差异与时间延迟。因此,生成的音频不再是单声道的简单复制,而是拥有了真实、自然的宽度和深度,为听者构建出可信的声场空间。

即将发布全新功能“音果”
新玩法将超越国际头部公司

在WAIC 2025现场,自由量级团队预告了“音潮”平台即将重磅发布全新功能“音果”,实现真正意义上的多重风格融合致敬体验,对标并超越海外同类产品7月刚刚推出的同类功能。

音潮通过自研的强大对比学习模型, 实现了多首歌曲的曲风、情绪、音色、唱法、配器融合, 从而进行音乐的再创作, 老树抽新芽, 让歌曲迸出全新的生命力. 此外,通过简单的超参数调节,实现了平滑的渐进融合比例调节,可以轻松调整灵感来源的配比, 绽放无限可能, 一因(音)结一果. 我们相信, 每一位用户都能轻松上手"音果", 在音乐中享受自己亲手描绘的因果。

值得一提的是,作为"最懂你的音乐模型",音潮也已经支持了跨模态输入。用户可上传文字、图片或视频作为创作参考,系统通过自动与音频特征联合引导,即可生成出一首符合”此情此景“的专属音乐。

自由量级CTO兼执行CEO姜涛博士表示:“此次即将推出‘音果’,旨在为国内音乐人提供真正可控、高保真、低门槛的生成式创作工具,让创意回归创作者,让中国 AI 音乐产品走向世界一线阵营。”姜涛透露,"音果"功能,也是中国本土生成式 AI 音乐公司首次对标世界头部公司,并予以技术性和产品功能的超越。这不仅意味着技术上的落地与自主可控,也将推动创作型经济在本土音乐产业形成新范式。

此外,在自由量级执行CEO姜涛博士看来,作为AI音乐新物种,“音潮”的出现让音乐创作不再受专业技术和资源的限制,吹响了音乐平权的号角。““‘音潮’的核心价值在于大幅降低创作的技术门槛与时间成本,从根本上颠覆了原有的行业规则与价值链。‘音潮’的目标绝不是取代音乐人,而是打破资源垄断,释放被技术门槛禁锢的无穷创意,并最终实现创作者、用户与平台多方共赢的新兴生态系统。”

“音潮”打破了过去音乐传统单向传播模式,让用户既是内容的消费者,也能便捷地成为内容的创作者与参与者,形成动态循环的创意社区;也让音乐产业的核心价值,从制作能力向独特创意与审美加速迁移。不仅如此,通过创新的版权与激励机制,确保音乐作品的版权收益核心归属于创作源头——音乐人本身。“我们目前的方案是,只要是通过‘音潮’创作的歌曲,版权均归用户。”姜涛博士介绍,“甚至我们能通过完整生成记录和用户账户身份生成唯一的歌曲创作凭证,用于证明这首歌确实出自该用户之手。”

值得一提的是,与目前国内外已发布的同类模型和产品相比,‘音潮’在生成效率与成本控制方面均具备显著优势,单首歌曲生成成本不到目前市场同类的五分之一。这款融合顶尖AI技术与艺术创造力的应用,势必将点燃普通用户和专业音乐人的创作热情,重塑音乐产业的生产与消费模式,引领中国AI音乐应用进入国际领先阵营。

打造中国本土演示设计智能体PI

全新定义未来AI原生内容创作范式

除“音潮”音乐大模型外,自由量级还孵化了AI原生演示设计智能体产品PI:Presentation Intelligence。在以生成式和智能体协同为特征的AI时代,PI致力于打造专业知识和设计智能体高效协作的原生内容创作范式,成为HumanXAgentic-Content内容创作和共享的全新范式。

通过从意图理解(Intention Undertstanding with high-Context),多智能体协作的设计引擎(Agenitc-Design Engine)和原生多模态编辑器(AI-Native Design Copilot),PI架构了一个涵盖多模态内容创作全流程的全栈智能体Co-pilot系统。定义了人机协同(human-in-the-loop)的AI设计智能体的全新范式,为全球用户提供专业质量、精准完备、高效和谐的交互体验。

通过大模型能力,Pi对用户的内容和创作意图进行理解和梳理,从建立内容大纲和设计架构开始从零设计。通过Pi设计引擎,调控多个Agent和算法线程配置组合布局、样式、配图、文字处理等一气呵成,每一个作品都是唯一的专属设计。这就是一个AI-原生的创意过程。

Pi负责人、自由量级COO杨疆博士认为:“人机交互的本质就是上下文的丰富度和带宽。”大模型技术无限增强了这个环节。这对于产品而言,交互设计有了指数级增长的发挥空间,同时产生了巨大平衡决策:在human和agent之间的放权平衡,或者在各种交互模态之间的选择平衡。PI坚持两个设计价值观:其一是人机和谐共赢的价值观;另一个则是学习迭代的价值观。所以,Pi设计了支持创作和共享的内容全生命周期的Copilot平台,人的创意和工作,AI的任务调度,交互的模式都是一个可以动态平衡调节的环境,产品设计也在这个方法论的指导下快速迭代。

Pi的原生智能编辑器为用户提供了全新的沉浸式Ai-原生体验。在这个以自然交互为优先设计逻辑的Copilot环境里,数据,模型和Agents都无缝嵌入,轻松调度。Pi团队多年深耕AI内容产品的经验为Copilot带来了丝滑流畅,瞬时响应的极致体验。同时,Pi支持多人,多Agent的协作编辑,逐渐呈现出在丰富的上下文环境中人机和内容共同创意和生长的未来图景。

“我们的初衷就是致力于以AGI重塑未来交互,我们相信,AI不是替代人类,而是释放人类更深层的创造力。”Pi负责人,自由量级COO杨疆博士表示,“PI就是在定义‘AI原生设计智能体’这一全新品类,欢迎大家一起体验这场设计生产力的革新。”

本文来源:IPO早知道

来源:IPO早知道

重要提示: 本文仅代表作者个人观点,并不代表乐居财经立场。本文旨在为满足广大用户的信息需求而采集提供,并非商业性或盈利性用途。任何单位或个人认为本文来源标注有误,或涉嫌侵犯其知识产权等相关权利的,请提供身份证明、权属证明及详细侵权情况证明等相关资料,点击【联系客服】或发邮件至【ljcj@leju.com】,我们将及时审核处理。

24小时热门文章

更多热读

最新文章

更多原创

评论

点击下载App参与更多互动

前往乐居财经APP查看原文,体验更佳

榜单