威力财巨人网络出席国际会议Interspeech 2025，展示多模态大模型最新成果

威力财威力财威力财

　　近日，全球语音信号处理领域顶级学术会议Interspeech 2025在荷兰鹿特丹举行。巨人网络（002558）AI Lab的多模态语音技术研究成果成功入选会议，并获得Oral（口头报告）发表资格。团队受邀作现场技术演讲，展示巨人网络在多模态生成方向上的最新研究进展。

　　Interspeech由国际语音通信协会（ISCA）主办，是全球语音处理领域规模最大、影响力最强的综合性学术盛会之一，代表了该领域的最高学术水平，也是全球最新技术与理念交流的重要平台。

　　在此次演讲中，巨人网络AI Lab重点介绍了自主研发的多模态生成框架MM-MovieDubber——这是将 “多模态理解 + 生成” 范式深度融合并结合具体应用的技术方案。该框架通过先对场景中复杂视觉信息准确理解，再基于整合后的多模态信息进行协同生成，构建起 “理解 - 生成” 的完整技术链路，为复杂场景下的多模态内容生成提供了全新技术思路。

　　今年以来，巨人网络AI Lab多项人工智能研究成果入选了ACM MM、ICASSP、Interspeech等国际顶级学术会议，依托语义、语音、视频等多模态大模型的全矩阵布局与深厚积累威力财，加速拓宽AI应用场景与商业化进程。同时，巨人网络在AI领域将持续推进开放合作与生态共建，共同突破技术壁垒、释放产业潜能。

易好商配提示：文章来自网络，不代表本站观点。