威力财威力财威力财
近日,全球语音信号处理领域顶级学术会议Interspeech 2025在荷兰鹿特丹举行。巨人网络(002558)AI Lab的多模态语音技术研究成果成功入选会议,并获得Oral(口头报告)发表资格。团队受邀作现场技术演讲,展示巨人网络在多模态生成方向上的最新研究进展。
Interspeech由国际语音通信协会(ISCA)主办,是全球语音处理领域规模最大、影响力最强的综合性学术盛会之一,代表了该领域的最高学术水平,也是全球最新技术与理念交流的重要平台。
在此次演讲中,巨人网络AI Lab重点介绍了自主研发的多模态生成框架MM-MovieDubber——这是将 “多模态理解 + 生成” 范式深度融合并结合具体应用的技术方案。该框架通过先对场景中复杂视觉信息准确理解,再基于整合后的多模态信息进行协同生成,构建起 “理解 - 生成” 的完整技术链路,为复杂场景下的多模态内容生成提供了全新技术思路。
今年以来,巨人网络AI Lab多项人工智能研究成果入选了ACM MM、ICASSP、Interspeech等国际顶级学术会议,依托语义、语音、视频等多模态大模型的全矩阵布局与深厚积累威力财,加速拓宽AI应用场景与商业化进程。同时,巨人网络在AI领域将持续推进开放合作与生态共建,共同突破技术壁垒、释放产业潜能。
易好商配提示:文章来自网络,不代表本站观点。