近日,标贝科技语音合成音色库又有新进展。针对智能客服场景,上新两个温和风格音色,适用于服务回访、业务咨询、产品介绍等细分业务场景。加上前不久的两款严肃客服音色,标贝科技已累计上线20多个风格迥异的男女客服发音人,全力加速企业客服中心的智能化转型。
此外,本次也同步上线两个泰语女声音色和法语女声音色,以满足更多细分场景的应用需求。
大模型 驱动 语音合成更“拟人”
传统的语音合成,因为技术上的限制,通常是采集标准的播音风格录音,以保证数据的稳定性。但是用它合成出来的声音也会过于标准、刻板,程序化,不接地气,容易让用户产生听觉疲劳。
在大模型爆发的背景下,作为生成式AI的重要课题,语音合成也取得了飞速发展。从引人入胜的有声小说,到准确无误的语音导航,再到丰富多彩的视频内容配音、问答流畅的虚拟数字人。人机语音交互场景越来越深入,声音体验的价值也被持续不断挖掘出来,富有情感表现力的拟人化语音合成成为当下的语音交互新态势。
超自然的大模型合成音色定制
结合当前智能语音产业需求现状,标贝科技持续在多风格、多情感语音合成能力上不断深耕细作,打造全链路语音定制方案。凭借其强大的语言理解和生成能力,为企业客户服务、陪伴式语音交互、沉浸式听书等场景,提供更自然、更准确的语音输出。
相较于传统语音合成效果,标贝科技语音合成音色定制方案依托语音大模型迁移学习和深度神经网络技术,具备更多的多样化和高延展优势。它能够比较准确捕捉到数千种音色的语调、情感等特征,让模型更好地复刻出真人说话时的犹豫停顿、变速等副语言习惯,在不同的应用场景下,轻松创造出无限的声音变化、情感和风格。

据评测,通过标贝科技语音合成音色定制方案输出的合成音色,在韵律表现、音色层次感、情感拟人化方面均有了大幅提升,MOS评分达到4.5以上,充满“人情味”。
此外,标贝科技语音合成音色定制方案可以支持客户自选声音及提供语料定制,并提供包括录音棚、录音师、韵律标注、MOS 评测任务等定制音色所需的全链路服务。有效降低音视频内容生产成本,让音频内容的生产和分发更为有效。
据中商情报网发布的《2023年全球及中国智能语音市场规模预测分析》,预计2023年我国智能语音市场规模将达到382亿元,同比增长34%。随着智能语音助手、自动语音响应系统等应用的广泛推广,智能语音市场前景广阔。
标贝科技语音合成音色定制方案已经在医疗、金融、数字人、泛娱乐等领域得到应用,助力中国银行、人民日报、湖南电信、恒生电子、清博智能等多家行业头部企业实现AI语音能力的应用与拓展。未来,标贝科技将继续依托语大模型底座支撑,通过不断的技术创新和产品迭代,推动AI语音技术落地至更多应用场景,为用户带来更加便捷、智能、人性化的语音交互体验。
免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.