科大讯飞虚拟人爱加拜年,多项技术突破瓶颈

2021-02-09 15:47:53 来源:i黑马
        【每日科技网】

  对于虚拟人,很多人并不陌生。早前科大讯飞的多语种虚拟主播小晴、央视A.I.虚拟记者通通,给了大众对技术应用的更多想象空间。

  近日,科大讯飞虚拟人技术再突破,发布更加活泼生动的A.I.虚拟人爱加,并上线了爱加帮你送新春祝福的H5《你用A.I.拜年了吗?》,用户可通过爱加,把最暖心的新春祝福送到家人朋友眼前。(在微信公众号“科大讯飞”后台回复“爱加”即刻体验,还有机会获得千元惊喜A.I.礼物)

  和以往小晴等虚拟人不一样的是,爱加在声音、肢体动作乃至于微表情的表达上更丰富,还熟悉更多种语言和方言,用户通过爱加拜年,能让天南海北的朋友倍感亲切。

  技术难点逐一击破,这次爱加更“人性化”

  人工智能不断进步,A.I.早已不再是冷冰冰的科技,而是演变成为能帮助人类享受智慧生活、守护情感世界的好帮手。虚拟人的应用前景可期,但由于技术限制,其肢体动作、语言、情感表达效果还不能满足人们期待。

  那么科大讯飞是如何攻克合成难点,让其A.I.虚拟人有更高的触达率?

  首先,拓展A.I.虚拟人的“本事”,让其“能说会道”“能歌善舞”。在科大讯飞A.I.虚拟人已有的多语种、多方言合成能力之外,科大讯飞提出了基于歌唱音准的无监督歌唱标注方法,将发音和音准分离,利用神经网络分层级预测,结合高精度神经网络声码器合成高品质歌曲,同时提出姿态自适应的表情合成技术,解决了舞动状态面部姿态大角度以及多角度快速切换场景下的唇形合成难题,在使得虚拟人在精通各种语言的同时,还能倾情演唱。

  其次,增强虚拟人的“人性化”。为了给虚拟人注入情感,使其在互动表达中更有人情味,科大讯飞结合认知心理学理论对虚拟人进行交互情感设计,利用无监督表征学习方法,分离并获取语音中的情感表征。同时,利用海量文本无监督语义模型对各类文本进行情感分类预测,实现人性化的端到端情感合成系统,让虚拟人“活泼”起来。

  最后,提升虚拟人的“表现力”。为使拜年视频更具个性化,科大讯飞提出结合场景的背景音乐、音效叠加方案。通过对常用场景分类分析,构建丰富多元的背景音乐、音效资源库,结合具体应用场景,进行背景音乐、音效的预测、叠加,从而实现高表现力的虚拟形象合成,用户能定制理想状态中的拜年场景,让A.I.拜年场景更加生动多元。

  值得一提的是,基于科大讯飞提出的海量说话人的音视频数据预训练技术,虚拟人爱加能够做到基于少量数据就完成快速的建模,满足多种场景多种风格形象的快速定制,同时,当前虚拟人实时合成的速度以及并发一直是业界的痛点,科大讯飞本次的虚拟人拜年活动支持了高并发在线高质量视频生成,从而大幅提升虚拟人视频制作的效率。用户只需要等待几秒钟就可以完成一个A.I.虚拟人合成视频,有效突破了A.I.虚拟人因为并发路数有限而不能大规模推广的难题,同时也展现出A.I.虚拟人从toB向toC推广应用的可能。

  可以预见,虚拟人爱加只是一个科大讯飞在虚拟人技术突破的一个新起点,它的出现为下一步A.I.虚拟人的大范围、规模化应用奠定了坚实基础。

  目前,科大讯飞基于A.I.交互能力的虚拟形象解决方案,已经应用于多个场景,如虚拟站务员、虚拟金融理财顾问、虚拟面试官,科大讯飞虚拟人的多模态得到了广泛应用。虚拟人爱加的技术突破,正是科大讯飞多年技术的厚积薄发,用A.I.理念改变生活的发展理念的具体呈现。未来,科大讯飞还会为虚拟人带来怎样的科技高峰再现,值得期待。

免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.

猜你喜欢

中西合璧不是事儿,凯度《用心焕新厨》硬核改造潘长江父女厨房

6月6日,由高端新厨电品牌凯度电器独家冠名,一众明星联袂出演的抖音微综艺《用心焕新厨》首期节目温情落幕。节目中,明星主理人袁姗姗带领资深设计师詹碧涵,走进了喜剧表演艺术家潘长江与女儿潘阳的工作室。通过

凯度

2天前

上海飞络|AIAgent赋能企业云MSP运维管理 ---开启智能高效新范式

在数字化转型浪潮下,企业为满足云业务灵活性与高可用性需求,多云架构成为主流选择。然而,AWS、阿里云、Azure云等不同云平台的协同管理难题,让传统MSP运维模式捉襟见肘。上海飞络信息科技有限公司推出

上海飞络

2天前

铁铁心愿单加速实现!鸿蒙版快手上线多项功能,反馈通道持续开放

当前,千行万业的鸿蒙应用正在加速迭代,为华为nova14系列手机和即将亮相的华为Pura80系列手机持续增添新体验。比如在近日,鸿蒙版快手迎来重磅更新,铁铁们的心愿单正在加速实现!此次更新不仅新增了包

Acloudear司享网络出席SAP Emarsys峰会:破解流量困局,驱动精准增长

当流量红利褪去,品牌如何从“抢眼球”转向“懂人心”?2025年5月28日,Acloudear作为SAP铂金合作伙伴及数字营销解决方案创新代表,受邀出席在深圳举办的SAPEmarsys2025出海品牌增

2天前

科技照亮银发生活 创新编织幸福晚年

在老龄化浪潮日益汹涌的今天,如何为银发一族构筑一个安心、惬意、便利的居住天地,已成为全社会共同瞩目的课题。富德生命人寿,以“美好生活”居家养老服务为突破口,凭借产品的科技赋能与创新驱动,为老年人的世界

2天前

科大讯飞“听见AI的声音”关爱听障人士公益行动6周年,和万茜一起听见更大的世界

6月6日,科大讯飞“听见AI的声音”关爱听障人士公益行动正式迎来六周年。今年,讯飞听见与中国聋人协会、中国残疾人艺术团、演员万茜继续携手,携手呼吁大家关注听障群体。由科大讯飞联合中国聋人协会、中国残疾

科大讯飞

2天前