当前位置:清远传媒网 > 星座 > 正文

声音逼真还能实现变声秀,科大讯飞虚拟主播领先同类产品

清远传媒 www.gdqynews.com   发布时间:2019-08-27 12:11:38   作者:财经

 

  就在5月21日,科大讯飞2019新品发布会上,使用了全球首个多语种A.I.虚拟主播,能实现中、英、日、韩、俄、西、法7国语言,以及维吾尔语、藏语2种民族语言同时进行直播,在发布会现场引起了关注。就人工智能语音技术技术革新而言,科大讯飞无疑已经走在了行业前列。

  在此之前,今年全国会议上科大讯飞就推出了人工智能虚拟主播小晴,这次以全身形象亮相新品发布会,作为大会的串场主持人。在发布会上,科大讯飞的虚拟主播不止主持得惟妙惟肖,还表演了变声技术,其模拟了多个男女声音,惟妙惟肖的声音让人以为这几位嘉宾真的来到了现场。相信之后科大讯飞能够让变声技术运用在娱乐领域中,实现声音的cosplay。

  目前在网络上AI换脸技术获得了许多网友的热捧,此次科大讯飞的语音cos秀给未来直播以及视频等娱乐领域带来了更多的可能。而且科大讯飞的虚拟主播不仅拥有流畅动听的话语还有自然的表情动作,这让人感受到极强的娱乐性。或许在未来的影视剧中,会大面积出现科大讯飞的声音cos。毕竟这不止节约了影视剧制作成本,还加快了影视剧制作的进程。

  当然,科大讯飞的虚拟主播之所以能够如此惟妙惟肖,是因为科大讯飞在多个技术维度都有创新。就拿虚拟主播来说,其就将科大讯飞语音合成、机器翻译、图像处理等人工智能技术进行了结合。目前整个行业中,能够将这么多科技前沿技术融合得这样好的企业,屈指可数。

  据了解本次发布会上,客串主持人的虚拟主播,其表情和声音的模拟也是可以调节的。先输入播报的内容,通过科大讯飞的语音合成技术进行语音合成,然后利用多模态合成模型基于语音驱动表情序列生成对应的表情序列。这样就能够达到声像一致,给人展现出如同主播在主持的感受。

  科大讯飞的语音合成和理解、图像处理、机器翻译等人工智能技术,能实现多个语种的实时新闻播报,在发音和实时翻译方面也十分准确和专业。不仅如此,科大讯飞还研发了具有娱乐性的虚拟主播以及变声cos,为整个娱乐行业的发展带来了更多可能。