您的位置:首页 > 5G动态 > 正文

韩国首位AI主播亮相人工智慧可以完全取代真人主播了吗

发布时间:2021-02-18 21:11:35  编辑:  来源:

议题背景

2020年11月6日,韩国MBN电视台运用以真人主播「金柱夏」为原型的AI主播,顺利播报了当天的主要新闻。由于AI主播报导新闻的影像十分逼真,立刻引发大众热烈讨论。

影片中左为真人主播,右为AI主播:

新闻报导:

中央社〈韩国首名AI主播上工,对新闻业是助力还是压力(影)〉 新头壳〈太过逼真!南韩首位AI主播亮相,网友直呼:令人毛骨悚然〉

究竟目前AI主播可以完全取代真人主播了吗?此技术的特点和和限制为何?我们邀请专家释疑。

来看看专家怎么说。

许志仲(国立屏东科技大学资讯管理系助理教授) 2020年11月25日

此AI新闻主播,主要是由韩国MoneyBrain公司所开发,并未对外揭露技术相关细节。然而,从学术的角度来看,要合成以假乱真的AI主播,在技术上并无太大困难之处,诸如影片的生成、声音的合成,都有既有相关研究领域的开放原始码与研究论文可供参考。

作出AI主播所需最简便的方法,只要将相关的新闻文稿先输入电脑,并拍摄一真人影片,并套用换脸技术即可。因此若的学研团队,有结合影像视讯与声讯处理之专才,并不难产生相似的成果。

事实上,在影像与视讯处理的领域,最常见的传统换脸技术,如大家熟知的DeepFake深度伪造,或是其他开源CycleGAN(注1)等技术,都有能力合成出上述的成果。

虽然目前现有相关文献中,较少提及能直接从文稿,生成具有逼真视觉效果加上语音的AI主播,但各部分相关技术皆有一定程度的水準。

例如,人工智慧顶尖会议(AAAI Conference on Artificial Intelligence),去(2019)年就有一篇知名论文(注2)发展之AI技术,可以透过学习资料库中影片,学习声音与脸部表情的关係。接着,给定特定的声音讯号,以及目标人脸,便能产生仿真的人脸视讯,甚至产生AI主播。

故在技术上,并非不可能。然而目前我们可以观察到,大多数的生成技术通常是在较平坦单调的背景中使用,这也是受限于技术的限制,目前还无法合成出在複杂且变动背景下的人脸视讯。

自从2019年开始,许多产业与学术研究团队注意到这些生成人脸,可能带来许多潜在危机,因此侦测这些伪造人脸相关技术,已有不少团队投入。例如影像视讯相关国际研讨会,近一两年来皆有少数相关研究成果产出,其中包含Microsoft与Facebook都有相关的研发成果。

国内我们团队亦投入AI生成影像的鉴识技术多达两年,除了已可稳定辨识出伪造人脸影像,目前在人脸视讯和AI主播等类似的应用上,亦有相关研究成果準备发表。

虽然我们很难肯定未来是否会有更多AI生成技术,可以令我们发展的鉴识技术都失效,但可以确定的一点是,未来会有更多的产学研团队,投入伪造影视讯辨识的领域。

相关利益声明:无相关利益 注释 (注1) 编注:CycleGAN是一个神经网路模型,可用来作不同影像之间互相转换,例如把照片中的的斑马转换为棕色马,或是把画作中的夏天场景转换为冬天。公开程式码请参考〈junyanz/pytorch-CycleGAN-and-pix2pix〉。 (注2) Zhou, H., Liu, Y., Liu, Z., Luo, P., & Wang, X. (2019). “Talking face generation by adversarially disentangled audio-visual representation.” Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 33, pp. 9299-9306.

本文经新兴科技媒体中心授权刊登,原文刊载于此

标签:
版权声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。
版权声明: 本站若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。转载文章是出于传递更多信息之目的。
版权所有: 阜新生活网 ·(2019-2021) .闽ICP备20009870号-2. 联系QQ:173 0547 905 .