韩国社会・文化

人工智能模仿的名人声音恐被恶意用于电话诈骗

社会・文化 2017年10月20日 16:35

“我是总统。”(文在寅总统的声音)

“我是孙石熙,大韩民国的新闻工作者,JTBC新闻部部长。”(JTBC部长孙石熙的声音)

近期,某网站上上传的一些声音成为了热门话题。这些并不是文在寅总统和孙石熙部长亲口所说,而是技术人员通过声音合成技术制作而成,但与真人声音十分相似。游戏制作公司的工程师金泰勋(音,25岁)10月19日上午将这些声音样本设定为非公开。这些样本约一个周前被公开在网站上。

游戏制作公司Devsisters公开声音样本后,因为担心被恶意利用,也担心收到技术合作邀请,所以决定将其设定为不公开。该声音合成技术在10月16日由Naver主办的开发者大会上曾被介绍公开。

合成的原理就是通过分析名人声音从而合成新的句子。让计算机同时学习声音及该声音的含义,然后以此为基础读出新的句子。声音数据越多、音质越好,合成效果也就越好。

开发者金泰勋利用了YouTube上的视频和新闻等声音数据。文在寅总统演讲的声音、孙石熙主持人播报新闻的声音也被作为了“原材料”。使用者们反映称,在金泰勋于网站上公开的样本中,通过对2个小时的声音片段分析制作而成的文在寅总统的合成声音多少还有些别扭;对5个小时的声音片段分析而成的朴槿惠总统的声音十分逼真;通过15个小时的声音片段合成的孙石熙部长的声音听上去与真人别无两样。

苹果和三星电子的“Siri”和“Bixby”等人工智能(AI)为了可以输出近似人类的声音,目前正在使用与此相类似的技术。

Naver通过演员刘仁娜的声音提供有声读物服务。制造了阿尔法狗(Alpha Go)的谷歌子公司DeepMind正在利用神经网络技术开发人工智能。该人工智能可自行展开训练,以便输出类似人类的声音。

开发者金泰勋10月16日在网站上公开了他本人开发的声音合成技术的源代码(algorithm)。他表示,“这并不是什么高难度技术,未来不仅是企业,许多普通人也可以使用”。金泰勋称“会让任何人都可以轻松使用声音合成技术”,从而公开了源代码,但在成为了关注、讨论的对象后,他又在10月19日删除了源代码。

有观点担忧称,类似的声音合成技术恐被恶意利用,从事电话诈骗等犯罪活动。

众多专家指出,如果合成声音不是被作为叫醒服务等个人使用,或将产生法律问题。作为著作权领域专家的律师朴赞薰解释称,“在未经本人同意的情况下合成的声音,除了损害名誉的内容外,包含普通内容的声音也存在侵犯人格权的可能。如果被用作餐馆宣传等商业用途,则有可能侵犯名人的肖像权”。经常负责著作权相关诉讼的律师高韩卿表示,“合成声音所说的话事实上并非本人所说,因此也有观点认为这并不属于侵权。所以相关问题在法律上仍并未有明确的界定”。

中央大学社会专业教授申光荣解释称,“对声音合成技术的担心类似于指纹、虹膜采集技术的发展而引发的担忧。新技术的出现会带来对规范问题的思考”。Naver相关人士表示,“关于对艺人声音的合成,我们正在推进与所属经纪公司的签约。预计今后社会将就此展开讨论”。

COPYRIGHTⓒ 韩国中央日报中文网

扩大照片 新闻首页

分享到

Top