最新新闻:

Nvidia的Maxine为深造和偏向视频通话打开了大门

时间:2020-10-23 10:51:50来源:互联网

AI会推动未来的视频聊天吗?这就是Nvidia本周通过推出Maxine所暗示的,该平台为开发人员提供了一套GPU加速的AI会议软件。Maxine为最终用户带来了AI效果,包括凝视校正,超分辨率,噪声消除,面部重新照明等,同时还减少了视频会议消耗的带宽。在视频会议有助于记录带宽使用的时代,保持质量的压缩是一项受欢迎的创新。但是,Maxine的其他更具装饰性的功能引发了有关AI的负面影响(可能还有偏见)的不舒服的问题。

快速回顾:Maxine使用称为生成对抗网络(GAN)的AI模型来修改视频供稿中的面孔。表现最好的GAN可以创建不存在的人的真实肖像,例​​如虚构的公寓楼快照。在Maxine的情况下,它们可以增强视频源中的照明并实时重新组合帧。

计算机视觉算法中的偏见无处不在,其中Zoom的虚拟背景和Twitter的自动照片裁剪工具不利于肤色较深的人。Nvidia尚未详细介绍用于开发Maxine的数据集或AI模型训练技术,但并非没有可能,例如,该平台无法像浅肤色的脸部一样有效地操纵Black脸部。

除了偏见问题之外,还有一个事实是面部增强算法并不总是心理健康的。波士顿医学中心和其他机构的研究表明,滤镜和照片编辑会损害人们的自尊,并引发身体畸形等疾病。作为回应,谷歌本月初表示,将默认关闭其智能手机的“美容”过滤器,以消除粉刺,雀斑,皱纹和其他皮肤瑕疵。该公司在一份声明中说:“当您不知道相机或照片应用程序已应用滤镜时,这些照片可能会对心理健康产生负面影响。”“这些默认过滤器可以悄悄地设定一些人与之相对的美容标准。”

更不用说玛克辛可能会被用来避开深度造假的检测。该平台的一些功能是分析通话中人们的面部特征,然后通过算法使另一边视频中的面部恢复活力,这可能会干扰系统识别录音是否被编辑过的能力。目前,Maxine只能在early access中提供给开发者使用,但是潜在的滥用是公司目前还没有解决的问题。

Nvidia发表了这一声明:“我们的研究团队在开发Nvidia Maxine平台用于视频会议应用程序的AI功能时,密切关注种族,性别,年龄和文化多样性。他们策划了大约一千小时的视频培训数据,这些数据在广泛的社区中都有代表,因此该技术将在所有背景下被尽可能多的人使用...由于Maxine是模块化平台,因此应用程序开发人员可以选择将哪些功能包括在他们的应用程序中视频会议应用程序。它们可以包括(也可以不包括)注视和面部对齐等支持AI的功能,以使通话更像自然对话,使人们可以在屏幕上而不是在自己的网络摄像头上看面部。”

这些都不是暗示Maxine在设计上是恶意的。凝视校正,面部重新照明,放大和压缩似乎很有用。但问题玛克辛引发指向一个缺乏考虑其技术可能造成的危害,一个高科技产业的失误,从而共同它成为一个老生常谈。最好的情况是Nvidia采取措施(如果尚未采取措施)以最大程度地减少可能出现的不良影响。但是,该公司没有预留通话时间来说明Maxine的揭幕仪式上的这些步骤,这一事实并没有激发人们的信心。

有关AI报道,请将新闻提示发送给Khari Johnson,Kyle Wiggers和Seth Colaner,并确保订阅AI Weekly时事通讯并在我们的AI频道上添加书签。

声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。

图文推荐

热点排行

精彩文章

热门推荐