Facebook FRLR分享沉浸式音频新进展，挑战极致还原真实音效

VR/AR

2020

09/06

19:28

映维网

来源：映维网作者黄颜

Facebook Reality Labs Research (FRLR)日前分享了最新的音频计划。他们的目标是将相关技术应用到AR头显中，并允许你在嘈杂的环境中轻松地隔离人声，同时再现虚拟声音，使其看起来像是来自周围的真实世界。其中，一个定制的头相关传输函数（HRTF）是提供这种体验的关键，但涉及过程耗时且昂贵。所以，FRLR团队正在研究一种能够根据耳朵照片生成精确HRTF的可扩展解决方案。

Facebook Reality Labs（FRL）现在是Facebook旗下所有VR/AR团队的统一名称，并旨在开发下一代的沉浸式技术（包括Oculus头显）。Facebook Reality Labs Research（FRLR）则是这一事业群下属的研发部门。

日前，FRLR分享了关于沉浸式音频研究计划的最新进展，并表示这项研究“与Facebook实现AR眼镜的工作直接相关”，但其中的部分内容同样适用于VR。

1. 空间音频

团队的目标之一是，再现一种在感知方面与同一房间里的真实之物或真实之人的声音无法区分的虚拟音效。

研究负责人菲利普·罗宾逊（Philip Robinson）表示：“想象一下，如果你在打电话，你会认为对方就在身边，你会忘记你们实际上是相隔两地。这就是我们正在开发的技术的愿景。”

为了达到这个目标，研究人员表示他们需要解决两个关键挑战：理解用户所处环境的独特听觉特征；理解用户聆听声音的独特生理方式。

要理解房间的声学特性（声音如何回响），这可以通过根据头显追踪传感器绘制的几何图形来估计房间的声音。结合人工智能能够估计房间内特定表面的声学特性，这种关于真实声音如何在空间中传播的粗略图景可以用来提升虚拟声音的真实感，令其听起来仿佛真的是来自同一个房间。

Facebook的研究人员同时表示，所述信息可以添加到LiveMaps中（Facebook为真实世界构建的增强现实副本），并由同一空间中的其他设备调用。随着时间的推移，声学估计可以通过众包数据得到改善。

第二个主要挑战是理解用户聆听世界的独特方式。人类听觉是与头部和耳朵的形状息息相关。头部和耳朵的形状不仅会影响你所听到的声音，它对你辨别周围声音来源同样十分重要。如果你借用别人的耳朵来生活一天，你将非常难以确定声音到底是从何而来。

对于声音如何与不同形状的耳朵相互作用，学术界已经进行了充分的研究，而这可以用一个名为头相关传输函数（HRTF）的紧凑数值函数进行表示。但要精确测量一个人的HRTF，我们需要专门的工具和一个漫长的校准过程。这就像眼科医生测试你的眼睛视力参数一样，所以相关的解决方案难以扩展至每一个人。

针对这种情况，Facebook Reality Labs Research希望“开发一种可以根据（你的）耳朵照片这样简单的输入来近似出一个可行的个性化HRTF的算法”。

为了展示团队在空间音频方面的研究进展，他们制作了一款小型游戏。其中，被试穿戴一副追踪耳机并站在一个房间中，而里面散落着数个真正的扬声器。然后，研究人员播放一个声音，并要求被试判断声音是不是虚拟生成并通过耳机播放，又或是通过真实扬声器播放。研究小组指出，大多数被试的研究结果表明，虚拟声音和真实声音几乎无法区分。

2. 情景感知型降噪

尽管“感知方面无法区分”的虚拟声音可能会令你觉得朋友或家人就在身边，但Facebook Reality Labs Research同时希望利用音频来增强真实的面对面交流。

一个方法是创建情景感知的降噪技术。尽管今天降噪技术的目标是减少所有的外在声音，但情景感知型的降噪技术旨在隔离你不希望听到的外界声音，但保留你希望听到的声音。

为了做到这一点，Facebook的研究人员制作了原型耳塞，以及包含麦克风，头部追踪和眼动追踪功能的原型眼镜。原型眼镜可以监控周围的声音以及用户的视线。专门的算法将利用所述信息来判断用户希望听到的内容，如对面桌子的人，房间角落里的电视。信息将输入到算法的音频处理部分，并由后者筛选传入的声音，从而突出显示来自特定对象的特定声音，同时减少其他所有声音。

– – — – –

显然，对于Facebook正在研究的这项技术，其最终目标是应用到AR和VR头显。尽管研究人员表示他们已经验证了所述概念，但我们尚不清楚什么时候才能从实验室带到日常头显之中。

原文链接：https://yivian.com/news/77575.html

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

相关热点

英伟达基于AI的超级采样DLSS 2.1将支持VR，可大大提

除了发布新显卡外，英伟达在今天一则Reddit问答中证实了DLSS深度学习超采样抗锯齿技术的新版本已经推出。名为DLSS 2.1带来了一系列的重要创新，包括超级性能模式。

谷歌研究分享：从RGB图像准确估计透明对象的三维姿

三维对象的位置和方向估计是计算机视觉应用的核心问题之一。对于涉及到增强现实和机器人操作等对象级感知的计算机视觉用例中，其需要知晓对象在世界中的三维位置，从而直接影响它们或者正确地将模拟对象放...

快手领投，红衫高瓴参投，Nreal完成4000万美元融资

混合现实科技公司Nreal今天宣布已完成4000万美元的B1轮融资。本次融资由快手领投，红杉资本中国基金、金浦科技基金、高瓴创投、以及中金资本旗下中电中金基金跟投，并且由势能资本担任独家财务顾问。

创维VR宣布将采用高通骁龙VR移动平台开发XR终端

9月5日，高通 XR生态合作伙伴大会暨第二届高通XR创新应用挑战赛颁奖典礼在江西南昌国际博览城绿地铂瑞酒店举行。创维VR总经理李文权受邀出席本次大会并参与高层对谈会，在对谈会上表示创维VR已与高通在XR...

《巫师3》增强版将同时登陆PS5、XBOX、PC平台

CDPR 的全球社区领导，Marcin Momot 已经宣布，一个增强版本的巫师 3 将来到下一代控制台和 PC 与光线跟踪和广泛的视觉和技术改进。幸运的是，在任何平台上拥有游戏的玩家将免费升级到新版本。

Facebook FRLR分享沉浸式音频新进展，挑战极致还原真实音效

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们