VR沉浸感的奥秘:人眼如何通过双目视差硬解深度信息
VR沉浸感的奥秘:人眼如何通过双目视差硬解深度信息
VR技术如何实现沉浸感?这背后涉及人眼如何通过双目视差来感知深度信息。本文将从人眼立体视觉的产生机制、双目汇聚、单眼聚焦、辐辏调节冲突(VAC)以及双目视差等多个专业角度,深入解析VR沉浸感的奥秘。
人眼立体视觉产生机制
平面屏幕的2D画面带来的立体感主要来自大脑的补充。通过仿射变换,可以改变图像的几何结构,同时保持图像中平行线的平行性。张角是指物体所占人眼视野的视场角大小,同一物体离人眼越近,在人眼视野里的张角越大,这就是"近大远小"的原理。
人脑可以比喻为计算机,心理感知属于软件估算,生理感知属于硬件测量。在立体视觉中,双眼线索的优先级大于单眼线索。焦平面是指光线经过透镜在焦点时,物体所在位置的平面。远离焦平面时,成像会变模糊,蓝色代表短焦,红色代表长焦。
长焦距(光线暗)时,大光圈会导致小景深,虚化范围大。在VR眼镜里看屏幕,类似于放大镜看屏幕。人眼平均瞳距为65mm,因此在VR眼镜里,单眼聚焦只能看到约1.3m的大屏(具体距离与所戴的VR眼镜光学设计有关)。在VR眼镜的2D模式下,左眼或右眼的一半画面会被复制成相同的两份到左右眼屏幕,失去了双眼线索,相当于在VR里看一个距离为1.3m的2D大屏。
深度信息与自由度
深度信息是双目显示器的根本特性。以第一人称游戏为例,6DOF(六自由度)游戏如穿越火线,通过变换视角观察物体时,物体的图像会进行仿射变换。移动视差是指视线在视野中横向移动时,物体的运动方向和速度的差异。例如,坐在奔驰的火车上,近处的树和电线杆看起来移动得快,而远处的景物则看起来移动得慢。
值得注意的是,VR的根本特性是深度信息,而不是6DOF。平面屏幕也能实现6DOF,例如第三人称游戏如原神。
双目汇聚
人的双眼对两幅画面进行直接的硬件解码。视网膜成的像"中间清晰,四周模糊",视野中心的一小块区域称为"注视点",在视网膜上对应成像区域称为中央凹。中央凹是视网膜上视锥细胞最密集的区域,此处成的像分辨率最高,感知最清晰。中央凹不完全在中心处,偏向太阳穴侧,盲点在鼻翼侧。
双目汇聚,汇聚的是视轴。汇聚角由两只眼睛转动的角度决定,注视点越近,汇聚角越大;注视点越远,汇聚角越小。当想看到视野中的某处时,眼球会转动把注视点切换到所关注的区域,产生视野里所看到的东西都是清晰的错觉,实际上只有注视点所在的区域是清晰的。这一原理在VR中应用为注视点渲染和注视点投影。双目汇聚感知注视点的深度信息只是相对的,近距离时比较准,远距离时视轴接近平行,双目汇聚失效。
辐辏调节冲突(VAC)
双目汇聚和单眼聚焦需要联动产生立体感。在VR眼镜中,光学透镜的焦距没有随着双目汇聚而同步,即聚焦深度不同步。为了解决这一问题,VR光学透镜需要具有可变的焦距,配合眼球追踪,通过计算人眼双目汇聚角,反推汇聚深度,再改变光学透镜的聚焦深度从而实现同步。
VR内人眼效果模拟
在VR内,双眼远处清晰,近处模糊,而变成单眼近处清晰,再变成双眼又模糊。
双目视差
在正视差空间里,物体在左右眼睛成的像无法融合成单一的图案。当注视点在手指A时,手指B位于正视差空间,双像分散,具有正视差。当注视点在手指B时,手指A位于负视差空间,双像交错,具有负视差。定位点/零差面的绝对深度越近,相对深度/立体视觉阈值越高。超过1350米时,会被认为在同一深度上。在VR中,单眼聚焦感知是失效的。VR眼镜的本质是可以输出深度信息的双目眼镜,将深度信息编码进带有视差的左右图像里。