引言
众所周知,现实世界是一个三维空间,除去时间这一维度,现实世界是由长度、宽度和高度三个维度组成,我们每天就生活在这个三维世界中,而现有的显示设备大多数都只能显示二维信息,并不能带给人真实的三维感觉。为了使显示的物体和场景具有深度感(也就是3D),人们纷纷对3D显示技术展开研究,经历了二十几年的发展,目前已取得了十分丰硕的成果。
裸眼3D显示器被广泛应用于广告、传媒、示范教学、展览展示以及影视等各个不同领域。区别于传统的双目3D显示技术,裸眼3D显示由于拥有其裸眼的独特特性,即不需要观众佩戴眼镜或头盔便可观赏3D效果,且其逼真的景深及立体感,又极大提高了观众在观看体验时的视觉冲击力和沉浸感,成为产品推广、公众宣传及影像播放的最佳显示产品。
然而,观众不佩戴任何设备又是如何感知3D的呢?
1、裸眼如何感知3D
现实世界是三维世界,人眼观看物体时看到的图像具有位差,两幅图像之间的偏差我们称之为视差(disparity/parallax)。正是这种视差,使人们能区别物体的远近,并获得立体感。根据视差值的不同,视差又可分为正视差(positive parallax),负视差(negativeparallax)和零视差(zero parallax)。当观众在观看时,正视差使人产生物体深入屏幕的感觉;负视差使人产生物体悬浮于屏幕外的感觉;零视差是正视差和负视差的分界,物体刚好被投射到屏幕上,即我们常说的零平面。夏天夜晚的星星离我们很远,我们观看星星的视线几乎是平行的,这时视差接近于零,人眼难以区分星星的距离,因而我们觉得星星距离我们同样远,繁星仿佛在一个平面上没有立体感。
人的大脑是一个极其复杂的神经系统,它可以将映入双眼的两幅具有视差的图像,经视神经中枢的融合反射,以及视觉心理反应便可产生三维立体感觉。利用这个原理,我们可以将两幅具有视差的左右图像通过显示器显示,将其分别送给左右眼,从而获得3D感。
裸眼3D显示的原理一般是通过光栅或透镜将显示器显示的图像进行分光,从而使人眼接收到不同的图像,这样便实现了3D显示。狭缝光栅显示器通过在显示面板前方放置一个参数合适的狭缝,对显示的内容进行遮挡,在经过一定距离后,到达人眼的光线便可被分开,双眼接收到两幅含有视差的图像。图 1 中人眼就能分别看到蓝色和绿色,这样就能产生立体效果。
图 1 狭缝光栅显示原理
Fig. 1 Principle of parallax barriers display
柱状透镜式采用了相同的原理,只是实现的方式由狭缝换成了透镜,透镜通过对光的折射作用,将不同的显示内容折射到空间中不同的地方,到达人眼时显示的内容被分开,人眼接收到两幅含有视差的图像,这样便产生了立体效果,如图 2 所示。
图 2 柱状透镜显示原理
Fig. 2 Principle of lenticular lenses display
因而,裸眼立体显示仍基于立体视觉原理,只是通过改进立体显示器,以特定光学遮挡和光路传播控制的方式,实现将含有视差的图像分别传送到我们的左右眼睛,进而观看到立体影像。
2、3D视频源格式
目前3D视频源格式有多种,不同的视频格式具有不同的优缺点,本节将对几种常见的3D视频源格式做简要的分析与介绍。
2.1 左右视图
左右视图格式采用左视图和右视图并排传输的方式,如图 3 所示。传统的立体电影或立体电视一般采用基于左右视点两路 2D 视频的表达方式,这是由于左右视图格式虽然水平分辨率损失了一半,但完整的保存了原左右视图的垂直分辨率。
MPEG-2 MVP(Multi-view Profile)使用时域伸缩工具,提供了对双目立体视频的编码支持。将一路视频(左视)作为基本层,另一路视频(右视)作为增强层。MPEG-4通过使用MAC(Multiple Auxiliary Component)存放视差信息,支持双目立体视频的编码。采用左右视图格式的3D视频源,解码重建原始视点的计算比较简单,但在绘制其它虚拟视点时需要做立体匹配,因而计算较复杂,且随着绘制视图的视差值增大,合成的视图质量将随之下降。因此,左右视图格式较适合双目立体显示,在多视点自由立体显示中应用较少。
图 3 左右视图3D格式
Fig.3 Side-by-side3Dformat
2.2 上下视图
上下视图格式采用左视图和右视图上下排列的方式传输,如图 4 所示,这种格式与左右视图格式类似,只是它完整的保存了原左右视图的水平分辨率,而垂直分辨率损失了一半。
图 4 上下视图3D格式
Fig. 4 Top-and-bottom3Dformat
2.3 视频+深度图(video plus depth, V+D)
“V+D”格式包含了一幅彩色图和相应的深度图,如图 5 所示,其中深度图表达了 2D 图像中的像素点与3D场景中真实点之间的距离,即空间信息,深度信息是非常重要的几何信息,对3D场景的编码和重构具有重要的意义。采用 DIBR(Depth-Image Based Rendering)算法可以方便的绘制出任意视点。欧洲的 ATTEST 项目采用了“V+D”格式,其中 2D 彩色视频采用MPEG-2 编码,深度采用 MPEG-2、MPEG-4或H.264 进行编码,“V+D”的3D格式已标准化为 MPEG-C Part3,即 ISO/IEC 23002-3。Philips已发布了基于“V+D”格式的3D显示器接口规范白皮书,并且推出了相应的显示器产品。本文采用的3D输入视频源格式即为“V+D”,作为DIBR系统的视频输入,通过 DIBR 系统绘制得到多个视点视图,生成裸眼3D内容。
图 5 “V+D”3D格式
Fig. 5 Video plus depth3Dformat
2.4 多路视频+深度(multi-view video plus depth, MVD)
由于多路视点视频需要传输多路数据,因而传输数据量太大,在实际中难以实现,采用 MVD 格式可以有效的解决这个问题。与“V+D”格式类似,MVD 格式传输 2D 视频序列和相应的深度图序列,通过 DIBR 绘制得到虚拟视点,而与“V+D”格式不同的是,MVD 格式需要传输多路 2D 视频和深度序列,多路视频中的信息互补可以有效地解决遮挡、空洞问题,扩展视角范围,从而使绘制的虚拟视点质量得到了大大提高。图 6 显示了ballet 序列 MVD 格式。
(a) 第一个摄像机在时刻 1~4 拍摄的 ballet 彩色图以及对应的深度图
(b) 第二个摄像机在时刻 1~4 拍摄的 ballet 彩色图以及对应的深度图
图 6 MVD3D格式
Fig. 6 Multi-view video plus depth3Dformat
2.5 分层深度视频(layered depth video, LDV)
分层深度视频格式即消除遮挡格式,是由 Philips 在“V+D”格式的基础上提出的,即 LDI(layered depth image),通过再增加一层“V+D”,描述背景中被遮挡区域的视频及深度,将3D场景分解为前景和背景,用两层“V+D”来描述。图 7分别为“V+D”“全背景消除遮挡”格式和“V+D”“去冗余消除遮挡”格式,全背景消除遮挡格式包含全部的背景信息及其深度图,去冗余消除遮挡格式包含背景中被遮挡的 2D 图像及其深度图。此种格式较适用于深度平滑的背景上叠加虚拟合成的动画对象的场景,对于深度层次丰富的自然场景,特别是对法线与光轴方向接近垂直的物体表面的信息,还是不能很好地表达。
图 7 LDV3D格式
Fig. 7 Layered depth video3Dformat
3、裸眼3D显示技术
根据显示原理和光学结构的不同,裸眼3D显示技术主要有光屏障式(parallaxbarrier)、柱状透镜技术(lenticular arrays)以及集成成像技术(integral imaging)。
下面简要介绍这几种技术。
3.1 光屏障式技术
夏普公司欧洲实验室的工程师们经过 10 年的研究,开发了光屏障式技术,基于该技术的自由立体显示可以在三维/二维模式间进行切换,凭借该技术夏普在2002 年底成功的向市场推出了自动立体液晶显示器。如图 8 所示,光屏障式技术由高分子液晶层、LCD 面板、开关液晶屏及偏振膜等组成,视差障壁是通过利用液晶层和偏振膜产生方向为 90°的一系列垂直条纹形成的,这些垂直条纹宽几十微米,当光通过时就形成了垂直的细条栅模式。
视差障壁是该技术实现裸眼3D显示的关键所在,在3D显示模式下,安置在 LCD面板及背光模块间的视差障壁,实现了左眼和右眼分别接收到不同的视图,从而使观众感受到3D效果。
优点:兼容现有的 LCD 液晶制造工艺,因而在成本和量产上较具优势。
缺点:显示分辨率与视点数成反比,画面显示亮度较低。
图 8 光屏障式技术示意图
Fig. 8 Illustration of parallax barrier
3.2 柱状透镜技术
菲利普公司基于传统的微柱透镜方法对裸眼3D显示技术展开研究,其开发的裸眼3D显示器是在液晶显示屏的前面加上一层微柱透镜,每个柱透镜下面的图像像素被分成 R、G、B 子像素,每个子像素通过透镜以不同的方向投影,观众便可从不同的方向观看到不同的视图,如图 9 所示。该技术的缺点是放大了像素间的距离,所以简单的叠加子像素是一种难以取得好的显示效果的做法,一种更好的方法是使一组子像素交叉排列,且让柱透镜与像素列呈一定的倾斜角度。
优点:显示亮度高,3D沉浸感更好。
缺点:与现有 LCD 液晶制造工艺不兼容,需要更高的成本。
图 9 柱状透镜技术示意图
Fig. 9 Illustration of lenticular lenses
3.3 集成成像技术
集成成像(最初被称为集成摄影)已有 100 多年的历史,集成成像使用一组球形、方形或六角形的透镜产生三维图像,它可以同时提供水平和垂直视差,属于真三维显示。最早提出集成成像显示技术的实时拍摄方法是 NHK(日本广播公司)科学与技术研究实验室。在拍摄采集步骤中,每个镜头或针孔将记录采集到的对象,这些对象被称为元素图像,大量小型和并列的元素图像将在透镜阵列后方的录制设备上成像,图 10 显示了集成成像采集和显示的原理。
优点:属于真三维立体显示,在视角范围内可以提供近乎连续变化的视差。
缺点:技术尚不成熟,图像显示分辨率低,视角较小。
(a) 采集与显示原理
(b) 采集与显示过程
图 10 集成成像技术示意图
Fig. 10 Illustration of integral imaging
立体显示还包含多种实现方式,比如:全息技术(holographicdisplay technology)、裸眼3D投影技术、头部跟踪技术(head tracking technology)等。
全息技术能实现真正的三维立体显示,观众可以在不同的角度裸眼观看影像,全息技术涉及复杂的光学技术,其显示的图像漂浮在空中,显示效果非常震撼。目前主要有全像式、透射式、反射式等全息显示技术,这些技术仍处于研究阶段。
裸眼3D投影技术也称建筑3D立体投影,分为建筑外巨幅墙面投影和建筑内巨幅墙面投影两种,目前国外应用较多的巨幅墙面投影是建筑外巨幅墙面投影。巨幅墙面投影具有科技感浓郁、3D画面巨大、显示效果震撼,能够吸引社会中的不同人群驻足观看,具有非常高的关注度,因而在产品宣传、主题传播上可以获得很好的效果。
头部跟踪技术可以在只提供单视点的条件下,实现具有运动视差的立体显示。
在众多的自由立体显示系统中,基于光栅的 LCD 自由立体显示设备因其易于加工、多视点立体效果好,因而成为了市面上最早出现的裸眼立体显示器,包括任天堂公司的3DS,都采用了狭缝光栅式结构,对于显示器和电视机这种像素点距固定的设备,一般柱镜光栅不好匹配,因此使用狭缝可以有效的解决匹配问题。
用于自由立体显示器的光栅可以分为三大类:狭缝光栅、棱柱镜光栅、点阵式光栅。其中,点阵式光栅很少见,本文方法主要基于狭缝光栅和棱柱镜光栅。