问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

一文看懂索尼CMOS传感器的各种对焦技术(纯干货建议收藏)

创作时间:
作者:
@小白创作中心

一文看懂索尼CMOS传感器的各种对焦技术(纯干货建议收藏)

引用
1
来源
1.
http://www.360doc.com/content/24/1222/16/85359500_1142611886.shtml

随着手机摄影的不断发展,CMOS传感器的对焦技术也在不断演进。从最初的反差对焦到如今的全像素八核对焦,每一代技术都在追求更快、更准、更清晰的对焦效果。本文将带你深入了解索尼CMOS传感器的各种对焦技术,从原理到应用,全面解析这些令人惊叹的技术革新。

1. 反差对焦

作为最早的自动对焦技术,其技术原理是最简单的,同时也是最自然的,因为人眼对焦所基于的原理也是反差式——通过大脑对画面的反差信息之判断从而调节晶状体的对焦。

“反差”的具体判断原理为:当物体不在焦内时,画面虚化成一个个弥散圆叠加在一起,此时弥散圆的半径远大于点,因此亮度和对比度都低;而当对焦准确时,焦内是一个个的点,画面锐利因此对比度高。

也就是说,对焦不准确之时整个画面都是模糊的,没有明显的反差信息;而当对焦准确之时,焦点范围图像是最清晰的状态,而焦点之外的区域则表现为模糊状态,反差非常明显。

判断原理说完,那么具体的工作原理就很好理解了。当镜头对准被拍摄物体时,对焦模组的马达便会驱动镜片从底部向顶部移动,在这个过程中传感器会进行全面检测。

同时传感器还会持续记录所检测到的对比度等反差数值,当找到反差最大的位置后,运动到顶部的镜片便会回到这个位置从而完成最终的对焦。

在这个过程中,会看到取景框内容有一系列的模糊清晰之反复变化过程,与此对应的术语便是“拉风箱”。其优点是技术简单且成本低,但缺点也很明显——耗时太长了!

2. 相位对焦 / 激光对焦 / TOF 对焦

有趣的是,相位对焦(Phase Detection Auto Focus,简称为PDAF)技术其实也与人眼有关,只不过其相关的是“人眼测距”原理——双眼由于位置不同故接收光线会形成视差从而得知物体远近。

根据这个人眼仿生原理,手机CIS会设置一些“掩蔽式相位对焦像素”,即有些像素上面的彩色滤光片会被屏蔽左一半或右一半,而这些左、右掩蔽式相位对焦像素便配成了一对从而得以模拟人眼检测光信号的距离信息。

然后检测到的信息会交给 ISP 计算相位差,最终计算结果出来之后就可以直接指引镜片移动到合适的位置以完成合焦。由于这个过程是一步到位的,所以实际对焦速度明显比反差式对焦更快。

那么具体的计算判断过程如何呢?原来在合焦状态下,投影在感光区的光线距离是有既定数值且会对应一部分配对的相位对焦像素点——此为事先设计好的焦点检测基准。

在此基础之下,代表被摄物体距离偏近的前焦状态,其所投射之较小间距便会显示波峰向中心偏移,而这个波峰的偏移量便是相位差。

根据波峰的偏移方向以及相位差信息,镜片就会知道移动的方向以及移动的距离。同理,代表被摄物体距离偏远的后焦状态之工作方式照此反推即可(具体过程看下图)。

虽然这种对焦方式不需要来回试探,只需一次镜片移动即可完成对焦,但为了提高对焦精度还是需要与反差对焦组合使用——先用相位对焦快速移动镜片再以反差式对焦微调。

理论上来说,用于相位对焦的像素越多则对焦速度越快,但由于掩蔽式相位对焦像素不参与成像,所以增加过多的相位差检测像素便会造成后期插补图像信息困难,使得图像画质下降。

此外,这些相位差检测像素的数量瓶颈又限制了暗光环境对焦性能。为了解决暗光对焦问题,首先引入的是激光对焦传感器——其能发射红外光线进行物理测距从而辅助对焦。

但是,这种采用意法半导体方案的激光对焦有距离限制(一般2米以内),于是后面索尼就出场了。

索尼方案具体可分两种,一种是原理与激光对焦一样的 dTOF 方案。

索尼的 dTOF 功率更大适合远距离对焦,故很快便替代了意法半导体方案,成为各大旗舰首选。

另一种则是成本更高的 iTOF 镜头方案,其通过投射面光源,再积存反射光并检测与光源的相位差,从而间接测定深度信息。

iTOF 方案虽然只适合中近距离对焦,但其却有精度更高的优点。

那些用在前置 3D TOF 人脸识别模组上的便是这种方案,另外一些老款顶级旗舰还会将其用在后置影像模组中参与混合对焦。

3. 全像素双核对焦 / “2×1 OCL”双核对焦

虽然 TOF 方案可以辅助暗光对焦,但掩蔽式相位对焦在画质损失方面的缺点却无法解决;为此基于双PD共享 OCL(片上微透镜)像素结构的全像素双核对焦技术,便登上了历史舞台。

其具体原理,就是让这两个 PD(光电二极管)组成全新形式的一对“眼睛”,再通过双PD的“一开一合”获得相位差检测能力。且由于两个PD的信息可以相加,因此得以消除相位差影响并最终获得无损画质。

这样结果就很明显了,以往的掩蔽式相位对焦仅有少量的像素参与对焦,而这个双核对焦直接就是全像素皆可对焦!关键其还能获得全部的进光量,使得暗光对焦性能也不会被削减!

也就是说全像素双核对焦一问世,便直接解决了以往掩蔽式相位对焦所存在的对焦像素量少、画质易受损、暗光对焦性能弱等三大顽疾!一跃成为了当年旗舰传感器的首选对焦技术。

但全像素双核对焦啥都好,就是有个很明显的缺点——由于要放置两个PD因此其像素尺寸不能太小,于是“2×1 OCL”双核对焦就冒出来了。

也就是说有两个像素共用了一个大的微透镜,并以此组成一对“眼睛”进行相位对焦。这样不管像素尺寸有多小,只要有个大的微透镜能罩住它俩,就能组成一种全新形式的“双核对焦”。

“2×1 OCL”双核对焦由于没有掩蔽损耗,故其进光量相较于掩蔽式相位对焦直接就翻倍了!

不过这些“2×1 OCL”像素并不参与成像,所以其只能和掩蔽式像素一样部分存在于CIS上。虽然其各方面性能都比不上全像素双核对焦,但这并不妨碍手机厂商故意将其简称为“双核对焦”以蹭全像素双核对焦的光。

那么在手机宣传中该怎么分辨这两种技术呢?其实很简单,就看有没有“全像素”这个前缀即可。

知识插补:Quad Bayer 排列

为了讲清楚以下的对焦技术,这个知识点还是得补充一下的。如上图所示,Quad Bayer 排列的每个颜色之滤片皆覆盖了四个像素,感觉好像是 Bayer 排列的“放大版”。

实际确实如此,那为何要多此一举呢?刚开始的时候,是因为像素尺寸太小滤色片工艺跟不上,只能采用这种“曲线救国”的方式,顺带还能在营销环节大肆吹嘘一波。

后面随着“卷大底”潮流盛行,大像素开始受到重视,这种情况就不复存在了,但其依然没被淘汰——可见是有“真本事”的。下面就详细讲一下,其转为高像素模式的工作原理。

首先,Quad Bayer 排列要进行PD补偿和坏点补偿。然后由于所覆盖的子像素位置不同,导致感光能力有一定差别,所以就需要引入 Crosstalk。

具体来说就是将全图分成多个 ROI 方块,然后计算各像素通道的能量并确定其补偿数据,最终使用这些校准数据从而让原本不均匀状态的能量分布变得更为平衡。

落到实处的效果就是,Crosstalk 校准补偿可以去除由于信号差别造成的格子、锯齿状等色块干扰——这种干扰现象在拍摄单一色块时尤为明显。

经过这些补偿操作后,就正式开始进入 Remosaic 环节了,这个过程也分为三步。

第一步:利用插值算法,将 Quad Bayer Raw 数据转换为三组RGB数据。

第二步:再用将 RGB Image 转Bayer的算法,将其分解为三组 Bayer Raw Image。

第三步:将三组数据合为正常的 Bayer 排列,并送到ISP进行“去马赛克”处理。

熟悉“去马赛克”算法的朋友,看到这个 Remosaic 环节估计会很熟悉,毕竟有些步骤是一样的。当然,这只是最基础的一套 Remosaic 算法。

后面随着 Quad Bayer 技术的发展,索尼还研究出了其它更先进的转换排列算法。于是,低光照情况下像素合成以扩展进光量,高光照情况下转 Bayer 排列以获得高解析力,就成为了这个技术的宣传点。

但是,凡事有利必有弊,这个技术先天就有个明显缺点——即采样空间精度下降这个难题,毕竟 Bayer 阵列本来就是靠猜色插值来输出图像的!

4. 全像素全向对焦

随着 Quad Bayer 技术的发展,索尼还拓展出了一种全新的对焦技术——直接用 Quad Bayer 排列的四个像素去对焦。

前面说到,“2×1 OCL”双核对焦虽然可以应对像素尺寸很小的传感器,但在综合性能方面却明显弱于全像素双核对焦,那么有没有两全其美的方案呢?

这时候如果每一片微透镜都能覆盖四个像素,那么在 Quad Bayer 排列的加持下,那不就相当于“全像素四核对焦”了吗?

而且全像素双核对焦还有个缺点,那就是在面对缺少图案变化的拍摄物体时不太敏感,也就是说其横向纹理对焦能力偏弱。

这就好像传统单反上的“一字对焦点”,只能检测竖向纹理,那要加强对焦性能该怎么办呢?首先就是增加横向纹理的对焦能力,从而组成“十字”对焦点阵列。

这时候如果一个微透镜能够覆盖四个像素,那不就可以分割成左右、上下、斜向来检测相位差吗?而这就是所谓的“米字”对焦。

同时在暗光环境下,还可以利用“像素四合一”模式和全像素对焦特点最大程度地拓展进光量,故其暗光对焦性能非常强。

不过,这个对焦技术有个很大缺点,那就是在微透镜数量巨幅减少的情况下,切换到高像素模式时其解析力和默认的像素合成状态没啥明显区别。

这就是为什么采用局部“2×2 OCL”结构的豪威OV64B(下图左边所示),能在长焦望远方面发挥大作用的根本原因。

那为什么全像素“2×2 OCL”结构会让高像素模式接近形同虚设呢?简单来说可以回想全像素双核对焦,有没有因为单像素多个PD提高了解析力?

具体来说,则是又回到了 Quad Bayer 排列所面临的采样空间精度下降问题:本来滤色片这么玩就影响到解析力了,结果微透镜还跟着这么玩!

总的来说还是归因于算法不能凭空增加细节这个本质,虽然如今在 AI 加持下高像素算法已经很牛了,那么在像素结构层面能不能有更好的方案呢?

5. 全像素八核对焦

没错,最终的答案就是结合了 Quad Bayer 排列和单像素双PD结构的全像素八核对焦,如今索尼的顶级旗舰传感器皆采用了这个技术。

按照索尼官方的说法,这个对焦技术最大的特点就是在进行HDR拍摄时,长曝光、中曝光和短曝光的所有像素皆能获取相位差。

这就是 QBC3-HDR 技术所展现的奇效,在对焦时可以不受目标物亮度的影响,这在面对大光比场景时其对焦性能便能得到酣畅淋漓的发挥。

同时全像素八核对焦,还向下兼容全像素双核对焦的所有优点!此外在高像素模式解析力表现方面,相较于全像素全向对焦也有明显的先天优势。

但是,在全向对焦性能方面其依然不如全像素“2×2 OCL”结构,虽然其综合表现已经非常极致了。

于是为了最牛的视频录制对焦性能,苹果便向索尼定制了手机界独一无二的,全像素八核对焦结合掩蔽式相位对焦之超级复合对焦技术。

但果子此举就没有副作用吗?答案显然是否定的。因为其掩蔽式相位对焦像素的密度很高,这对于拍照的解析力表现而言非常不利。

当然,大家都知道果子真正关心的还是视频录制性能,所以这个对焦方案对于拍照解析力的影响对其而言并无大碍,本来这世上就没有真正完美的技术方案。

和果子一样在视频录制对焦性能方面出奇招的,还有那款昙花一现的华为定制传感器IMX608,其负责对焦的像素结构如下图所示非常特别。

具体来说就是在像素十六合一模式下,斜向相连的那八个掩蔽式像素每两对合成一组相位对焦结构,这像不像普通的掩蔽式相位对焦像素对?

要知道IMX608的原生像素尺寸为1.12微米,那么十六合一后就是巨大的4.48微米了!这种级别的掩蔽式相位对焦,无论是暗光对焦性能还是录像对焦性能皆会有出色表现。

其实三星传感器也有全像素八核对焦,只不过其又发展出了另一种特色技术方案——即绿色子像素通过斜切的光电二极管获得全向对焦能力。

总结:

①,反差对焦(CDAF)——功能机时代就存在的古老技术,可以精准找到对比度最高的对焦点并自动对焦,技术简单成本低但是耗时过长。

②,掩蔽式相位对焦(PDAF)——由iPhone6系列首发,能够根据相位差信息计算出对焦点从而快速对焦,缺点是对焦性能受限于对焦像素数量、暗光对焦性能弱和掩蔽式结构有损画质。

③,全像素双核对焦(Dual PD)——由三星S7系列首发,通过全像素双PD结构一举解决了 PDAF 的全部缺点,但横向纹理检测能力弱。

④,“2×1 OCL”双核对焦(Dual PDAF)——由OPPO R9s系列首发,通过部分不参与成像之共享微透镜的双像素获得相位对焦能力,暗光对焦性能虽然比 PDAF 强但其它缺点两者皆一样。

⑤,全像素全向对焦(2×2 OCL)——由OPPO Find X2 Pro首发,通过 Quad Bayer 排列四像素共享大微透镜的结构,获得极致暗光对焦性能和全向对焦能力,缺点是高像素模式接近形同虚设。

⑥,全像素八核对焦(Octa PD)——由华为P40系列首发,通过 Quad Bayer 排列和 Dual PD 的结合,在高像素模式解析力无忧情况下还额外拥有超牛HDR对焦能力,但横向纹理检测能力弱。

拓展阅读:

有关QBC-HDR的知识详见《一文看懂索尼的多重曝光HDR技术》

有关 DCG-HDR 和 LOFIC 技术的知识详见《一文看懂索尼、三星和豪威的各种单曝光 HDR 技术》

传感器架构迭代详见《一文看懂索尼CMOS传感器的历代技术演进》

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号