随着科学技术的发展,数据生成也呈指数级增长。全息数据存储(HDS)技术拥有大存储容量、快速的数据传输速率和较长的使用寿命等优点,使其成为一种新兴的存储技术,适合用于大数据的长期存储。其中,相位型HDS在编码率和信噪比方面比振幅型HDS具有更大的优势。但是,直接从强度图像中重建相位信息仍是需要解决难题。深度学习(DL)在解决计算成像问题方面已经取得很好的成果。在HDS中,利用DL网络来建立衍射强度图像和相位数据页之间的关系。一旦网络训练完成,就可以从衍射强度图像中直接重建相位。通常,训练网络需要大量的标记样本来学习最优参数,且网络的性能在很大程度上依赖于这些训练样本的数量和质量。然而,收集大量的样本进行网络训练是非常耗时且费力的。 在本文中,我们提出了一种结合了HDS的编码特性的图像分割方法,以显著减少所需的训练样本的数量。接下来,我们将详细讨论图像分割的方法。首先,可以使用不同的分割大小来执行分割任务。我们设置了一个相位数据页面的分割窗口,其大小表示分割图像中的相位数。由于图像在一定的距离上传播,并在探测器上产生菲涅耳衍射条纹。像素边界处的强度根据两个相邻像素之间的相对相位进行调制。基于DL的相位重建依赖于这些相位之间的边界衍射信息。因此,如图1所示,将衍射强度图像的分割窗口始终设置为略大于相位数据页面的分割窗口,以保留相邻相位的衍射信息。分割窗口从左到右,从上到下移动一个相位像素。不同的分割窗口产生不同数量的样本。图像分割尺寸越小,可分割的样本数量越多。然而,较小的分割尺寸意味着减少了每个分割图像内的信息内容。在可分割的图像数量和分割图像中包含的信息之间存在平衡。不同相位分割大小和训练集总像素之间的关系分布,如图2所示。 |
图1. 分割窗口的示意图 (a)相位数据页,(b)对应的衍射强度图像 |
图2. 不同相位分割大小和训练集总像素之间的关系分布 |
HDS系统如图3所示。我们对图像分割方法进行模拟和实验,其相位重建结果如图4所示。图中,x轴表示相位分割大小,y轴表示训练数据集中原始样本对(OSP)的数量,z轴表示验证数据集中重建相位数据页的平均误码率。图4 (a)和(c)分别为模拟和实验相位重建结果。图4(b)和(d)表示图4 (a)和(c)的对数处理结果。这种数据处理方法对小值的差异比大值的差异更敏感,使得与图2相符合。DL网络的相位重建结果与训练数据集中的总信息量正相关。在图2中,随着相位分割大小的增加,训练数据集像素的数量先上升,后下降。同时,在图4中,随着相位分割大小的增加,相位重建的误码率先减小,后增加。我们可以得出以下结论,原始样本的适当分割大小范围为4到29,并且相对于中间值(相位分割大小=16)往往更好。 |
图3. HDS系统 |
图4. 基于DL的图像分割的相位重建结果 (a) 模拟BER, (b)模拟Log(BER),(c)实验BER,(d)实验Log(BER) |
传统的基于DL的相位重建方法和基于DL图像分割的相位重建方法的比较结果如表1所示。传统的基于DL的相位重建方法和基于DL图像分割的相位重建方法的误码率分别为1.80%和1.17%。前者使用500个OSP来训练网络,而后者只使用9个OSP。在训练样本数量方面,基于DL的图像分割方法降低了约54倍,在重建质量方面,该方法的误码率比传统方法降低了约35%,码率为1.17%。 |
表1 传统的基于DL的相位重建方法和基于DL图像分割的相位重建方法的比较 |
上述研究成果以“Image segmentation of phase-modulated holographic data storage based on deep learning”为题,整理发表在美国光学学会 (The Optical Society of American, OPTICA) 期刊杂志 Optics Express, Vol. 32, Issue 20, 35002-35014 (2024) 上。 论文的相关链接:https://doi.org/10.1364/OE.536783 |