探秘编码技术 抢占科技前沿——记中国科学技术大学信息科学技术学院林宪正博士
2019-12-21 21:23:00 访问量:

◎本刊记者   赵林

探秘编码技术 抢占科技前沿——记中国科学技术大学信息科学技术学院林宪正博士

 1948年,现代信息论的奠基人、美国科学家香农发表了《通信的数学理论》,标志着信息与编码理论这一学科的创立。几十年来,信息与编码技术不断发展,一次又一次关键技术的历史性突破,波澜壮阔般推动着人类通信迈过一个又一个顶峰。一个新的发现会创造一个全新的研究领域,一个新的发现会创造出无数奇迹,每一位科学家都是这一领域的重要角色,现如今,研究者们不断突破创新,各种优秀的编码技术的涌现,才造就了今天人类通信奇迹。

毫无疑问,中国科学技术大学网络空间安全学院的林宪正博士正是这样一位科学家,他多年来致力于研究信道编码技术,从事科研工作包括:有限域GF(2m)上的FFT及其在RS码上的应用和CRC快速算法研究,在纠错码算法、存储系统纠删码与数位水印等领域取得了重大的突破,提高了通信网络中信息处理和传输的方式,为信息理论研究领域的重大突破做出了突出贡献。

开拓创新 编码领域斩获成果

林博士是我国信道编码领域的新起之秀,自2016年起任职中国科学技术大学特任研究员,他曾获中国电子学会第24届信息论学术年会最佳报告奖、科大新创校友基金会“新创学者”称号、已通过中科院百人计划C类择优,现在,已成长为信道编码领域知名的青年学者。

离散傅里叶变换(Discrete Fourier Transform,DFT)是一种经典的线性变换,已被广泛应用于信号分析与图像处理中。快速傅立叶变换(Fast Fourier Transform,FFT)是快速计算DFT的算法,其需要O(n lg(n))复数运算。然而,当DFT建构于有限域GF(2m)上时,我们较难直接应用经典FFT算法,因此其计算复杂度稍大于O(n lg(n))。为了解决此问题,林博士提出一种对于GF(2m)多项式环的基底,并基于此基底给出了一个复杂度为O(n lg(n))的算法,解决了代数计算领域一个关键问题。

Reed-Solomon(RS)码是一类经典的线性纠错码。如今RS码已被广泛地应用于各种商业用途,如CD、DVD 和蓝光光盘,QR码,一些存储系统与通信标准等。因此,RS码的编译码速度为核心问题。基于有限域上的FFT算法,林博士提出了一系列RS码上的编码,纠删译码与纠错算法。这些算法构成目前已知RS编解码的最低复杂度。对于林博士的优秀成果,该领域的世界各位权威人士都给予了高度的评价。

再生码是一类纠删码,主要应用于分布式存储系统。为了系统的可靠性,一般分布式存储系统会将数据拷贝n份分别存于网络的不同节点上,但是拷贝法带来巨大的存储代价。基于纠错码,如RS码,的存储技术可以大幅度降低存储代价,但是恢复故障节点时需要大量数据传输。再生码由于能在存储代价和传输代价方面取得平衡而受到关注。在这方面的工作中,林博士建构出一系列的再生码,其所需要的有限域大小编译码复杂度等皆优于之前已知的再生码。

除此之外,林博士在信息内容安全的研究主要在可逆信息隐藏码与可视密码上。首先,利用可逆信息隐藏技术,接收者从载密图中提取秘密消息后还可以无损重构原始载体。此技术在军事、医学、司法图像篡改认证等领域有重要应用,尽管这方面理论研究大约2000年左右已大致完成,但一直以来能逼近最佳率失真曲线的可逆隐藏码主要是针对二元载体设计的。对此,他提出了一种可逼近灰阶信号率失真界的可逆隐藏码,这是首个将可逆隐藏码的理论研究从二元域扩展至灰阶信号上的工作,从而更贴近一般图像的格式。

而关于第二个研究方向可视密码,是一种秘密分享机制,可将一张秘密黑白图像编码成N张投影片,使得某些投影片经迭合即可看到秘密图像。与传统Shamir多项式秘密分享方案比较,可视密码的主要特点在于译码时不需经由计算机运算,因此适合无计算机的应用环境。林博士在此领域上发表了多项创新成果,如当N趋近无穷大时最优化对比的视觉密码方案。他还提出了一种结合视觉密码学与多项式秘密分享的机制:当没有计算机辅助译码时,其秘密图像可经由迭合译码;当有计算机辅助时,可计算出高质量的秘密图像。

挑战突破 算法研究再攀新高

除了理论贡献外,林博士亦积累一些项目成果。目前一些冷存储文件系统会用少量校验RS码编码数据以避免数据丢失。因此林博士亦针对少量校验位RS码设计其快速算法。首先证明3校验位MDS码的编码复杂度下界,又提出新的RS码算法逼近此理论下界。模拟结果显示,对于3校验位RS码,新的算法吞吐量为Intel公司开发的函数库ISA-L的2.75倍。

除此之外,林博士的项目成果还有CRC快速算法,CRC是一种常见的错误检测码,在存储系统中,由于每块数据在读出与写入皆须计算CRC以检测错误,因此计算CRC是系统性能主要瓶颈之一。在研究工作中,他们提出新算法逼近CRC计算量理论下界(每信息比特2 XOR)。模拟实验显示,在Intel Xeon CPU E5-2658 v2上,新算法的吞吐量约为Intel ISA-L函数库的3.13倍。以上技术正在申请3项专利,其部份专利技术已用于商用存储系统中。其测试报告指出,其开发算法使得系统的普遍性能指标提升5至10%,最大性能提升15%。

放眼未来,林博士将进行的阶段性研究工作计划是RS码算法理论研究和Rateless RS码的算法设计,对于RS编码,目前是否已达到最优解?对于RS译码,是否存在更快的算法?这些问题,正是林博士的研究所要解决的,预期成果将证明某些条件下RS编码的复杂度下界,为此设计一种新的RS纠删译码算法。期望最终在编码领域与美国标杆企业竞争核心算法技术。

回顾人类编码历史,波澜壮阔、百花齐放,毫不夸张地说,现在正是信道编码技术的文艺复兴时期,而开启文艺复兴之门的,正是像林博士这样开拓创新、勇于挑战的科研工作者们。现在,编码技术的历史舞台上,5G时代即将登场,随着不断增加的数据会对存储方式带来新的压力,亟待研究新型的编码算法技术,打破国外技术垄断,并引领世界先进水平,激发信道编码史无前例的创新活力。这就是林博士未来努力实现的目标,“风起云涌自当扬帆起航,任重道远更需策马扬鞭”,他正在这条科研道路上砥砺前行。