無損壓縮鼻祖去世了,享年 86 歲。
他就是Abraham Lempel,來自以色列的科學家。
正是因為他和同事發明的LZ77/LZ78 壓縮算法,才有了 Zip、GIF、PNG、TIFF、MP3、PDF 等直到今天還在流行的文件格式。
他生前曾就職的的以色列理工學院評價他為 " 學院成立 100 年來最偉大的研究員之一 ",并稱很少有科學家 " 像他一樣在技術發展以及我們的日常生活領域中都産生了如此大的影響 "。
無數網友為他的離世哀悼。
有人還表示:
我的研究生論文主題是 HTML 壓縮,裡面都還寫有他的名字呢。
共同發明 LZ77/LZ78,徹底改寫數據壓縮領域
Lempel 教授于 1936 年出生于波蘭。
23 歲的時候他進入以色列理工學院,經過八年的學習,拿到博士學位。
就在畢業十年之際,41 歲的他成為母校的全職教授,負責電氣工程和計算機科學專業的教學(随後又擔任了三年計算機學院院長)。
這一年,正是他和同事 Jacob Ziv 發明 LZ77 算法的那一年,也就是 1977 年(下圖左為 Ziv,右為 Lempel)。
正如其名,"LZ77" 中的 "L" 代表 Lempel 教授,"Z" 代表他的同事 Ziv 教授,"77" 則是發明年份。
如果你是計算機專業的學生,LZ77 算法一定出現過你的課本之上。
它的特點包括簡單、易于實現,可以針對任何數據格式進行無損壓縮,完全區别于此前已經誕生的各種有損壓縮算法。
它主要采用的是基于字典的方式進行壓縮。
簡單來說,就是把數據中可以組成 " 短語 " 的一串字符加入 " 字典 ",然後再有匹配的字符出現就采用标記來代替,由此就能實現壓縮的目的。
在具體操作中,該算法會将數據分為" 滑動窗口 " 和 " 數據緩沖區 "。
每次處理數據的時候,先把一部分數據預載入緩沖區,然後依次載入滑動窗口區(有長度限制)。
如果後進入的字符在滑動窗口裡面出現匹配的時候,就記進當前的短語字典中。
随着滑動窗口的不斷向前,字典會不斷變化,不停地滑動字符向前,尋找到更多與字典中的短語匹配的選項,然後用帶有含義的标記符進行标記,最終就可以得到一段壓縮好的表示結果。
例子如下圖所示,粉色為滑動窗口區,藍色為緩沖區。
從上面的原理我們可以看出,LZ77 的壓縮比比較高,但由于要不停地找匹配選項,壓縮過程有一些耗時,但又由于解壓速度又非常快(标記會說明匹配項的明确位置),總體還是算得上非常高效的。
兩位教授就以論文的形式将他們這一成果公布了出來。
很快,在 1978 年,他們又對 77 算法進行了更新,誕生了同樣著名的 LZ78,也就是 LZ77 的第二個版本。
不管後來大家如何 " 修修補補 ",衍生出更加高效和完善的LZSS、LZW、LZH等新算法,它們的原理都和 Lempel 教授和 Ziv 教授的思想沒有什麼差别。
因此,在這些算法上誕生的 TIFF、PNG、ZIP、MP3 等廣為流傳的壓縮文件格式,都得感謝這兩位老爺子的貢獻。
這不,2004 年,IEEE就宣布 LZ77 和 LZ78 算法成為電氣和電子工程的" 曆史裡程碑 "。
Lempel 教授也因為所作貢獻,拿了不少獎項,包括 IEEE 信息理論學會技術創新金禧獎和 2007 年的 IEEE Richard W. Hamming 獎章,後者主要表彰他在 " 數據壓縮方面的開創性工作 "。
57 歲被惠普聘用,貢獻了 8 項專利
在改寫數據壓縮領域之後,Lempel 教授并沒有 " 閑着 "。
1993 年,已經 57 歲的他被惠普公司聘用。
僅過了一年,他就出來創立了惠普以色列實驗室(HP Labs Israel),并擔任其董事長直到 71 歲。
在此期間,惠普以 Lempel 教授的名義注冊了 8 項專利。
如今,Lempel 教授已于上周日(2 月 5 日)辭世,離 87 歲生日就還差一周時間。
悼念。
訃告地址:
https://www.technion.ac.il/en/2023/02/technion-mourns-prof-abraham-lempel/
參考鍊接:
[ 1 ] https://www.ynetnews.com/business/article/hjdfzoa2o
[ 2 ] https://twitter.com/search?q=Abraham%20Lempel&src=typed_query