前言
介紹全同態加密(FHE):探索其令人興奮的應用、限制以及推動其受歡迎的最新發展。
當我(Mustafa)第一次聽到「全同態加密」(FHE)時,我想到了區塊鏈領域為流行概念賦予長名稱的傾向。這些年來,我們遇到了許多在業界引起轟動的流行詞,最近的一個是「零知識證明」(ZKP)。
在對一些使用FHE建造產品的新公司進行一些調查和探索之後,我注意到了一個充滿了燦爛新工具的地平線。在未來的幾個月和幾年中,FHE可能會像ZKP一樣成為席捲產業的下一個大技術。各公司正利用在密碼學和雲端運算各領域的最新進展,為邁向一個強大的、保護資料隱私的未來鋪路。問題不在於我們是否能實現,而是何時能實現,我相信FHE可能是推動資料隱私和所有權前進的關鍵催化劑。
“FHE是密碼學的聖杯。隨著時間的推移,FHE將重塑所有計算的結構,無論是web2還是web3。”
什麼是同態
Homomorphism(同態)這個名詞,我們先來理解「同態」這個字的意思。追溯其根源,同態起源於數學,定義為在兩個同類型代數結構之間的映射,它保留了它們之間的一個核心組成部分。
如果你像我一樣更喜歡實用的定義,那麼這背後的數學原理是,兩個群組不需要完全相同,就可以擁有相同的核心屬性。例如,想像兩個盛有水果的盒子,每個盒子對應一個不同的群體:
- 盒子A包含小型水果。
- 盒子B包含大型水果。
儘管各個水果的大小不同,但在盒子A中將小蘋果和橙子一起榨汁可以產生與在盒子B中將大蘋果和橙子一起榨汁相同的混合果汁味道。榨汁以產生相同的味道類似於在兩個盒子之間保持一個核心組件。假設相同的風味是我們的主要關注點,那麼我們從哪個盒子榨取果汁並不重要,因為果汁的數量並非我們關注的焦點。在重要的方面(味
道),這兩個群體是等價的,所以它們之間的差異(大小和數量)不會影響我們定義的它們的主要功能,即產生特定的果汁風味。
與同態類比,我們捕捉了它的兩個主要特徵:
映射:我們在水果之間建立了聯繫,其中盒子A中的每個小水果都對應盒子B中的較大版本。因此,
盒子A中的小蘋果對應盒子B中的大蘋果,依此類推。
操作保持:如果在盒子A中榨兩個小水果產生了特定的風味,那麼在盒子B中榨它們對應的較大版本也應產生相同的風味。儘管獲取的果汁的大小和數量不同,但「風味特徵」得以保持。
什麼是全同態加密
將這一點與本文的中心話題聯繫起來,全同態加密(FHE)是一種特定的資料加密方法,它使人們能夠在不暴露原始資料的情況下對加密資料進行計算。理論上,對加密資料的分析和計算應產生與對原始資料進行的相同的結果。透過FHE,我們在加密資料集中的資料與原始資料集中的資料之間建立了一對一的聯繫。在這種情況下,核心元件的保留是能夠對任一資料集中的資料執行任何計算並產生相同的結果的能力。
在這方面,許多公司已經採取預防措施來保護用戶資料並維護差分隱私。公司很少在雲端或其資料庫中儲存原始的、未加密的資料。因此,即使攻擊者控制了公司的伺服器,他們仍需繞過加密才能讀取和存取資料。然而,當資料僅僅被加密並未被使用時,它並不具有趣味性。當公司希望對資料進行分析以獲得有價值的洞見時,他們別無選擇,只能解密資料來進行。當資料解密時,它變得脆弱。然而,透過端對端加密,FHE變得非常有用,因為我們不再需要解密資料來分析它;這只是可能性的冰山
一角。
一個關鍵的考慮因素是公司是否應該被允許一開始就閱讀和儲存我們的個人資訊。許多人對此的標準回應是,公司需要看到我們的數據才能為我們提供更好的服務。
如果YouTube不儲存像我的觀看和搜尋歷史這樣的數據,演算法就無法充分發揮潛力,向我展示我感興趣的影片。因此,許多人認為在資料隱私和獲得更好的服務之間的權衡是值得的。然而,有了FHE,我們不再需要做出這種權衡。像YouTube這樣的公司可以在加密資料上訓練他們的演算法,並為最終用戶產生相同的結果,而不會侵犯資料隱私。具體來說,他們可以同態加密像我的觀看和搜索歷史這樣的信息,在不查看它的情況下進行分析,然後根據分析向我展示我感興趣的視頻。
FHE是向建立一個我們的數據不再是我們自由給予組織的有價值商品的未來邁出的重要一步。
全同態加密的應用
全同態加密(FHE)如果正確應用,將是所有儲存用戶資料的行業的突破。我們正在觀察一項可能改變我們對資料隱私的整體態度以及公司可接受的侵犯限度的技術。
讓我們先來探討FHE如何能改造醫療產業的資料實務。許多醫院在其資料庫中保存著病患的私人記錄,
出於道德和法律原因,這些記錄必須保密。然而,這些資訊對外部醫學研究人員非常有價值,他們可以分析這些數據以推導出關於疾病和潛在治療方法的重要見解。一個減緩研究進度的主要障礙是
在將資料外包給研究人員時保持患者資料的完全保密。有許多方法可以使患者記錄匿名化或偽匿名化,但這些方法都不完美,要么可能過多地透露某人的信息,使其可識別,要么可能沒有透露足夠的病例信息,使得難以獲得關於疾病的準確見解。
透過FHE,醫院可以同態加密患者數據,使在雲端保護患者隱私變得更加容易。醫學研究人員可以在加密資料上執行計算和運行分析功能,而不會妨礙患者的隱私。由於加密資料與原始資料之間存在一對一的映射,因此從加密資料集獲得的結果提供了可以應用於實際病例的真實見解。 FHE可以迅速推動醫療產業的進步。
全同態加密(FHE)在人工智慧(AI)訓練中的另一個令人興奮的應用也值得關注。目前,AI領域面臨隱私問題,這阻礙了公司獲取對精煉AI演算法至關重要的大量廣泛資料集的能力。培訓AI的公司必須在使用有限的公共資料集、支付大量金錢購買私人資料集或建立資料集之間做出選擇,後者對於使用者較少的小公司來說尤其具有挑戰性。 FHE應該能夠解決阻止許多資料集提供者進入這個市場的隱私問題。因此,FHE的改進很可能導致可用於訓練AI的資料集數量增加。這將使AI訓練更加經濟可行且精細化,鑑於可用資料集的多樣性增加。
使用FHE,公司可以在不洩漏原始資料的情況下對加密資料進行機器學習模型訓練。這意味著數據所有者可以安全地分享他們的加密數據,而不必擔心隱私洩露或數據濫用。同時,AI模型訓練者可以利用更多樣化和全面的資料集來改進其演算法,這些資料集在沒有FHE的情況下可能無法使用。因此,全同態加密不僅提高了資料的安全性,也拓寬了AI研究和開發的可能性,使得AI技術的應用更加廣泛和有效率。
過去全同態加密的缺陷
儘管全同態加密(FHE)確實承諾將改變當代大數據,但我們為什麼還沒有看到更多的實際應用呢?
雖然FHE已經是人們討論和研究多年的話題,但現實是,在實踐中實現FHE非常困難。核心挑戰在於執行FHE所需的運算能力。一個全同態安全的資料集可以產生與其原始資料形式相同的分析結果。這是一個挑戰性的壯舉,需要大量的計算速度和能力,其中許多在現有計算機上實施是不切實際的。通常在原始資料上需要幾秒鐘的操作,在同態加密資料集上可能需要幾小時甚至幾天。這種計算挑戰造成了一個自我延續的循環,許多工程師推遲了FHE專案的承擔,從而減緩了其發展並限制了其優勢的完全實現。
工程師在FHE上面臨的一個具體的計算問題是處理「噪音誤差」。在對同態加密資料集進行計算時,許多工程師都遇到了每次計算都會產生額外雜訊或錯誤的情況。當只需要進行幾次計算時,這是可以容忍的,但在多次分析之後,雜訊可能變得如此突出,以至於原始資料變得難以理解。數據幾乎喪失了。
為什麼是現在
就像生成式人工智慧一樣,曾經被認為是有限且原始的,直到它變成主流,全同態加密(FHE)正走在類似的進步軌道上。許多行業領袖,甚至那些超越區塊鏈領域的領袖,已經聚集起來組織對FHE的大量研究和開發。這導致了幾個近期的行業發展,推動了這項技術進步的引人注目的敘述。
DPRIVE項目
2021年3月,微軟、英特爾和美國國防高級研究計劃局(DARPA)同意啟動一個多年期計劃,以加速全同態加密(FHE)的發展。這個名為「虛擬環境中的資料保護」(DPRIVE)的計畫標誌著FHE的重大進展。它展示了兩家專注於雲端運算和電腦硬體的行業巨頭聯合應對資料隱私問題。他們啟動這個計劃是為了建立能夠管理FHE計算速度的電腦和軟體,並建立精確實施FHE的指導方針,防止錯誤使用導致的資料外洩。
作為DPRIVE計畫的一部分,工程師們承擔了透過探索方法來減少雜訊至保持原始資料水準的任務,以此來減輕先前提到的『雜訊錯誤』。一個有前景的解決方案是設計大算術字大小(LAWS)資料表示。雖然傳統的電腦處理器(CPU)通常使用64位元字,但工程師正在開發能夠處理1024位元或更多位元的LAWS新硬體。這種方法之所以有效,是因為研究顯示較長的字直接影響訊號雜訊比。簡單地說,較長的字在FHE中每進行一步額外計算時產生的噪聲更少,允許執行更多的計算,直到達到數據丟失閾值。透過建構新硬體來應對這些挑戰,參與DPRIVE計畫的工程師大大減少了執行FHE所需的計算負載。
為了加速運算並接近使FHE速度提升100,000倍的目標,DPRIVE團隊開啟了一個持續的旅程,設計出超越常規處理和繪圖單元能力的新資料處理系統。他們開發了一種新的多指令多資料(MIMD)系統,能夠同時管理多個指令和資料集。 MIMD類似於建造一條新的高速公路,而不是使用現有不適合的道路來容納FHE快速、即時計算所需的流量。
DPRIVE計劃的一個有趣之處在於它在計算機數學計算中廣泛使用了'並行性'。這使得開發者能夠同時進行多個大數字計算。你可以將並行性想像為同時部署一群數學家來處理一個巨大數學問題的不同部分,而不是讓他們一個接一個地完成各自的工作。儘管同時進行多項計算有助於快速解決問題,但電腦必須進行空冷以防止過熱。
2022年9月,啟動該計畫一年半多後,微軟、英特爾和DARPA宣布他們已成功完成DPRIVE計畫的第一階段。他們目前正在進行DPRIVE的第二階段。
SDK和開源函式庫
隨著眾多大型公司在全同態加密(FHE)領域的先行探索,可用的軟體開發套件(SDK)和開源程式庫數量激增,這使得開發者能夠基於彼此的工作進行構建。
微軟宣布推出Microsoft Seal,這是一個開源程式庫,為開發者提供了在資料集上執行同態加密的工具。這使得更廣泛的開發者能夠探索FHE,從而民主化了端對端加密和計算服務的存取。該程式庫提供了同態加密程式的範例,並附有詳細的註釋,以指導開發者進行正確和安全的使用。
英特爾也推出了自己的同態加密工具包,為開發者提供工具以在雲端中更快實現同態加密。英特爾設計這個工具包時保持了靈活性,確保與最新的數據處理和計算進度相容。它包括專為格密碼學定制的函數、與Microsoft Seal的無縫操作集成、同態加密方案的樣本以及指導用戶的技術文件。
谷歌的Private Join and Compute開源函式庫為開發者提供了多方運算(MPC)工具。這種計算方法允許各方結合各自不同的資料集來獲得共享見解,而無需向彼此暴露原始資料。 Private Join and Compute結合了來自FHE的密碼技術與Private Set Intersection(PSI)以優化資料保密實踐。 PSI是另一種密碼方法,允許擁有不同資料集的各方識別共有元素或資料點,而無需透露他們的資料。谷歌在推進資料隱私方面的方法不僅僅集中在FHE上;它透過將FHE與其他有影響力的資料實踐整合,優先考慮了更廣泛的MPC概念。
值得注意的是,針對FHE的聲譽良好的開源程式庫的可用性正在上升。然而,當觀察到知名公司在其營運中實驗這些庫時,這一點變得更加引人注目。 2021年4月,作為著名的股票交易所和資本市場的全球技術實體,納斯達克將FHE納入其營運。納斯達克利用英特爾的FHE工具和高速處理器,透過反洗錢努力和詐欺偵測來應對金融犯罪。這是透過使用同態加密來識別包含敏感資訊的資料集中的有價值見解和潛在的非法活動來實現的。
最近的資本募集
除了前面提到的公司進行的研究和開發外,還有幾家其他公司最近獲得了專注於全同態加密(FHE)的舉措的大量資金。
Cornami 是一家大型科技公司,因開發專為同態加密設計的可擴展雲端運算技術而聞名。他們參與了許多旨在創建比傳統CPU更有效支援FHE的運算系統的努力。他們還指導旨在保護加密資料免受量子運算威脅的舉措。 2022年5月,Cornami宣布成功完成C輪融資,獲得了由軟銀領投的6,800萬美元,使其總資本達到了1.5億美元。
Zama 是區塊鏈產業中的另一家公司,它正在建立開源同態加密工具,開發者可以利用這些工具使用FHE、區塊鏈和AI建立令人興奮的應用程式。 Zama 已經建構了一個全同態以太坊虛擬機器(fhEVM)作為其產品供應的一部分。這種智能合約協議使鏈上交易資料在處理過程中保持加密。探索Zama 庫的各種應用的開發者對其性能印象深刻,即使在複雜的用例中也是如此。 Zama 在2022年2月成功完成了由Protocol Labs 領投的4,200萬美元A輪融資,使其總資本提升到了5,000萬美元。
Fhenix 也是一個新興項目,它正在將FHE帶入區塊鏈。他們的目標是將FHE應用擴展到隱私支付之外,為FHE在去中心化金融(DeFi)、橋接、治理投票和Web3遊戲等領域的激動人心的用例打開大門。 2023年9月,Fhenix 宣布完成由Multicoin Capital 和Collider Ventures 領投的700萬美元種子輪融資。
接下來會發生什麼
多年來,全同態加密(FHE)一直是一個承諾提供強大端對端加密的想法,預示著資料隱私強大的未來。最近的發展開始將FHE從理論夢轉變為現實應用。雖然各種公司正在競爭成為首個實現強大、功能完整的FHE版本的先驅,但許多公司正合作共同導航這項強大技術的複雜性。這種合作精神透過他們實施各種跨團隊專案和開發與其他庫整合的開源庫而顯現。
根據我的發現,圍繞FHE的討論似乎影響深遠。在接下來的幾周里,我很高興能夠更深入地探討,並分享我對FHE研究的更多見解。具體來說,我渴望探索更多關於以下主題的內容:
FHE的新興應用:
- 零知識證明(ZKPs)與FHE之間的相互作用。
- 將FHE與私有集合交集(PSI)整合,以推進安全的多方計算(MPC)。
- 像Zama和Fhenix這樣的新公司,正在FHE領域中引領發展。
Reference:
Arampatzis, Anastasios. “Latest Developments in Homomorphic Encryption.” Venafi, 1 Feb. 2022, venafi.com/blog/what-are-latest-developments-homomorphic-encryption-ask-experts/.
Arampatzis, Anastasios. “What Is Homomorphic Encryption & How Is It Used.” Venafi, 28 Apr. 2023, venafi.com/blog/homomorphic-encryption-what-it-and-how-it-used/.
“Building Hardware to Enable Continuous Data Protections.” DARPA, 2 Mar. 2020,www.darpa.mil/news-events/2020-03-02.
Cristobal, Samuel. “Fully Homomorphic Encryption: The Holy Grail of Cryptography.” Datascience.Aero, 7 Jan. 2021, datascience.aero/fully-homomorphic-encryption-the-holy-grail-of-cryptography/.
“Homomorphic Encryption: What Is It, and Why Does It Matter?” Internet Society, 9 Mar. 2023,www.internetsociety.org/resources/doc/2023/homomorphic-encryption/.
Hunt, James. “FHENIX Raises $7 Million in Seed Round Led by Multicoin Capital.” The Block, The Block, 26 Sept. 2023,www.theblock.co/post/252931/fhenix-seed-multicoin-capital.
「Intel® Homomorphic Encryption Toolkit.」 Intel, accessed 8 Oct. 2023,www.intel.com/content/www/us/en/developer/tools/homomorphic-encryption/overview.html#gs.fu55im.
“Intel to Collaborate With Microsoft on DARPA PROGRAM.” Intel, 8 Mar. 2021,www.intel.com/content/www/us/en/newsroom/news/intel-collaborate-microsoft-darpa-program.html#gs. ftusxq.
「Intel Xeon Advances NASDAQ's Homomorphic Encryption R&D.」 Intel, 6 Apr. 2021,www.intel.com/content/www/us/en/newsroom/news/xeon-advances-nasdaqs-homomorphic-encryption-rd.html#gs .6mpgme.
Johnson, Rick. “Intel Completes DARPA DPRIVE Phase One Milestone for a Fully Homomorphic Encryption Platform.” Intel, 14 Sept. 2022, community.intel.com/t5/Blogs/Products-and-Solutions/HPC/IntelComplet-DAR -DPRIVE-Phase-One-Milestone-for-a-Fully/post/1411021.
「Microsoft Seal: Fast and Easy-to-Use Homomorphic Encryption Library.」 Microsoft Research, 4 Jan. 2023,www.microsoft.com/en-us/research/project/microsoft-seal/.
Paillier, Dr. Pascal. “Fully Homomorphic Encryption: The Holy Grail of Cryptography.” Business Age, 9 Mar. 2023,www.businessage.com/post/fully-homomorphic-encryption-the-holy-grail-of-cryptography.
Samani, Kyle. “The Dawn of On-Chain FHE.” Multicoin Capital, 26 Sept. 2023, multicoin.capital/2023/09/26/the-dawn-of-on-chain-fhe/.
Walker, Amanda, et al. “Helping Organizations Do More Without Collecting More Data.” Google Online Security Blog, 19 June 2019, security.googleblog.com/2019/06/helping-organizations-do-more-without-collecting-more -data.html.
「What Is Fully Homomorphic Encryption?」 Inpher, 11 Apr. 2021, inpher.io/technology/what-is-fully-homomorphic-encryption/.
White, Matt. “A Brief History of Generative AI.” Medium, 8 July 2023, matthewdwhite.medium.com/a-brief-history-of-generative-ai-cb1837e67106#:~:text=Although%20most%20people% 20will%20admit,of%20Stability%20AI's%20Stable%20Diffusion.