區(qū)塊鏈的技術(shù)定義
簡單來說,區(qū)塊鏈是一個提供了拜占庭容錯、并保證了最終一致性的分布式數(shù)據(jù)庫;從數(shù)據(jù)結(jié)構(gòu)上看,它是基于時間序列的鏈式數(shù)據(jù)塊結(jié)構(gòu);從節(jié)點拓撲上看,它所有的節(jié)點互為冗余備份;從操作上看,它提供了基于密碼學的公私鑰管理體系來管理賬戶。
或許以上概念過于抽象,我來舉個例子,你就好理解了。
你可以想象有 100 臺計算機分布在世界各地,這 100 臺機器之間的網(wǎng)絡是廣域網(wǎng),并且,這 100 臺機器的擁有者互相不信任。
那么,我們采用什么樣的算法(共識機制)才能夠為它提供一個可信任的環(huán)境,并且使得:
節(jié)點之間的數(shù)據(jù)交換過程不可篡改,并且已生成的歷史記錄不可被篡改;
每個節(jié)點的數(shù)據(jù)會同步到最新數(shù)據(jù),并且會驗證最新數(shù)據(jù)的有效性;
基于少數(shù)服從多數(shù)的原則,整體節(jié)點維護的數(shù)據(jù)可以客觀反映交換歷史。
區(qū)塊鏈就是為了解決上述問題而產(chǎn)生的技術(shù)方案。
我們結(jié)合以往講過的內(nèi)容,和即將要講的內(nèi)容,先提煉一下區(qū)塊鏈在技術(shù)上的 7 個特征,你先記住,我們后續(xù)會慢慢道來:
區(qū)塊鏈的存儲基于分布式數(shù)據(jù)庫;
數(shù)據(jù)庫是區(qū)塊鏈的數(shù)據(jù)載體,區(qū)塊鏈是交易的業(yè)務邏輯載體;
區(qū)塊鏈按時間序列化區(qū)塊數(shù)據(jù),整個網(wǎng)絡有一個最終確定狀態(tài);
區(qū)塊鏈只對添加有效,對其他操作無效;
交易基于非對稱加密的公私鑰驗證;
區(qū)塊鏈網(wǎng)絡要求拜占庭將軍容錯;
共識算法能夠“解決”雙花問題。
區(qū)塊鏈的核心技術(shù)組成
無論是公鏈還是聯(lián)盟鏈,至少需要四個模塊組成:P2P 網(wǎng)絡協(xié)議、分布式一致性算法(共識機制)、加密簽名算法、賬戶與存儲模型。
1. P2P 網(wǎng)絡協(xié)議
P2P 網(wǎng)絡協(xié)議是所有區(qū)塊鏈的最底層模塊,負責交易數(shù)據(jù)的網(wǎng)絡傳輸和廣播、節(jié)點發(fā)現(xiàn)和維護。
通常我們所用的都是比特幣 P2P 網(wǎng)絡協(xié)議模塊,它遵循一定的交互原則。比如:初次連接到其他節(jié)點會被要求按照握手協(xié)議來確認狀態(tài),在握手之后開始請求 Peer 節(jié)點的地址數(shù)據(jù)以及區(qū)塊數(shù)據(jù)。
這套 P2P 交互協(xié)議也具有自己的指令集合,指令體現(xiàn)在在消息頭(Message Header) 的 命令(command)域中,這些命令為上層提供了節(jié)點發(fā)現(xiàn)、節(jié)點獲取、區(qū)塊頭獲取、區(qū)塊獲取等功能,這些功能都是非常底層、非?;A的功能。如果你想要深入了解,可以參考比特幣開發(fā)者指南中的 Peer Discovery 的章節(jié)。
2. 分布式一致性算法
在經(jīng)典分布式計算領域,我們有 Raft 和 Paxos 算法家族代表的非拜占庭容錯算法,以及具有拜占庭容錯特性的 PBFT 共識算法。
如果從技術(shù)演化的角度來看,我們可以得出一個圖,其中,區(qū)塊鏈技術(shù)把原來的分布式算法進行了經(jīng)濟學上的拓展。
?。▓D來自網(wǎng)絡)
在圖中我們可以看到,計算機應用在最開始多為單點應用,高可用方便采用的是冷災備,后來發(fā)展到異地多活,這些異地多活可能采用的是負載均衡和路由技術(shù),隨著分布式系統(tǒng)技術(shù)的發(fā)展,我們過渡到了 Paxos 和 Raft 為主的分布式系統(tǒng)。
而在區(qū)塊鏈領域,多采用 PoW 工作量證明算法、PoS 權(quán)益證明算法,以及 DPoS 代理權(quán)益證明算法,以上三種是業(yè)界主流的共識算法,這些算法與經(jīng)典分布式一致性算法不同的是,它們?nèi)谌肓私?jīng)濟學博弈的概念,下面我分別簡單介紹這三種共識算法。
PoW: 通常是指在給定的約束下,求解一個特定難度的數(shù)學問題,誰解的速度快,誰就能獲得記賬權(quán)(出塊)權(quán)利。這個求解過程往往會轉(zhuǎn)換成計算問題,所以在比拼速度的情況下,也就變成了誰的計算方法更優(yōu),以及誰的設備性能更好。
PoS: 這是一種股權(quán)證明機制,它的基本概念是你產(chǎn)生區(qū)塊的難度應該與你在網(wǎng)絡里所占的股權(quán)(所有權(quán)占比)成比例,它實現(xiàn)的核心思路是:使用你所鎖定代幣的幣齡(CoinAge)以及一個小的工作量證明,去計算一個目標值,當滿足目標值時,你將可能獲取記賬權(quán)。
DPoS: 簡單來理解就是將 PoS 共識算法中的記賬者轉(zhuǎn)換為指定節(jié)點數(shù)組成的小圈子,而不是所有人都可以參與記賬。這個圈子可能是 21 個節(jié)點,也有可能是 101 個節(jié)點,這一點取決于設計,只有這個圈子中的節(jié)點才能獲得記賬權(quán)。這將會極大地提高系統(tǒng)的吞吐量,因為更少的節(jié)點也就意味著網(wǎng)絡和節(jié)點的可控。
3. 加密簽名算法
由于我不是密碼學專業(yè)出身,所以這個部分我會以介紹為主。
在區(qū)塊鏈領域,應用得最多的是哈希算法。哈希算法具有抗碰撞性、原像不可逆、難題友好性等特征。
其中,難題友好性正是眾多 PoW 幣種賴以存在的基礎,在比特幣中,SHA256 算法被用作工作量證明的計算方法,也就是我們所說的挖礦算法。
而在萊特幣身上,我們也會看到 Scrypt 算法,該算法與 SHA256 不同的是,需要大內(nèi)存支持。而在其他一些幣種身上,我們也能看到基于 SHA3 算法的挖礦算法。以太坊使用了 Dagger-Hashimoto 算法的改良版本,并命名為 Ethash,這是一個 IO 難解性的算法。
當然,除了挖礦算法,我們還會使用到 RIPEMD160 算法,主要用于生成地址,眾多的比特幣衍生代碼中,絕大部分都采用了比特幣的地址設計。
除了地址,我們還會使用到最核心的,也是區(qū)塊鏈 Token 系統(tǒng)的基石:公私鑰密碼算法。
在比特幣大類的代碼中,基本上使用的都是 ECDSA。ECDSA 是 ECC 與 DSA 的結(jié)合,整個簽名過程與 DSA 類似,所不一樣的是簽名中采取的算法為 ECC(橢圓曲線函數(shù))。
從技術(shù)上看,我們先從生成私鑰開始,其次從私鑰生成公鑰,最后從公鑰生成地址,以上每一步都是不可逆過程,也就是說無法從地址推導出公鑰,從公鑰推導到私鑰。
圖來自《精通比特幣》一書
4. 賬戶與交易模型
從一開始的定義我們知道,僅從技術(shù)角度可以認為區(qū)塊鏈是一種分布式數(shù)據(jù)庫,那么,多數(shù)區(qū)塊鏈到底使用了什么類型的數(shù)據(jù)庫呢?
我在設計元界區(qū)塊鏈時,參考了多種數(shù)據(jù)庫,有 NoSQL 的 BerkelyDB、LevelDB,也有一些幣種采用基于 SQL 的 SQLite。這些作為底層的存儲設施,多以輕量級嵌入式數(shù)據(jù)庫為主,由于并不涉及區(qū)塊鏈的賬本特性,這些存儲技術(shù)與其他場合下的使用并沒有什么不同。
區(qū)塊鏈的賬本特性,通常分為 UTXO 結(jié)構(gòu)以及基于 Accout-Balance 結(jié)構(gòu)的賬本結(jié)構(gòu),我們也稱為賬本模型。UTXO 是“unspent transaction input/output”的縮寫,翻譯過來就是指“未花費的交易輸入輸出”。
這個區(qū)塊鏈中 Token 轉(zhuǎn)移的一種記賬模式,每次轉(zhuǎn)移均以輸入輸出的形式出現(xiàn);而在 Balance 結(jié)構(gòu)中,是沒有這個模式的。