早前,PAData聯合專注於區塊鏈交易的一站式數據服務平台Chain.info起底全球BTC交易市場中主流交易所的錢包,從400萬餘個錢包的餘額變化和錢包間資金流轉情況觀察第三季度交易所的競爭格局。點擊閱讀《400萬個錢包揭示BTC資金網絡三大所誰在失守存量市場? 》

根據PAData的分析,交易所的交易業務共涉及三類錢包,分別是充提錢包、熱錢包和冷錢包,其中充提錢包的數量佔比達到99.9%。而且不同交易所三類錢包的特徵差異也反映出各交易所資金流轉的不同風格。

從錢包餘額可以看出交易所的真實市場份額,今年第三季度,BTC餘額最多的交易所是Huobi,三類錢包共存有29.6萬枚,其次是Binance,共有24.1萬枚。而Huobi則以第三季度總共超過5萬的淨流入進一步鞏固了其在BTC交易市場中的地位。

交易所間的轉賬還鉤織了一張資金網,其本質是交易所間存量博弈的競爭現狀。從統計來看,Binance、Bitstamp、OKEX和Huobi之間的資金流轉十分活躍。其中,OKEX和Huobi之間的資金互動最活躍,但Binance流失了10.4萬枚BTC到其他交易所。

那麼作為一切分析的基礎——交易所錢包是如何挖掘出來的呢? PAData專訪了數據合作夥伴Chain.info的技術負責人李禎,詳解交易所錢包背後的挖掘邏輯。

0 (1).jpeg


以下是訪談實錄:


PAData:交易所的充提錢包是什麼?有什麼特徵?


Chain.info李禎:用戶在交易所開設了一個賬戶以後,交易所會給用戶提供一個充幣地址。現在主流交易所為用戶提供的充幣地址一般是不可更換的,也就是一個用戶對應一個充幣地址,除非交易所大面積統一更換。這類地址佔比大概是交易所的地址總數的99.9%以上。

PAData:1個交易所的充幣地址代表1個用戶,那是不是可以從交易所的充提錢包數量來看這個交易所的實際用戶規模有多大?


Chain.info李禎:可以這麼看,但是也不能完全這麼理解。存在兩種情況使得實際用戶規模與充提錢包數量不等,一種開戶後充過一次幣,之後再也不使用了,那這就不好確認是否還是實際用戶(實際活躍的用戶),另一種是以某種方式繞過KYC開戶,那麼一個實際用戶可能對應多個充提錢包。

PAData:交易所的熱錢包是什麼?有什麼特徵?


Chain.info李禎:熱錢包是屬於交易所的聯網錢包,主要作用是負責普通充幣地址和冷錢包之間的資金流通以及用戶提幣。熱錢包佔比極小,大致數量也就是10到30之間,但是它的交易數極大。

PAData:交易所的冷錢包是什麼?有什麼特徵?


Chain.info李禎:冷錢包是交易所的離線錢包,交易所會將大部分的資產存儲在冷錢包中。冷錢包只與熱錢包進行資金流通,具有交易總數較小,單次交易總額比較大的特點。

PAData:用戶在交易所中的交易,體現在交易所錢包層面上,比特幣是如何流轉的?

Chain.info李禎:用戶在交易所發生的一切交易行為都是在交易所的數據庫裡發生的,這是無法被監控到的,因為這些數據是交易所握有的。但是用戶的一些行為也會跟交易所產生一定的關係。比如說在充值的時候,用戶和交易所的充值地址發生了一次聯繫,然後在提幣的時候,用戶會從交易所的熱錢包或者其他的充幣地址拿到一筆錢。比如說你想提0.1個比特幣,剛好有一個用戶的賬戶裡有0.2個幣的話,就可能從這個充值地址裡面就直接提給你。

比特幣就是這樣流入或流出交易所的。但用戶的幣不一定會流入熱錢包或冷錢包。

0.jpeg

PAData:根據BTC的UTXO模型,如何判斷一筆交易涉及的多個地址的歸屬?


Chain.info李禎:BTC的交易使用UTXO(Unspent Transaction Output)模型,每一個UTXO屬於一個地址,一個地址可以包含多個UTXO,每一個UTXO是不可拆分的。在交易時,發起交易的用戶使用自己的UTXO作為交易輸入,構造新的UTXO作為交易輸出,這意味著輸入側的地址通常屬於同一個主體。所以我們先考慮輸入一側的地址,根據比特幣構建交易的方式可知,出現在輸入側的地址屬於同一個主體。這就是錢包地址挖掘的第一步——縱向挖掘。

PAData:在縱向挖掘邏輯下,是否可能存在特殊情況,即輸入側的地址由多個主體擁有?


Chain.info李禎:確實存在一種小概率的情況,這種情況在比特幣交易裡面稱為“混幣”,指一筆交易裡面含有多個主體的地址。但是這裡我們基本可以忽略這種情況,原因在於,混幣操作對交易所來說沒有什麼意義,一是容易造成一些安全問題,另外,我們對所有交易所的地址進行了一次分析,發現並沒有兩個交易所的地址出現在同一筆交易的輸入一側。

PAData:除了縱向挖掘以外,還有哪幾種挖掘邏輯?

Chain.info李禎:還有前向挖掘和後向挖掘兩種。

前向挖掘是在縱向挖掘基礎上對輸出側地址做判斷的過程,判斷邏輯是基於普通轉賬的找零交易形態。在前向挖掘中,被挖掘地址必須出現在輸入一側,且輸入側地址數不為二,輸出側地址數一定為二。其中,有一個輸出地址的BTC值擁有4位以上小數時,那麼這個地址和輸入方一樣屬於同一個主體,這個地址就是找零地址。

前向挖掘中輸入一側通常都是交易所的冷錢包,然後輸出一側有一個地址是交易所的熱錢包,然後剩下的地址才是交易所新的冷錢包。這個特性是我們先整理了很多交易所的交易數據後提煉出來的。

與前向挖掘相對的是後向挖掘。在後向挖掘中,被挖掘地址必須出現在輸出一側,且輸入側地址數為一,輸出側地址數一定為二。根據錢包的不同特徵可以判斷輸出側的被挖掘地址是熱錢包地址,且在該筆交易中發送給熱錢包地址的金額一定要大於100個BTC,那麼符合條件的交易中的三個地址屬於同一個主體,並且輸入側的地址可能是冷錢包地址。

PAData:這三個挖掘方法之間有順序嗎?


Chain.info李禎:先進行縱向挖掘,把交易所的地址信息先盡量都挖到,然後再通過錢包特徵或其他的方式分析出熱錢包,我們首先確定它是熱錢包了,然後才能進行後向挖掘去找冷錢包。總的來說會按照縱向挖掘——前向挖掘——後向挖掘的順序進行。

PAData:通過這些挖掘方法,最先挖掘到的是哪類錢包呢?


Chain.info李禎:最先挖到的是充提錢包。其實第一個充值錢包就是我們隨便找一個交易所,然後註冊成為用戶,這樣就會有一個充值地址了。然後我們就往裡面可以放一些錢進去,這時候就可以看到這個錢的流動,順著就能找到熱錢包和冷錢包。

PAData:假如在一個標籤都沒有的情況下,可以怎麼樣來判斷交易所比特幣的流轉呢?


Chain.info李禎:這樣的話就比較難了,但是還是可以追踪的,比如說我們現在也在監控大額的交易,現在鏈上如果出現了大額交易的話,我們會對他們的地址進行溯源,去追踪發現一些交易所。我們現在已經找到了幾個這樣的交易所,而且體量還不小,但是我們不知道他們他們是誰。

PAData:Coinbase也是頭部的比特幣交易所之一,為什麼沒有此次數據挖掘沒有覆蓋到Coinbase的錢包數據?


Chain.info李禎:Coinbase的熱錢包很有意思,它不像其他的交易所熱錢包,是一個固定的或者幾個固定的,Coinbase的熱錢包是一次性使用的。所以這個是我們現在正在攻克的主要方向。