很多人都說:“現在的東南亞就像是坐著時光機,回到了 90 年代的中國市場?!?的確,在互聯網領域,我們經常能在東南亞看到中國互聯網發(fā)展歷程的影子。本文我們將詳細介紹一下東南亞企業(yè)的去 Oracle 經歷,揭秘中國經驗是如何復制到東南亞市場的。
Prestomall 是一家成立于 2014 年的東南亞電商企業(yè),此前這家企業(yè)一直使用的是 Oracle 數據庫。所有業(yè)務全部由一套 Oracle 數據庫支持,同時還有一套 Oracle 數據庫用來支撐測試環(huán)境。
2018 年 8 月,距離 Oracle 數據庫軟件授權證到期還有 3 個月的時間,Prestomall 決定不再使用 Oracle 數據庫,并開始尋找替代方案。為什么 Prestomall 決定在這個時候去 Oracle 呢?選定的替代方案是什么呢?整個遷移過程又是如何做的?…為了搞清楚這些問題,InfoQ 采訪了參與 Prestomall 去 Oracle 全過程的阿里云技術團隊。
為什么要去 Oracle?過去幾年,隨著整個東南亞移動互聯網的發(fā)展,Prestomall 也迎來了增長黃金期。以營收規(guī)模計算,過去 3 個財年,該公司實現了 256% 的增長。Prestomall 業(yè)務的成功使得公司需要處理的數據量出現井噴式的增長,IT 費用也隨之水漲船高,這也是 Prestomall 決定去 Oracle 的主要原因。
Oracle 的 License 費用太高了,隨著 Prestomall 客戶量和數據量的增加,這部分費用占據了大部分的 IT 預算,制約了其業(yè)務的發(fā)展,所以在授權還剩三個月的時候,Prestomall 開始尋找 Oracle 的替代方案。
另外,隨著業(yè)務的快速發(fā)展,現有的 Oracle 數據庫垂直架構限制了其彈性增長的需求,傳統(tǒng)數據庫不適應快速的互聯網 + 發(fā)展,這也使得 Prestomall 下定決心替換 Oracle。
技術選型減少 IT 費用是 Prestomall 去 Oracle 的主要原因,所以最初在選擇替代方案時,IT 費用是一個重要的指標,同時由于授權即將到期,遷移時間也是需要考慮的重要因素。
最開始的選型方案:更傾向于開源數據庫據了解,Prestomall 最初想到的替代方案有三種,分別是:
第一種,采用 Oracle 外的另一種商用數據庫,如 IBM DB2, 微軟 SQL Server 等;
第二種,使用開源數據庫,例如 MySQL、PostgreSQL;
第三種,保留 Oracle,繼續(xù)續(xù)費 License;
Prestomall 想要徹底去 Oracle,擺脫傳統(tǒng)傳統(tǒng)商業(yè)數據庫廠商的鎖定,所以排除了第一種和第三種方案。其實保留 Oracle 或者使用其它商業(yè)數據庫本就是權宜之舉,除非沒有可行的辦法或者時間來不及,才會保留 Oracle,畢竟業(yè)務的正常運行是必須要保障的事情。不過,Prestomall 團隊也意識到,如果繼續(xù)拖延的話,未來去 Oracle 的困難和挑戰(zhàn)將會更大。
經過一番評估之后,Prestomall 團隊更傾向于選擇開源數據。在備選的開源數據庫產品中,PostgreSQL 比 MySQL 提供了更多的 SQL 功能,應用方面也與 Oracle 更加貼近,并且遷移成本也較低,自然成為了技術選型的第一選擇。
在有了初步的技術選型之后,Prestomall 團隊就遷移方案做了進一步細化的評估:
第一, 選取的數據庫與已有的 Oracle 有多大的兼容性 ?
第二, 延用已有的本地部署解決方案,還是遷移上云?
第三, 遷移的工作量和時間究竟會多久?
第四, 采用新的技術方案,是否有足夠的技術支持?
最終選型方案:PolarDB + ADAM + DTS + 專家服務Prestomall 最終選定的替代方案是 PolarDB + ADAM + DTS + 專家服務。說實話,這個方案有點出人意料,畢竟最開始這個方案并沒有出現在 Prestomall 的選擇列表中,而且 Prestomall 原有的 Oracle 數據庫是部署在本地的,選擇了 PolarDB 就意味著數據庫要遷移上云。
最終方案中的 PolarDB 是阿里云自主研發(fā)的關系型分布式云原生數據庫,兼容三種數據庫引擎:MySQL、PostgreSQL、高度兼容 Oracle 語法;ADAM 是數據庫和應用遷移服務,可覆蓋 Oracle 遷移的全生命周期;DTS 支持 RDBMS、NoSQL、OLAP 等數據源間的數據交互,集數據遷移 / 訂閱 / 同步于一體。
那么,為什么最終會選擇這個方案呢?阿里云數據庫與應用遷移產品總監(jiān)楊霖表示主要原因其實有三個:
一是上云適配業(yè)務發(fā)展。之前 Prestomall 使用的是本地 Oracle 數據庫,而選擇 PolarDB 就可以享受到云數據庫彈性擴展的能力,按需申請資源,對于電商企業(yè)而言這種模式非常適配業(yè)務。
二是遷移成本最優(yōu)。這里的成本不單單是指遷移后數據庫資源的使用費用,同時也包括了遷移的工作量、代碼的修改量以及遷移時間等其它成本。經過評估,PolarDBD 與 Oracle 數據庫的兼容性非常高,整體遷移成本最優(yōu)。
三是風險整體可控,技術支持有保障。2000 年,阿里開始使用 Oracle 數據庫,2008 年,決定去 Oracle 數據庫。當前 Prestomall 的遭遇,跟十年前的阿里一樣,而在過去十幾年中,阿里的技術人員趟出了從 Oracle-RAC 數據庫到 PolarDB,從云下到云上的搬遷,積累了很多經驗,并沉淀了類似 ADAM、DTS 這樣的產品。這些成功經驗對 Prestomall 來說有著很大的吸引力。
據透露,在最初的提案階段,阿里云數據庫團隊通過 ADAM 給出了一個超詳細的改造計劃,包括 DB 層面如何去自動映射、自動解析、自動轉換,以及應用層每一行代碼如何改造。同時,還對不同數據庫產品的兼容性做了比較定量的代碼改造分析。
阿里云數據庫國際站產品負責人德邁介紹:“使用 ADAM 分析之后,我們發(fā)現,如果不使用 ADAM,從 Oracle 遷移到 PostgreSQL,80% 以上的代碼是需要修改的,如果使用 ADAM 遷移到 PostgreSQL,10% 左右的代碼是需要修改的,而如果遷移到 PolarDB,只有 5% 的代碼是需要修改的?!倍@也是 PolarDB 入選最終遷移方案的重要原因。
遷移過程確定了遷移方案之后,接下來要做的就是具體的遷移工作了。據了解,Prestomall 整個去 Oracle 可以六個階段:
第一步是去 Oracle 的技術選型,前面我們詳細介紹了選型過程,這里不再贅述。
第二步是去 Oracle 的賦能,即在實現與 Oracle 數據庫解耦的同時,實現業(yè)務 IT 架構升級,獲得更大的業(yè)務自由度。
第三步是業(yè)務改造,對于所有想要去 Oracle 的客戶來說,這是最難的部分。業(yè)務改造面臨的兩大問題是工作量評估和兼容性。
第四步是數據遷移,不僅要保證全量和增量數據的一致性,同時還要提供數據回流的能力,讓數據上得來下得去。
第五步是測試與調優(yōu),雖然 PolarDB 與 Oracle 兼容,但是始終是兩個產品,各自有各自的產品特性,因此遷移上去之后還需要做進一步的調試。
第六步是割接與護航,在完成上線割接之后,還會有兩個星期的阿里技術專家的保駕護航。
值得一提的是,在遷移過程中,ADAM 有兩個功能發(fā)揮了很大的作用,一個是自動轉換的功能,可以幫助使用者將原有的 Oracle SQL 自動改造成 PolarDB 兼容的 SQL。另一個是自動學習功能,雖然 PolarDB 與 Oracle 是高度兼容的,但也會有語法差異,而 ADAM 的 SQL 語法染色功能會使用不同的顏色來標注語法差異,幫助使用者快速領悟到語法差異規(guī)則。
據了解,目前 Prestomall 的業(yè)務流量幾乎全部遷移到了 PolarDB 上,只剩郵件系統(tǒng)中的兩張表還在做反向同步。
另外提到數據庫遷移,很多人都會關心安全性的問題,尤其 Prestomall 作為東南亞的一家電商平臺,在流程方面會更關注業(yè)務保護。據阿里云高級 DBA 專家鄭旦介紹,在數據保護和業(yè)務穩(wěn)定方面,阿里云主要做了兩個層面的工作:第一個層面,DTS 不僅完成了數據遷移的工作,同時還在這個過程中做了數據校驗;第二個層面,ADAM 對 Prestomall 系統(tǒng)的兼容性和兼容性結果做了一致性的檢查。
寫在最后業(yè)界一直有“天下苦 Oracle 久矣”的說法,但是在實際去 Oracle 的過程中,總會犯難。那么,業(yè)界在去 Oracle 實踐時,通常都有哪些選擇呢?
阿里云智能數據庫事業(yè)部產品總監(jiān)葉正盛(斗佛)表示:“其實去 Oracle 的選擇不是很多,業(yè)內常使用的基本上只有三種,一種是遷移到其它商業(yè)數據庫,但這種方式用的較少;第二種是選擇一種兼容度較高的數據庫,這種方式的優(yōu)勢是業(yè)務基本不用做大的改造;第三種是切換到分布式數據庫,這種方式的劣勢是需要在業(yè)務上做重新設計,但優(yōu)點是完成之后,可以享受分布式帶來的紅利。”