轉(zhuǎn)自:編程技術(shù)宇宙 粉絲朋友們,不知道大家看故事看膩了沒(要是沒膩可一定留言告訴我^_^),今天這篇文章?lián)Q換口味,正經(jīng)的來寫寫技術(shù)文。言歸正傳,咱們開始吧! 今天的這篇文章,聊一個軒轅君之前工作中遇到的需求:如何在Java中調(diào)用Python代碼? 要不要先Mark一下,說不定將來哪天就用上了呢? 本文結(jié)構(gòu):- 需求背景 需求背景進(jìn)擊的 Python隨著人工智能的興起,Python 這門曾經(jīng)小眾的編程語言可謂是煥發(fā)了第二春。 以 tensorflow、pytorch 等為主的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的開發(fā)框架大行其道,助推了 python 這門曾經(jīng)以爬蟲見長(python 粉別生氣)的編程語言在 TIOBE 編程語言排行榜上一路披荊斬棘,坐上前三甲的寶座,僅次于 Java 和 C,將 C 、JavaScript、PHP、C#等一眾勁敵斬落馬下。 當(dāng)然,軒轅君向來是不提倡編程語言之間的競爭對比,每一門語言都有自己的優(yōu)勢和劣勢,有自己應(yīng)用的領(lǐng)域。另一方面,TIOBE 統(tǒng)計的數(shù)據(jù)也不能代表國內(nèi)的實際情況,上面的例子只是側(cè)面反映了 Python 這門語言如今的流行程度。 Java 還是 Python說回咱們的需求上來,如今在不少的企業(yè)中,同時存在 Python 研發(fā)團(tuán)隊和 Java 研發(fā)團(tuán)隊,Python 團(tuán)隊負(fù)責(zé)人工智能算法開發(fā),而 Java 團(tuán)隊負(fù)責(zé)算法工程化,將算法能力通過工程化包裝提供接口給更上層的應(yīng)用使用。 可能大家要問了,為什么不直接用 Java 做 AI 開發(fā)呢?要弄兩個團(tuán)隊。其實,現(xiàn)在包括 TensorFlow 在內(nèi)的框架都逐漸開始支持 Java 平臺,用 Java 做 AI 開發(fā)也不是不行(其實已經(jīng)有不少團(tuán)隊在這樣做了),但限于歷史原因,做 AI 開發(fā)的人本就不多,而這一些人絕大部分都是 Python 技術(shù)棧入坑,Python 的 AI 開發(fā)生態(tài)已經(jīng)建設(shè)的相對完善,所以造成了在很多公司中算法團(tuán)隊和工程化團(tuán)隊不得不使用不同的語言。 現(xiàn)在該拋出本文的重要問題:Java 工程化團(tuán)隊如何調(diào)用 Python 的算法能力? 答案基本上只有一個:Python 通過 Django/Flask 等框架啟動一個 Web 服務(wù),Java 中通過 Restful API 與之進(jìn)行交互 上面的方式的確可以解決問題,但隨之而來的就是性能問題。尤其是在用戶量上升后,大量并發(fā)接口訪問下,通過網(wǎng)絡(luò)訪問和 Python 的代碼執(zhí)行速度將成為拖累整個項目的瓶頸。 當(dāng)然,不差錢的公司可以用硬件堆出性能,一個不行,那就多部署幾個 Python Web 服務(wù)。 那除此之外,有沒有更實惠的解決方案呢?這就是這篇文章要討論的問題。 給 Python 加速尋找方向上面的性能瓶頸中,拖累執(zhí)行速度的原因主要有兩個:
眾所周知,Python 是一門解釋型腳本語言,一般來說,在執(zhí)行速度上: 解釋型語言 < 中間字節(jié)碼語言 < 本地編譯型語言 自然而然,我們要努力的方向也就有兩個:
結(jié)合上面的兩個點,我們的目標(biāo)也清晰起來: 將 Python 代碼轉(zhuǎn)換成 Java 可以直接本地調(diào)用的模塊 對于 Java 來說,能夠本地調(diào)用的有兩種:
其實我們通常所說的 Python 指的是 CPython,也就是由 C 語言開發(fā)的解釋器來解釋執(zhí)行。而除此之外,除了 C 語言,不少其他編程語言也能夠按照 Python 的語言規(guī)范開發(fā)出虛擬機(jī)來解釋執(zhí)行 Python 腳本:
Jython?如果能夠在 JVM 中直接執(zhí)行 Python 腳本,與 Java 業(yè)務(wù)代碼的交互自然是最簡單不過。但隨后的調(diào)研發(fā)現(xiàn),這條路很快就被堵死了:
這條路行不通,那還有一條:把 Python 代碼轉(zhuǎn)換成 Native 代碼塊,Java 通過 JNI 的接口形式調(diào)用。 Python -> Native 代碼整體思路先將 Python 源代碼轉(zhuǎn)換成 C 代碼,之后用 GCC 編譯 C 代碼為二進(jìn)制模塊 so/dll,接著進(jìn)行一次 Java Native 接口封裝,使用 Jar 打包命令轉(zhuǎn)換成 Jar 包,然后 Java 便可以直接調(diào)用。 流程并不復(fù)雜,但要完整實現(xiàn)這個目標(biāo),有一個關(guān)鍵問題需要解決: Python 代碼如何轉(zhuǎn)換成 C 代碼? 終于要輪到本文的主角登場了,將要用到的一個核心工具叫:Cython 請注意,這里的Cython和前面提到的CPython不是一回事。CPython 狹義上是指 C 語言編寫的 Python 解釋器,是 Windows、Linux 下我們默認(rèn)的 Python 腳本解釋器。 而 Cython 是 Python 的一個第三方庫,你可以通過 官方介紹 Cython 是一個 Python 語言規(guī)范的超集,它可以將 Python C 混合編碼的.pyx 腳本轉(zhuǎn)換為 C 代碼,主要用于優(yōu)化 Python 腳本性能或 Python 調(diào)用 C 函數(shù)庫。 聽上去有點復(fù)雜,也有點繞,不過沒關(guān)系,get 一個核心點即可:Cython 能夠把 Python 腳本轉(zhuǎn)換成 C 代碼 來看一個實驗:
將上述代碼通過 Cython 轉(zhuǎn)化,生成 test.c,長這個樣子:代碼非常長,而且不易讀,這里僅截圖示意。 實際動手1.準(zhǔn)備 Python 源代碼# FileName: Test.py
2.準(zhǔn)備一個 main.c 文件這個文件的作用是對 Cython 轉(zhuǎn)換生成的代碼進(jìn)行一次封裝,封裝成 Java JNI 接口形式的風(fēng)格,以備下一步 Java 的使用。
這個文件中一共有3個函數(shù):
根據(jù) JNI 接口規(guī)范,native 層面的 C 函數(shù)命名需要符合如下的形式: // QualifiedClassName: 全類名 所以在main.c文件中對定義需要向上面這樣命名,這也是為什么前面強(qiáng)調(diào)python接口函數(shù)命名不能用下劃線,這會導(dǎo)致JNI接口找不到對應(yīng)的native函數(shù)。 3.使用 Cython 工具編譯生成動態(tài)庫補(bǔ)充做一個小小的準(zhǔn)備工作:把Python源碼文件的后綴從 python源代碼Test.pyx和main.c文件都準(zhǔn)備就緒,接下來便是 Cython 的工作需要準(zhǔn)備一個 setup.py 文件,配置好轉(zhuǎn)換的編譯信息,包括輸入文件、輸出文件、編譯參數(shù)、包含目錄、鏈接目錄,如下所示:
setup.py文件準(zhǔn)備就緒后,便執(zhí)行如下命令,啟動轉(zhuǎn)換+編譯工作: python3.6 setup.py build_ext --inplace 生成我們需要的動態(tài)庫文件: 4.準(zhǔn)備Java JNI調(diào)用的接口文件Java業(yè)務(wù)代碼使用需要定義一個接口,如下所示:
到這一步,其實已經(jīng)實現(xiàn)了在Java中調(diào)用的目的了,注意調(diào)用業(yè)務(wù)接口之前,需要先調(diào)用initModule進(jìn)行native層面的Python初始化工作。
輸出:
成功實現(xiàn)了在Java中調(diào)用Python代碼! 5.封裝為 Jar 包做到上面這樣還不能滿足,為了更好的使用體驗,我們再往前一步,封裝成為Jar包。 首先原來的JNI接口文件需要再擴(kuò)充一下,加入一個靜態(tài)方法loadLibrary,自動實現(xiàn)so文件的釋放和加載。 // FileName: Test.java 接著將上面的接口文件轉(zhuǎn)換成java class文件:
最后,準(zhǔn)備將class文件和so文件放置于Test目錄下,打包: jar -cvf Test.jar ./Test 自動化上面5個步驟如果每次都要手動來做著實是麻煩!好在,我們可以編寫Python腳本將這個過程完全的自動化,真正做到 限于篇幅原因,這里僅僅提一下自動化過程的關(guān)鍵:
關(guān)鍵問題1.import 問題上面演示的案例只是一個單獨(dú)的 py 文件,而實際工作中,我們的項目通常是具有多個 py 文件,并且這些文件通常是構(gòu)成了復(fù)雜的目錄層級,互相之間各種 import 關(guān)系,錯綜復(fù)雜。 Cython 這個工具有一個最大的坑在于:經(jīng)過其處理的文件代碼中會丟失代碼文件的目錄層級信息,如下圖所示,C.py 轉(zhuǎn)換后的代碼和 m/C.py 生成的代碼沒有任何區(qū)別。 這就帶來一個非常大的問題:A.py 或 B.py 代碼中如果有引用 m 目錄下的 C.py 模塊,目錄信息的丟失將導(dǎo)致二者在執(zhí)行 import m.C 時報錯,找不到對應(yīng)的模塊! 幸運(yùn)的是,經(jīng)過實驗表明,在上面的圖中,如果 A、B、C 三個模塊處于同一級目錄下時,import 能夠正確執(zhí)行。 軒轅君曾經(jīng)嘗試閱讀 Cython 的源代碼,并進(jìn)行修改,將目錄信息進(jìn)行保留,使得生成后的 C 代碼仍然能夠正常 import,但限于時間倉促,對 Python 解釋器機(jī)理了解不足,在一番嘗試之后選擇了放棄。 在這個問題上卡了很久,最終選擇了一個笨辦法:將樹形的代碼層級目錄展開成為平坦的目錄結(jié)構(gòu),就上圖中的例子而言,展開后的目錄結(jié)構(gòu)變成了
單是這樣還不夠,還需要對 A、B 中引用到 C 的地方全部進(jìn)行修正為對 m_C 的引用。 這看起來很簡單,但實際情況遠(yuǎn)比這復(fù)雜,在 Python 中,import 可不只有 import 這么簡單,有各種各樣復(fù)雜的形式: import package 除此之外,在代碼中還可能存在直接通過模塊進(jìn)行引用的寫法。 展開成為平坦結(jié)構(gòu)的代價就是要處理上面所有的情況!軒轅君無奈之下只有出此下策,如果各位大佬有更好的解決方案還望不吝賜教。 2.Python GIL 問題Python 轉(zhuǎn)換后的 jar 包開始用于實際生產(chǎn)中了,但隨后發(fā)現(xiàn)了一個問題: 每當(dāng) Java 并發(fā)數(shù)一上去之后,JVM 總是不定時出現(xiàn) Crash 隨后分析崩潰信息發(fā)現(xiàn),崩潰的地方正是在 Native 代碼中的 Python 轉(zhuǎn)換后的代碼中。
崩潰的烏云籠罩在頭上許久,冷靜下來思考:為什么測試的時候正常沒有發(fā)現(xiàn)問題,上線之后才會崩潰? 再次翻看崩潰日志,發(fā)現(xiàn)在 native 代碼中,發(fā)生異常的地方總是在 malloc 分配內(nèi)存的地方,難不成內(nèi)存被破壞了?又發(fā)現(xiàn)測試的時候只是完成了功能性測試,并沒有進(jìn)行并發(fā)壓力測試,而發(fā)生崩潰的場景總是在多并發(fā)環(huán)境中。多線程訪問 JNI 接口,那 Native 代碼將在多個線程上下文中執(zhí)行。 猛地一個警覺:99%跟 Python 的 GIL 鎖有關(guān)系! 眾所周知,限于歷史原因,Python 誕生于上世紀(jì)九十年代,彼時多線程的概念還遠(yuǎn)遠(yuǎn)沒有像今天這樣深入人心過,Python 作為這個時代的產(chǎn)物一誕生就是一個單線程的產(chǎn)品。 雖然 Python 也有多線程庫,允許創(chuàng)建多個線程,但由于 C 語言版本的解釋器在內(nèi)存管理上并非線程安全,所以在解釋器內(nèi)部有一個非常重要的鎖在制約著 Python 的多線程,所以所謂多線程實際上也只是大家輪流來占坑。 原來 GIL 是由解釋器在進(jìn)行調(diào)度管理,如今被轉(zhuǎn)成了 C 代碼后,誰來負(fù)責(zé)管理多線程的安全呢? 由于 Python 提供了一套供 C 語言調(diào)用的接口,允許在 C 程序中執(zhí)行 Python 腳本,于是翻看這套 API 的文檔,看看能否找到答案。 幸運(yùn)的是,還真被我找到了: 獲取 GIL 鎖: 釋放 GIL 鎖: 在 JNI 調(diào)用入口需要獲得 GIL 鎖,接口退出時需要釋放 GIL 鎖。 加入 GIL 鎖的控制后,煩人的 Crash 問題終于得以解決! 測試效果準(zhǔn)備兩份一模一樣的 py 文件,同樣的一個算法函數(shù),一個通過 Flask Web 接口訪問,(Web 服務(wù)部署于本地 127.0.0.1,盡可能減少網(wǎng)絡(luò)延時),另一個通過上述過程轉(zhuǎn)換成 Jar 包。 在 Java 服務(wù)中,分別調(diào)用兩個接口 100 次,整個測試工作進(jìn)行 10 次,統(tǒng)計執(zhí)行耗時: 上述測試中,為進(jìn)一步區(qū)分網(wǎng)絡(luò)帶來的延遲和代碼執(zhí)行本身的延遲,在算法函數(shù)的入口和出口做了計時,在 Java 執(zhí)行接口調(diào)用前和獲得結(jié)果的地方也做了計時,這樣可以計算出算法執(zhí)行本身的時間在整個接口調(diào)用過程中的占比。
總結(jié)本文提供了一種 Java 調(diào)用 Python 代碼的新思路,僅供參考,其成熟度和穩(wěn)定性還有待商榷,通過 HTTP Restful 接口訪問仍然是跨語言對接的首選。 至于文中的方法,感興趣的朋友歡迎留言交流。
|
|