如今,越來越多的人開始使用Python來進行股票和基金的數(shù)據(jù)分析,旨在提高自己的投資技能,同時也為了更深入地了解硬核編程的知識體系。剛開始的時候,許多人都通過爬蟲來從東方財富等網(wǎng)站獲取數(shù)據(jù),但是隨著時間的推移,人們發(fā)現(xiàn)了一個新的大陸——一些小伙伴已經(jīng)開源了這些數(shù)據(jù)。盡管其中一些開源數(shù)據(jù)可能會因為運營成本等原因收取一些費用,但這也是情理之中的事情。 一、數(shù)據(jù)接口現(xiàn)在,給大家介紹三種開源金融數(shù)據(jù)接口庫,這三種開源數(shù)據(jù)源開發(fā)庫分別是:Akshare、Baostock和Tushare。 1. AkshareAkshare是基于Python的開源金融數(shù)據(jù)接口庫,主要目的是為金融數(shù)據(jù)科學(xué)家和愛好者提供股票、期貨、期權(quán)、基金、外匯、債券、指數(shù)、數(shù)字貨幣等金融產(chǎn)品的基本面數(shù)據(jù)、實時和歷史行情數(shù)據(jù)、衍生數(shù)據(jù)的一套開源工具。Akshare的特點是通過爬蟲直接獲取權(quán)威的金融數(shù)據(jù)網(wǎng)站公布的原始數(shù)據(jù)。 2. BaostockBaostock提供大量準確、完整的證券歷史行情數(shù)據(jù)、上市公司財務(wù)數(shù)據(jù)等。通過python API獲取證券數(shù)據(jù)信息,滿足量化交易投資者、數(shù)量金融愛好者、計量經(jīng)濟從業(yè)者數(shù)據(jù)需求。數(shù)據(jù)返回格式為pandas DataFrame類型,以便于用pandas進行數(shù)據(jù)分析和可視化。 3. TushareTushare是一個開源的Python財經(jīng)數(shù)據(jù)接口包,主要實現(xiàn)對股票等金融數(shù)據(jù)從數(shù)據(jù)采集、清洗加工到數(shù)據(jù)存儲的過程,能夠為金融分析人員提供快速、整潔、和多樣的便于分析的數(shù)據(jù)。Tushare返回的絕大部分數(shù)據(jù)格式都是pandas DataFrame類型,非常便于用pandas/NumPy/Matplotlib進行數(shù)據(jù)分析和可視化。用戶還可以通過Tushare的數(shù)據(jù)存儲功能,將數(shù)據(jù)全部保存到本地后進行分析。目前Tushare-Pro版的高級數(shù)據(jù)接口是收費的。Tushare-Pro版本的收費是希望用戶通過積分的方式來獲取更多的數(shù)據(jù)量和接口調(diào)用頻次。 二、總結(jié)雖然這些開源數(shù)據(jù)在API上十分相似,但它們各自都有優(yōu)點和劣勢。這三個庫中Tushare的數(shù)據(jù)最全,但是目前Tushare-Pro版高階數(shù)據(jù)接口是收費的,可以根據(jù)需要選擇使用。 安裝這些開源庫時,建議使用國內(nèi)鏡像源加速安裝。通過利用好這些數(shù)據(jù),可以幫助我們分析股票投資策略,判斷哪些基金經(jīng)理在一段時間內(nèi)的收益相對比較高,以及注重回溯歷史數(shù)據(jù)的投資方式。 最后,如果你對投資股票、基金感興趣,或者對Python如何實現(xiàn)這些感興趣,都可以與我進行溝通。 pypi.douban.com/simple/ |
|