人工智能算法與Python大數(shù)據(jù) 致力于提供深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、人工智能干貨文章,為AI人員提供學(xué)習(xí)路線以及前沿資訊 23篇原創(chuàng)內(nèi)容 公眾號(hào) 點(diǎn)上方人工智能算法與Python大數(shù)據(jù)獲取更多干貨 在右上方 ··· 設(shè)為星標(biāo) ★,第一時(shí)間獲取資源 僅做學(xué)術(shù)分享,如有侵權(quán),聯(lián)系刪除 轉(zhuǎn)載于 :機(jī)器學(xué)習(xí)算法與Python實(shí)戰(zhàn) 大學(xué)公開(kāi)數(shù)據(jù)集 (Stanford)69G大規(guī)模無(wú)人機(jī)(校園)圖像數(shù)據(jù)集【Stanford】 http://cvgl./projects/uav_data/ 人臉?biāo)孛钄?shù)據(jù)集【CUHK】 http://mmlab.ie./archive/facesketch.html 自然語(yǔ)言推理(文本蘊(yùn)含標(biāo)記)數(shù)據(jù)集【NYU】 https://www./projects/bowman/multinli/ Berkeley圖像分割數(shù)據(jù)集BSDS500【Berkeley】 https://www2.eecs./Research/Projects/CS/vision/grouping/resources.html 寵物圖片(分割)數(shù)據(jù)集【Oxford】 http://www.robots./~vgg/data/pets/ 發(fā)布ADE20K場(chǎng)景感知/解析/分割/多目標(biāo)識(shí)別數(shù)據(jù)集【MIT】 https://groups.csail./vision/datasets/ADE20K/ 多模態(tài)二元行為數(shù)據(jù)集【GaTech】 http://www.cbi./mmdb/ 計(jì)算機(jī)視覺(jué)/圖像/視頻數(shù)據(jù)集Fashion-MNIST風(fēng)格服飾圖像數(shù)據(jù)集【肖涵】 https://github.com/zalandoresearch/fashion-mnist 大型(50萬(wàn))LOGO標(biāo)志數(shù)據(jù)集 https://data.vision.ee./cvl/lld/ 4D掃描(60fps移動(dòng)非剛性物體3D掃描)數(shù)據(jù)集【D-FAUST】 http://dfaust.is.tue. 基于MNIST的視覺(jué)計(jì)數(shù)合成數(shù)據(jù)集Counting MNIST http:///tools/counting-mnist/ YouTube MV視頻數(shù)據(jù)集【Keunwoo Choi】 https://github.com/keunwoochoi/YouTube-music-video-5M 計(jì)算機(jī)視覺(jué)合成數(shù)據(jù)集/工具大列表【unrealcv】 https://github.com/unrealcv/synthetic-computer-vision 動(dòng)物屬性標(biāo)記數(shù)據(jù)集【ChristophH. Lampert/Daniel Pucher/JohannesDostal】 http://cvml./AwA2/ 日本漫畫(huà)數(shù)據(jù)集Manga109 http://dl./citation.cfm?doid=3011549.3011551 俯拍舞蹈視頻數(shù)據(jù)集 http://homepages.inf./rbf/CEILIDHDATA/ Pixiv(著色)圖片數(shù)據(jù)集【Jerry Li】 https://github.com/jerryli27/pixiv_dataset e-VDS視頻數(shù)據(jù)集 https://engineering./elab/eVDS/#download Quick, Draw!簡(jiǎn)筆畫(huà)涂鴉數(shù)據(jù)集 https://github.com/googlecreativelab/quickdraw-dataset 簡(jiǎn)筆畫(huà)涂鴉數(shù)據(jù)集【hardmaru】 https://github.com/hardmaru/sketch-rnn-datasets 服飾人像生成模型(&Chictopia10K[HumanParsing]時(shí)尚人像解析數(shù)據(jù)集)【Christoph Lassner/Gerard Pons-Moll/Peter V. Gehler】 http://files.is.tue./classner/gp/ COCO像素級(jí)標(biāo)注數(shù)據(jù)集 https://github.com/nightrome/cocostuff 大規(guī)模街道級(jí)圖片(分割)數(shù)據(jù)集【Peter Kontschieder】 http://blog./product/2017/05/03/mapillary-vistas-dataset.html 大規(guī)模日語(yǔ)圖片描述數(shù)據(jù)集 https://github.com/STAIR-Lab-CIT/STAIR-captions Cityscapes街景語(yǔ)義分割數(shù)據(jù)集(50城30類(lèi)5k細(xì)標(biāo)20k粗標(biāo)圖片及標(biāo)記視頻) https://github.com/mcordts/cityscapesScripts (街頭)時(shí)尚服飾數(shù)據(jù)集(2000+標(biāo)注圖片) https://github.com/bearpaw/clothing-co-parsing PyTorch實(shí)現(xiàn)的VOC2012數(shù)據(jù)集Pixel-wise目標(biāo)分割【BodoKaiser】 https://github.com/bodokaiser/piwise Twenty Billion Neurons對(duì)象復(fù)雜運(yùn)動(dòng)與交互視頻數(shù)據(jù)集【Nikita Johnson】 https://www./blog/the-something-something-video-dataset 文本/評(píng)價(jià)/問(wèn)答/自然語(yǔ)言數(shù)據(jù)集(20萬(wàn))英文笑話數(shù)據(jù)集【TaivoPungas】 https://github.com/taivop/joke-dataset 機(jī)器學(xué)習(xí)保險(xiǎn)行業(yè)問(wèn)答開(kāi)放數(shù)據(jù)集【HainWang】 https://github.com/shuzi/insuranceQA 保險(xiǎn)行業(yè)問(wèn)答(QA)數(shù)據(jù)集【Minwei Feng】 https://github.com/shuzi/insuranceQA Stanford NLP發(fā)布新的多輪、跨域、任務(wù)導(dǎo)向?qū)υ挃?shù)據(jù)集【Mihail Eric】 https://github.com/keunwoochoi/YouTube-music-video-5M 實(shí)體/名詞語(yǔ)義關(guān)系標(biāo)記數(shù)據(jù)集【David S. Batista】 https://github.com/davidsbatista/Annotated-Semantic-Relationships-Datasets NLVR:自然語(yǔ)言基礎(chǔ)數(shù)據(jù)集(對(duì)象分組、數(shù)量、比較及空間關(guān)系推理) http://lic.nlp./nlvr/ 2.8萬(wàn)文章/10萬(wàn)問(wèn)題大規(guī)模(英語(yǔ)考試)閱讀理解數(shù)據(jù)集 https://github.com/qizhex/RACE_AR_baselines 錯(cuò)誤拼寫(xiě)數(shù)據(jù)集 http://www.dcs./~ROGER/corpora.html 文本簡(jiǎn)化數(shù)據(jù)集 http://www.cs./~dkauchak/simplification/ 英語(yǔ)詞/句/語(yǔ)義框架框架標(biāo)注數(shù)據(jù)集FrameNet https://framenet.icsi./fndrupal/ (又一個(gè))自然語(yǔ)言處理(NLP)數(shù)據(jù)集列表【Nicolas Iderhoff】 https://github.com/niderhoff/nlp-datasets 跨語(yǔ)種/多樣式/多粒度文本相似性檢測(cè)數(shù)據(jù)集 https://github.com/FerreroJeremy/Cross-Language-Dataset Quora數(shù)據(jù)集:400000行潛在重復(fù)問(wèn)題 http://qim.ec./quora_duplicate_questions.tsv 文本分類(lèi)數(shù)據(jù)集 http://disi./moschitti/corpora.htm Frames:Maluuba對(duì)話數(shù)據(jù)集 https://datasets./Frames/dl 跨域(Amazon商品評(píng)論)情感數(shù)據(jù)集 http://www.cs./~mdredze/datasets/sentiment/ 語(yǔ)義網(wǎng)機(jī)器學(xué)習(xí)系統(tǒng)評(píng)價(jià)/基準(zhǔn)數(shù)據(jù)集集合 http://dws.informatik./en/research/a-collection-of-benchmark-datasets-for-ml 其它數(shù)據(jù)集數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)數(shù)據(jù)集匯總 https:///datasets CORe50:連續(xù)目標(biāo)識(shí)別數(shù)據(jù)集【VincenzoLomonaco&DavideMaltoni】 https://vlomonaco./core50/ (Matlab)數(shù)據(jù)集統(tǒng)計(jì)分布自動(dòng)發(fā)現(xiàn)【Isabel Valera】 http://proceedings./v70/valera17a.html (建筑物)損害評(píng)估數(shù)據(jù)集【tsunami】 https://github.com/faiton713/ABCDdataset IndieWeb社交圖譜數(shù)據(jù)集【IndieWeb】 http://www. DeepMind開(kāi)源環(huán)境/數(shù)據(jù)集/代碼集合【DeepMind】 https:///research/open-source/ 鳥(niǎo)叫聲數(shù)據(jù)集【xeno-canto】 http://www. Wolfram數(shù)據(jù)集倉(cāng)庫(kù) https://datarepository. 大型音樂(lè)分析數(shù)據(jù)集FMA https://github.com/mdeff/fma (300萬(wàn))Instacart在線雜貨購(gòu)物數(shù)據(jù)集【Jeremy Stanley】 https://tech./3-million-instacart-orders-open-sourced-d40d29ead6f2 用于欺詐檢測(cè)的合成財(cái)務(wù)數(shù)據(jù)集【TESTIMON】 https://www./ntnu-testimon/paysim1 NSynth:大規(guī)模高質(zhì)量音符標(biāo)記音頻數(shù)據(jù)集 https://magenta./datasets/nsynth LIBSVM格式分類(lèi)/回歸/多標(biāo)簽/字符串?dāng)?shù)據(jù)集 https://www.csie./~cjlin/libsvmtools/datasets/binary.html 筆記本電腦用logistic回歸擬合100G數(shù)據(jù)集【DmitriySelivanov】 http:///post/2017-02-07-large-data-feature-hashing-and-online-learning-part-2/ StackExchange近似/重復(fù)問(wèn)題數(shù)據(jù)集 http://nlp.cis./resources/cqadupstack/ 2010-2017最全KDD CUP賽題回顧及數(shù)據(jù)集 http:///2kRoQ1 食譜數(shù)據(jù)集:帶有評(píng)級(jí)、營(yíng)養(yǎng)及類(lèi)別信息的超過(guò)2萬(wàn)種食譜【HugoDarwood】 https://www./hugodarwood/epirecipes 奧斯卡數(shù)據(jù)集【Academy of Motion Picture Arts and Sciences】 https://www./theacademy/academy-awards 計(jì)算醫(yī)療庫(kù):(TensorFlow)大型醫(yī)療數(shù)據(jù)集分析與機(jī)器學(xué)習(xí)建模【AkshayBhat】 https://github.com/AKSHAYUBHAT/ComputationalHealthcare 聚類(lèi)數(shù)據(jù)集 https://cs./sipu/datasets/ 官方開(kāi)放氣候數(shù)據(jù)集 https://pan.baidu.com/s/1i52Xarb 全球恐怖襲擊事件數(shù)據(jù)集【START Consortium】 https://www./START-UMD/gtd 七個(gè)機(jī)器學(xué)習(xí)時(shí)序數(shù)據(jù)集 https:///time-series-datasets-for-machine-learning/ 大型眾包關(guān)系數(shù)據(jù)庫(kù)自然語(yǔ)言查詢(xún)語(yǔ)義解析數(shù)據(jù)集(8萬(wàn)+查詢(xún)樣本) http:///RNMr09n 賽馬賠率數(shù)據(jù)集 http:///RNf0tXN 新的YELP數(shù)據(jù)集:包含470萬(wàn)評(píng)論和15.6萬(wàn)商家 http:///RNG6JYi JMIR數(shù)據(jù)集專(zhuān)刊《JMIR Data》 http:///RCIhmvS 日文木版印刷文字識(shí)別數(shù)據(jù)集 http:///RCZPfYB 多模態(tài)二元行為數(shù)據(jù)集 http:///RCzFn1g 機(jī)器學(xué)習(xí)論文/數(shù)據(jù)集/工具集錦(日文) http:///RKV7x2A 機(jī)器學(xué)習(xí)公司的十大數(shù)據(jù)搜集策略 http:///R54rtvd NLP數(shù)據(jù)集加載工具集 http:///RaYwYXl 日語(yǔ)相似詞數(shù)據(jù)集 http:///RaVFV35 大規(guī)模人本完形填空(多選閱讀理解)數(shù)據(jù)集 http:///Rac2Pey 高質(zhì)量免費(fèi)數(shù)據(jù)集列表 http:///R6B1aqa 《數(shù)據(jù)之美》自然語(yǔ)言數(shù)據(jù)集/代碼 http:///hBOTM4 微軟數(shù)據(jù)集MS MARCO,閱讀理解領(lǐng)域的「ImageNet」 http:///RIMqGBK AI2科學(xué)問(wèn)答數(shù)據(jù)集(多選) http:///RI5liwJ 常用圖像數(shù)據(jù)集大全(分類(lèi),跟蹤,分割,檢測(cè)等) 搜狗實(shí)驗(yàn)室數(shù)據(jù)集: http://www.sogou.com/labs/dl/p.html 互聯(lián)網(wǎng)圖片庫(kù)來(lái)自sogou圖片搜索所索引的部分?jǐn)?shù)據(jù)。其中收集了包括人物、動(dòng)物、建筑、機(jī)械、風(fēng)景、運(yùn)動(dòng)等類(lèi)別,總數(shù)高達(dá)2,836,535張圖片。對(duì)于每張圖片,數(shù)據(jù)集中給出了圖片的原圖、縮略圖、所在網(wǎng)頁(yè)以及所在網(wǎng)頁(yè)中的相關(guān)文本。200多G http://www./ IMAGECLEF致力于位圖片相關(guān)領(lǐng)域提供一個(gè)基準(zhǔn)(檢索、分類(lèi)、標(biāo)注等等) Cross Language Evaluation Forum (CLEF) 。從2003年開(kāi)始每年舉行一次比賽. http://staff.science./~xirong/index.php?n=Main.Dataset ---------?--------- |
|
來(lái)自: 漢無(wú)為 > 《人工智能平臺(tái)及應(yīng)用》