作者:麥子(轉載請注:解螺旋·醫(yī)生科研助手) 初入一個領域,你可能會感到很孤單。尤其是當你還沒有自己的課題,老板和師兄師姐又都很忙、只能自己玩的時候。 你讀了許多文獻,知道了一些方法,或者從解螺旋上學到了一招,卻仍然一知半解。你深知“紙上得來終覺淺,絕知此事要躬行”,但不是還沒有課題嗎,躬行個鬼啊。 那你說不定是忽視了文獻中的補充材料(Supplementary materials)。 補充材料通常是一些不太核心的內容,限于篇幅,或限于紙媒的本身特性(如視頻、音頻等),不能在刊印的正文中提供,就另外整理出來在雜志的網(wǎng)站上發(fā)表。在我們速讀文獻,急著擴大閱讀面時,很容易就忽略了。 但如果想要深度了解一項研究,學習一種研究方法,它們就成了埋在正文之下的寶藏。它們可能是更詳細的結果、方法,還可能是原始數(shù)據(jù),都是正正經(jīng)經(jīng)的出版物,是要經(jīng)過同行評審的。 補充結果是最常見的,但不是這么重要,想看就看不想看就算了。 對方法的補充論述,可以加深我們對實驗設計的理解,有時候會解釋一下為什么會這樣設計。但這類材料相對較少。當對實驗設計不理解時,去找找補充材料,說不定會有答案。 補充的原始數(shù)據(jù),就是我們今天的主角! 科研社區(qū)中,越來越提倡數(shù)據(jù)共享,最初的目的是讓科研過程公開透明,提高科研成果的可重復性。但另有一個用處,就是教育。利用真實科研活動中產(chǎn)生的數(shù)據(jù)進行案例學習,能把數(shù)據(jù)放到具體的故事情節(jié)中去理解,明白它的意義所在,迅速敲開科研的大門。 不過說了這么多,原始數(shù)據(jù)到底怎么找? 直接從文獻中找 這當然是第一來源啦,讀到了遇到了就拿來用了。 但如果讀到的文獻中有感興趣的方法,恰好它又沒有附送原始數(shù)據(jù)怎么辦?搜另一篇采用同一方法的、附送原始數(shù)據(jù)的文獻嗎?倒也不失為一個辦法,麥子也曾經(jīng)這么做。在一些較大的期刊網(wǎng)站上搜“關鍵詞+supplementary”,也挺管用的。 但后來覺得這個方法有點中二,別說補充材料別名繁多,像什么additional data,supporting information之類,有時候即使有了supplementary,也不一定有原始數(shù)據(jù)呀。而且那些非OA的文章,你也是能在網(wǎng)站上搜到supplementary字樣的,但你就是拿不到呀~Sci-hub是不負責幫你偷補充材料的喲。 這時就會想,有沒有什么網(wǎng)站是集中收集原始數(shù)據(jù)或補充材料的呢? Dryad:科研教育是它的初心 地址:http:/// 這是由美國國家科學基金會資助建立的非盈利性公共科研數(shù)據(jù)共享平臺,通過跟期刊、機構、基金組織合作的方式,倡導作者們將數(shù)據(jù)提交到這個庫中,與文章同時發(fā)表。它創(chuàng)辦的目的之一,正是讓學生們能利用真實數(shù)據(jù)學做科研。 它收集的數(shù)據(jù)大多來自OA期刊,或混合期刊上的OA文章。但也會有些例外,比如2016年下載量排行第2的那份數(shù)據(jù)就來自Science,分析了全球科研汪們對Sci-hub的使用情況。不僅提供了2.7G(壓縮后684.5M)原始數(shù)據(jù),還給出了處理、分析這些數(shù)據(jù)所使用的Python代碼,簡直手把手帶你上路: 后一句注釋真是溫心=_= 但這篇文章并不是OA的,還是要通過Sci-hub獲取原文: 下載量第4的數(shù)據(jù)來自一份心臟病學的研究(JACC Cardiovasc Interv. 2016;9(8):757-67.)。763位受試者的觀察數(shù)據(jù)全部以.csv表格形式上傳,壓縮后172.9M。像這么大的數(shù)據(jù)是不太可能上傳到期刊的存儲庫里作為補充材料的,換言之,用上面那個土辦法很難找到。圖就不貼了。 FigShare:資源更廣,搜索更方便 地址:https:/// 這貨的界面粉嫩得不像個學術網(wǎng)站,但它真的是跟多家學術出版商有合作的數(shù)據(jù)共享平臺,如 Wiley,SpringerNature,Taylor and Francis,PNAS等。它是由Digital Science公司開發(fā)的,致力于提高“研究內容”的可見性。不僅是補充材料,正文中的圖表也能搜到。 它相對于Dryad,搜索更便捷。想學習Keplan Meier生存分析,搜關鍵詞,就得到相應的圖片、數(shù)據(jù)集,也可在文件類型列表里勾選Dataset進行過濾: 而且它支持多種文件格式的預覽,不僅是圖片,那些數(shù)據(jù)集也可點進相應頁面,看到具體內容。 它也有Dryad入口(https://dryad./): 當然這兩個網(wǎng)站都會在數(shù)據(jù)頁面附上原文鏈接。這樣差不多就夠用了。 這些網(wǎng)站也有局限性,因為數(shù)據(jù)共享還只是部分科學家的倡議,實踐之路才剛開始。2000年以前,上傳補充材料的文章都寥寥可數(shù),現(xiàn)在雖然有了飛速增漲,但數(shù)據(jù)共享仍然是個新概念。簡而言之,能拿到的數(shù)據(jù),不如文獻那樣豐富。 如果你還沒體會到這些數(shù)據(jù)的好處,那我告訴你,我曾經(jīng)悄悄帶領你利用那些數(shù)據(jù)來學習,最典型的是這個:《Cytoscape:龐大的相互作用網(wǎng)絡出圖神器》。所以將來你發(fā)了文章,麥子當然希望你也能上傳數(shù)據(jù)跟大家共享啦~ 再說遠一點,這些網(wǎng)站創(chuàng)立的目的,不僅僅是教育和傳播科研成果,還有已發(fā)表數(shù)據(jù)的再利用,挖出更多的價值。從你的研究視角出發(fā)來搜一搜,看看能不能發(fā)現(xiàn)什么新的東西,說不定一篇文章就從這些數(shù)據(jù)中誕生了呢。 |
|