這篇文章主要介紹“如何使用GDC API查看和下載TCGA的數(shù)據(jù)”,在日常操作中,相信很多人在如何使用GDC API查看和下載TCGA的數(shù)據(jù)問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”如何使用GDC API查看和下載TCGA的數(shù)據(jù)”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!
作為一家“創(chuàng)意+整合+營銷”的成都網(wǎng)站建設(shè)機(jī)構(gòu),我們在業(yè)內(nèi)良好的客戶口碑。創(chuàng)新互聯(lián)提供從前期的網(wǎng)站品牌分析策劃、網(wǎng)站設(shè)計、網(wǎng)站建設(shè)、做網(wǎng)站、創(chuàng)意表現(xiàn)、網(wǎng)頁制作、系統(tǒng)開發(fā)以及后續(xù)網(wǎng)站營銷運(yùn)營等一系列服務(wù),幫助企業(yè)打造創(chuàng)新的互聯(lián)網(wǎng)品牌經(jīng)營模式與有效的網(wǎng)絡(luò)營銷方法,創(chuàng)造更大的價值。
API是應(yīng)用程序編程接口,很多的網(wǎng)站都有對應(yīng)的API,方便程序抓取數(shù)據(jù),比如NCBI, EBI, KEGG等等,GDC也有對應(yīng)的API, 可以方便的查詢和下載TCGA的數(shù)據(jù),API的網(wǎng)址如下
https://gdc.cancer.gov/developers/gdc-application-programming-interface-api
API都有一個base url, 通過base url加上內(nèi)置的指令,可以實現(xiàn)特定數(shù)據(jù)集的訪問和下載,GDC API的base url如下
https://api.gdc.cancer.gov/
https://api.gdc.cancer.gov/legacy/
第一種訪問和操作GDC harmonized database, 第二種訪問和操作GDC legacy archive。endpoint是內(nèi)置的指令,支持的指令如下所示
從功能上可以劃分為查詢,下載,提交數(shù)據(jù)三大塊,常用的的功能包括查詢和下載
通過JSON
這種格式進(jìn)行數(shù)據(jù)交換,以files
為例,以其對應(yīng)的uuid
為例進(jìn)行查詢的用法如下
curl https://api.gdc.cancer.gov/files/5891556e-0b86-42bd-aa0e-a319471dc574
返回的數(shù)據(jù)如下
這種格式就是JSON
, 可以和網(wǎng)站上的查詢結(jié)果比較一下,鏈接如下
https://portal.gdc.cancer.gov/files/5891556e-0b86-42bd-aa0e-a319471dc574
可以看到API返回的信息中包含了網(wǎng)頁上提供的基本信息。在實際使用中,更多的是按照某種條件進(jìn)行檢索,相關(guān)的參數(shù)很多,這里就不展開了。
通過download
指定,可以根據(jù)文件的uuid
進(jìn)行下載,有GET和POST兩種方式。GET適用于同時下載幾個文件,POST適用于大批量下載。
以GET方式下載的用法如下
curl --remote-name --remote-header-name 'https://api.gdc.cancer.gov/data/5891556e-0b86-42bd-aa0e-a319471dc574'
如果有多個文件的uuid,用逗號連接,示意如下
curl --remote-name --remote-header-name 'https://api.gdc.cancer.gov/data/e3228020-1c54-4521-9182-1ea14c5dc0f7,18e1e38e-0f0a-4a0e-918f-08e6201ea140'
以POST方式下載需要主要準(zhǔn)備一個文件,記錄要下載文件的uuid編號,該文件可以有兩種格式,第一種示意如下
ids=556e5e3f-0ab9-4b6c-aa62-c42f6a6cf20c&ids=e0de63e2-02f3-4309-9b24-69f4c24e85fc
假設(shè)該文件名稱為uuids
, 下載的命令為
curl --remote-name --remote-header-name --request POST 'https://api.gdc.cancer.gov/data' --data @uuids
第二種示意如下
采用該文件進(jìn)行下載的命令如下
curl --remote-name \
--remote-header-name \
--request POST \
--header 'Content-Type: application/json' \
--data @uuids \
'https://api.gdc.cancer.gov/data'
以上只是GDC API的基本用法,更多用法請參考官方文檔,鏈接如下
https://docs.gdc.cancer.gov/API/Users_Guide/Getting_Started/
通過熟練使用API,可以實現(xiàn)程序自動化的下載TCGA數(shù)據(jù),有很多TCGA數(shù)據(jù)下載的R包,就是通過調(diào)用API來實現(xiàn)對應(yīng)的功能。
到此,關(guān)于“如何使用GDC API查看和下載TCGA的數(shù)據(jù)”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
網(wǎng)頁標(biāo)題:如何使用GDCAPI查看和下載TCGA的數(shù)據(jù)
文章網(wǎng)址:http://weahome.cn/article/jsdisi.html