火箭君曾經(jīng)介紹過(guò)使用Excel直接下載網(wǎng)頁(yè)中數(shù)據(jù),但是在實(shí)際使用中你會(huì)發(fā)現(xiàn)許多困難,比如說(shuō)在本文介紹的案列中,你根本無(wú)法通過(guò)Excel抓取到網(wǎng)頁(yè)中合適的信息,而微軟旗下的另一款軟件Power BI在這時(shí)候就顯示出了無(wú)可比擬的優(yōu)勢(shì)。具體是什么,就讓我們來(lái)看看文章吧! 什么是Power BI?也許有的小伙伴對(duì)于此工具還比較陌生。根據(jù)微軟官方的定義,PowerBI是這樣一款產(chǎn)品: Power BI 是軟件服務(wù)、應(yīng)用和連接器的集合,它們協(xié)同工作以將相關(guān)數(shù)據(jù)來(lái)源轉(zhuǎn)換為連貫的視覺(jué)逼真的交互式見解。 無(wú)論用戶的數(shù)據(jù)是簡(jiǎn)單的 Excel 電子表格,還是基于云和本地混合數(shù)據(jù)倉(cāng)庫(kù)的集合,Power BI 都可讓用戶輕松地連接到數(shù)據(jù)源,直觀看到(或發(fā)現(xiàn))重要內(nèi)容,與任何所希望的人進(jìn)行共享。 它是一種集成式的工具,提現(xiàn)了微軟在企業(yè)端為企業(yè)數(shù)字化轉(zhuǎn)型所做出的嘗試。但是,天生的好工具也不只能局限于在企業(yè)業(yè)務(wù)場(chǎng)景,Power BI也可以為我們個(gè)人所用。 比如…… 抓取豆瓣“最受關(guān)注圖書榜”如果我們想要抓取豆瓣讀書頁(yè)面上(https://book.douban.com/)“最受關(guān)注圖書榜”的相關(guān)信息:
這時(shí)我們就可以毫不猶豫得使用這個(gè)Power BI工具。 >>>Step 1 在Power BI的主界面中分別選中”獲取數(shù)據(jù)“->”Web'。 >>>Step 2 在彈出的窗口中復(fù)制進(jìn)豆瓣的地址(https://book.douban.com/),并確認(rèn) >>>Step 3 這時(shí)候會(huì)再?gòu)棾鲆粋€(gè)導(dǎo)航器,選擇“使用示例添加表”。 >>>Step 4 這時(shí)你能看到再次彈出的窗口分別由兩部分組成:上部為瀏覽器,下部為類似Excel表格的界面。這時(shí),你只要給到列的標(biāo)題,并選擇前1到2個(gè)需要抓取的數(shù)據(jù)內(nèi)容,比如說(shuō)“人生海?!焙汀捌つw的秘密”這兩個(gè)書名,然后按回車。Power BI會(huì)自動(dòng)幫你填充所有其他在網(wǎng)頁(yè)中相同的元素類型。 以此類推可以完成評(píng)分,作者等內(nèi)容的抓取。 按確認(rèn)鍵結(jié)束內(nèi)容抓取。 >>>Step 5 數(shù)據(jù)抓取加載完成后,我們就可以在數(shù)據(jù)視圖中看到所有內(nèi)容。 如果你說(shuō):“唔,我還是想用Excel來(lái)最終處理或者保存這些數(shù)據(jù)?!边@當(dāng)然也是沒(méi)有問(wèn)題的。只要在右側(cè)的工具欄中,右鍵單擊表格,在彈出的菜單中選擇“復(fù)制表”。這樣你就可以安安心心把這些數(shù)據(jù)存到Excel中去了。 你學(xué)會(huì)了嗎? 原文鏈接: http:///powerbi201905a/ |
|