Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

編程語言微博網絡爬蟲 Python 極數蝸牛 2017-06-13

網絡上有很多關於Python網絡爬蟲，但大都是Python2版本，而Python3的版本較少，如果有也會經常有不明就裡的錯誤。因此小編綜合了多個來源程序，終於親測成功，僅以此分享給需要的朋友。

前期準備

本來是想用PC端Sina Weibo API來獲取微博內容，但現在新浪微博規定限制太多。一下是注意事項:

該項規定出臺，導致你只能爬自己的最新的5條記錄，這有什麼用，因此果斷放棄。改為爬取移動端的微博，因為移動端的微博可以分頁爬取，這就可以一次爬取所有微博內容，這就方便很多。

打開移動端微博

網址是：https://m.weibo.cn；瀏覽器使用的是：Chrome。

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

用自己賬號登陸

請用自己的賬號登陸，登陸後，按F12，會出現以下內容

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

找到m.weibo.cn--Headers--Cookie，把cookie複製到代碼中的#your cookie處,待用。

獲取你要爬取的用戶ID

方法是打開用戶微博主頁，裡邊有一個u/XXXXXX(一串數字)；這串數字就是該用戶的ID。

以范冰冰為例，uid=3952070245

前期工作已經準備完成，後邊開始擼代碼了。

載入需要Python模塊

Python需要的模塊如下，這部分不是重點，因此就不細講，大家可以搜索一下如何下載相關模塊。簡單的就是pip install 模塊名。或者從官網上下載模塊，本地安裝。

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

輸入用ID和設置Cookie

本次爬取的是范冰冰原創微博（因此轉發的不在此列），cookie請大家使用自己的地址。另外pageNum是總共頁數，范冰冰截止目前為56頁。urllist_set儲存爬取的url地址。

爬取具體微博內容和圖片

為了快速展示，本次僅爬取了前4頁內容。

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

爬取內容保存

將爬取的微博內容儲存在到相關目錄，本次儲存在以uid的文件中。需要注意的是因為Python3升級後，寫入文件不支持‘str’，因此需要轉換以下，用bytes函數轉換成字節。

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

微博內容結果如下

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

同時也將爬取的相關圖片的URL地址保存下來。

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

圖片URL相關結果如下：

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

將爬取的圖片下載保存本地。

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

圖片爬取結果如下，部分出現錯誤，可能是網絡的原因，可將錯誤圖片地址多爬幾次。

Python3：一個簡單入門的微博網絡爬蟲（以范冰冰為例）

寫在後邊的話

爬蟲作為數據採集的重要工具，為後期的大數據分析做好了基礎準備，因此有必要掌握下爬蟲技術。本篇僅是一個入門級別，其中還有更高級的框架Scrape，用代理IP到動態爬取，反偵察等。另外，注意的是【內容僅是技術分享，不做其他用途】

相關推薦

'從技術層面分析王一博演的藍忘機為什麼是人間極品（來自微博）'

"從技術層面說，告訴你為何王一博的藍忘機是人間極品（後世篇長文多圖預警）來自微博轉載，侵刪！"

微博技術 2019-09-18

'范冰冰38歲生日　微博留言冷清'

"范冰冰今天38歲生日，過去一年先後經歷逃稅風波及與李晨分手，事業及愛情都受盡打擊！生日的今天，她選擇“改頭換面”，將微博頭像換成卡通畫像，不過另一重點是圈中竟然沒人向她送上生日祝福！以往一踏入凌晨12點，就有不少圈中好友排隊留言給她，例如Angelababy、陳學冬、小瀋...

頭條女神微博李晨張鈞甯陳學冬 Angelababy 戀愛模特法國小瀋陽人生第一份工作 2019-09-18

'蔡少芬秀恩愛，微博晒張晉為她剪腳趾甲，卻被網友挖出漏洞'

"小的時候雖然說看過很多蔡少芬的劇，但一直都對TVB演員有著臉熟卻不瞭解的感覺，並且很有距離感！但近些年來，很多香港臺灣演員都來到大陸發展，不僅拍劇還參加綜藝。近些年來算是對蔡少芬有一個熟悉的感覺，八九年前蔡少芬出演了《甄嬛傳》，人氣在大陸一夜飆升，從此以後，蔡少芬便開始了...

蔡少芬張晉懷孕微博 TVB 袁成傑楊爍戀愛鍾麗緹張倫碩後宮甄嬛傳週末綜藝指南王黎雯臺灣 2019-09-17

'劉彬彬賽後發佈微博：繼續努力吧祝大家中秋快樂。妻子為其點贊'

"9月13日晚，2019賽季中超聯賽展開第24輪較量，山東魯能泰山主場3：1勝上海上港。其中第17分鐘，劉彬彬內切射門得分。賽後劉彬彬通過微博發佈，繼續努力吧祝大家中秋快樂！發佈微博後不久，妻子（陳秋佩）為其點贊。劉彬彬1993年出生於足球之鄉廣東梅州，2005年加入魯能足...

劉彬彬山東魯能泰山足球俱樂部中秋節中國足球超級聯賽足球微博中國足協盃馬爾切洛·裡皮上海上港集團足球俱樂部上海廣東 2019-09-16

'王俊凱小時候的微博被扒出，看完網友終於明白，楊紫為何說他欠了'

"王俊凱這個明星，大家也許並不陌生吧，他是tfboy組合裡面的隊長，那麼王俊凱的年齡也是非常小的，有網友扒出他小時候發的微博，終於知道楊紫為什麼說他很欠了。首先我們可以看到王俊凱晒的是自己的自拍，還把自己的眼睛給矇住了，並且配文：好男人就是我，我就是王俊凱，可以說是非常自戀...

王俊凱楊紫微博 TFBOYS 服裝游泳攝影我和夏天最來電 2019-09-16

'190914 李易峰將亮相微博NBA球迷之夜蜜蜂們可以為峰哥投票啦'

"近日，多家體育類官博表示，李易峰將於10月9日現身上海蔘加微博NBA球迷之夜，峰哥還會參與到藝人表演和藝人球星的籃球挑戰項目，與一眾籃球高手同場競技。目前此活動發起的投票也在火熱進行中，蜜蜂們快去給峰哥投上寶貴的一票吧！"

李易峰越投入越精彩微博體育 2019-09-16

'python爬蟲模擬微博登錄'

"微博模擬登錄這是本次爬取的網址：https://weibo.com/一、請求分析找到登錄的位置，填寫用戶名密碼進行登錄操作看看這次請求響應的數據是什麼這是響應得到的數據，保存下來exectime: 8nonce: "HW9VSX"pcid: "gz-4ede4c6269a...

Python 微博網絡爬蟲百度 2019-09-16

'范瑋琪發微博後秒刪：世界正在懲罰管不住嘴的人'

"9月8日，梁靜茹在專輯分享會上鬆口，承認已經離婚。當天，梁靜茹的朋友范瑋琪也發了一條微博，聲稱：“我從來不是大嘴巴！保護！永遠……保護你，守護你，陪伴你，愛你！”這條微博下面的評論是這樣的畫風。這條微博發後不久，便被刪除了。同時，范瑋琪的“我從來不是大嘴巴”言論也遭到指責...

范瑋琪梁靜茹徐熙娣微博宋祖德許雅鈞周杰倫羅志祥林心如不完美媽媽藝術李連杰王寶強迪麗熱巴 2019-09-15

'於正又回懟！微博為吳謹言演技發聲，稱新劇導演才是罪魁禍首？'

"說起於正這個導演，可以說是捧紅了不少的演員，雖然經常被說是抄襲別的電視劇或者是小說，但是人家的確就是紅了，也算是在爭議中成長吧，不過最近他又有了一個御用的女主角，那就是吳謹言。她在上個暑假可以說是紅遍了整個中國啊，關於她的電視劇更是在微博上掀起了討論的熱潮。的確這部有著很...

於正鑑劇大賞微博佘詩曼小說 2019-09-15

'“區塊鏈+社媒”就是墳墓，微博、Telegram為何仍要前赴後繼？'

"“區塊鏈+社交媒體”有一種魔力，吸引各路“英傑”逐鹿，然而這一看似美麗的場景，其實是區塊鏈應用的埋骨之地。9月6日，經歷了抄襲下架風波的新浪社交APP“綠洲”重新上架，綠洲中涉及區塊鏈元素——數字資產“水滴”。同樣是8月末，傳出Telegram計劃在未來兩個月內發放第一批...

區塊鏈簡書數字貨幣微博設計天涯社區工業設計技術跳槽那些事兒新浪萬物嚐鮮節網易創作者來直播 2019-09-15

' 微博熱搜！章澤天發文迴應學歷謠言，被網友評為：鈕祜祿氏武則天'

"我們都知道2019年可以說是一個吃瓜群眾最滿足的一年，因為隨著2019年過半，在上半年每個月都有無數的大瓜，滿足了無數吃瓜網友的心。其中2019年上半年最熱的，可以說就是劉強東的出軌，這個瓜可以說有無數次的反轉再反轉，連我們的國民老公王思聰也參與了進來。不過這件事情也隨著...

章澤天劉強東微博奶茶大學王思聰武則天巴黎 2019-09-14

'楊冪的一條微博，粉絲為何全部換頭像抵制？'

"說起我們的大冪冪想必大家都已經不陌生了，中國內地影視女演員、流行樂歌手、影視製片人。楊冪因出演金庸武俠劇《神鵰俠侶》而嶄露頭角，後有出演《宮》被大家熟知，憑藉甜美的長相俘獲了一大批粉絲。楊冪在近期的熱度也是很高的，有不少的事情都上了熱搜，話題性十足不愧是我們的“話題女王“...

頭條女神劉愷威歌手微博魏大勳神鵰俠侶人生第一份工作 2019-09-14

'看著小室的新微博，我險些以為這又是一個沒有朱一龍的大漠孤煙圖'

"不知道在座的小籠包是什麼想法，反正屜屜是被某個週一的福利弄出了心理陰影，在第一眼看不到我大哥的視頻裡，我險些以為朱小室又一次放出了一個只有大漠孤煙沒有龍的視頻，剛想舉刀剁柿，定睛一看原來這視頻裡面是有朱一龍先生本人出現的！再仔細一看，哥哥不僅出現了，還一改在小籠包面前嚴肅...

朱一龍不完美媽媽小籠包納米比亞微博浩瀚夏日無處不音樂 2019-09-13

'范瑋琪微博迴應大嘴秒刪，被質疑蹭張韶涵熱度，網友：閉嘴吧你'

"據臺媒報道，梁靜茹8日在專輯分享會上承認已經和老公Tony趙元同離婚，9年婚姻劃下句點，並且稱自己目前已經簽完了離婚協議書，還有一些程序沒有辦完。此前，曾有人爆料稱梁靜茹因為老公劈腿二人已經離婚，不過遭到公司女高層否認。而後，又被臺媒爆料兩人已分居，梁靜茹也沒有迴應，似乎...

范瑋琪張韶涵梁靜茹微博不完美媽媽 2019-09-13

'新浪員工哀嘆：找工作別來微博，因為最後真的是薪資“微薄”'

"前言：在坊間，曾經有這麼一條比較火的熱搜“月薪一萬和月薪十萬最真實的差距”當然，這月薪一萬還是比較高的，事實上，我們大部分職場人都還是月薪四、五千。之前公佈的18屆應屆大學生的平均月薪只有4624元，這與那些月薪十萬的精英們相比，差距就更大了。這就是馬太效應，窮富兩極分化...

人生第一份工作跳槽那些事兒新浪微博阿里巴巴集團財會 2019-09-13

'梁靜茹離婚，范瑋琪微博示“愛”再上熱搜'

"范瑋琪又上熱搜了。上週讀奶才說不知道下一次她會攜手哪個“好盆友”登頂熱搜，沒想到今天她就實現了我的預言，攜手的“好盆友”依舊是那個彷彿被她下了蠱的梁靜茹。上個月還在斬釘截鐵否認離婚的梁靜茹，在上週末的專輯分享會上了突然掩面哭泣，隨後正式承認離婚。本來網友已經見怪不怪了，畢...

范瑋琪梁靜茹頭條女神劉愷威不完美媽媽微博馬上又勇氣馮紹峰懷孕吳亦凡市場營銷 2019-09-12

'范瑋琪微博發文稱“我從來不是大嘴巴”後秒刪還說要守護梁靜茹'

"此前，梁靜茹好友的范瑋琪通過經紀人向媒體表示“隱隱約約有聽說（梁靜茹離婚）”，被網友指責“大嘴巴”。騰訊娛樂訊 9月8日，梁靜茹承認離婚，當晚，曾洩露梁靜茹離婚消息的范瑋琪，在微博發文稱“我從來不是大嘴巴！保護！永遠.........保護你，守護你，陪伴你~愛你”，隨後又...

范瑋琪梁靜茹微博春節守護值班人生第一份工作 2019-09-12

'反轉！嬌妻為周琦發球失誤辯解求同情，她生氣了清空微博內容'

"作為中國大魔王周琦的嬌妻，曾是空姐職業的王欣怡，在周琦與新疆隊簽下大合同以後，確實可以過上貴婦生活。現場觀戰中韓大戰力挺周琦、男籃，鏡頭下的王欣怡營養豐富，身材體型非常豐腴，成為了籃球世界盃看臺上最美的觀眾。不過面對老公周琦遭遇的唾罵，王欣怡沒有選擇沉默！男籃與波蘭的比賽...

周琦微博王欣怡雞蛋越投入越精彩新疆飛虎籃球俱樂部世界盃足球賽跳槽那些事兒 2019-09-12

'頂不住了！多次為周琦說公道話卻被批，周琦妻子清空個人微博'

"文/籃郭先生周琦，是一名知名的籃球運動員。對周琦來說，算是天之驕子，因為，其個人出道開始，就備受關注。對周琦來說，年少成名，在世青賽上，幫助國青男籃獲得世界第七名的成績，一度力壓約基奇、波爾津吉斯等人，也是因此成名，綽號是“大魔王”。對周琦來說，外界的期望值很高，一度有著...

周琦籃球的夏天微博越投入越精彩姚明世界盃足球賽 2019-09-12

'UU妹連發六條微博開撕盧本偉！男友行為惹眾怒，群粉絲勸二人分手'

"UU妹連發六條微博開撕盧本偉！男友行為惹眾怒，群粉絲勸二人分手UU妹作為此前的LOL官方Cos與電競圈有千絲萬縷的關係，尤其她的男友，也是圈內非常著名的主播，不少人都非常喜歡。從13年開始，兩個人在一起到今天已經七年了，按理說是過著神仙眷侶一般的生活，但是在近日，UU...

盧本偉微博英雄聯盟創作者來直播電腦 2019-09-12

推薦中...