目錄
爬蟲(chóng)小工具
一個(gè)可以用于下載圖片、視頻、文件的小工具,有下載進(jìn)度顯示功能。稍加修改即可添加到自己的爬蟲(chóng)中。
動(dòng)態(tài)示意圖:
爬蟲(chóng)實(shí)戰
1、biqukan.py:《筆趣看》盜版小說(shuō)網(wǎng)站,爬取小說(shuō)工具
第三方依賴(lài)庫安裝:
使用方法:
2、video_downloader:愛(ài)奇藝等主流視頻網(wǎng)站的VIP視頻破解助手(暫只支持PC和手機在線(xiàn)觀(guān)看VIP視頻!)
感謝Python3二維碼生成器作者:https://github.com/sylnsfar/qrcode
編譯好的軟件下載連接:https://pan.baidu.com/s/1bqSTNJL 密碼:p8bs
解壓密碼:cuijiahua.com
無(wú)需Python3環(huán)境,在Windows下,解壓即用!軟件使用方法
源碼可查看video_downloader,運行源碼需要搭建Python3環(huán)境,并安裝相應第三方依賴(lài)庫:
在video_downloader文件夾下,安裝第三方依賴(lài)庫:
使用方法:
運行環(huán)境:
3、baiduwenku.py: 百度文庫word文章爬取
原理說(shuō)明:http://blog.csdn.net/c406495762/article/details/72331737
代碼不完善,沒(méi)有進(jìn)行打包,不具通用性,純屬娛樂(lè ),以后有時(shí)間會(huì )完善。
4、shuaia.py: 爬取《帥啊》網(wǎng),帥哥圖片
《帥啊》網(wǎng)URL:http://www.shuaia.net/index.html
原理說(shuō)明:http://blog.csdn.net/c406495762/article/details/72597755
第三方依賴(lài)庫安裝:
5、daili.py: 構建代理IP池
原理說(shuō)明:http://blog.csdn.net/c406495762/article/details/72793480
6、carton: 使用Scrapy爬取《火影忍者》漫畫(huà)
代碼可以爬取整個(gè)《火影忍者》漫畫(huà)所有章節的內容,保存到本地。更改地址,可以爬取其他漫畫(huà)。保存地址可以在settings.py中修改。
動(dòng)漫網(wǎng)站:http://comic.kukudm.com/
原理說(shuō)明:http://blog.csdn.net/c406495762/article/details/72858983
7、hero.py: 《王者榮耀》推薦出裝查詢(xún)小助手
網(wǎng)頁(yè)爬取已經(jīng)會(huì )了,想過(guò)爬取手機APP里的內容嗎?
原理說(shuō)明:http://blog.csdn.net/c406495762/article/details/76850843
8、financical.py: 財務(wù)報表下載小助手
爬取的數據存入數據庫會(huì )嗎?《跟股神巴菲特學(xué)習炒股之財務(wù)報表入庫(MySQL)》也許能給你一些思路。
原理說(shuō)明:http://blog.csdn.net/c406495762/article/details/77801899
動(dòng)態(tài)示意圖:
9、one_hour_spider:一小時(shí)入門(mén)Python3網(wǎng)絡(luò )爬蟲(chóng)。
原理說(shuō)明:
本次實(shí)戰內容有:
10、douyin.py:抖音App視頻下載
抖音App的視頻下載,就是普通的App爬取。
原理說(shuō)明:個(gè)人網(wǎng)站:http://cuijiahua.com/blog/2018/03/spider-5.html
11、douyin_pro:抖音App視頻下載(升級版)
抖音App的視頻下載,添加視頻解析網(wǎng)站,支持無(wú)水印視頻下載,使用第三方平臺解析。
原理說(shuō)明:個(gè)人網(wǎng)站:http://cuijiahua.com/blog/2018/03/spider-5.html
12、douyin_pro_2:抖音App視頻下載(升級版2)
抖音App的視頻下載,添加視頻解析網(wǎng)站,支持無(wú)水印視頻下載,通過(guò)url解析,無(wú)需第三方平臺。
原理說(shuō)明:個(gè)人網(wǎng)站:http://cuijiahua.com/blog/2018/03/spider-5.html
動(dòng)態(tài)示意圖:
13、geetest.py:GEETEST驗證碼破解
爬蟲(chóng)最大的敵人之一是什么?沒(méi)錯,驗證碼!Geetest作為提供驗證碼服務(wù)的行家,市場(chǎng)占有率還是蠻高的。遇到Geetest提供的滑動(dòng)驗證碼怎么破?授人予魚(yú)不如授人予漁,接下來(lái)就為大家呈現本教程的精彩內容。
原理說(shuō)明:http://www.cuijiahua.com/blog/2017/11/spider_2_geetest.html
動(dòng)態(tài)示意圖:
14、12306.py:用Python搶火車(chē)票簡(jiǎn)單代碼
可以自己慢慢豐富,蠻簡(jiǎn)單,有爬蟲(chóng)基礎很好操作,沒(méi)有原理說(shuō)明。
15、baiwan:百萬(wàn)英雄輔助答題
效果圖:

原理說(shuō)明:http://cuijiahua.com/blog/2018/01/spider_3.html
功能介紹:
16、Netease:根據歌單下載網(wǎng)易云音樂(lè )
效果圖:

功能介紹:根據music_list.txt文件里的歌單的信息下載網(wǎng)易云音樂(lè ),將自己喜歡的音樂(lè )進(jìn)行批量下載。
17、bilibili:B站視頻和彈幕批量下載
使用說(shuō)明:
三個(gè)參數:
-d 保存視頻的文件夾名
-k B站搜索的關(guān)鍵字
-p 下載搜索結果前多少頁(yè)
github 下載地址 :https://github.com/Jack-Cherish/python-spider
聯(lián)系客服