2017/12/06
Wednesday
昨天晚上在Github上看到一個(gè)Python資源大全列表,僅僅是一個(gè)README文件,沒(méi)有一行代碼,就獲得了9000多個(gè)star,真是沒(méi)有“人性”:-) 想我Tushare給多少人帶來(lái)了方便,解放了多少個(gè)腰纏萬(wàn)貫的量化投資人的數據處理時(shí)間,熬了多少個(gè)通宵,喝了多少箱六個(gè)核桃,也才獲得4000多個(gè)star。
不說(shuō)了,今天晚上再買(mǎi)一箱六個(gè)核桃,回去補補腦。若有意,點(diǎn)開(kāi)http://tushare.org右上角的Github地址,或者直接訪(fǎng)問(wèn):https://github.com/waditu/tushare,然后狠狠點(diǎn)一下Star,就算給米哥點(diǎn)贊了。(掐指一算,這應該是米哥第一次在這么嚴肅的地方不正經(jīng)的推廣)
話(huà)說(shuō)回來(lái),這個(gè)列表確實(shí)集合了大家的所學(xué)所用,是一個(gè)給小白增長(cháng)功力的武學(xué)秘籍名錄,里面不乏葵花寶典般能讓你走火入魔的技術(shù),也有能讓你打通技術(shù)任督二脈的六脈神劍,還有只需要學(xué)一招小李飛刀就能闖遍各大公司的獨門(mén)技術(shù)。
十八般武藝,大家各取所需。米哥簡(jiǎn)單整理了一下跟Python數據分析相關(guān)的技術(shù)呈現出來(lái),臺燈下,地鐵里,各位碼友、礦友且學(xué)且用,各顯神通吧。
1
機器學(xué)習和計算機視覺(jué)
Crab:靈活、快速的推薦引擎
gensim:人性化的話(huà)題建模庫
hebel:GPU 加速的深度學(xué)習庫
NuPIC:智能計算 Numenta 平臺
pattern:Python 網(wǎng)絡(luò )挖掘模塊
PyBrain:另一個(gè) Python 機器學(xué)習庫
Pylearn2:一個(gè)基于 Theano 的機器學(xué)習庫
python-recsys:一個(gè)用來(lái)實(shí)現推薦系統的 Python 庫
scikit-learn:基于 SciPy 構建的機器學(xué)習 Python 模塊
pydeep:Python 深度學(xué)習庫
vowpalporpoise:輕量級 Vowpal Wabbit 的 Python 封裝
skflow:一個(gè) TensorFlow 的簡(jiǎn)化接口(模仿 scikit-learn)
Caffe: 一個(gè) Caffe 的python接口
OpenCV:開(kāi)源計算機視覺(jué)庫
pyocr:Tesseract 和 Cuneiform 的包裝庫
pytesseract:Google Tesseract OCR 的另一包裝庫
SimpleCV:一個(gè)用來(lái)創(chuàng )建計算機視覺(jué)應用的開(kāi)源框架
2
數據分析
blaze:NumPy 和 Pandas 的大數據接口
cclib:一個(gè)用來(lái)解析和解釋計算化學(xué)軟件包輸出結果的庫
NetworkX:一個(gè)為復雜網(wǎng)絡(luò )設計的高性能軟件
Neupy:執行和測試各種不同的人工神經(jīng)網(wǎng)絡(luò )算法
Numba:Python JIT (just in time) 編譯器,針對科學(xué)用的 Python ,由Cython 和 NumPy 的開(kāi)發(fā)者開(kāi)發(fā)
NumPy:使用 Python 進(jìn)行科學(xué)計算的基礎包
Open Babel:一個(gè)化學(xué)工具箱,用來(lái)描述多種化學(xué)數據
Open Mining:使用 Python 挖掘商業(yè)情報 (BI) (Pandas web 接口)
orange:通過(guò)可視化編程或 Python 腳本進(jìn)行數據挖掘,數據可視化,分析和機器學(xué)習
Pandas:提供高性能,易用的數據結構和數據分析工具
PyDy:PyDy 是 Python Dynamics 的縮寫(xiě),用來(lái)為動(dòng)力學(xué)運動(dòng)建模工作流程提供幫助, 基于 NumPy, SciPy, IPython 和 matplotlib
PyMC:馬爾科夫鏈蒙特卡洛采樣工具
RDKit:化學(xué)信息學(xué)和機器學(xué)習軟件
SciPy:由一些基于 Python ,用于數學(xué),科學(xué)和工程的開(kāi)源軟件構成的生態(tài)系統
statsmodels:統計建模和計量經(jīng)濟學(xué)
SymPy:一個(gè)用于符號數學(xué)的 Python 庫
cclib:一個(gè)用來(lái)解析和解釋計算化學(xué)軟件包輸出結果的庫
NetworkX:一個(gè)為復雜網(wǎng)絡(luò )設計的高性能軟件
Neupy:執行和測試各種不同的人工神經(jīng)網(wǎng)絡(luò )算法
Numba:Python JIT (just in time) 編譯器,針對科學(xué)用的 Python ,由Cython 和 NumPy 的開(kāi)發(fā)者開(kāi)發(fā)
NumPy:使用 Python 進(jìn)行科學(xué)計算的基礎包
Open Babel:一個(gè)化學(xué)工具箱,用來(lái)描述多種化學(xué)數據
Open Mining:使用 Python 挖掘商業(yè)情報 (BI) (Pandas web 接口)
orange:通過(guò)可視化編程或 Python 腳本進(jìn)行數據挖掘,數據可視化,分析和機器學(xué)習
Pandas:提供高性能,易用的數據結構和數據分析工具
PyDy:PyDy 是 Python Dynamics 的縮寫(xiě),用來(lái)為動(dòng)力學(xué)運動(dòng)建模工作流程提供幫助, 基于 NumPy, SciPy, IPython 和 matplotlib
PyMC:馬爾科夫鏈蒙特卡洛采樣工具
RDKit:化學(xué)信息學(xué)和機器學(xué)習軟件
SciPy:由一些基于 Python ,用于數學(xué),科學(xué)和工程的開(kāi)源軟件構成的生態(tài)系統
statsmodels:統計建模和計量經(jīng)濟學(xué)
SymPy:一個(gè)用于符號數學(xué)的 Python 庫
3
數據可視化
matplotlib:一個(gè) Python 2D 繪圖庫
bokeh:用 Python 進(jìn)行交互式 web 繪圖
ggplot:ggplot2 給 R 提供的 API 的 Python 版本
plotly:協(xié)同 Python 和 matplotlib 工作的 web 繪圖庫
pyecharts:基于百度 Echarts 的數據可視化庫
pygal:一個(gè) Python SVG 圖表創(chuàng )建工具
pygraphviz:Graphviz 的 Python 接口
PyQtGraph:交互式實(shí)時(shí) 2D/3D/ 圖像繪制及科學(xué)/工程學(xué)組件
SnakeViz:一個(gè)基于瀏覽器的 Python's cProfile 模塊輸出結果查看工具
vincent:把 Python 轉換為 Vega 語(yǔ)法的轉換工具
VisPy:基于 OpenGL 的高性能科學(xué)可視化工具
4
數據API構建及服務(wù)
Django
django-rest-framework:一個(gè)強大靈活的工具,用來(lái)構建 web API
django-tastypie:為Django 應用開(kāi)發(fā)API
django-formapi:為 Django 的表單驗證,創(chuàng )建 JSON APIs
Flask
flask-api:為 flask 開(kāi)發(fā)的,可瀏覽 Web APIs
flask-restful:為 flask 快速創(chuàng )建REST APIs
flask-restless:為 SQLAlchemy 定義的數據庫模型創(chuàng )建 RESTful APIs
flask-api-utils:為 Flask 處理 API 表示和驗證
eve:REST API 框架,由 Flask, MongoDB 等驅動(dòng)
Pyramid
cornice:一個(gè)Pyramid 的 REST 框架
與框架無(wú)關(guān)的
falcon:一個(gè)用來(lái)建立云 API 和 web app 后端的高性能框架
sandman:為現存的數據庫驅動(dòng)系統自動(dòng)創(chuàng )建 REST APIs
restless:框架無(wú)關(guān)的 REST 框架 ,基于從 Tastypie 學(xué)到的知識
ripozo:快速創(chuàng )建 REST/HATEOAS/Hypermedia APIs
5
爬蟲(chóng)及網(wǎng)頁(yè)處理
Scrapy:一個(gè)快速高級的屏幕爬取及網(wǎng)頁(yè)采集框架
cola:一個(gè)分布式爬蟲(chóng)框架
Demiurge:基于PyQuery 的爬蟲(chóng)微型框架
feedparser:通用 feed 解析器
Grab:站點(diǎn)爬取框架
MechanicalSoup:用于自動(dòng)和網(wǎng)絡(luò )站點(diǎn)交互的 Python 庫
portia:Scrapy 可視化爬取
pyspider:一個(gè)強大的爬蟲(chóng)系統
RoboBrowser:一個(gè)簡(jiǎn)單的,Python 風(fēng)格的庫,用來(lái)瀏覽網(wǎng)站,而不需要一個(gè)獨立安裝的瀏覽器
BeautifulSoup:以 Python 風(fēng)格的方式來(lái)對 HTML 或 XML 進(jìn)行迭代,搜索和修改
bleach:一個(gè)基于白名單的 HTML 清理和文本鏈接庫
cssutils:一個(gè) Python 的 CSS 庫
html5lib:一個(gè)兼容標準的 HTML 文檔和片段解析及序列化庫
lxml:一個(gè)非??焖?,簡(jiǎn)單易用,功能齊全的庫,用來(lái)處理 HTML 和 XML
MarkupSafe:為Python 實(shí)現 XML/HTML/XHTML 標記安全字符串
pyquery:一個(gè)解析 HTML 的庫,類(lèi)似 jQuery
untangle:將XML文檔轉換為Python對象,使其可以方便的訪(fǎng)問(wèn)
xhtml2pdf:HTML/CSS 轉 PDF 工具
xmltodict:像處理 JSON 一樣處理 XML
6
算法和設計模式
Python 實(shí)現的算法和設計模式。
algorithms:一個(gè) Python 算法模塊
python-patterns:Python 設計模式的集合
sortedcontainers:快速,純 Python 實(shí)現的SortedList,SortedDict 和 SortedSet 類(lèi)型
聯(lián)系客服