最近一直有師弟師妹和朋友問(wèn)我數學(xué)和研究的關(guān)系,研一要去學(xué)什么數學(xué)課。畢竟在清華,衡量一個(gè)研究生最重要的指標之一就是paper,而沒(méi)有數學(xué),是肯定上不了世界頂級的期刊和會(huì )議的,這在計算機學(xué)界尤其重要!你會(huì )發(fā)現,不論哪個(gè)領(lǐng)域有價(jià)值的東西,都一定離不開(kāi)數學(xué)!在這樣一個(gè)信息時(shí)代,當google已經(jīng)讓世界沒(méi)有秘密的時(shí)候,一種卓越的數學(xué)思維,絕對可以成為你的核心競爭力. 無(wú)奈本人實(shí)在見(jiàn)地有限,且生活慵懶,一直沒(méi)能整理出一些有價(jià)值的東西,今日拜讀了lin dahua的空間,突然發(fā)現大牛已經(jīng)做了此工作,便zz至此與大家分享。紅筆標注之處,是本人的一些感受,也算站在巨人肩膀上做一些膚淺之論吧。最后補充一句:對于大部分不做純數學(xué)理論的人來(lái)說(shuō)(99.99999%的人都屬于這一類(lèi)),學(xué)一門(mén)數學(xué)時(shí)一定要建立和實(shí)際物理世界的聯(lián)系。這樣掌握的數學(xué)知識才有價(jià)值,也最深刻!
前面幾篇談了一些對數學(xué)的粗淺看法。其實(shí),如果對某門(mén)數學(xué)有興趣,最好的方法就是走進(jìn)那個(gè)世界去學(xué)習和體驗。
這里說(shuō)說(shuō)幾本我看過(guò)后覺(jué)得不錯的數學(xué)教科書(shū)。
1. 線(xiàn)性代數 (Linear Algebra):
我想國內的大學(xué)生都會(huì )學(xué)過(guò)這門(mén)課程,但是,未必每一位老師都能貫徹它的精要。這門(mén)學(xué)科對于Learning是必備的基礎,對它的透徹掌握是必不可少的。我在科大一年級的時(shí)候就學(xué)習了這門(mén)課,后來(lái)到了香港后,又重新把線(xiàn)性代數讀了一遍,所讀的是
Introduction to Linear Algebra (3rd Ed.) by Gilbert Strang.
這本書(shū)是MIT的線(xiàn)性代數課使用的教材,也是被很多其它大學(xué)選用的經(jīng)典教材。它的難度適中,講解清晰,重要的是對許多核心的概念討論得比較透徹。我個(gè)人覺(jué)得,學(xué)習線(xiàn)性代數,最重要的不是去熟練矩陣運算和解方程的方法——這些在實(shí)際工作中MATLAB可以代勞,關(guān)鍵的是要深入理解幾個(gè)基礎而又重要的概念:子空間(Subspace),正交(Orthogonality),特征值和特征向量(Eigenvalues and eigenvectors),和線(xiàn)性變換(Linear transform)。(如果你能理解傅立葉變化究竟做了一件什么事情,你才能說(shuō)你知道了子空間!學(xué)線(xiàn)性代數一定要理解MATLAB能為你做的事情之外其他的東西,這才是精髓。而很遺憾,很多高校的線(xiàn)性代數考試只測試學(xué)生的計算能力。有幾個(gè)數學(xué)老師能告訴學(xué)生:我們?yōu)槭裁匆嬎闾卣髦??)從我的角度看?lái),一本線(xiàn)代教科書(shū)的質(zhì)量,就在于它能否給這些根本概念以足夠的重視,能否把它們的聯(lián)系講清楚。Strang的這本書(shū)在這方面是做得很好的。
而且,這本書(shū)有個(gè)得天獨厚的優(yōu)勢。書(shū)的作者長(cháng)期在MIT講授線(xiàn)性代數課(18.06),課程的video在MIT的Open courseware網(wǎng)站上有提供。有時(shí)間的朋友可以一邊看著(zhù)名師授課的錄像,一邊對照課本學(xué)習或者復習。
http://ocw.mit.edu/OcwWeb/Mathematics/18-06Spring-2005/CourseHome/index.htm2. 概率和統計 (Probability and Statistics): (功利一點(diǎn)的講,統計是最實(shí)用的一門(mén)學(xué)科,如果你不去研究,不去做高端的金融投資分析,那么你可以不去學(xué)泛函,不去學(xué)線(xiàn)性代數,不去了解拓撲,但你一定離不開(kāi)統計!時(shí)間序列分析也很重要,甚至比統計還來(lái)得實(shí)用,可國內卻鮮有高校開(kāi)設這門(mén)課程。。。)
概率論和統計的入門(mén)教科書(shū)很多,我目前也沒(méi)有特別的推薦。我在這里想介紹的是一本關(guān)于多元統計的基礎教科書(shū):
Applied Multivariate Statistical Analysis (5th Ed.) by Richard A. Johnson and Dean W. Wichern
這本書(shū)是我在剛接觸向量統計的時(shí)候用于學(xué)習的,我在香港時(shí)做研究的基礎就是從此打下了。實(shí)驗室的一些同學(xué)也借用這本書(shū)學(xué)習向量統計。這本書(shū)沒(méi)有特別追求數學(xué)上的深度,而是以通俗易懂的方式講述主要的基本概念,讀起來(lái)很舒服,內容也很實(shí)用。對于Linear regression, factor analysis, principal component analysis (PCA), and canonical component analysis (CCA)這些Learning中的基本方法也展開(kāi)了初步的論述。
之后就可以進(jìn)一步深入學(xué)習貝葉斯統計和Graphical models。(To my great acknowledgement, it is just for research.)一本理想的書(shū)是
Introduction to Graphical Models (draft version). by M. Jordan and C. Bishop.
我不知道這本書(shū)是不是已經(jīng)出版了(不要和Learning in Graphical Models混淆,那是個(gè)論文集,不適合初學(xué))。這本書(shū)從基本的貝葉斯統計模型出發(fā)一直深入到復雜的統計網(wǎng)絡(luò )的估計和推斷,深入淺出,statistical learning的許多重要方面都在此書(shū)有清楚論述和詳細講解。MIT內部可以access,至于外面,好像也是有電子版的。
3. 分析 (Analysis): (這才是真正數學(xué)家應該做的事情,無(wú)奈本人智力水平有限,無(wú)法于此領(lǐng)域有多少見(jiàn)地)
我想大家基本都在大學(xué)就學(xué)過(guò)微積分或者數學(xué)分析,深度和廣度則隨各個(gè)學(xué)校而異了。這個(gè)領(lǐng)域是很多學(xué)科的基礎,值得推薦的教科書(shū)莫過(guò)于
Principles of Mathematical Analysis, by Walter Rudin
有點(diǎn)老,但是絕對經(jīng)典,深入透徹。缺點(diǎn)就是比較艱深——這是Rudin的書(shū)的一貫風(fēng)格,適合于有一定基礎后回頭去看。
在分析這個(gè)方向,接下來(lái)就是泛函分析(Functional Analysis)。
Introductory Functional Analysis with Applications, by Erwin Kreyszig.
適合作為泛函的基礎教材,容易切入而不失全面。我特別喜歡它對于譜論和算子理論的特別關(guān)注,這對于做learning的研究是特別重要的。Rudin也有一本關(guān)于functional analysis的書(shū),那本書(shū)在數學(xué)上可能更為深刻,但是不易于上手,所講內容和learning的切合度不如此書(shū)。
在分析這個(gè)方向,還有一個(gè)重要的學(xué)科是測度理論(Measure theory),(泛函是一切數學(xué)之源,而測度論又是泛函的基石。如今世界頂級投行的quant大部分都是利用概率測度去做風(fēng)險中性建模和衍生品定價(jià),誰(shuí)說(shuō)分析數學(xué)沒(méi)有用?!ibank的衍生品投資分析都是基于測度中性去做的,因為對于大規模投資來(lái)說(shuō),最大的問(wèn)題不是profit,而是risk hedging)但是我看過(guò)的書(shū)里面目前還沒(méi)有感覺(jué)有特別值得介紹的。
4. 拓撲 (Topology):
在我讀過(guò)的基本拓撲書(shū)各有特色,但是綜合而言,我最推崇:
Topology (2nd Ed.) by James Munkres
這本書(shū)是Munkres教授長(cháng)期執教MIT拓撲課的心血所凝。對于一般拓撲學(xué)(General topology)有全面介紹,而對于代數拓撲(Algebraic topology)也有適度的探討。此書(shū)不需要特別的數學(xué)知識就可以開(kāi)始學(xué)習,由淺入深,從最基本的集合論概念(很多書(shū)不屑講這個(gè))到Nagata-Smirnov Theorem和Tychonoff theorem等較深的定理(很多書(shū)避開(kāi)了這個(gè))都覆蓋了。講述方式思想性很強,對于很多定理,除了給出證明過(guò)程和引導你思考其背后的原理脈絡(luò ),很多令人贊嘆的亮點(diǎn)——我常讀得忘卻饑餓,不愿釋手。很多習題很有水平。
5. 流形理論 (Manifold theory):
對于拓撲和分析有一定把握時(shí),方可開(kāi)始學(xué)習流形理論,否則所學(xué)只能流于浮淺。我所使用的書(shū)是
Introduction to Smooth Manifolds. by John M. Lee
雖然書(shū)名有introduction這個(gè)單詞,但是實(shí)際上此書(shū)涉入很深,除了講授了基本的manifold, (個(gè)人覺(jué)得現在vision領(lǐng)域的manifold learning只是一些無(wú)病呻吟的研究,it is just for papers,但是我并不是說(shuō)流行學(xué)習對vision沒(méi)有用處,只是manifold真正的魅力遠沒(méi)有被挖掘出來(lái)!正像俄羅斯那一群科學(xué)怪人整出的l1-norm,誰(shuí)能想到今天對vision界帶來(lái)了如此大的變革。其實(shí),有時(shí)學(xué)習數學(xué)只是一種信仰。)tangent space, bundle, sub-manifold等,還探討了諸如綱理論(Category theory),德拉姆上同調(De Rham cohomology)和積分流形等一些比較高級的專(zhuān)題。對于李群和李代數也有相當多的討論。行文通俗而又不失嚴謹,不過(guò)對某些記號方式需要熟悉一下。
雖然李群論是建基于平滑流形的概念之上,不過(guò),也可能從矩陣出發(fā)直接學(xué)習李群和李代數——這種方法對于急需使用李群論解決問(wèn)題的朋友可能更加實(shí)用。而且,對于一個(gè)問(wèn)題從不同角度看待也利于加深理解。下面一本書(shū)就是這個(gè)方向的典范:
Lie Groups, Lie Algebras, and Representations: An Elementary Introduction. by Brian C. Hall
此書(shū)從開(kāi)始即從矩陣切入,從代數而非幾何角度引入矩陣李群的概念。并通過(guò)定義運算的方式建立exponential mapping,并就此引入李代數。這種方式比起傳統的通過(guò)“左不變向量場(chǎng)(Left-invariant vector field)“的方式定義李代數更容易為人所接受,也更容易揭示李代數的意義。最后,也有專(zhuān)門(mén)的論述把這種新的定義方式和傳統方式聯(lián)系起來(lái)。
————————————————————————————
無(wú)論是研究Vision, Learning還是其它別的學(xué)科,數學(xué)終究是根基所在。(數學(xué)是能與上帝對話(huà)的語(yǔ)言)學(xué)好數學(xué)是做好研究的基石。(如果你能摒棄了功利的去學(xué)習數學(xué),那么數學(xué)也勢必能夠為你帶來(lái)功利!)學(xué)好數學(xué)的關(guān)鍵歸根結底是自己的努力但是選擇一本好的書(shū)還是大有益處的。不同的人有不同的知識背景,思維習慣和研究方向,因此書(shū)的選擇也因人而異,只求適合自己,不必強求一致。上面的書(shū)僅僅是從我個(gè)人角度的出發(fā)介紹的,我的閱讀經(jīng)歷實(shí)在非常有限,很可能還有比它們更好的書(shū)