數(shù)學(xué)之美讀后感(通用19篇)
當看完一本著作后,對人生或者事物一定產(chǎn)生了許多感想吧,何不靜下心來寫寫讀后感呢?那么讀后感到底應(yīng)該怎么寫呢?以下是小編整理的數(shù)學(xué)之美讀后感,僅供參考,歡迎大家閱讀。
數(shù)學(xué)之美讀后感 篇1
讀完這本書有一點強烈的感受:工具一定要先進。數(shù)學(xué)是強大的工具,計算機也是。這兩種工具結(jié)合在一起,造就了強大的google、百度、亞馬遜、阿里、京東、騰迅等公司。他們不是百年老店,但他們掌握了先進的工具。
掌握了先進的工具,必將獲得競爭優(yōu)勢。如果你知道哪里有一群軟件工程師,維護著更大的一群計算機,那么不要猶豫,想辦法使用他們提供的服務(wù),因為這會給你帶來優(yōu)勢。所以我們使用Google的搜索和郵件,在亞馬遜、京東和淘寶上購物,用QQ和微博聯(lián)系朋友,使用銀行卡和網(wǎng)上銀行,利用交易終端在全球市場上進行各種交易……
人類歷史就是一部工具的進化史。石器、青銅、鐵器、火藥、蒸汽機、內(nèi)燃機、電報、電話、電視、計算機、衛(wèi)星、互聯(lián)網(wǎng),工具的進步引領(lǐng)著文明的進步。新的工具不斷淘汰老的工具,就像互聯(lián)網(wǎng)視頻點播正在淘汰電視、微博正在淘汰報紙、電子書正在淘汰紙質(zhì)書那樣。
但有一些古老的工具,今天仍有人在學(xué)習(xí)和使用,甚至在上面花費許多時間。毛筆就是這樣一個例子。今天學(xué)習(xí)掌握毛筆這種“落后的”工具,還有什么意義?其實我們在使用一些“落后的”工具時,主要是在學(xué)習(xí)工具背后的思想。書法和繪畫中蘊含的藝術(shù)審美的一般原則,經(jīng)得起具體工具變遷的考驗。甲骨文、金文、石鼓文所包含的對空間構(gòu)圖的理解,仍然值得現(xiàn)代人學(xué)習(xí)。思想工具是比實物工具更強大的工具。
工具組合使用,形成更強大的新工具。《數(shù)學(xué)之美》中提到的馬爾可夫鏈雖然是很強大的工具,但我在數(shù)學(xué)課上沒有聽老師提到過。這本書中給我印象最深的例子是余弦定理和新聞分類。余弦定理是中學(xué)數(shù)學(xué),再加上一些不算很難的多維向量的知識,竟然解決了計算機新聞分類這樣的難題!
每一種工具的背后,是人們對世界的一種理解。蒸汽機和內(nèi)燃機背后,是力學(xué)的世界。電報、電話、電視、計算機和互聯(lián)網(wǎng)背后,是信息的世界。數(shù)學(xué)是抽象的工具,是其他工具背后的工具。每一門學(xué)科要成為科學(xué),都少不了數(shù)學(xué)。也許有一天人們會習(xí)慣,用數(shù)學(xué)工具來分析藝術(shù)。數(shù)學(xué)是一種語言,它源于具體的世界,又高于具體的世界。如果說語言是對世界的認識和描述,如果說數(shù)學(xué)是一種語言,那么它一定是最接近神的語言。看似毫不相關(guān),卻又能描述萬事萬物。
學(xué)習(xí)數(shù)學(xué)有什么用?物理學(xué)家費曼當年在大一時提出這個問題,他的師兄建議他轉(zhuǎn)到物理系。今天,這個問題已不成為問題。具有扎實數(shù)學(xué)功底的人才正進入各行各業(yè),例如金融業(yè)。我認識一個出版社的老總,他招應(yīng)屆畢業(yè)生有一個條件:數(shù)學(xué)要好。
工具雖好,關(guān)鍵還要會用。最終要回到掌握先進工具的人。軟件算法工程師加上計算機集群,這是目前一流企業(yè)必需的裝備。正如馬克。安德森所說的,各行各業(yè)的一流公司,都是軟件公司。優(yōu)秀的軟件算法工程師,是人才爭奪的焦點。這樣,我們就容易理解Google招工程師的要求。
對信息加工處理和傳遞的能力不斷增強,是知識經(jīng)濟的特點。《數(shù)學(xué)之美》展示了Google如何運用數(shù)學(xué)和計算機網(wǎng)絡(luò),帶領(lǐng)我們進入云計算和大數(shù)據(jù)時代。
知識經(jīng)濟時代的工作,就是在各自的領(lǐng)域中進行科學(xué)研究。科學(xué)研究要大膽假設(shè),小心求證。科學(xué)研究要量化。科學(xué)研究要有對比實驗。科學(xué)研究要有數(shù)學(xué)模型。科學(xué)研究要有田野調(diào)查。科學(xué)研究要有文獻查證。科學(xué)研究要有同行評議。《數(shù)學(xué)之美》向我們介紹了自然語言分析領(lǐng)域的科研方法和過程。
任何一個領(lǐng)域,深入進去都有無數(shù)的細節(jié)。有興趣的人不但沒被這些細節(jié)嚇倒,反而會興致勃勃地研究,從而達到令人仰慕的高度。吳軍先生向我們展示了數(shù)學(xué)和算法中的這些細節(jié),也展示了他所達到的高度。值得我學(xué)習(xí)。
數(shù)學(xué)之美讀后感 篇2
我在想,為什么我們要學(xué)習(xí)數(shù)學(xué)?也許這個問題成年人有一萬個答案,可是當我們第一次走進教室,學(xué)習(xí)數(shù)學(xué)的時候,大概率還是個孩子,你怎么跟一個孩子解釋為什么要學(xué)習(xí)數(shù)學(xué)呢?我把這個問題拋給了一個朋友,他說:“為了提高思維邏輯能力,這是我初中老師在第一節(jié)數(shù)學(xué)課上告訴我們的”。或者一位5歲的小朋友又會問:“什么是邏輯能力呢?”
也許從出生第一天,我們就一直在被動的接收一些東西,父母的勸導(dǎo),老師的傳授,可5歲的孩子還是會把玩具散落一地,6歲的孩子仍然會因為父母不給買玩具而嗷嗷大哭,無論你怎么勸導(dǎo)一個人,怎么勸誡一個人,他可能仍然會犯你認為會出現(xiàn)的錯誤。我記得有位教育專家這么說:“你告訴寶寶他把玩具弄壞了,就等于丟了10個棒棒糖”,從此以后這個寶寶可能會更加珍惜玩具。這個方法很簡單,但是貌似最有效。數(shù)學(xué)是什么?數(shù)學(xué)不就是把復(fù)雜的東西簡單化么?
現(xiàn)在我們再回答前面的問題:為什么我要學(xué)習(xí)數(shù)學(xué)?我們可以這么跟5歲的小朋友說:“媽媽給你10元錢,讓你買醬油,醬油7元、棒棒糖1元一個,剩下的錢你可以買幾個棒棒糖?”或許想吃棒棒糖的就會苦思冥想一番,或許未來媽媽真的給他10元錢去買醬油,結(jié)果回來就變成了一瓶醬油和3個棒棒糖。或者再過一段時間,這位小朋友會選擇6元的醬油,因為可以獲得4個棒棒糖了。他這么計算著:7+3和6+4都可以等于10,那么如果要必須買醬油的情況下,1+9也可以等于10。我們都知道也有1元的袋裝醬油,于是9個棒棒糖到手了。任何知識的魅力都在于自我的發(fā)現(xiàn),只有你對它產(chǎn)生了無限的興趣,你就會不斷的發(fā)現(xiàn)它的美,《數(shù)學(xué)之美》也可以變成《物理之美》。
有些人會說,上面的例子是利益驅(qū)動型,不是興趣驅(qū)動型,對于一個孩子來說,你能指望他向成人那樣:“我需要的不是物質(zhì)世界,我需要的是精神世界?”。5歲寶寶最喜歡做得事情就是在吃和玩上面,請問,成年人不也是如此么?這就是天性。只不過成年人的自控能力足夠大罷了。
我們回到書本上,這本書是否合適自己?如果沒有專業(yè)的數(shù)學(xué)知識,很難讀懂。但是它又有著無限的魅力,讓你不自覺的讀下去,為什么?因為“數(shù)學(xué)之美”,雖然大多數(shù)人看不懂里面的公式,但是能夠明白數(shù)學(xué)能解決的問題:概率統(tǒng)計學(xué)能夠解決自然語言處理、布爾代數(shù)能解決搜索引擎的問題、有限狀態(tài)機和動態(tài)規(guī)劃能解決地圖問題、向量+特征向量+余弦定理能解決自動新聞分類問題、最大熵模型解決金融問題,看著看著我就莫名的產(chǎn)生了一種想要學(xué)習(xí)算法的沖動,這不就是本書的意義所在么?
最后,我推薦幾個章節(jié)希望有興趣的讀者可以關(guān)注下:
1. 信息指紋,可以讓復(fù)雜的數(shù)據(jù)用簡單的一串數(shù)字存儲
2. 13章,提到的簡單之美。當然之后多次提到
3. 余弦定理(通過向量+特征向量+余弦定理)可以判斷兩條數(shù)據(jù)的相似性
4. 17章,簡單密碼學(xué)(對密碼感興趣的可以看看)
5. 布隆過濾器,用很少的空間存儲大量的數(shù)據(jù),從而解決黑名單的問題(黑名單數(shù)據(jù)量龐大的時候,會增加判斷某一個名單是否出現(xiàn)過的難度)。
6. 29章,分治算法,雖然沒有很明白算法,但是原理其實很簡單:把復(fù)雜的東西拆分成若干小的部分,然后進行逐個解決或者說各個擊破
7. 30章,神經(jīng)網(wǎng)絡(luò),其實沒那么神秘,神經(jīng)就好比一個網(wǎng)絡(luò)(馬爾科夫模型+貝葉斯網(wǎng)絡(luò))中的各個節(jié)點而已。
8. 31章,大數(shù)據(jù),這章是最推薦看的,而且沒有很多專業(yè)的知識,一看就懂。不是什么都可以稱之為大數(shù)據(jù)的,大數(shù)據(jù)需要滿足幾個條件:數(shù)據(jù)的代表性、數(shù)據(jù)的多維度、數(shù)據(jù)的完備性。現(xiàn)在有很多公司都自稱自己有大數(shù)據(jù),請不要侮辱大數(shù)據(jù)這個詞。順便說一下像百度這樣的公司,近幾年都在大數(shù)據(jù)上深耕,據(jù)我了解,比如醫(yī)療上面的項目,寧可免費做,只要求能夠得到醫(yī)療方面的大數(shù)據(jù),可見其對大數(shù)據(jù)的重視程度。
數(shù)學(xué)之美讀后感 篇3
在網(wǎng)上看到有人推薦吳軍博士的《數(shù)學(xué)之美》,盡管我從事社會科學(xué)研究,但對數(shù)學(xué)的推崇一直如此,所以買來一讀,我的真切體驗正如吳軍博士在書的后記中所說,把自己“境界提升了一個層次”。
那么,對我而言,到底提升了什么境界呢?
首要的肯定是思想境界。在未讀這本書之前,我知道對于這個世界的事件形成的信息集合,人類只有兩種方式可以表達,一個是數(shù)字,一個是語言。整個實數(shù)的集合是無窮個,而且每個數(shù)字都是唯一的;整個世界中的事件也是無窮個的,而且每個事件也時獨一無二的,這樣數(shù)學(xué)中的數(shù)字集合與世界中的事件集合就構(gòu)成一個一一對應(yīng)的關(guān)系,所以研究數(shù)字之間的關(guān)系,實際上就是在研究世界中事件之間的關(guān)系。語言中的概念和世界中的事件之間也是可以構(gòu)成一個對應(yīng)關(guān)系的,但問題是,語言中概念的集合是有限的,所以它和數(shù)字集合的對應(yīng)顯然只能是部分對應(yīng)。
計算機科學(xué)的發(fā)展,人類需要把語言處理成數(shù)字,因為計算機只能識別數(shù)字信號,所以“語言的數(shù)字化”成為計算機產(chǎn)生以來發(fā)展最快、而且最有創(chuàng)新性的領(lǐng)域,而許多華人科學(xué)家成為了這個領(lǐng)域的頂尖專家,如李開復(fù),吳軍博士是卓越的科學(xué)家之一。至此我才感到,在計算機主導(dǎo)的世界中,信息化就是數(shù)字化,而最難的數(shù)字化、也是最有成就的數(shù)字化,就是對人類自然語言的數(shù)字化,因為人類的信息幾乎100%是用語言承載、傳播的,計算機要與人對話,變成智能化的機器,首先要解決的就是語言的數(shù)字化問題。但我們在電腦上自如地輸入文字時、或者拿著手機通話時,我們跟本沒有意識到,那些卓越的語言科學(xué)家,早已經(jīng)把我們的語言,轉(zhuǎn)化成數(shù)字信號,通過輸入、處理、解碼的方式,讓我們無障礙地聯(lián)絡(luò)、工作。
我似乎感到,語言與數(shù)字的關(guān)系,就是人與自然關(guān)系的接口。套用古希臘畢達哥拉斯學(xué)派的觀點,加上我的理解,即是,數(shù)是萬物的本原,語言是人的本原!
吳軍博士似乎也在提升我對方法的認識境界。科學(xué)研究的思考方式,習(xí)慣遵循本質(zhì)、規(guī)律、連續(xù)性思維,在語言學(xué)研究的早期,人類為了讓計算機識別語言,采用建立語言規(guī)則和語言規(guī)則數(shù)據(jù)庫的辦法,但最終以失敗告終(20世紀50-70年代),70年代后科學(xué)家采用了語言統(tǒng)計模型,研究取得了突飛猛進。語言統(tǒng)計模型的勝利,再一次證明了宇宙量子模型的信念,世界是不連續(xù)的隨機性的粒子構(gòu)成,人類數(shù)千年文明進化出來的語言系統(tǒng),就是動態(tài)的隨機概率事件。其二,物理思維再也難逃牛頓的經(jīng)典本質(zhì)思維方法,即找尋到百分之百確定性的規(guī)律,而信息論思維是研究如何把握不確定性現(xiàn)象,利用概率統(tǒng)計是不二法門。其三,語言本質(zhì)上就是信息傳播,只有從通信模型視角才能真正理解計算機的功能,對語言的編碼、處理、傳輸、解碼是計算機的強項,計算機是永遠不可能理解語言的意思的。
在《數(shù)學(xué)之美》中,吳軍博士對他的老師、師兄弟、同事的經(jīng)歷、掌故進行了敘述,讓我們了解到這些世界一流的學(xué)科家、技術(shù)精英們的為人處世品質(zhì)、鮮明個性、科學(xué)素養(yǎng)及其管理風(fēng)格。例如賈里尼克對博士生的嚴酷淘汰,馬庫斯對學(xué)生的寬宏大度,但我感到他們有一樣?xùn)|西是共同的,就是對科學(xué)創(chuàng)造、頂尖人才的識別和器重,甚至是無條件的包容。如此為人的境界才是根本,因為偉大的科學(xué)創(chuàng)造畢竟是人做出來的,只有崇高的人文精神之下才能造就頂尖的人才、一流的科學(xué)和技術(shù)。
觀國內(nèi)的學(xué)說界,官風(fēng)盛行、人情充斥,與這些一流學(xué)說群對科學(xué)創(chuàng)造的賞識、對個性人才的包容,對科學(xué)探索的熱誠,可謂相去甚遠。
看來,我們只能寄希望于年輕一代,但愿吳博士的《數(shù)學(xué)之美》,能讓我們的學(xué)子們,初步體驗到科學(xué)精英們卓越的才智與情懷。
數(shù)學(xué)之美讀后感 篇4
看完《浪潮之巔》,了解了硅谷很多公司尤其是互聯(lián)網(wǎng)公司的沉浮,對吳軍的書就非常感興趣,看到吳軍的另一本書《數(shù)學(xué)之美》,激起了很深的興趣,所以很快把書看完了,普及了很多基礎(chǔ)的知識的同時也啟發(fā)了很多想法,感覺很爽。
我自己在交大學(xué)的是工科(雖然沒怎么上過課),小學(xué)、初中、高中都是一路參加數(shù)學(xué)競賽,名次都還不錯,也因此沒有參加中考、高考,一路保送,自己對數(shù)學(xué)有很深的感情,同時女朋友大學(xué)也是數(shù)學(xué)系,有點后悔的大學(xué)選了個并不感興趣的專業(yè)(交大當時允許我隨便選專業(yè),我沒有跟父母商量自己選了船舶制造)。看這本書的過程中找到了很多高中在看競賽書的感覺,里面提到的很多概率論(不等式)、圖論、數(shù)論的知識是高中數(shù)學(xué)聯(lián)賽復(fù)試的重點,高中的時候已經(jīng)研究的很深了,不過大學(xué)荒廢了之后也忘得差不多了,書中提到的很多定理還很有親切感
書名叫做《數(shù)學(xué)之美》,顯得有些太大,畢竟更多的是吳軍在google做搜索相關(guān)工作用到的數(shù)學(xué)模型的介紹與總結(jié),提到的數(shù)學(xué)部分大多集中在概率論、圖論、數(shù)論領(lǐng)域,所以書名太大了,可能hax說得對,也許是出版社為了賣書取得名字
不得不說吳軍是一個大家,文字中能夠透露出大家的氣勢,書中不斷的穿插著各種歷史上的大科學(xué)家以及科技領(lǐng)域的大家的小故事甚至八卦,從文字中非常能夠感受到吳軍是一個和他們一個層次的人(即使他自己會自謙說是一個二流的工程師之類)
書中具體的模型就不介紹了,說幾點我學(xué)到的知識,能列出來的都是看完還有點印象的:
1.在互聯(lián)網(wǎng)的世界中,信息是如何量化的,信息熵是怎么回事?有啥用?
2.搜索領(lǐng)域中,語言是如何統(tǒng)計的,尤其是如何通過概率模型進行分詞
3.搜索引擎是如何工作的—網(wǎng)絡(luò)爬蟲是怎么回事兒
4.PageRank是怎么回事?為了解決什么問題?
5.密碼與解密領(lǐng)域的數(shù)學(xué)模型,尤其提到的二戰(zhàn)時候的各種解密的趣事兒,提到的電視劇《暗算》打算抽空看下
6.拼音輸入法的數(shù)學(xué)模型
7.、文本自動分類的模型
……
看完之后最大的感受就是:
1.數(shù)學(xué)模型巨大作用,推動著新技術(shù)的發(fā)展
2.攻城師是一個偉大的職業(yè),能夠運用這些知識轉(zhuǎn)化為生產(chǎn)力,非常牛叉
3.書中提到了很多數(shù)學(xué)模型都是在不斷的進化、改良、升級,也就是說有人不斷的在做優(yōu)化,會有不斷更好的模型、更新的技術(shù)出現(xiàn),跟得上技術(shù)的發(fā)展可能也是比較重要的,否則很多人一直在做某一點上的持續(xù)優(yōu)化就沒有意義了。
但同時技術(shù)很大的作用是用來解決實際問題的,書中提到的各個數(shù)學(xué)模型、各種方法都是為了解決人們的需求或者業(yè)務(wù)的需求,畢竟公司不是科學(xué)研究所,所以追求通過技術(shù)直接解決用戶需求或者做成易用的工具給業(yè)務(wù)人員、運營人員來間接解決用戶需求是挺重要的,可能不是技術(shù)人員覺得做到80分就可以了,而是用戶、使用工具的人覺得做到80分是一個重要的衡量
提到“工具”,想到趙趙說過的一句話:“不好用就等于沒有”,可能就是這個點,同時運用工具的人必須好好的運用,如果用不好甚至不用就太對不起技術(shù)了
數(shù)學(xué)之美讀后感 篇5
前一陣子因興趣研究CMUSphinx這套庫的應(yīng)用不得要領(lǐng),就去查看了下一些語音識別的基本原理的文章,偶然碰到了數(shù)學(xué)之美。其實浪潮之巔也是因此開始看的、結(jié)果先一步看完了,畢竟一本歷史書,一本介紹數(shù)學(xué)和語言處理的,難度不同
說實話,因為初中高中荒廢了太多時間,我的英文和數(shù)學(xué)基礎(chǔ)比較差,我大學(xué)的數(shù)學(xué)都是勉強修過的。一直以來數(shù)學(xué)對我是一個很恐怖的學(xué)科,也不知道為什么計算機專業(yè)對數(shù)學(xué)要求比較高。我個人就是數(shù)學(xué)分數(shù)很低,但是專業(yè)課學(xué)的還不錯,唯一好點的數(shù)學(xué)科目就是離散數(shù)學(xué)吧,另外的工科數(shù)學(xué)分析和高等代數(shù)都是慘不忍睹的
看完這本書后,我發(fā)現(xiàn)我還真是低估了數(shù)學(xué)的作用,一個復(fù)雜的語言識別過程,用統(tǒng)計語言模型竟然用那么簡單的數(shù)學(xué)模型就解決了,這對我的沖擊很大。另一個對我影響比較大的就是余弦定理和新聞的分類。以前那些各種三角函數(shù)的變換、三角函數(shù),各種向量,各種空間圖形在我印象中就只能用于畫設(shè)計圖,或者搞空間物理化學(xué)等基礎(chǔ)學(xué)科的應(yīng)用上,想著“這種東西和計算機編程有什么關(guān)系?要計算角度,庫里不都提供了嗎?”,哪成想到改變一下思路,改變一下方法,就簡單的把那么復(fù)雜的分裂問題給解決了。現(xiàn)在想想我當初想法還真是幼稚啊,可惜覆水難收,過去的時間已經(jīng)回不來了,但至少我現(xiàn)在明白了數(shù)學(xué)的重要性,總能想辦法彌補的。
不得不說國內(nèi)的教科書還真是太死板了。很多書上,先不說沒講應(yīng)用領(lǐng)域和這個能干嗎,有些教科書連推導(dǎo)過程也沒說明白。像我大學(xué)時候的那幾本高代高數(shù)的教科書,在某一步關(guān)鍵的過程寫一句“顯而易見”,然后就莫名其妙的出現(xiàn)了結(jié)果,這讓我們基礎(chǔ)差的人情何以堪啊,更何況我問了那些數(shù)學(xué)好的,他們想推導(dǎo)出那一步也要想好久。后來換了一下同濟大學(xué)版,發(fā)現(xiàn)同樣的定理,同樣的范圍,就是理解起來容易了不少。果然好書和差一點的書差別真不少。所以我就在網(wǎng)上整理了一些好的數(shù)學(xué)書籍,等會兒x就貼到文后,以后慢慢補。
"技術(shù)分為術(shù)和道兩種,具體的做事方法是術(shù),做事的原理和原則是道。這本書的目的是講道而不是講術(shù)。很多具體的搜索技術(shù)很快會從獨門絕技到普及,再到落伍,追求術(shù)的人一輩子工作很辛苦。只有掌握了搜索的本質(zhì)和精髓才能永遠游刃有余。” ,然后吳軍先生用搜索反作弊的例子漂亮的解釋了這兩種差別。我以前做過的項目里,如果出現(xiàn)沒想過的情況,就加一個異常處理處理特殊情況,本來很簡單的東西,愣是被我搞復(fù)雜了。現(xiàn)在想回來,那時候境界太低,連開始的本質(zhì)和原理都沒弄清楚,就埋頭搞下去了,以后要多注意點。
我一向喜歡實用性強的方法和工具,在這書里我特別喜歡阿米特·辛格博士的那一章。吳軍博士就用寥寥幾頁的描述中講解了辛格博士的處理事情的方法和原則,先幫用戶解決主要的問題,再決定要不要糾結(jié)在次要的部分上;要知道修改代碼的所作所為,知其所以然;能用簡單方法解決就用簡單的,可讀性很重要。
不過中間有兩個部分沒搞明白,最大熵模型和貝葉斯網(wǎng)絡(luò),沒搞懂為什么能解決那些問題。貝葉斯網(wǎng)絡(luò)還能稍微理解,少了馬爾科夫鏈的線性約束,更自由;但最大熵模型真搞不懂為什么那么好用,以后繼續(xù)研究。
總之這是一本很好的書,推薦大家讀一下。
數(shù)學(xué)之美讀后感 篇6
第8章里的“索引”,作者講到谷歌面試產(chǎn)品經(jīng)理的一道題目:如何向你的奶奶解釋搜索引擎。關(guān)于這個問題,好的回答據(jù)說是用圖書館的索引卡片做類比。
我奶奶是個文盲,一生為農(nóng),日出而作,日落而息。她很少看電視,更別說圖書館。所以用圖書館的例子,對我們來說,很生動;對她來說,很生澀。
我們村的田地是按照地形、土質(zhì)和流水等來劃分的,計有一等地、二等地和三等地。一般情況下,一等地用來種水稻,二等地用來種菜,三等地用來種水果。
所以當我奶奶想要給我摘桔子的時候,她肯定不會從一等地或者二等地一塊地一塊地找過來,而是直接跑到三等地(一般就是山上)。
像這樣的索引,是基于腦子里的“數(shù)據(jù)庫”,因為田地不會很多,多了也來不及種,所以跟布爾代數(shù)沒什么關(guān)系。但是這樣解釋,我奶奶就會大概明白了。我奶奶生前一次電腦也沒用過,跟她解釋這些,唯一的意義是,她會覺得我沒有敷衍她,這會使她欣慰——如果有機會解釋的話。
楊小凱曾經(jīng)說,如果張五常多加注重使用數(shù)學(xué)模型,那諾獎也許就拿下了。張五常對此不以為然,反以為傲,自詡當今世上只有科斯、阿爾欽和他才敢只用文字,不借助數(shù)學(xué)模型就在經(jīng)濟學(xué)界占有一席之地。
當然,張五常也不是徹底否定數(shù)學(xué)的作用,他認為能夠用文字解釋的經(jīng)濟學(xué)原理,不必使用數(shù)學(xué)對其復(fù)雜化。
數(shù)學(xué)在信息學(xué)和經(jīng)濟學(xué)里都有廣泛應(yīng)用,但是在信息科學(xué)方面,對數(shù)學(xué)作用大小的爭論就沒有經(jīng)濟學(xué)那么大了。
我們常說搜索引擎的競價廣告,就可能經(jīng)歷到第三方公司,通常他們宣傳自己是谷歌或者別的搜索引擎公司的代理商,然后通過不正當手段為客戶提高網(wǎng)頁的排名。谷歌在消除網(wǎng)絡(luò)作弊方面做了很多努力,通過修改排序算法來為搜索者提供更加準確實效的信息。
“作弊的本質(zhì)是在網(wǎng)頁排名信號中加入噪音,因此反作弊的關(guān)鍵是去噪音。沿著這個思路可以從根本上提高搜索算法抗作弊的能力。”我們公司就是吃了這個虧,交了不少錢給第三方公司,結(jié)果算法一變,關(guān)鍵詞的排名從前三下降到前三頁沒影。
社交搜索正在雄起,但是如果想要在傳統(tǒng)的搜索引擎中占據(jù)有利排名,我想,第三方公司的技術(shù)水平是很關(guān)鍵的。
大學(xué)專業(yè)課里,數(shù)電總是要比模電簡單不少。
自然界里大部分的信號都屬于模擬信號。所謂模擬信號,是指時間和數(shù)值上都是連續(xù)變化的信號。在實際電路中,模/數(shù)轉(zhuǎn)換是一個很重要的過程,將預(yù)處理的模擬信號經(jīng)過模/數(shù)變換為數(shù)字信號,然后進行數(shù)字信號處理。而數(shù)字化處理有很多優(yōu)點,比如功能強大、抗干擾能力強、易集成化等。
簡而言之,如果沒有數(shù)學(xué),就沒有數(shù)字信號處理的概念,也就無法進行信號的傳輸,而數(shù)字信號傳輸在大規(guī)模的集成電路里是必不可少的,這是通信成功的基本要求。
之前看到有人說如果高中看這本書,也許數(shù)學(xué)就是另一番天地,會有所突破。我不覺得,如果高中看這種書,我想,大多數(shù)人還是會對數(shù)學(xué)更加望而卻步。本書更適合通信電子這些專業(yè)的學(xué)生,在學(xué)習(xí)專業(yè)課的時候輔助閱讀,對理解通信原理、數(shù)電模電等都有更形象生動的想法。
數(shù)學(xué)之美讀后感 篇7
我是在讀了吳軍博士的《浪潮之巔》之后,發(fā)現(xiàn)推薦了《數(shù)學(xué)之美》這本書。我到豆瓣讀書上看了看評價,就果斷在當當上下單買了一本研讀。本來我以為這是一本充滿各種數(shù)學(xué)專業(yè)術(shù)語的書,讀后讓我非常震撼的是吳軍博士居然能用非常通俗的語言將自然語言處理等高深理論解釋的相當簡單。在李開復(fù)博士之后,吳軍博士又成為了目前備受矚目的具有深厚技術(shù)背景的作家。對于我來說,讀這本書有掃盲的功效,讓我知道了很多以前不知道的東西。我的想法是在研究生階段,不只局限于導(dǎo)師的研究方向,通過更加廣泛的涉獵知識,去尋找一個自己喜歡的研究領(lǐng)域。如果找到了這樣一個領(lǐng)域,那么我就讀博士。如果沒有的話,那么我想還是工作算了。
1、學(xué)科之間的聯(lián)系是如此的重要
全書主要是圍繞著吳軍博士所研究的自然語言處理方向來講述一些應(yīng)用在這個研究領(lǐng)域的數(shù)學(xué)知識,用了很大篇幅講解了將通信的原理應(yīng)用到自然語言處理上所取得的巨大成功。以前學(xué)習(xí)計算機網(wǎng)絡(luò)的時候,學(xué)過一個香農(nóng)定理。對香農(nóng)的認識就從香農(nóng)定理開始,因為考研會考相關(guān)的計算題。看了這本書才知道,香農(nóng)的《信息論》對今天的影響真的是不可估量。通過這樣一個過程,我也對以前的本科學(xué)校的學(xué)科建設(shè)產(chǎn)生了一些憂慮。對于培養(yǎng)計算機人才來說,無論是培養(yǎng)應(yīng)用型人才,還是培養(yǎng)研究型人才,都應(yīng)該與電子、通信有一定的交叉,這樣對學(xué)生思考問題的啟發(fā)與視野的開闊有著重要的作用。計算機本身就是從電子、通信、數(shù)學(xué)等學(xué)科中抽出來的新興的學(xué)科,在發(fā)展了多年之后,我們發(fā)現(xiàn)它仍然需要繼承一些傳統(tǒng)。回想自己的本科四年,上的更多的課時
語言類、技術(shù)類的課程,這些課程的確對提升學(xué)生的就業(yè)有很大幫助。但是我想說的是,一個忽視數(shù)學(xué)基礎(chǔ)、學(xué)科交叉的學(xué)校,他無法成為一所國內(nèi)的一流大學(xué)。作為一個母校培養(yǎng)的學(xué)生,我深知改革的阻力與困難,但是我希望母校的計算機學(xué)院能越辦越好。我們現(xiàn)在已經(jīng)培養(yǎng)出很多高薪優(yōu)秀的技術(shù)人才,我希望將來也能培養(yǎng)出更多的研究型人才。
2、看起來很牛的東西卻用著難以置信的簡單數(shù)學(xué)原理
在整本書中讓我最為印象深刻的是解釋Google搜索的原理,居然就是簡單的布爾代數(shù)運算。這個的確讓我大跌眼鏡,我一直認為搜索時一個非常復(fù)雜而龐大的問題,其數(shù)學(xué)原理也是相當高深的,但是吳軍博士的解釋讓我大開眼界。與此同時也知道了Google為什么牛,牛在哪了。搜索的原理雖然非常簡單,但是搜索是一個需要對海量數(shù)據(jù)進行操作的工作。Google在海量數(shù)據(jù)的處理方面的確是相當先進的,MapReduce、BigTable等等一些技術(shù)的發(fā)明與應(yīng)用使得Google在搜索上無出其右。目前分布式存儲、分布式計算、數(shù)據(jù)倉庫與存儲等研究領(lǐng)域近些年來的大熱也說明Google在引領(lǐng)研究方向上的超凡本領(lǐng)。
3、感謝概率老師的教誨
在大二的時候,有一個在我們學(xué)生中聲望很高的概率老師,他在課程即將結(jié)束的時候跟我們說我們將的是前幾章,這些事概率論與數(shù)理統(tǒng)計的基礎(chǔ)。對于你們計算機的學(xué)生來時,后面的章節(jié)才是最有用的.,以后一定要好好的研究,弄上一兩個在你的畢業(yè)設(shè)計上就會讓你畢業(yè)設(shè)計提升一個檔次,有可能驗收你畢業(yè)設(shè)計的老師也不懂。我當時對他的話沒有特別在意,我只關(guān)心期末考試要考哪些題目,因為我那個學(xué)期的概率課基本上都在睡覺,只有他講笑話的時候不睡。我看《數(shù)學(xué)之美》后發(fā)現(xiàn)馬爾科夫鏈、貝葉斯網(wǎng)絡(luò)之后,對以前的概率老師充滿無限的敬意。我發(fā)現(xiàn)我們再本科階段學(xué)習(xí)的《高等數(shù)學(xué)》、《線性代數(shù)》、《概率論與數(shù)理統(tǒng)計》在計算機學(xué)科應(yīng)用較多的要數(shù)概率論與數(shù)理統(tǒng)計,還有一門我學(xué)的不好的《離散數(shù)學(xué)》在計算機中也是有著舉足輕重的地位。我在看米歇爾的《機器學(xué)習(xí)》時也發(fā)現(xiàn)很多熟悉的概率論與數(shù)理統(tǒng)計的知識,這讓我不得不開始考慮重新彌補自己的數(shù)學(xué)短板。我的想法是在研一這一年把概率論與數(shù)理統(tǒng)計、線性代數(shù)、離散數(shù)學(xué)盡我最大的努力補一補,希望他們對我今后的學(xué)習(xí)有所幫助。
4、說說作者吳軍博士
吳軍博士寫的書對于學(xué)習(xí)計算機的學(xué)生來說,讀起來有種說不出的親切感。可能這跟他是技術(shù)出身的原因有關(guān),流暢的文筆、質(zhì)樸的文風(fēng)也讓人讀起來很舒服。看高曉松在優(yōu)酷上的《曉說》就知道,在硅谷有著眾多的華裔工程師,他們很多都來自清華、北大等國內(nèi)的名牌大學(xué),這些人在美國實現(xiàn)著自己的夢想。吳軍博士也曾是這其中的一員,我非常希望那些像吳軍博士一樣的牛人們能夠?qū)憰蛘邅韲鴥?nèi)的大學(xué)做一些演講、論壇等等,開闊一下我們的視野,傳授一下做學(xué)問的經(jīng)驗。與此同時,我也在想為什么我們國家那么多優(yōu)秀的IT人才都去了美國。這個問題在我去蘋果公司在東軟信息學(xué)院組織的培訓(xùn)過程中得到了答案,那個南京郵電的老師講了講中國為什么不像美國那么有創(chuàng)造力。我們中國人并不缺乏創(chuàng)造力,很多時候是我們所處的外部環(huán)境恰恰阻礙了創(chuàng)新。我想那么多優(yōu)秀的清華北大學(xué)子紛紛到大洋彼岸的美國,正是被美國開放的學(xué)術(shù)環(huán)境、創(chuàng)新氛圍所吸引,每個人都有自己的夢想,他們?nèi)ッ绹彩菫榱四軐崿F(xiàn)自己的夢想。以前都覺得他們是不愛國,現(xiàn)在長大了,對于這個問題看得更清楚了一點。我想說我們的祖國在經(jīng)歷了改革開放30多年的飛速發(fā)展之后,目前正處于一個關(guān)鍵和脆弱的時期。我們靠著人口紅利取得了巨大的成就,我們能不能憑借人才紅利取得更大的成就還是未知。希望有更多的人才能像李開復(fù)博士、吳軍博士那樣,為我們這個民族青年的成長和國家發(fā)展做出貢獻。
數(shù)學(xué)之美讀后感 篇8
如果要評選最令人痛恨的科目,估計非數(shù)學(xué)莫屬了。
人類花了幾百年時間才形成了現(xiàn)代數(shù)學(xué)完備的理論體系,結(jié)果卻要求我們在3-5年里全部學(xué)完。這顯然是要杯具的。也顯然是除了背公式就沒有其他辦法的。
數(shù)學(xué),小學(xué)的時候全是數(shù)字,初中的時候加入了XY,高中的時候基本沒數(shù)字了,大學(xué)高數(shù)不但數(shù)字少,而且各種符號滿天飛。
其實想想就明白了,古時候的人們真的是閑的才去研究數(shù)學(xué)的嗎?明顯是在工程工作和實際生活中遇到了難題,需要數(shù)學(xué)這個科學(xué)的皇后來解決,于是人們才去研究的數(shù)學(xué)啊。數(shù)學(xué)是與應(yīng)用分不開的啊。為什么在學(xué)習(xí)的過程中,卻被生生剝離了實際呢?《數(shù)學(xué)之美》里面的一句話提醒了我,幾乎所有的科學(xué)家都是數(shù)學(xué)家,但是很少有數(shù)學(xué)家同時是語言學(xué)家。
會做事而不會講事的人,編寫了我們的教材。
如果《數(shù)學(xué)之美》的作者吳軍執(zhí)筆重寫我們的數(shù)學(xué)教科書,說不定中國會出現(xiàn)更多的數(shù)學(xué)家。
由于每個月都買1-2百的書,對什么是好書,我現(xiàn)在心里是越來越有底了。其實標準很簡單,能不羅嗦的把事情給講清楚了,就是好書。從這個標準出發(fā),我杯具的發(fā)現(xiàn),國內(nèi)的教科書極少有滿足這個簡單的標準的。大部分是生搬硬套,大雜燴一鍋燉。
本著事情要講清楚的原則,現(xiàn)在的數(shù)學(xué)教科書,就應(yīng)該把課后習(xí)題給詳解。把公式隱含的條件反復(fù)的強調(diào),而不是像躲貓貓一樣找死不見,解體的時候應(yīng)該循序漸進,適量更新,而不是幾十年不變。那些公式什么的,你多解釋幾遍,多用文字講解一下,多寫點有用的中文,少推導(dǎo)些萬年不用的公式,少寫點“容易得出”“易推導(dǎo)出”這些無用的文字,增加一下讓教科書的可讀性,行不行?別整的公式套公式,顯得你編書的人很牛逼似地,其實你就是一心虛的。心虛怕講得多錯的多,被人質(zhì)疑你的權(quán)威性,逼就是有錯不改,強賣垃圾,編的這么爛,如果不是指定教材,放到市場上有人買才怪。最惡心的還壟斷,還不給別人編。
《數(shù)學(xué)之美》是把數(shù)學(xué)怎么簡單,怎么好理解就怎么講。
教科書是公式一擺,撒手不管,習(xí)題雷同例題,與實際脫節(jié),任外面山洪海嘯,我自巋然不動。
中國的教科書啊,學(xué)一下國外的吧。北大出版社翻譯出版的《經(jīng)濟學(xué)原理》雖然是教科書,但是凡是對經(jīng)濟有一丁點興趣的人,都會對這套書稱贊不已。這才是教科書應(yīng)有的樣子啊。
數(shù)學(xué)之美讀后感 篇9
《數(shù)學(xué)之美》,一個從事多年工作的谷歌研究員眼中的數(shù)學(xué)。令我大飽眼福的是,大學(xué)里面的數(shù)學(xué)知識竟能如此廣泛運用到了計算機行業(yè)中。
在語音識別、翻譯,還有密碼學(xué)領(lǐng)域,有著許多基于概率統(tǒng)計的模型和思想。當然,貝葉斯公式是基礎(chǔ),應(yīng)用到隱含馬爾科夫鏈模型,神經(jīng)網(wǎng)絡(luò)模型。
在搜索中,一些相關(guān)性的計算,無不用到了概率的知識。在新聞分類中,用到了一些有關(guān)矩陣特征值、相似對角化的知識。當然,在圖像處理方面,矩陣變換可謂是無處不在。另外,在識別方面,有一些通信模型,涉及到了信道、誤碼率、信息熵。
最近剛開學(xué)也沒什么事,所以就想隨便找?guī)妆緯匆幌拢詈脛e是那種太艱深晦澀的書。8月份一直到現(xiàn)在,吳軍寫的這本12年5月出版的《數(shù)學(xué)之美》一直盤踞京東、亞馬遜等各大網(wǎng)上商城科技類圖書的榜首,當然,還有早些時候出版的《浪潮之巔》也排在很靠前的位置。心想市場的力量應(yīng)該能幫我挑出好書吧,于是就從圖書館借了一本來,一直到今天晚上把它給看完了。
因此想寫一點東西來總結(jié)、反思一下,反正剛開完班會也沒什么事干。
寫在前面的建議:如果你不討厭數(shù)學(xué)的話,強烈推薦這本書,網(wǎng)上也可以下到電子版,不過閱讀感覺上還是很不一樣的。
廢話就不多說了,《數(shù)學(xué)之美》其實是一本科普類的讀物,所面向的是接受過普通高等教育的人,完全不需要在特定領(lǐng)域有很深的造詣就可以看懂,大概懂一點線性代數(shù)、概率統(tǒng)計、組合數(shù)學(xué)、信息論、計算機算法、模式識別最好(雖然列舉了這么多,其實有些不懂也沒關(guān)系……),所以尤其適合信科的人看。內(nèi)容大部分是和人工智能、計算機相關(guān)的,這并非我所學(xué)的專業(yè),但作者比較擅長將看似復(fù)雜的原理用簡明的語言表達出來,所以可讀性還是很好的。
吳軍是清華大學(xué)畢業(yè)的,之前任職于Google,后來到了騰訊,這些文章都是發(fā)表在Google黑板報上的,后來經(jīng)過了重寫,所以網(wǎng)上下載的和書本內(nèi)容有所差異。由于吳軍本人是研究自然語言處理和語音識別的,所以統(tǒng)計語言模型的東西可能會多一點,不過我覺得這絲毫不妨礙全書數(shù)學(xué)之美的展現(xiàn)……感覺收獲還是挺多的,知識上的有一些,但更多還是思維方式上的。作者舉了很多例子試圖讓人明白很多看似復(fù)雜的高科技背后,基本原理其實是出乎意料簡單的(當然,必須承認第一個想到這些方法的人還是非常了不起的……)。比如高準確率的機器翻譯,看上去好像是計算機能夠理解各國語言,隱藏在背后的卻是很多具有大學(xué)理科學(xué)歷的人都非常清楚的統(tǒng)計模型和概率模型;再比如拼音輸入法的數(shù)學(xué)原理,早期的研究主要集中在縮短平均編碼長度,比如曾經(jīng)流行一時的五筆輸入法,而現(xiàn)今真正實用的輸入法卻是有很多信息冗余、編碼長度比較長的拼音輸入法,作者從信息論和市場的角度做了簡單的闡述;又比如新聞的自動分類,許多非IT領(lǐng)域的人可能會認為計算機可以讀懂新聞并進行分類,而實際上只是特征向量的抽取、多維空間中向量夾角的計算,非常非常簡單,但凡學(xué)過一點線性代數(shù)的人絕對是一看就懂的……當然,完美的實現(xiàn)還需要考慮很多細節(jié)和現(xiàn)實的情況,但這并不是這本書所關(guān)注的地方,數(shù)學(xué)之美在于其簡潔而不是繁瑣。
除了對于具體信息技術(shù)的剖析之外,作者還花了很大篇幅來講一些杰出人士的成長過程,特別是把這些人的成長經(jīng)歷和中國學(xué)生的成長經(jīng)歷作對比。雖然作者并沒有明說,但字里行間多少流露出對于中國高等教育以及很多中國企業(yè)的批評,一是教育的功利性,缺乏寬松的獨立思考的環(huán)境,即使學(xué)了一堆理論也難有用武之地,自然也就缺乏創(chuàng)新性的成果;二是中國企業(yè)的短視,大部分都不舍得在新框架開發(fā)上投資,而是坐享學(xué)術(shù)界和國外企業(yè)的研究成果。
總結(jié)一下呢,《數(shù)學(xué)之美》事實上不能帶給你編程能力的提升,也沒法讓人的數(shù)學(xué)水平有顯著的提升,但它在很大程度上讓你跳出教科書式的繁瑣細節(jié)的束縛,能夠從更宏觀的角度來思考信息世界背后的數(shù)學(xué)引擎的運行原理,讓人明白看似很高級、復(fù)雜的東西背后其實并不如我們所想象的那樣復(fù)雜,而我們所學(xué)的“枯燥”的數(shù)學(xué)真的可以“四兩撥千斤”,改變億萬人的生活。
數(shù)學(xué)之美讀后感 篇10
在看吳軍的《數(shù)學(xué)之美》之前,我并沒有看過他寫的《浪潮之巔》、《文明之光》等書,但是他主理的得到專欄《硅谷來信》已經(jīng)聽了很久,對吳軍其人頗為了解——本碩畢業(yè)于清華大學(xué),然后在約翰霍普金斯大學(xué)攻讀博士,02年、10年先后在谷歌和騰訊任職,是著名的自然語言處理和搜索專家,現(xiàn)在主業(yè)是硅谷風(fēng)險投資。他的專欄宣傳標語是“像時代領(lǐng)航者一樣思考”,吳軍也確實具有“時代領(lǐng)航者”那樣的視野和見識,除了專業(yè)領(lǐng)域之外,對于日常生活和學(xué)習(xí)、職業(yè)發(fā)展也有不俗的見解。
《數(shù)學(xué)之美》最初是吳軍做谷歌研究員時,在谷歌黑板報上撰寫的一系列文章。雖然谷歌黑板報的本意是讓吳軍從一個科學(xué)家的角度介紹一下谷歌的技術(shù),但是他卻更希望“讓做工程的年輕人看到在信息技術(shù)行業(yè)做事情的正確方法”——因為吳軍剛到谷歌時,發(fā)現(xiàn)谷歌早期的一些算法根本沒有系統(tǒng)的模型和理論基礎(chǔ),而是用“湊”的方法解決問題,工程水平低下。國內(nèi)這種情況就更加泛濫了。
后來,吳軍又將這一系列博客幾乎重寫了一遍,寫成了《數(shù)學(xué)之美》,希望它能向非IT行業(yè)的從業(yè)人員普及一些IT領(lǐng)域的數(shù)學(xué)知識,能成為茶余飯后消遣的科普讀物。“世界上最好的學(xué)者總是有辦法深入淺出地把大道理講給外行聽,而不是故弄玄虛地把簡單的問題復(fù)雜化”,因此吳軍盡力以伽莫夫(《從一到無窮大》作者)、霍金為榜樣,力圖將數(shù)學(xué)之美展示給所有普通讀者。
由于我學(xué)習(xí)過概率論、數(shù)理統(tǒng)計、數(shù)據(jù)結(jié)構(gòu),整本書看下來,除了某些章節(jié)后的“延伸閱讀”和馬爾可夫鏈等內(nèi)容外,其他都是可以看懂的。其實看不懂的部分主要是在用數(shù)學(xué)推理證明文中的論點,即使不看也不會影響閱讀體驗。
吳軍在扉頁講道:“數(shù)學(xué)之美,首先在于其內(nèi)容或許復(fù)雜而深奧,但形式常常很簡單。同時,數(shù)學(xué)之美還在于數(shù)學(xué)原理的通用性和普遍性——數(shù)學(xué)上的一點突破,可以帶動很多領(lǐng)域和行業(yè)的進步。”
我高中時曾因為數(shù)學(xué)的應(yīng)用不明確而對其抱有偏見,直到大學(xué)接觸到了數(shù)學(xué)建模。同樣,這本書中講到了許多數(shù)學(xué)在信息技術(shù)工程領(lǐng)域的應(yīng)用,搭建了數(shù)學(xué)與應(yīng)用之間的橋梁。
書中最令人印象深刻的例子就是通信。人與人之間的交流,也算是廣義上的通信,因此通信與我們的生活息息相關(guān)。而數(shù)學(xué)在通信中的應(yīng)用非常普遍,因為從電報、電話、電視到互聯(lián)網(wǎng),這些現(xiàn)代通信都遵從著信息論的規(guī)律,而整個信息論的基礎(chǔ)就是數(shù)學(xué)。不僅如此,整個人類的自然語言和文字的起源背后,都受到數(shù)學(xué)規(guī)律的支配——因為數(shù)字和文字、自然語言一樣,都是信息的載體;語言和數(shù)學(xué)產(chǎn)生的目的都是為了記錄和傳播信息。
一個典型的通信系統(tǒng)是這樣的:發(fā)送者(人或者機器)發(fā)送信息時,需要采用一種能在媒體中(比如空氣、電線)傳播的信號,比如語音或者電話線的調(diào)制信號,這個過程是廣義的編碼。然后通過媒體傳播到接收方,這個過程是信道傳輸。在接收方,接收者(人或者機器)根據(jù)事先約定好的方法,將這些信號還原成發(fā)送者的信息,這個過程是廣義上的解碼。
我們平時說話時,大腦就是一個信息源,聲帶、空氣就是如電線、光纜般的信道,聽眾的耳朵就是接收器,而聲音就是傳送的信號。根據(jù)聲學(xué)信號推測說話者的意思,就是語音識別。
語言實質(zhì)上是一套編碼、解碼的規(guī)則。從字(字母)到詞的構(gòu)詞法是詞的編碼規(guī)則,這套規(guī)則是完備的(有限且封閉的集合);從詞到句的語法是語言的編碼規(guī)則,這套規(guī)則是不完備的(無限和開放的集合)——任何語言都有語法覆蓋不到的地方。
正是由于語法是不完備的規(guī)則,所以在自然語言處理的研究當中,基于規(guī)則的方法走向了一條死路。隨著計算機性能和可用數(shù)據(jù)量的增加,基于統(tǒng)計的方法已經(jīng)被廣泛運用到自然語言處理中。書的第2章到第7章,圍繞自然語言處理的統(tǒng)計學(xué)模型,講述得深入淺出,而且對科學(xué)界的許多大師級人物和他們的貢獻都做了介紹。
另一個絕妙的應(yīng)用案例,是第14章《余弦定理和新聞的分類》。我們在高中都學(xué)過用余弦定理判斷兩個向量之間的夾角大小,然而不知道這樣做有什么實際意義。如果當時我們的老師能舉出文本分類作為例子,一定能讓同學(xué)們興奮不已。
如果由人來做新聞分類,人一定會先把文章讀懂。但是計算機沒有智能,根本讀不懂新聞,它只擁有強大的計算能力。這就要求我們把文字組成的新聞變成一組可以計算的數(shù)字,然后設(shè)計一個算法,算出任意兩篇新聞的相似性。
新聞傳遞信息,而詞是信息的載體,“同一類新聞用詞都是相似的,不同類的新聞用詞各不相同”。當剔除掉“的、地、得”和“之乎者也”那樣的助詞和虛詞之后,對新聞中剩下的實詞,計算出每個詞的出現(xiàn)頻率(實際上更為復(fù)雜,因為只是一篇讀書筆記,我就簡化成“出現(xiàn)頻率”了),再按照詞在詞匯表中出現(xiàn)的順序,將這些頻率值依次排列,就得到了這篇新聞的特征向量。
如果詞匯表中的某個詞在新聞中沒有出現(xiàn),對應(yīng)的頻率值為0。如果詞匯表總共有64000個詞,就會得到一個64000維的特征向量,向量中每一個維度的大小代表每個詞對這篇新聞主題的貢獻。新聞就這樣,從文字變成了數(shù)字。
一篇10000字的文本,它的特征向量各個維度的數(shù)值普遍比一篇500字的文本要大,因此單純比較各個維度的大小沒有太大意義。但是,向量的方向卻有很大的意義。如果兩個向量的方向基本一致,說明它們的新聞用詞比例基本一致。
因此,可以通過余弦定理計算兩個特征向量之間的夾角,判斷對應(yīng)的新聞主題的接近程度。在真實的文本分類聚合過程中,需要自底向上不斷合并,合并的過程中類別越來越少,而每個類越來越大。
另外值得一提的是,這項研究的動機很有意思。當時某個國際會議需要把提交上來的幾百篇論文交給各個專家評審,把每個研究方向的論文交給這個方向最有權(quán)威的專家。作為會議程序委員會主席的雅讓斯基教授為了偷懶,就想了這個將論文自動分類的方法,由他的學(xué)生弗洛里安很快實現(xiàn)了。
考慮到多次迭代的計算量,后文又介紹了矩陣奇異值分解的方法,將計算量縮小到1/6。
此外,書中還介紹了搜索引擎算法、拼音輸入法等應(yīng)用背后的數(shù)學(xué)模型。第19章《談?wù)剶?shù)學(xué)模型的重要性》中用托勒密的地心說模型(大圓套小圓)舉例,講:“正確的數(shù)學(xué)模型在科學(xué)和工程中至關(guān)重要,而發(fā)現(xiàn)正確模型的途徑往往是曲折的。正確的模型在形式上通常是簡單的。”
其實這本書中,除了IT領(lǐng)域的數(shù)學(xué)應(yīng)用之外,還有許多值得深挖的地方。看書的過程中,我有時會突然從書中的觀點聯(lián)想到其他地方看過的觀點。比如講信息和情報時說到斯大林在中蘇邊界的60萬大軍不敢輕易調(diào)到歐洲戰(zhàn)場,就聯(lián)系到《日本大敗局》里日本明知必敗卻執(zhí)意南下進攻,偷襲珍珠港;比如講信息論中“冗余度”的概念時,聯(lián)系到羅胖“冗余度大是優(yōu)勢,信息傳播效率反而高”的看法;講到數(shù)學(xué)模型的重要性時,想到黎曼的非歐幾何對相對論、超空間研究的重大意義……
其實大多情況下,看書只是用來怡情、消遣的手段,和打牌、玩游戲本質(zhì)上是一樣的。讀書的過程中經(jīng)常會靈光乍現(xiàn),這就是讀書的樂趣。
數(shù)學(xué)之美讀后感 篇11
確切的來說,《數(shù)學(xué)之美》并不是一本書,它是谷歌黑板報中的一系列文章,介紹數(shù)學(xué)在信息檢索和自然語言處理中的主導(dǎo)作用和奇妙應(yīng)用,每一篇文章都不長,但小中見大,從看似高深的高科技中用通俗易懂的案例展示了數(shù)學(xué)之美,深深的吸引了我。
這一系列文章的作者是google公司的科學(xué)家吳軍。他畢業(yè)于清華大學(xué)計算機系(本科)和電子工程系(碩士),并于1993-1996年在清華任講師。他于1996年起在美國約翰霍普金斯大學(xué)攻讀博士,并于XX年獲得計算機科學(xué)博士學(xué)位。在清華和約翰霍普金斯大學(xué)期間,吳軍博士致力于語音識別、自然語言處理,特別是統(tǒng)計語言模型的研究。他曾獲得1995年的全國人機語音智能接口會議的最佳論文獎和XX年eurospeech的最佳論文獎。
吳軍博士于XX年加入google公司,現(xiàn)任google研究院資深研究員。到google不久,他和三個同事們開創(chuàng)了網(wǎng)絡(luò)搜索反作弊的研究領(lǐng)域,并因此獲得工程獎。XX年,他和兩個同事共同成立了中日韓文搜索部門。吳軍博士是當前google中日韓文搜索算法的主要設(shè)計者。在google其間,他領(lǐng)導(dǎo)了許多研發(fā)項目,包括許多與中文相關(guān)的產(chǎn)品和自然語言處理的項目,并得到了公司首席執(zhí)行官埃里克施密特的高度評價。吳軍博士在國內(nèi)外發(fā)表過數(shù)十篇論文并獲得和申請了近十項美國和國際專利。他于XX年起,當選為約翰霍普金斯大學(xué)計算機系董事會董事。
正是他在信息檢索與自然語言處理領(lǐng)域中的一系列工作,使他講述了我所看到的內(nèi)容-數(shù)學(xué)之美。
看了數(shù)學(xué)之美,立即聯(lián)想到了金庸小說中的武林高人,總是把一套大多數(shù)人都會的入門功夫使得威力無比,擊潰眾多敵者。東西放在那,它的威力如何,并鍵在于使用者,武術(shù)如此,數(shù)學(xué)同樣如此。
于我而言,語音視別是一類高科技,作為非專業(yè)人土,深覺高奧。但看完數(shù)學(xué)之美之后,頓感驚詫,原來如此深奧東西的解決方法自己也學(xué)過,并且理工科讀過大學(xué)的人都學(xué)過,那就是統(tǒng)計學(xué)中的條件概率p(a/b),即b事件發(fā)生條件下a事件發(fā)生的概率。
如果s表示一連串特定順序排列的詞w1,w2,…,wn,換句話說,s可以表示某一個由一連串特定順序排練的詞而組成的一個有意義的句子。現(xiàn)在,機器對語言的識別從某種角度來說,就是想知道s在文本中出現(xiàn)的可能性,也就是數(shù)學(xué)上所說的s的概率用p(s)來表示。利用條件概率的公式,s這個序列出現(xiàn)的概率等于每一個詞出現(xiàn)的概率相乘,于是p(s)可展開為:
p(s)=p(w1)p(w2|w1)p(w3|w1w2)…p(wn|w1w2…wn-1)
其中p(w1)表示第一個詞w1出現(xiàn)的概率;p(w2|w1)是在已知第一個詞的前提下,第二個詞出現(xiàn)的概率;以次類推。不難看出,到了詞wn,它的出現(xiàn)概率取決于它前面所有詞。從計算上來看,各種可能性太多,無法實現(xiàn)。因此我們假定任意一個詞wi的出現(xiàn)概率只同它前面的詞wi-1有關(guān)(即馬爾可夫假設(shè)),于是問題就變得很簡單了。現(xiàn)在,s出現(xiàn)的概率就變?yōu)椋?/p>
p(s)=p(w1)p(w2|w1)p(w3|w2)…p(wi|wi-1)…
(當然,也可以假設(shè)一個詞又前面n-1個詞決定,模型稍微復(fù)雜些。)
接下來的問題就是如何估計p(wi|wi-1)。現(xiàn)在有了大量機讀文本后,這個問題變得很簡單,只要數(shù)一數(shù)這對詞(wi-1,wi)在統(tǒng)計的文本中出現(xiàn)了多少次,以及wi-1本身在同樣的文本中前后相鄰出現(xiàn)了多少次,然后用兩個數(shù)一除就可以了,p(wi|wi-1)=p(wi-1,wi)/p(wi-1)。
也許很多人不相信用這么簡單的數(shù)學(xué)模型能解決復(fù)雜的語音識別、機器翻譯等問題。其實不光是常人,就連很多語言學(xué)家都曾質(zhì)疑過這種方法的有效性,但事實證明,統(tǒng)計語言模型比任何已知的借助某種規(guī)則的解決方法都有效。比如在google的中英文自動翻譯中,用的最重要的就是這個統(tǒng)計語言模型。去年美國標準局(nist)對所有的機器翻譯系統(tǒng)進行了評測,google的系統(tǒng)是不僅是全世界最好的,而且高出所有基于規(guī)則的系統(tǒng)很多。
這就是數(shù)學(xué)的美妙之處了,它把一些復(fù)雜的問題變得如此的簡單。
看到《數(shù)學(xué)之美》,在感嘆數(shù)學(xué)的美妙與神奇之處時,自然而然聯(lián)系到自己專業(yè)(地質(zhì)工程而或巖土工程)中的數(shù)學(xué)應(yīng)用。
現(xiàn)在找文獻,搜索期刊一大堆基于數(shù)學(xué)的專業(yè)文獻,灰色數(shù)學(xué)的、模糊數(shù)學(xué)的、非線性的、系統(tǒng)的,等等,這么多的數(shù)學(xué)的使用,促進了一大批的文章,但這些數(shù)學(xué)方法的應(yīng)用究竟是發(fā)現(xiàn)了哪些問題?還是解決了實際問題嗎?還是僅發(fā)了文章,滿足了需求?現(xiàn)實是文章好發(fā),用著難用,解決問題還得傳統(tǒng)的方法,那么是這些數(shù)學(xué)方法不行,還是用的太膚淺,根本沒發(fā)揮其威力來?如果沒有發(fā)揮出威力來,那怎么用?怎么發(fā)揮?
數(shù)學(xué)之美讀后感 篇12
吳軍2012年的作品,源于其在谷歌黑板報的系列文章,講述數(shù)學(xué)方法在信息技術(shù)中的應(yīng)用,說明了為什么科學(xué)研究中方法論如此的重要,以及數(shù)學(xué)如何簡單優(yōu)雅地解決問題,直達本質(zhì)。對比他的其他作品比如《浪潮之巔》、《硅谷之謎》,本書比較偏技術(shù),屬于目前大熱的數(shù)據(jù)科學(xué)(Data Science)范疇,在云計算、大數(shù)據(jù)和人工智能等成為常態(tài)和趨勢的今天,適合所有對IT技術(shù)及相關(guān)管理人員閱讀。對我而言,最大的收獲包括:
規(guī)則vs算法:自然語言處理,在早期幾十年基于文法規(guī)則都無法達到可應(yīng)用的效果,終于在轉(zhuǎn)變?yōu)榛诮y(tǒng)計方法且積累了足夠數(shù)據(jù)后,形成了突破,達到了今日可大規(guī)模商用的效果。再次說明了數(shù)據(jù)及算法在今日的重要性。
一些常見應(yīng)用涉及的優(yōu)化算法:搜索相關(guān)(分詞、網(wǎng)絡(luò)爬蟲、索引、結(jié)果排名、廣告及反作弊)、文本處理(新聞分類、廣告相關(guān)性、輸入法)、地圖路線規(guī)劃、信息指紋、密碼學(xué)等。這些算法不止適用于這些應(yīng)用場景,還可以在其他許多地方借鑒,比如用戶評論分析也需要用分詞和語義分析,許多價值優(yōu)化算法都需要用到期望值最大化和邏輯回歸等。
優(yōu)雅的理論模型:在初始階段,出于時間和成本考慮,在技術(shù)實現(xiàn)上可能會使用一些拼湊的方法,甚至山寨,但是這種方法并不可持續(xù),很難進行系統(tǒng)化的優(yōu)化,開發(fā)維護成本都很高,最終會遇到災(zāi)難性問題。做事情需要有境界,最求簡單而優(yōu)雅的理論和工程實現(xiàn),這在長期是非常有好處的。
吳軍使用淺顯易懂的語言,把解決問題的思路和復(fù)雜的數(shù)學(xué)模型講得很清楚,雖然理解延伸閱讀里的具體數(shù)學(xué)公式還是有些挑戰(zhàn)。其實重要的是思想和方法,具體的實現(xiàn)可以在用到時再進一步的了解。如何用簡單的語言把復(fù)雜的技術(shù)講清楚,也是我工作的需要,要不斷學(xué)習(xí)磨練。書里提到了啟發(fā)吳軍這方面能力的兩本書,即《從0到無窮大》和《時間簡史》,會有要去看下。
數(shù)學(xué)之美讀后感 篇13
這本書一共3章,主要介紹了這些數(shù)學(xué)方法:統(tǒng)計方法、統(tǒng)計語言模型、中文信息處理、隱含馬爾科夫模型、布爾代數(shù)、圖論、網(wǎng)頁排名技術(shù)、信息論、動態(tài)規(guī)劃、余弦定理、矩陣運算、信息指紋、密碼學(xué)、搜索技術(shù)、數(shù)學(xué)模型、最大熵模型、拼音輸入法、貝葉斯網(wǎng)絡(luò)、句法分析、維特比算法、各個擊破算法等。從第一章開始其明了幽默的語言就深深的吸引了我,讓我覺得如果早一點看這本書,也許數(shù)學(xué)之于我就是另一番天地。
第一章里作者從原始人類的通信方式開始入手,人類最早利用聲音進行的通信依賴于開篇給出的"編碼-傳輸-解碼"的基本原理,指出原始人的通信方式和今天的通信方式?jīng)]什么不同,這世界上近現(xiàn)代最普遍的原理大部分都在人類發(fā)展的歷史上被無意識的使用著。
第六章信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的大量問題就是找相關(guān)的信息。信息熵的物理含義是對一個信息系統(tǒng)不確定性的度量,這一點與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會有著很強的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會借鑒其他知識。
這本書里也能找到不少在學(xué)的課程知識,如大學(xué)專業(yè)課里,數(shù)電總是要比模電簡單不少,而自然界里大部分的信號都屬于模擬信號。所謂模擬信號,是指從時間和數(shù)值兩種維度上看來都是連續(xù)變化的信號。在實際電路中,模數(shù)轉(zhuǎn)換是一個很重要的過程,將預(yù)處理的模擬信號經(jīng)過模數(shù)變換為數(shù)字信號,然后進行數(shù)字信號處理。而數(shù)字化處理有很多優(yōu)點,比如功能強大、抗干擾能力強、易于傳輸?shù)取?/p>
簡而言之,如果沒有數(shù)學(xué),就沒有數(shù)字信號處理和傳輸?shù)母拍睿鴶?shù)字信號傳輸在當下大規(guī)模的集成電路里是必不可少的,這是通信成功的基本要求。
作者把生活中遇到的復(fù)雜的問題,以簡單清晰,直觀的模型或者公式展現(xiàn)出來。我們可能過于注意生活中的種種奇妙現(xiàn)象,往往忽略了追求其理論邏輯的演繹,而這,也是大部分問題的主要根源。
羅素曾經(jīng)說過:"數(shù)學(xué),如果正確地看,不但擁有真理,而且也具有至高的美";愛因斯坦也曾說過:"純數(shù)學(xué)使我們能夠發(fā)現(xiàn)概念和聯(lián)系這些概念的規(guī)律,這些概念和規(guī)律給了我們理解自然現(xiàn)象的鑰匙。"數(shù)學(xué)在所有科學(xué)領(lǐng)域起著基礎(chǔ)和根本的作用。"哪里有數(shù),哪里就有美"。在這里,我也想把《數(shù)學(xué)之美》真誠推薦給每一位對自然、科學(xué)、生活有興趣有熱情的朋友,不管你是從事職業(yè),讀一讀它,會讓你受益良多。
吳軍老師在《數(shù)學(xué)之美》中提到:"這本書的目的是講道而不是講術(shù)。很多具體的搜索技術(shù)很快會從獨門絕技到普及,再到落伍,追求術(shù)的人一輩子工作很辛苦。只有掌握了搜索的本質(zhì)和精髓才能永遠游刃有余"。回到我們?nèi)粘5纳钪校枰獙W(xué)習(xí)的東西、技術(shù)太多太多,如果一味地只為去追技術(shù)的腳步,那么我們也會很累很累。然而基本的原理卻是沒有怎么變化的。只見森林,不見樹木,難免迷失;站在高處向下看,也許我們一直看不到底,但是站在底處卻是可以看見底的。
數(shù)學(xué)之美讀后感 篇14
人們發(fā)現(xiàn)真理的形式上從來都是簡單的,而不是復(fù)雜和含混的。——牛頓
自小就學(xué)數(shù)學(xué)的我,并不覺得它是美好的。于我而言,數(shù)學(xué)就像緊箍咒一樣,不能提,一提。就頭疼。
而看了吳軍博士所寫的《數(shù)學(xué)之美》后,我對數(shù)學(xué)的感覺,從以前的被動獲取和勉強學(xué)習(xí),變成了強烈熱愛和主動積極的學(xué)習(xí)。這原因就在于我發(fā)現(xiàn)了它的價值,它的一枝獨秀,不可或缺的地位,數(shù)學(xué)的博大精深和對其相關(guān)的各類事業(yè)的發(fā)展的價值已使我深深陶醉其中。這本書中有很多復(fù)雜且長的公式,但這并不妨礙大眾的閱讀,因為它并非在于讓你了解更多IT領(lǐng)域的知識,而是用了大量篇幅介紹各個領(lǐng)域的典故,讓我們感受數(shù)學(xué)思維。這就像李欣教授所說:“成為一個領(lǐng)域的大師有其偶然性,但更有其必然性。其必然性就是大師們的思維方法。”
英國哲學(xué)家弗朗西斯·培根在《論美德》這篇文章中講:“美德就如同華貴的寶石,在樸素的襯托下最顯華麗。”數(shù)學(xué)的美妙,也恰恰在于一個好的思維,好的方法。
在《數(shù)學(xué)之美》十四章,我被它的標題吸引到了。“余弦定理和新聞的分類”,這倆看似八竿子打不著。卻有著緊密的聯(lián)系。可以說,新聞的分類很大程度上依賴的是余弦定理。我們都知道,計算機處理一個問題是讓他去算,而不是像人類一樣理解了它,再去解決。而科學(xué)家們遇到這個問題,卻用了另一種思維,他們把文字的新聞變成一組可計算的數(shù)字,然后再設(shè)計一個算法來算出任意兩篇新聞的相似性。稍詳細一些就是:對于一篇新聞中的所有實詞。計算出它們的TF-IDF值,再把這些值按照其在對應(yīng)詞匯表的位置依次排列就得到一個向量,這即新聞的特征向量。這時,就可以通過計算兩個向量夾角來判斷對應(yīng)的新聞主題的接近程度,這也就要用到余弦定理了。我在必修五數(shù)學(xué)書上學(xué)到余弦定理時,很難想象它可以用來對新聞進行分類。在這里我又一次看到了數(shù)學(xué)工具的用途。
在書中,我也了解到了數(shù)學(xué)的發(fā)展實際上是不斷的抽象和概括的過程。這些抽象了的方法看似離生活越來越遠,但他們最終能找到應(yīng)用的地方,布爾代數(shù)便是如此。
布爾代數(shù)的簡單不能再簡單了。運算的元素只有兩個0和1,基本的運算只有“與”、“或”和“非”。幾乎就是我們現(xiàn)在所學(xué)的“判斷命題真假”。在布爾代數(shù)提出后的80多年里,他確實沒有什么像樣的應(yīng)用。直到1938年香農(nóng)在他的碩士論文中指出,布爾代數(shù)來實現(xiàn)開關(guān)電路。才使得布爾代數(shù)成為數(shù)字電路的基礎(chǔ)。正是依靠這一點,人類用一個個開關(guān)電路最終“搭出”電子計算機。
這些,都能體現(xiàn)作者“簡單即是美”的思想。他在書中也寫道:“數(shù)學(xué)的精彩之處就在于簡單的模型可以干大事。”這些,也都是我從未感受到過的。并且,在這本書中,作者也用了不少篇幅來介紹通信領(lǐng)域的世界級專家,讓我對真正的世界級學(xué)者有更多的了解和理解,比如賈里尼克,Google AK-47的設(shè)計者——阿米特·辛格博士,自然語言處理的教父米奇·馬庫斯等等。
愛因斯坦說過:“從希臘哲學(xué)到現(xiàn)代物理學(xué)的整個科學(xué)史中。不斷有人力圖地表面上極為復(fù)雜的自然現(xiàn)象歸結(jié)為幾個簡單的基本概念和關(guān)系,這就是整個自然哲學(xué)的基本原理。”這本書把數(shù)學(xué)在IT領(lǐng)域的美麗予以了精彩表達,我也知道,把一件復(fù)雜的事用簡單的語言表達出來,并非易事,這應(yīng)該也是各界人士都對這本書予以好評的原因吧。
當然,我也明白,欣賞美不是終極目的,更值得我們追求的是創(chuàng)造美境界。
還有,希望未來的自己,無論生活好與壞,都能少一點浮躁,多一點踏實和對自然科學(xué)本質(zhì)的好奇求知。
數(shù)學(xué)之美讀后感 篇15
我第一次看到這本書是在兩三年前,當時看的是電子書,雖然沒太仔細看,但是第一次近距離了解到這些互聯(lián)網(wǎng)應(yīng)用背后的數(shù)學(xué)原理。
前段時間,我在同學(xué)的桌上看到了《數(shù)學(xué)之美》的紙質(zhì)書,就向他借來讀。雖說"書非借不能讀也",但實際上借了書也沒能好好讀,斷斷續(xù)續(xù)讀了有一個月才讀完。
由于工作背景的緣故,吳軍博士的這本書主要內(nèi)容集中在語言識別和搜索領(lǐng)域,但這絲毫不妨礙它確實反映了很多共同的道理。我總結(jié)了幾點供大家探討。
1. 簡單就是美
歐拉公式,最美的數(shù)據(jù)公式之一。
雖然在大家的眼里,數(shù)學(xué)是一門深奧的學(xué)科,但是很多數(shù)學(xué)規(guī)律卻能用非常簡單的公式表示出來。我想"簡單卻非常有用"或許就是數(shù)學(xué)之美的內(nèi)涵吧。
書中作者給了很多"簡單卻非常有用"的例子,比如簡單的布爾代數(shù)就是搜索引擎的數(shù)學(xué)基礎(chǔ);比如助Google一舉逆襲成為搜索老大pagerank算法就是矩陣乘法迭代結(jié)合TF-IDF公式;地圖導(dǎo)航搜索就是簡單的動態(tài)規(guī)劃;統(tǒng)計語言模型可以輕松解決看似難度、復(fù)雜度超高機器翻譯、語音識別。
數(shù)學(xué)的精彩之處就在于簡單的模型可以干大事。從本質(zhì)上講,數(shù)學(xué)的思維方法就是抽象與簡化。簡單的模型怎么來?靠的是先抽象,后簡化。對于復(fù)雜的問題,往往可以通過抽象,然后用數(shù)學(xué)模型來描述它。選擇了合理的模型就成功了一半。但是有了模型,往往模型看著簡單,但求解比較困難。這就需要合理假設(shè)繼續(xù)簡化,或者說通過增加合理的假設(shè)條件來簡化計算。以書上提到的馬爾科夫鏈為例,雖然公式的求解非常困難,但是一旦加上適當?shù)募僭O(shè),問題就一下子簡化了非常多。
所以,針對紛繁蕪雜的現(xiàn)實情況,我們一定要能時刻準備著把復(fù)雜問題簡單化,一定要做到大膽合理假設(shè),盡可能的簡化問題,抓住其主要矛盾,先用很小的代價解決大部分的問題,剩下的部分再分步解決。
2. 透過現(xiàn)象看本質(zhì)
作者說到,技術(shù)分為術(shù)和道兩種,具體的做事方法是術(shù),做事的原理和原則是道。技術(shù)容易學(xué),但也容易落伍,所以追求術(shù)的人一輩子工作很辛苦,只有掌握了道的本質(zhì)和精髓才能永遠游刃有余。真正做好一件事沒有捷徑,需要一萬小時的專業(yè)訓(xùn)練和努力。
道是什么?道實際上就是方向,就是判斷。
我想有些領(lǐng)導(dǎo)之所以成為優(yōu)秀的領(lǐng)導(dǎo),是因為他們掌握了道,反而對具體的術(shù)不那么關(guān)注。
舉個書上的兩個例子,都是關(guān)于搜索的:一個例子是搜索的本質(zhì)是什么?自動下載盡可能多的網(wǎng)頁;建立快速有效的索引;根據(jù)相關(guān)性對網(wǎng)頁進行公平準確的排序。另一個例子是搜索引擎作弊的本質(zhì)是什么?是在網(wǎng)頁排名信號中加入了噪聲,因此反作弊的關(guān)鍵是去除噪聲。
所以,我們在工作的時候,要善于理解事物的原理與本質(zhì)。要先回答是什么、為什么?最后才是怎么做。再比如,在學(xué)習(xí)某個軟件或某項技術(shù)時,就需要先掌握它的工作原理與工作機制,以便于我們判斷其適用的場景和不適用的場景,而不是先去熟悉怎么用它。
3. 循序漸進、逐步演化
書上對自然語言處理著墨很多。最初的自然語言處理是基于規(guī)則的句法分析,但是一段時間過后,人們發(fā)現(xiàn)句法分析的準確率很難提升。正當句法分析派走投無路的時候,統(tǒng)計語言模型出現(xiàn)了,而且越走越順,很快就把句法分析派遠遠拋在了后面。問題就來了,那為什么最開始科學(xué)家們不直接研究統(tǒng)計語言模型?答案當然是不能,原因是時機還不成熟,因為統(tǒng)計語言模型所需要基于的大數(shù)據(jù)量的語言庫還沒有,大規(guī)模并行計算的能力還不夠。同樣的,統(tǒng)計語言模型就是最好的嗎?當然是不盡然,科學(xué)家們現(xiàn)在開始研究基于深度學(xué)習(xí)的自然語言處理,相信不久的將來,語言識別、機器翻譯會有另外一個質(zhì)的飛躍。
我們做什么事情都不可能是一蹴而就,一步到位,想畢其功于一役的往往最后的結(jié)局都是失敗的。
對我們而言,不管是架構(gòu)規(guī)劃也好、系統(tǒng)建設(shè)也好、管理工作也好,更是需要找準突破口,循序漸進,逐步演化。當然,我們也不能固步自封、墨守成規(guī)。
數(shù)學(xué)之美讀后感 篇16
最近看了這本《數(shù)學(xué)之美》,不得不感嘆一句,可惜早已身不在起點。
我讀書的時候,數(shù)學(xué)成績一直都很好,雖然離開學(xué)校已經(jīng)10多年,自覺當初的知識還是記得很多,6~7年前再考線性代數(shù)和概率論,還是得到了很高的分數(shù)。不過我也和大部分人一樣,覺得數(shù)學(xué)沒有太多用處,特別是高中和大學(xué)里面學(xué)的,那些三角函數(shù),向量,大數(shù)定律,解析幾何,除了在考試的題目里面用一下,平時又有什么地方可以用呢?
看了《數(shù)學(xué)之美》,驚嘆于數(shù)學(xué)的浩瀚和簡單,說它浩瀚,是因為它的分支涵蓋了科學(xué)的方方面面,是所有科學(xué)的理論基礎(chǔ),說它簡單,無論多復(fù)雜的問題,最后總結(jié)的數(shù)學(xué)公式都簡單到只有區(qū)區(qū)幾個符號和字母。
這本書介紹數(shù)學(xué)理論在互聯(lián)網(wǎng)上的運用,平時我們在使用互聯(lián)網(wǎng)搜索或者翻譯功能的時候,時常會感嘆電腦對自己的了解和它的聰明,其實背后的原理就是一個個精美的算法和大量數(shù)據(jù)的訓(xùn)練。那些或者熟悉或者陌生的數(shù)學(xué)知識(聯(lián)合概率分布,維特比算法,期望最大化,貝葉斯網(wǎng)絡(luò),隱形馬爾可夫鏈,余弦定律,etc),一步步構(gòu)建了我們現(xiàn)在所賴以生存的網(wǎng)上世界。
之所以覺得自己早已身不在起點,是因為上面這些數(shù)學(xué)知識,早已經(jīng)不在我的知識框架之內(nèi),就算曾經(jīng)學(xué)過,也不過是囫圇吞棗一樣的強記硬背,沒有領(lǐng)會過其中的真正意義。而今天想重頭在來學(xué)一次,其實已經(jīng)不可能了。且不說要花費多少的精力和時間,還需要的是領(lǐng)悟力。而這一些,已經(jīng)不是我可以簡單付出的。
不像物理、化學(xué)需要復(fù)雜的實驗來驗證,很多數(shù)學(xué)的證明,幾乎只要有一顆聰明的頭腦和無數(shù)的草稿紙,可是光是這顆聰明的頭腦,就可以阻攔掉很多人。有人說多讀書就會聰明,我不否認,書本的確會提供很多知識,可是不同的人讀同一本書也會有不同的收貨,這就限制于每個人的知識框架和認知水平。就如一個數(shù)學(xué)功底好過我的人,看這本書,就會更容易理解里面的公式和推導(dǎo)出這些公式的其他運用點,而我,只能站在數(shù)學(xué)的門口,感嘆一句,它真的好美吧。
當然,我暫時無法在實際生活中運用這些數(shù)學(xué)公式,可是書中提到的一些方法論,還是很有幫助的
1)一個產(chǎn)業(yè)的顛覆或者創(chuàng)新,大部分來自于外部的力量,比如用統(tǒng)計學(xué)原理做自然語言處理。
2)基礎(chǔ)知識和基礎(chǔ)數(shù)據(jù)是很重要性,只有足夠多和足夠廣的數(shù)據(jù),才可以提供有效的分析,和驗證分析方法的好壞。
3)先幫用戶解決80%的問題,在慢慢解決剩下的20%的問題;
4)不要等一個東西完美了,才發(fā)布;
5)簡單是美,堅持選擇簡單的做法,這樣會容易解釋每一個步驟和方法背后的道理,也便于查錯。
6)正確的模型也可能受噪音干擾,而顯得不準確;這時不應(yīng)該用一種湊合的修正方法加以彌補,而是要找到噪音的根源,從根本上修正它。
7)一個人想要在自己的領(lǐng)域做到世界一流,他的周圍必須有非常多的一流人物。
數(shù)學(xué)之美讀后感 篇17
數(shù)學(xué)用在模型上而不是現(xiàn)實世界中,需要抽象思考出模型,即數(shù)學(xué)對象是其所做。數(shù)系擴充中,復(fù)數(shù)i并沒有比無理數(shù)根號2更特殊的地方,因為它們作為抽象的數(shù)學(xué)構(gòu)造,如果充分自然,則必能作為模型找到它們的用途。實際上正是如此。
數(shù)學(xué)中有個根本性的重要事實:數(shù)學(xué)論證中的每一步都可以不斷地分解成更小更清晰有據(jù)的子步驟,但是這樣的過程最終會終止。原則上,最終會得到一條非常長的論證,它以普遍接受的公理開始,僅通過最基本的邏輯原則一步步推進,最終得到想要求證的結(jié)論。所以,任何關(guān)于數(shù)學(xué)證明有效性的爭論總是能夠解決的。爭論在原則上必然能夠解決這一事實使數(shù)學(xué)作為一個學(xué)科是獨一無二的。在這里,公理系統(tǒng)的主要問題不是真實性,而是自洽性和有用性,即數(shù)學(xué)證明就是由特定前提能夠得出特定結(jié)論,而不考慮該前提是否正確。
我不清楚這一“根本性的重要事實”在現(xiàn)實中的使用范圍有多大,但由此可以聊一點別的問題。現(xiàn)實中,如果甲對事情有A觀點(或說價值觀),乙有B觀點,并為此爭執(zhí)。有下面幾種情況:
1、在上述的范圍之外,即沒有定論。
2、有定論,但是雙方都沒有給出足夠的證據(jù)證明和反駁。
3、有定論,一方給出了足夠的證據(jù)(或者反駁理由),因為表達能力導(dǎo)致表述不清晰而沒有說服對方。
4、有定論,一方給出了足夠的證據(jù)(或者反駁理由),因為對方理解不夠或理解偏差導(dǎo)致沒有被說服。第234條與這幾項有關(guān):知識量,表達能力,理解能力,對外界的認知和自我認知。其中語言本身的局限性會一定程度上影響表達和理解,認知能力是一項綜合的要求很高的能力。“評論”這件事就是個很合適的例子。如果說創(chuàng)造更需要的是才氣,那么評論更需要的就是能力。但是,無論雙方是否知道有無定論,很多情況下需要陳述不少或很多證據(jù)或反駁理由,由第234條可知人與人交流的效率很低,并且可能伴隨一些沖突。若考慮到一些人的利益因素等,交流會更復(fù)雜。
數(shù)學(xué)之美讀后感 篇18
讀完本書,第一感受:次奧!原來數(shù)學(xué)如此多的原理模型概念都可以用去解決各種IT技術(shù)問題啊。特別是語言識別和自然語言處理這類問題完全就是建立在數(shù)學(xué)原理之上的。總之,這本書就是用非常深入淺出的話去說明如何用數(shù)學(xué)方法去解決計算機的各種工程問題。這是一本講道,而不是術(shù)的書。 要完全讀懂這本書,我覺得至少需要掌握這三門課:高等數(shù)學(xué),離散數(shù)學(xué),還有概率論與數(shù)理統(tǒng)計。唉,我當初數(shù)學(xué)學(xué)得太水了,還掛了高數(shù)啊!有好的概念沒看懂,以后有時間在好好看吧。如果想搞計算機研究的話,數(shù)學(xué)基礎(chǔ)必不可少,別總在抱怨各種數(shù)學(xué)課上的東西一輩子都用不著。
發(fā)現(xiàn)作者對人類自然發(fā)展的認識非常深,其從語言,文字,數(shù)學(xué)的產(chǎn)生發(fā)展,信息的傳播記錄得出了這個結(jié)論:信息的產(chǎn)生傳播接收反饋,和今天最先進的通信在原理上沒有任何差別。就算是科學(xué)上最高深的技術(shù),那也是模擬我們生活中的一些基本原理。
我們今天使用的十進制,就是我們扳手指扳了十次,就進一次位。而瑪雅文明他們數(shù)完了手指和腳指才開始進位,所以他們用的是二十進制。實際上阿拉伯數(shù)字是古印度人發(fā)明的,只是歐洲人不知道這些數(shù)字的真正發(fā)明人是古印度,而就把這功勞該給了“二道販子”阿拉伯人。
語言的數(shù)學(xué)本質(zhì)
任何一種語言都是一種編碼方式,比如我們把一個要表達的意思,通過語言一句話表達出來,就是利用編碼方式對頭腦中的信息做了一次編碼,編碼的結(jié)果就是一串文字,聽者則用這語言的解碼方法獲得說話者要表達的信息。
自然語言處理模型
計算機是很笨的,他們唯一會做的就是計算。自然語言處理在數(shù)學(xué)模型上是基于統(tǒng)計的,說一個句子是否合理,就看看他出現(xiàn)的可能性大小如何,可能性就是用概率來衡量,比如一個句子,出現(xiàn)的概率為1/10^10,另一個句子出現(xiàn)的概率為1/10^20,那么我們就可以說第一個句子比第二個句子更加合理。當然這要求有足夠的觀測值,他有大數(shù)定理在背后支持。
最早的中文分詞方法
這句話:“同學(xué)們呆在圖書館看書”,如何分詞?應(yīng)該是這樣:同學(xué)們/呆在/圖書館/看書。最先的方法是北航一老師提出的查字典方法,就是把句子從左道右掃描一遍,遇到字典里面出現(xiàn)的詞就標示出來,遇到復(fù)合詞如(北京大學(xué))就按照最長的分詞匹配,遇到不認識的字串就分割成單個字,于是中文的分詞就完成了。但是這只能解決78成的分詞問題,但是“像發(fā)展中國家”這種短語它是分不出來的。后來大陸用基于統(tǒng)計語言模型方法才解決了。
隱含馬可夫模型(沒這么看懂)
一直被認為是解決打多數(shù)自然語言處理問題最為快速有效的方法,大致意思是:隨機過程中各個狀態(tài)的概率分布,只與他的前一個狀態(tài)有關(guān)。比如對于天氣預(yù)報,我們只假設(shè)今天的氣溫只與昨天有關(guān)而與前天沒有關(guān)系,這雖然不完美,但是以前不好解決的問題都可以給出近視值了。
一個讓我印象深刻的觀點:
小學(xué)生和中學(xué)生其實沒有必要花那么多時間去讀書,其覺得最主要的是孩子們的社會經(jīng)驗,生活能力,和那時候樹立起來的志向,這將幫助他們一生。而中學(xué)生階段花很多時間比同伴多讀的課程,在大學(xué)以后可以用非常短的時間就可以讀完。因為在大學(xué)階段,人的理解能力要強很多,比如中學(xué)要花500小時才能搞明白的內(nèi)容,大學(xué)可能花100小時就搞定了。學(xué)習(xí)和教育是一個人一輩子的事情,很多中學(xué)成績好的人進入大學(xué)后有些就表現(xiàn)不太好了,要有不斷學(xué)習(xí)的動力才行。
余弦定理和新聞分類
我在新浪干過一年多新聞,這篇認真看了一篇,很吃驚原理cos x與新聞分析也有關(guān)系啊。google的新聞服務(wù)是由計算機自動整理分類的。而傳統(tǒng)的媒體如門戶網(wǎng)站是讓編輯讀懂新聞,找到主題,再分類分級別的,真苦逼啊!計算機自動分類原理是這樣:如一篇新聞有10000個詞,組成一個萬維向量,這個向量就代表這篇新聞,可以通過某種算法表達這個新聞主題的類型,如果兩個向量的方向一致,說明對應(yīng)的新聞用詞一致,方向可用夾角表示,夾角可用余弦定理表示,所以當夾角的余弦值接近于1時,這兩篇新聞就可以歸為一類了。
沒看懂的東西:
布爾代數(shù):布爾代數(shù)把邏輯學(xué)和數(shù)學(xué)合二為一,給了我們一個全新的視角看世界。
網(wǎng)絡(luò)爬蟲的基本原來是利用了圖論的廣度優(yōu)先搜索和深度優(yōu)先搜索。
搜索引擎的結(jié)果排名用了稀疏矩陣的計算。
地圖最基本的計算是利用了有限狀態(tài)機和圖論的最短路徑。
密碼學(xué)原理,最大熵模型,拼音輸入法的數(shù)學(xué)模型,布隆過濾器,貝葉斯網(wǎng)絡(luò)等等。
任何事物都有它的發(fā)展規(guī)律,當我們認識了規(guī)律后,應(yīng)當在生活工作中遵循規(guī)律,希望大家透過IT規(guī)律的認識,可 以舉一反三的總結(jié)學(xué)習(xí)認識規(guī)律,這樣有助于自己的境界提升一個層次。
任何問題總是能找到相應(yīng)的準確數(shù)學(xué)模型,一個正確的數(shù)學(xué)模型在形式上應(yīng)當是簡單的,一個好的方法在形式上應(yīng)當也是簡單的。簡單才是美。
數(shù)學(xué)之美讀后感 篇19
很多人都覺得,數(shù)學(xué)是一個太高深、太理論的學(xué)科,不接近生活,對我們大多數(shù)人來說平時也根本用不到,所以沒必要去理解數(shù)學(xué)。但事情真的是這樣嗎?
其實不然,數(shù)學(xué)一直滲透在我們生活的各個方面,尤其是在今天這個信息時代,很多簡單樸素的數(shù)學(xué)思想,能發(fā)揮一般人很難想象的巨大作用。比如,計算機處理自然語言,用到的最重要工具是統(tǒng)計學(xué)的思想;計算機對新聞內(nèi)容的分類,依靠的是數(shù)學(xué)里的余弦定理;而電子電路的基本邏輯,則來源于僅有0和1兩個數(shù)字的布爾代數(shù)。
在《數(shù)學(xué)之美》里,吳軍用自己在工作中使用數(shù)學(xué)的親身經(jīng)歷,為我們展現(xiàn)了數(shù)學(xué)的重要性,以及他對數(shù)學(xué)之美的理解。吳軍是“得到”App專欄《吳軍的谷歌方法論》的主理人。曾先后供職于谷歌和騰訊,是著名的自然語言處理專家和搜索專家。同時,他還是位暢銷書作家,除了這本《數(shù)學(xué)之美》以外,還寫過《文明之光》《智能時代》《浪潮之巔》等多本暢銷書。
【數(shù)學(xué)之美讀后感(通用19篇)】相關(guān)文章:
時之美經(jīng)典散文11-19
清明之美優(yōu)美散文11-21
孤獨之美抒情散文06-10
平凡之美散文隨筆08-27
“國畫之美”現(xiàn)代文閱讀05-05
《四季之美》教學(xué)設(shè)計03-29
捕捉生活之美散文隨筆08-27
信仰之美,滿意答案作文800字03-28