大數據挖掘初讀感想
這篇文章是小編大學上課時交的一篇作業,對,就是一篇表達小編完全沒理工細胞的感想日志,哈哈哈哈哈哈~所以小編后來就離技術之路越來越遠了~~
上課的時候聽了很多有關大數據的項目,心里默默地崇敬起來,于是課后也去網上找了老師說的大數據創新與創業大賽:第一屆大數據技術創新與創業大賽——基于出租車GPS軌跡的位置服務。看了一下題目就懵了,連題目都沒看懂到底要干什么!?瀏覽了一下樣例,一開始以為類似ACM,結果一路看下去,除了看出獎勵很高以外幾乎都沒看懂。
可以肯定,這東西跟數學和算法有關,而且很難!
既然很難,那么就要付出更大的努力去學習了,去圖書館找書,找了好久發現老師經常說的.hadoop都被借完了,只好找了本《數據挖掘教程》//《Data Mining A Tutorial-Based Primer》,看起來比較入門,借著平時空閑的時間翻閱了一下,數據挖掘,顧名思義就是挖掘數據中有用的信息,幫助解釋當前行為或預測未來的結果。對于數據挖掘的含義,雖然聽多了也耳熟的很,也還是看了書才知道到底是干什么的。這幾天也看了些,雖然不是看得特別懂,就是了解了一下數據挖掘的研究方面及應用領域,瀏覽了一下各種例子中的算法,
初看數據挖掘的應用,我想也就商業上用的比較多吧,沒想到醫藥衛生自然科學也有它的身影,讓我有些意外,仔細讀來,發現確實,各種數據會形成一種特定的模式或規律,如地球資源探測衛星圖像數據集,這個數據集包括了表示一部分地球表面的數字化衛星圖像的像素點,每個實例分類到15個類別中的一個,由于每個類都包括巨大的數據量,分類的準確度受到了特定模型參數設置的影響。除了自然科學,還有醫藥衛生中心臟病患者數據集,脊柱臨床數據集等,甚至包括泰坦尼克號數據集!
說到數據挖掘,自然想到數據庫,書上還真有說到數據庫,KDD——數據庫中的知識發現,很專業的術語,感覺和數據挖掘差不多,不過KDD處理模型中還包括一個方法論,用來提取和準備數據,以及數據挖掘執行后對所要采取的行動做出決策。——其實我真沒看懂。
大部分理論和概念都沒怎么看懂,可能是剛開始接觸,還生疏,理解起來挺難的,書上提到可以為數據創建決策樹,可以概化數據,總結各數據屬性間的關系,看上去一目了然。不過要我自己來弄估計還得弄好長一段時間,理解了和自己能動手做畢竟還有段距離。
看了幾天書,其實也沒看懂多少,就大概了解了一下數據挖掘的一些關鍵術語,如果說收獲的話,應該是建立了一種思維模式吧,也許還不算正式形成了,不過對生活中的一些數據會多留意,會想是不是可能產生什么聯系,不過這也是想象而已啦,還是要多看下書,慢慢會理解的,對數學、算法這類學科會有一個針對性的學習。
【大數據挖掘初讀感想】相關文章:
數據挖掘實習報告04-07
數據收集比數據挖掘有意義07-15
數據挖掘工程師的職責內容09-27
初進公司的感想與體會06-21
初級經濟師重點知識:數據倉庫與數據挖掘08-13
讀苔絲感想08-06
初讀老師小學作文04-02
數據挖掘工程師工作的基本職責描述11-24
電子商務師考試內容:數據挖掘08-17