- 相關(guān)推薦
《大數(shù)據(jù)時(shí)代》讀書筆記
《大數(shù)據(jù)時(shí)代》是由英國作者維克托麥爾〃舍恩伯格等所著,主要描述的是大數(shù)據(jù)時(shí)代到臨人們生活、工作與思維各方面所遇到的重大變革。下面是小編整理的《大數(shù)據(jù)時(shí)代》讀書筆記,歡迎查看。
篇一:《大數(shù)據(jù)時(shí)代》讀書筆記
讀了《大數(shù)據(jù)時(shí)代》后,感覺到一個(gè)大變革的時(shí)代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時(shí)代,我們會假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想!薄半S著由假想時(shí)代到數(shù)據(jù)時(shí)代的過渡,我們也很可能認(rèn)為我們不在需要理論了!睍袔缀蹩隙ㄒ嵏步y(tǒng)計(jì)學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的.保護(hù)傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會它們。
當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
《大數(shù)據(jù)時(shí)代》第16頁“大數(shù)據(jù)的核心就是預(yù)測”。邏輯是——描述時(shí)空信息“類”與“類”之間長時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事?纱髷(shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲小栴}不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個(gè)更可怕的事情。
其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對論的矛盾,又搞出一個(gè)量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职,兒子就是兒子。那么大?shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有!洞髷(shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。
所以想向《大數(shù)據(jù)時(shí)代》的作者提一個(gè)合理化建議:把這本書繼續(xù)寫下去,至少加一個(gè)第四部分——大數(shù)據(jù)時(shí)代的邏輯思維。
篇二:《大數(shù)據(jù)時(shí)代》讀書筆記
數(shù)據(jù)已經(jīng)成為一種商業(yè)資本,一項(xiàng)重要的經(jīng)濟(jì)投入,可以創(chuàng)造新的經(jīng)濟(jì)利益。事實(shí)上,通過對海量數(shù)據(jù)進(jìn)行分析,我們可以獲得巨大價(jià)值的產(chǎn)品或服務(wù),或者深刻的洞見。
大數(shù)據(jù)時(shí)代的思維變革
。1)不是隨機(jī)樣本,而是全體數(shù)據(jù):在大數(shù)據(jù)時(shí)代的第一個(gè)轉(zhuǎn)變就是利用所有數(shù)據(jù),而不再僅僅依靠一小部分?jǐn)?shù)據(jù)。采樣分析的精確性隨著采樣隨機(jī)性的增加而大幅提高,但與樣本數(shù)量的增加關(guān)系不大。因此樣本選擇的隨機(jī)性比樣本數(shù)量更加重要。大數(shù)據(jù)的方法不采用隨機(jī)分析法,而是采用所有數(shù)據(jù),即樣本=總體。
。2)追求數(shù)據(jù)的混雜性而不是精確性:大數(shù)據(jù)為了擴(kuò)大數(shù)據(jù)規(guī)模允許不精確。大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復(fù)雜算法更加有效。大數(shù)據(jù)要求我們接受紛繁性,放棄對精確性的追求,在大數(shù)據(jù)時(shí)代我們無法獲得精確性。
。3)大數(shù)據(jù)追求相關(guān)關(guān)系而非因果關(guān)系:通過監(jiān)控一個(gè)現(xiàn)象的良好的關(guān)聯(lián)物,相關(guān)關(guān)系可以幫助我們捕捉現(xiàn)在和預(yù)測未來。大數(shù)據(jù)的相關(guān)關(guān)系分析法更加準(zhǔn)確、更快,而且不易受傳統(tǒng)思維模式和特定領(lǐng)域里隱含的固有偏見的影響。建立在相關(guān)關(guān)系分析法上基礎(chǔ)上的預(yù)測是大數(shù)據(jù)的核心。
大數(shù)據(jù)時(shí)代的商業(yè)變革
。1)一切皆可量化:量化是數(shù)據(jù)化的核心。我們要的是數(shù)據(jù)化而不是數(shù)字化。數(shù)據(jù)化是指一種把現(xiàn)象轉(zhuǎn)變?yōu)榭芍票矸治龅牧炕问降倪^程。數(shù)字化指的是把模擬數(shù)據(jù)轉(zhuǎn)換為0和1換算表示的二進(jìn)制碼。
有了大數(shù)據(jù)的幫助,我們不再會將世界看作世界是一連串我們認(rèn)為或是自然或是社會的現(xiàn)象,我們會意識到本質(zhì)上世界是由信息構(gòu)成的。將世界看作信息,看作可以理解的數(shù)據(jù)海洋,為我們提供了一個(gè)從未有過的審視現(xiàn)實(shí)的視角。它是一種可以滲透到所有生活領(lǐng)域的世界觀。
。2)數(shù)據(jù)的絕大部分價(jià)值都隱藏在表面之下:數(shù)據(jù)的價(jià)值不僅限于特定用途,它可以為同一目的而被多次使用,也可以用于其他目的。數(shù)據(jù)的基本用途是為信息的收集和處理提供依據(jù)。不同于物質(zhì)的東西,數(shù)據(jù)的價(jià)值不會隨著它的使用而減少,而是可以不斷地被處理。
數(shù)據(jù)的創(chuàng)新包括:數(shù)據(jù)的再利用(采集用戶的搜索數(shù)據(jù)判斷用戶的偏好或發(fā)展趨勢)、重組數(shù)據(jù)(多個(gè)數(shù)據(jù)集的總和重組在一起時(shí)比單個(gè)數(shù)據(jù)集更有價(jià)值)、可擴(kuò)展數(shù)據(jù)(使得某種方式收集的單一數(shù)據(jù)集有多種不同的用途)、數(shù)據(jù)的折舊值(隨著時(shí)間推移,大多數(shù)數(shù)據(jù)都會失去一部分基本用途但潛在價(jià)值依然強(qiáng)大)、數(shù)據(jù)廢氣(使用用戶在網(wǎng)上留下的數(shù)字軌跡,如在線交互痕跡,來改善舊服務(wù))、開放數(shù)據(jù)(開放政府?dāng)?shù)據(jù)讓私營部門和社會大眾訪問)。
。3)數(shù)據(jù)、技術(shù)與思維的三足鼎立:大數(shù)據(jù)價(jià)值鏈的構(gòu)成為大數(shù)據(jù)采集掌控、大數(shù)據(jù)挖掘技術(shù)、大數(shù)據(jù)思維,F(xiàn)今我們處在大數(shù)據(jù)時(shí)代的早期,思維和技能是最有價(jià)值的。但最終大部分的價(jià)值還是必須從數(shù)據(jù)本身中挖掘。大數(shù)據(jù)公司的多樣性表明了數(shù)據(jù)價(jià)值的轉(zhuǎn)移。隨著數(shù)據(jù)價(jià)值轉(zhuǎn)移到數(shù)據(jù)擁有者手上,傳統(tǒng)的商業(yè)模式也就被顛覆了。
未來行業(yè)專家和技術(shù)專家的光芒都會因?yàn)榻y(tǒng)計(jì)數(shù)學(xué)家和數(shù)據(jù)分析家的出現(xiàn)而變暗。因?yàn)楹笳卟皇芘f觀念的影響,能夠聆聽數(shù)據(jù)發(fā)出的聲音。
大數(shù)據(jù)決定企業(yè)的競爭力。規(guī)模很重要,大規(guī)模的公司擁有大量數(shù)據(jù)以及采集更多數(shù)據(jù)的能力,而小規(guī)模公司則更加靈活,因此中型企業(yè)將會逐漸消亡。
大數(shù)據(jù)時(shí)代的管理變革
。1)讓數(shù)據(jù)主宰一切隱憂:大數(shù)據(jù)的核心思想是用規(guī)模劇增來改變現(xiàn)狀,這會給我們帶來更多威脅。
在大數(shù)據(jù)時(shí)代,不管是告知與許可(很多數(shù)據(jù)在收集時(shí)并無意用作其他意圖,而最終卻產(chǎn)生了很多創(chuàng)新的用途)、模糊化(有意識的模糊化可能起到反作用)還是匿名化(大數(shù)據(jù)促進(jìn)了內(nèi)容的交叉檢驗(yàn)),這三大隱私保護(hù)策略都失效了。
大數(shù)據(jù)被濫用于因果分析可能導(dǎo)致罪責(zé)的判定是基于對個(gè)人未來的.預(yù)測。進(jìn)行個(gè)人罪責(zé)推定需要行為人選擇某種特定的行為,他的選擇是造成這個(gè)行為的原因。而大數(shù)據(jù)并不是建立在因果關(guān)系基礎(chǔ)上的,而是相關(guān)關(guān)系!所以大數(shù)據(jù)絕不可以用來進(jìn)行罪責(zé)推定!
。2)責(zé)任與自由并舉的信息管理:大數(shù)據(jù)時(shí)代要借助限制信息濫用的規(guī)范而不是最初的審查來防止其泛濫。要想保護(hù)個(gè)人隱私就需要個(gè)人數(shù)據(jù)處理器對其政策和行為承擔(dān)更多的責(zé)任。
個(gè)人隱私保護(hù)從個(gè)人許可到讓數(shù)據(jù)使用者承擔(dān)責(zé)任:為了實(shí)現(xiàn)數(shù)據(jù)二次運(yùn)用的優(yōu)勢與過度披露所帶來的風(fēng)險(xiǎn),監(jiān)管機(jī)制可以決定不同種類的個(gè)人數(shù)據(jù)必須刪除的時(shí)間。再利用的時(shí)間框架則取決于數(shù)據(jù)內(nèi)在風(fēng)險(xiǎn)和社會價(jià)值觀的不同。公司可以利用數(shù)據(jù)的時(shí)間更長,但相應(yīng)的必須為其行為承擔(dān)責(zé)任以及負(fù)有特定時(shí)間之后刪除個(gè)人數(shù)據(jù)的義務(wù)。我們還可以開發(fā)新的技術(shù)促進(jìn)隱私保護(hù)。如“差別隱私”:故意將數(shù)據(jù)模糊處理,促使對大數(shù)據(jù)庫的查詢不能顯示精確結(jié)果。
在依據(jù)大數(shù)據(jù)技術(shù)作重大決策時(shí)必須保證特定防護(hù)措施的到位:(a)公開原則。用來進(jìn)行預(yù)測分析的數(shù)據(jù)和算法必須公開。(b)公正原則。具備由第三方專家公證的可靠、有效的算法系統(tǒng)。(c)可反駁原則。明確提出個(gè)人可以對其預(yù)測進(jìn)行反駁的具體方式。(d)確保對人的評判依據(jù)真實(shí)行為而非大數(shù)據(jù)分析。
大數(shù)據(jù)的運(yùn)作超出我們正常理解范圍。為了防止大數(shù)據(jù)的預(yù)測、運(yùn)算法則和數(shù)據(jù)庫變得不透明、不可解釋、不可追蹤,大數(shù)據(jù)需要被檢測并保持透明度,當(dāng)然還有使這兩項(xiàng)得以實(shí)現(xiàn)的新型專業(yè)技術(shù)和機(jī)構(gòu),大數(shù)計(jì)算法師將會崛起。
為了保護(hù)極具競爭力的大數(shù)據(jù)市場,必須防止壟斷。政府也應(yīng)該公布其數(shù)據(jù)。
【《大數(shù)據(jù)時(shí)代》讀書筆記】相關(guān)文章:
小時(shí)代讀書筆記范文10-17
《智能時(shí)代》讀書筆記范文10-31
《時(shí)代廣場的蟋蟀》讀書筆記范文10-15
笑談大先生讀書筆記11-11
2016大學(xué)生數(shù)據(jù)結(jié)構(gòu)課程設(shè)計(jì)心得體會11-26
時(shí)代夢想作文11-28
自修時(shí)代-日記02-21
游戲時(shí)代作文10-17