大數據心得體會(精選15篇)
大數據心得體會 篇1
大數據時代已經悄然到來,如何應對大數據時代帶來的挑戰與機遇,是我們當代大學生特別是我們計算機類專業的大學生的一個必須面對的嚴峻課題。大數據時代是我們的一個黃金時代,對我們的意義可以說就像是另一個“80年代”。 在講座中秦永彬博士由一個電視劇《大太監》中情節來深入淺出的簡單介紹了“大數據”的基本概念,并由“塔吉特”與“犯罪預測”兩個案例讓我們深切的體會到了“大數據”的對現今這樣一個信息時代的不可替代的巨大作用。
在前幾年本世紀初的時候,世界都稱本世紀為“信息世紀”。確實在計算機技術與互聯網技術的飛速發展過后,我們面臨了一個每天都可以“信息爆炸”的時代。打開電視,打開電腦,甚至是在街上打開手機、PDA、平板電腦等等,你都可以接收到來自互聯網從世界各地上傳的各類信息:數據、視頻、圖片、音頻……這樣各類大量的數據累積之后達到了引起量變的臨界值,數據本身有潛在的價值,但價值比較分散;數據高速產生,需高速處理。大數據意味著包括交易和交互數據集在內的所有數據集,其規;驈碗s程度超出了常用技術按照合理的成本和時限捕捉、管理及處理這些數據集的能力。遂有了“大數據”技術的應運而生。
現在,當數據的積累量足夠大的時候到來時,量變引起了質變。“大數據”通過對海量數據有針對性的分析,賦予了互聯網“智商”,這使得互聯網的作用,從簡單的數據交流和信息傳遞,上升到基于海量數據的分析,一句話“他開始思考了”。簡言之,大數據就是將碎片化的海量數據在一定的時間內完成篩選、分析,并整理成為有用的資訊,幫助用戶完成決策。借助大數據企業的決策者可以迅速感知市場需求變化,從而促使他們作出對企業更有利的決策,使得這些企業擁有更強的創新力和競爭力。這是繼云計算、物聯網之后IT產業又一次顛覆性的技術變革,對國家治理模式、對企業的決策、組織和業務流程、對個人生活方式都將產生巨大的影響。后工業社會時代,隨著新興技術的發展與互聯網底層技術的革新,數據正在呈指數級增長,所有數據的產生形式,都是數字化。如何收集、管理和分析海量數據對于企業從事的一切商業活動都顯得尤為重要。
大數據時代是信息化社會發展必然趨勢,我們只有緊緊跟隨時代發展的潮流,在技術上、制度上、價值觀念上做出迅速調整并牢牢跟進,才能在接下來新一輪的競爭中擺脫受制于人的弱勢境地,才能把握發展的方向。
首先,“大數據”究竟是什么?它有什么用?這是當下每個人初接觸“大數據”都會有的疑問,而這些疑問在秦博士的講座中我們都了解到了。“大數據”的“大”不僅是單單純純指數量上的“大”,而是在諸多方面上闡釋了“大”的含義,是體現在數據信息是海量信息,且在動態變化和不斷增長之上。同時“大數據”在:速度(Velocity)、多樣性(Variety)、價值密度(Value)、體量(Volume)這四方面(4v)都有體現。其實“大數據”歸根結底還是數據,其是一種泛化的數據描述形式,有別于以往對于數據信息的表達,大數據更多地傾向于表達網絡用戶信息、新聞信息、銀行數據信息、社交媒體上的數據信息、購物網站上的用戶數據信息、規模超過TB級的數據信息等。
了解了“大數據”的“大”之后我們也該了解它所具有的巨大價值。就目前來說“大數據”的來源主要還是互聯網,來自互聯網上的大多數不被重視信息都是具有巨大開發價值的,
其具有巨“大”的商業價值,我們所缺少的只是一些數據分析等手段。例如:在如今,網購已經成為了一種風潮,網上也涌現了以淘寶、京東、亞馬遜等一系列的購物網站。而在這些網站之中,顧客的瀏覽記錄,購買記錄等等都是一些巨大商業價值的信息。借鑒“塔吉特”的先例,我們可以利用“大數據”技術收集分析,就可預測需求、供給和顧客習慣等,做到精準采購、精準投放,達到利益放大的效果。 從全球范圍來看,很多人都把20xx年看做是大數據時代的元年。在這一年里,很多行業在大數據方面的管理、規劃和應用已經覺醒。電商、金融、電信等行業數據有著長期的數據積累。事實上,很多互聯網公司,例如亞馬遜、Google、騰訊,更愿意將自己定位為數據企業。因為信息時代,數據成為經營決策的強有力依據,給企業帶來了發展和引領行業的機遇。銀行也同樣擁有豐富的數據礦藏,不僅存儲處理了大量結構化的賬務數據,而且隨著銀行渠道快速滲透到社交網絡、移動端等媒介,海量的非結構化數據也在等待被收集和分析。未來的金融業將更多地受到科技創新力的驅動,也越來越傾向于零售營銷:對于金融業來說,大數據意味著巨大的商機,可強化客戶體驗,提高客戶忠誠度。大數據技術的發展帶來企業經營決策模式的轉變,驅動著行業變革,衍生出新的商機和發展契機。駕馭大數據的能力已被證實為領軍企業的核心競爭力,這種能力能夠幫助企業打破數據邊界,繪制企業運營全景視圖,做出最優的商業決策和發展戰略。金融行業在大數據浪潮中,要以大數據平臺建設為基礎,夯實大數據的收集、存儲、處理能力;重點推進大數據人才的梯隊建設,打造專業、高效、靈活的大數據分析團隊;不斷提升企業智商,挖掘海量數據的商業價值,從而在數據新浪潮的變革中拔得頭籌,贏得先機
在如此快速的到來的大數據革命時代,我們還有很多知識需要學習,許多思維需要轉變,許多技術需要研究。職業規劃中,也需充分考慮到大數據對于自身職業的未來發展所帶來的機遇和挑戰。當我們掌握大量數據,需要考慮有多少數字化的數據,又有哪些可以通過大數據的分析處理而帶來有價值的用途?在大數據時代制勝的良藥也許是創新的點子,也許可以利用外部的數據,通過多維化、多層面的分析給我們日后創業帶來價值。借力,順勢,合作共贏。把自己的心門打開,像海綿般吸取積極、正能量的東西。
大數據心得體會 篇2
奧倫·艾奇奧倫(Oren Etzioni)創立的從文本中挖掘信息的公司ClearForest,已經被路透社收購。
美國股市每天成交量高達70億股,而其中三分二的交易都是由建產在數學模型和算法之上的計算機程序自動完成的。
farecast經過了20xx年立項,到20xx年被收購。經歷了5年的時間,數據從最早了120xx條到20xx億條。
大數據的平臺有:谷歌的MAPREDUCE 和開源HADOOP平臺(最初源于雅虎)。NOSQL更優先于MYSQL.
大數據所用的數據記錄單位:拍字節PB(2的50次方)和艾字節EB(2的60次方),澤字節ZB (2的70次方),太字節TB。1EB=10億GB。1ZB=1024EB
20xx年,所有數據中只有7%是存儲在報紙、書籍、圖片等媒價上的模擬數據,其余全部是數字數據。
20xx年世界上存儲的數據預計能達到約1.2澤字節,其中非數字數據只占不到2%。
人類存儲信息量的增長速度比世界經濟的增長速度快4倍。而計算機數據處理能力的增長速度則比世界經濟的增長速度快9倍。
大數據告訴我們“是什么”而不是“為什么”。在大數據時代,我們不必知道現象背后的原因。
大數據的算法從因果關系向相關關紗轉化。這也是思維方式的轉變。
推薦電影《點球成金》MONEYBALL
大數據的三個思維方式:
1、不要依靠分析少量的數據樣本,不要抽樣調查。要分析與某事物相關的所有數據。
2、不要追求精確性,要樂于接受紛繁復雜的數據。
3、不要探求難以捉摸的因果關系,轉而關注事物的相關關系。
大數據中的“大”不是絕對意義上的大,雖然在大多數情況下是這個意思。大數據是指不用隨機分析法這樣的捷徑,而采用所有數據的方法。
LYTOR相機(光場相機)就是對拍照場景的應用。將傳統相機的拍攝照片的樣本進行全收集,成為樣本=總體的應用代表。
意外的案例:
如果把一個在社區內有很多連接關系的人從社區關系網中剔除掉,這個關系網會變得沒那么高效,但卻不會解體。但是如果把一個與所在社區之外的很多人有著連接關系的人從這個關系網中剔除,整個關系網奶快就會破碎成很多的小塊。節點的做用。
社交網絡的多樣性是有額外價值的。這是一個人在社會關系網中的存在價值。
互聯網可以使數據達到精確嗎?只有5%的數據是結構化且能適用于傳統數據庫的。如果不接受混亂,剩下的95%的非結構化數據都無法被利用。只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶。
數據與算法那個更重要呢?簡單的算法+大數據,還是復雜的算法+小數據。結論就是大數據比算法智能系統更重要。
大數據心得體會 篇3
在看《大數據》之前,我只知道社會越來越數字化了,看完之后,才覺悟到:人類將迎來一個新的時代。
數字化已經把我們帶入一個信息時代,大數據卻把我們卷進了一場科技風暴之中,這本書中,作者為我們開啟了一個更包容更廣闊的新時代,大數據把社會的方方面面融合在了一起,曾經看似因果聯系緊密的事物,可能變得不再那么重要;毫無關聯的事物,可能隱藏著重要的信息,從科技、商業,到醫療、政治、教育、文化,大數據一概席卷囊括,它改變著我們的傳統思維,為這個時代注入了新鮮的血液,就像作者書中所說:“這項技術終將改變我們所居住的星球上的許多東西。”
大數據最顯著的影響是對于電子商務,通過大數據,最先洞察出潛在市場的,也必然最先占領市場。而電子商務對實業的沖擊又是勢不可擋,可見,掌握了大數據就主導了市場,擁有了先進的科技才能擁有堅實的競爭力。在醫療方面,曾經的非典時期,就是一個很好的例證,正是有大數據的預測功能,才使疫情得到了控制。在更小的方面,他也同樣改變著我們的生活,書中提到美國著名計算機專家奧倫 · 埃齊奧尼發明了飛機機票價格預測軟件,就是利用大數據造福我們生活的很好例子。
大數據不僅節省了時間,提高了效率,更將人類帶入一個新的文明階段。從分析因果總結經驗,轉變為搜集數據預測未來;由原來的滯后性變為現在的預見性——大大提高了人類認識世界、改造世界的能力,變被動為主動。大數據為我們掀開了歷史新紀元,不敢想象它將會為我們帶來什么,或許會出現新奇的生活方式,從未有過的職業,聞所未聞的商業模式,百家爭鳴的文化高峰;也或許會解開更多未解之謎,探索到宇宙之外的秘密?傊翢o疑問的是,大數據為我們帶來的未來是超乎想象的。
這本書中作者提到最多的是:改變我們的傳統思維,摒棄精確性轉向宏觀。從總結因果轉向預測。這個世界正以驚人的速度向前發展,數據大爆炸的波及范圍遠超乎我們的想象,單純靠人類的主觀判斷力是多么的有限,大數據早晚會取而代之這一現象,這必將影響我們的生活和工作,我們也只有認清這種趨勢,改變思維,調整步伐,緊跟時代才行。即使不能與時代同步,也盡量做到避免固步自封,認識大數據、利用大數據趨利避害,為我們的生活造福!
大數據心得體會 篇4
信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變„„我們這樣評論著的信息時代已經變為曾經。如今,大數據時代成為炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關系和不同,也試圖說明,為什么信息時代轉變為了大數據時代?大數據時代帶給了我們什么?
信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態范疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關于事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴于數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?
在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利于預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭并進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認為,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而并非相離互斥。
數據未來的故事。數據的發展,給我們帶來什么預期和啟示?銀行業天然有大數據的潛質?蛻魯祿、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基于數據的收集、整理、駕馭、分析能力,基于脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風云變換,穩健贏取未來。
大數據心得體會 篇5
讀完《大數據時代》這本書后,我意識到:我們即將或正在迎接由書面到電子的跳躍之后的又一重大變革。
這本書介紹了大數據時代來臨后,接踵而至的三項變革——商業變革、管理變革和思維變革。
其實,這場變革已經打響。商業領域由于大數據時代的到來而推陳出新。前幾年,一家名為Farecast的公司,讓預訂到更優惠的機票價格不再是夢想。公司利用航班售票的數據來預測未來機票價格的走勢,F在,使用這種工具的乘客,平均每張機票可以省大約50美元,這就是大數據給人們帶來的便利。
大家應該都知道20__年出現的H1N1型流感,就拿美國為例,疾控中心每周只進行一次數據統計,而病人一般都是難以忍受病痛的折磨才會去醫院就診,因此也導致了信息的滯后。然而,對于飛速傳播的疾病,Google公司卻能及時地作出判斷,確定流感爆發的地點,這便是基于龐大的數據資源,可見大數據時代對公共衛生也產生了重大的影響!
在我看來,如果想在在大數據時代里暢游,不僅要學會分析,而且還要能夠大膽地決斷。
在美國,每到七、八月份時,正是臺風肆虐之時,防澇用品也擺上了商品貨架。沃爾瑪公司注意到,每到這時,一種蛋撻的銷售量較其他月份明顯增加。于是,商家作了大膽的推測,出現這樣的結果源于兩種物品的相關性,便將這種蛋撻擺在了防澇用品的旁邊。這樣的舉措大大增加了利潤,這就是屬于世界頭號零售商的大數據頭腦!
大數據時代的到來,可以讓我們的生活更加便利。但是,如果讓大數據主宰一切,也存在一定的風險。
大家應該都知道電子地圖,它可以為人們指引方向。但大家應該還不知道,它會默默地積累人們的行程數據,通過智能分析可以推斷出哪里是自己的家,哪里是工作單位。我們的隱私就這樣被不為人知地收集著。
大數據時代的到來,讓我們的生活更安全,更方便,但與此同時,我們的隱私不再是隱私,數據的收集變得無所不包、無孔不入。世界已經向大數據時代邁進了一小步,一個嶄新的時代正向我們走來。讓我們用知識武裝大腦,做好準備,迎接新時代的到來!
大數據心得體會 篇6
信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態范疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關于事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴于數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?
在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利于預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭并進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認為,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而并非相離互斥。
數據未來的故事。數據的發展,給我們帶來什么預期和啟示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基于數據的收集、整理、駕馭、分析能力,基于脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風云變換,穩健贏取未來。
大數據心得體會 篇7
信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變„„我們這樣評論著的信息時代已經變為曾經。如今,大數據時代成為炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關系和不同,也試圖說明,為什么信息時代轉變為了大數據時代?大數據時代帶給了我們什么?
信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態范疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關于事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴于數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?
在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利于預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭并進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認為,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而并非相離互斥。
數據未來的故事。數據的發展,給我們帶來什么預期和啟示?銀行業天然有大數據的潛質?蛻魯祿、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基于數據的收集、整理、駕馭、分析能力,基于脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風云變換,穩健贏取未來。
大數據心得體會 篇8
“大數據”概念早在1980年就有國外的學者提出,可是最近幾年才廣泛受到大家的關注。當“大數據”這個概念傳到中國的時候,瞬間引起了轟動。隨即,各種有關“大數據”的資料和書籍充斥的我們的視野。隨意打開某個電子商務平臺圖書類頁面,在搜索框中搜索“大數據”三個字,就會出現好多本有關“大數據”的書籍?墒牵幸粋很有趣的現象就是:幾乎所有的平臺上,出現的第一本關于“大數據”的書籍一定是《大數據時代》。一點進去,這本書推薦欄里的第一句話就是:迄今為止全世界最好的一本大數據專著。同時,為這本書做推薦的都是各行業的精英領袖。所有“大數據”方面的書籍也是這本書銷量最高,評價最好。
我從來不會因為哪本書暢銷和很多人推薦就盲目跟風的去看一本書。因為我知道通常在這種情況下選擇一本書,整個閱讀的體會和感受是無法遵從自己的內心的,整個過程都很容易夾雜著別人對這本書的感受。所以通常我讀書的節奏大多都是跟不上“潮流”的,但往往經過風雨洗禮之后沉淀下來的都是精華。坦白講,閱讀這本書的初衷并不是因為我想從書中獲取到多少大數據方面的精華,只是很想知道對于這么一個很直白的名詞,作者是怎么寫出這么厚的一本書的。這種初衷或許很無知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書中的精華。
在看《大數據時代》這本書之前,我的所有讀后感都是集中在書籍給了我什么思考。對于這本書的讀后感,除了觀點碰撞之外,我還會加上大部分個人看這本書的體會。因為這本書,已經完全讓我模糊了大多數人口中的“全世界最好的書”是一種什么標準。也許《大數據時代》真的無法承載那么高的贊美!
大數據時代的入門書
看完這本書,我隨意調查了一些閱讀過這本書并且給這本書絕對好評的朋友。詢問他們這本書好在哪里?大多數的回答是說《大數據時代》這本書讓對大數據一無所知的他們了解了大數據這個概念,同時通過很多案例說明原來大數據能有這么大的用處,影響會有這么大!僅此而已。我看完這本書最大的感受是這本書分為上、下兩部分。前120多頁為上部分,后120多頁為下部分。之所以說《大數據時代》是一本關于大數據的入門書,是因為這本書用了前面120多頁的篇幅反復的強調大數據的出現對社會發展影響很大,并且要人們轉變小數據時代慣有的思想。所以整本書的前半部分就強調大數據時代的三個轉變:1、大數據利用所有的數據,而不再僅僅依靠一小部分數據,不再依賴于隨機采樣。2、大數據數據多,不再熱衷于追求精確性,也不再期待精確性。3、大數據時代不再熱衷于尋找因果關系,而是追求相關關系。所以整個上半部分沒什么可詳說的。我們重點聊聊本書的后半部分。
既然一直都在強調大數據對我們的意義,總要有具體體現。整本書中,我感觸最大的一個案例就是某公司通過分析大數據發現:新品發布的時候,舊一代的產品可能會出現短暫的價格上漲。因為人們在心理上就認為新產品的推出,舊產品就會便宜,從而就會提高購買量。這個發現和我們平常的心理是完全違背的,而且如果不用數據來證明,直接講道理給大家可能還是無法相信。這就是大數據對我們很多傳統思維的顛覆。一旦涉及到思維的改變,往往就會引起整個社會的大變動。
大數據這個概念的出現,讓大數據逐漸發展形成一條價值鏈。在這條價值鏈上,數據本身、技能和思維是最重要的環節。隨著互聯網技術的發展,越來越多的公司都能收集到大量的數據,這些數據也會越來越公開。可是在這些公司中,不是所有的公司都有從數據中提取價值或者用數據催生創新思想的技能。于是就會出現以下兩種公司,一種是掌握了專業技能但不一定擁有數據或者提出數據創新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數據的新價值的創新公司。短時間內,我們可能會感覺擁有創新思維,懂得挖掘出數據新價值的大數據思維是最重要的。可是等到產業成熟之后,所有人都知曉了大數據的意義,所有人便開始挖掘自己的大數據思維。同時,隨著科技的進步,掌握大數據技術的也將成為常態。所以到后來,整個價值鏈的核心環節還是回到了數據本身。而到那時候,大數據的公開性也就越來越小。
在大談完大數據對人類發展的積極意義之后,作者也考慮到大數據時代的風險。這一部分是作者腦洞大開的精彩之處,同時也是最荒謬的一部分。書中說大數據時代將要懲罰未來犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行為給防止。這樣的社會,大數據儼然已經延伸到了我們每個人生活的點滴。幾乎我們在生活中所做的一切都在大數據的“監控”之下,我想到那時候,別說我們每個人的隱私已經沒有的了,嚴重一點可以說是我們可能連人都不算了。在我們人的社會屬性中,自由權利是一項很重要的指標。通過大數據懲罰人的未來犯罪已經否定了人的自由選擇能力和人的行為責任自負。同時,由于數據是永久保存,大數據預測也是通過每個人之前的數據來判斷,所以大數據同樣也否定了人的求善心理。還有,從現在各種大數據預測的結果來看,很多發言人都說大數據不是百分百的準確。所以利用大數據來判斷人的行為發展已經違背了大數據不追求精確性的特征,這也是書中自相矛盾的地方。
對于一個新事物,如果能讓大家了解這個事物并且對此產生興趣,這已經算是一本不錯的入門書了。
大數據時代的心靈雞湯
從小到大,雞湯對于我們來說一直都挺珍貴的。身體虛弱了,喝點雞湯能夠補充營養。心靈受傷了,看點心靈雞湯可以鼓舞人心。可是近幾年,人們生活水平提高了,營養富余,雞湯已經不是人們補營養的期待了。同樣,心靈雞湯也是如此。
心靈雞湯其實是一個很虛偽的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來,心靈雞湯很大的一個特征就是:立人的志,但是就不告訴你實現志的方法。很多人每次在失意的時候就喜歡看心靈雞湯,希望能得到慰藉?赐旰笠灿X得醍醐灌頂,感覺整個世界都亮了。但又有幾個人想過喝完這些雞湯之后你除了看似重拾夢想,你還獲得了什么?你知道怎么去做嗎?《大數據時代》就是這樣一本書。整本書從頭到尾都在向讀者講述大數據的意義,當然期間也會用相應的案例來證明大數據確實有這樣的能力。但是,整本書從沒有涉及到技術層面的問題。或許對于大數據這種依靠互聯網技術的新事物,即使向讀者講技術,也沒有幾個人看得懂,可是整本書沒有一點關于大數據思維的技能引導。給出的案例中只有少數案例向讀者講述了這個公司為什么要利用大數據來解決這種問題,大多數都只是告訴讀者國外某家公司運用大數據得出了某種結論。同時,在本書中文譯作者寫的序里,強調自己翻譯這本著作的一大優點是可以結合國內的案例來分析書中的理論,結果,看到最后一頁都沒有看到一個國內企業關于大數據運用的案例。
之所以我稱之為“心靈雞湯”,還有一個原因就是作者在書中大講特講的大數據的作用,事實上按照現在的經濟發展水平和社會文明發展程度是很難實現的。書中很多時候的理論都是要建立在社會各項文明都發展健全的基礎上才能實現。
大數據的“傳銷手冊”
看到這個標題,大家可能會覺得我夸大其詞,受到如此多人好評的書怎么是“傳銷手冊”呢?對于這個表達,我只想說兩點:1、此說法僅代表我個人觀點,是否認同是個人問題。2、此說法主要針對本書的上部分。
我們都知道傳銷組織在發展下線的前期是要花大力氣去培訓的,也就是洗腦。而對于一個陌生又很難以理解的事物,最好的“洗腦”方式就是重復!洞髷祿䲡r代》這本書就是運用這種方式,前半部分為了讓讀者能夠接受“大數據”這個概念,作者反反復復提醒讀者大數據不是隨機采樣、不追求精確和不尋找因果關系。同時用很多看似很通俗易懂其實看完后還是不知道說了什么的案例來讓人信服大數據的作用。書中的后半部分雖然也是用這種方式來感染讀者,可后半部分中作者的暢想和對大數據的威脅分析還是對讀者有一些實質意義的,所以后半部分的“傳銷”影響就不是很重要。
大數據時代是未來的趨勢,這誰都不會否認。大數據改造了我們的生活,改變著我們的世界。不管它是以一種什么樣的姿態面向世界,它都沒有錯,因為大數據只是一種工具。但當人類開始質疑甚至恐懼大數據的時候,人類就該思考自己是否利用好這個好工具了。
大數據心得體會 篇9
近兩周用業余時間讀了《大數據時代》這本書,是聽培訓時杜威老師推薦的,我快速閱讀了一遍,覺得受到了一些啟發,發現了一些原來沒有想到看到的事情。
首先是大數據代表著數據的樣本=全體,這是一個與傳統統計學的顯著區別。大數據有能力獲得全體數據并對其進行分析。
第二就是相關性與因果性同樣重要。相關性說明了什么事情與什么什么事情有關系,如商場周圍車流量的增多與商場銷售額的相關性,因果性說明什么是什么的原因,如睡10個小時是有精神的原因。在大數據中,相關性要比因果性容易獲得,而且相關性已經能為客戶帶來較大的收益。
第三就是大數據允許存在不精確性、混雜性,由于數據量巨大,存在少量的異變不會對結果產生任何影響,如收益是1個億與1億零1元的差別可能決策者不關心。
第四是大數據中的三個主要因素,思維、數據、技術,思維覺得你在哪些地方使用大數據。在這三個因素之中,會產生數據中間商,來處理加工數據并出售。
大數據心得體會 篇10
《大數據》不是一本純技術的書籍,作者用美國多年來豐富而詳細的案例說明了大數據的趨勢和發展歷程,大數據的初衷就是將一個公開、高效的政府呈現在人民眼前。書中從美國《信息自由法》說起,其發展歷程充滿了坎坷,經過各個時期信息自由倡議者的努力,終于出現端倪,并迅速成長,充分體現出美國政府的信息必須被公開,以及個人的隱私必須被保護。人類可以“分析和使用”的數據在大量增加,通過這些數據的交換、整合和分析,人類可以發現新的知識,創造新的價值,帶來“大知識”、“大科技”、“大利潤”和“大發展”。
《大數據》開篇講述美國《信息自由法》歷經多任總統,其中有支持者,也有反對者,最后終于簽發,標志都美國進入信息公開及隱私保護的大數據時代。現如今全世界現有60多個國家制定、實施《信息自由法》。
隨著《信息自由法》的頒布,以及現代科技的發展,會產生越來越多的數據。數據主要來源是:1.各行各業通過計算機產生了大量的數據;2. 業務數據3. 民意數據4. 環境數據。并且數據在數量、速度、多樣性三個維度迅速增長,促使數據帝國逐漸興起。
有了這么多數據,應該如何利用?
首先,在治國方面。1.循“數”管理,減少交通事故死亡人數。2.用數據進行醫療福利打假,可為政府節省開支。3.警方通過CompStat系統,分析犯罪數據,預知犯罪地點。
其次,商務智能方面。1.數據倉庫,2.聯機分析(OLAP),3. 數據挖掘,4. 數據可視化。
當然隨著數據的增多,如何收集和使用這些數據,就需要制訂一系列的法則。1.收集法則:減負;2.使用法則:隱私;3.發布法則:免費,4.管理法則:質量。其中數據質量最為重要,為了保證數據質量頒布了《數據質量法》,同時也帶來了困惑,即給商業組織帶來了質疑政府公布數據質量的手段,對于這一手段,滿足其商業利益,是民主與商業組織之間的對抗和沖突。
同時,統一分析和使用大數據與個人隱私產生的沖突。通過中央數據銀行和全國統一ID就獲得某個人一生的行動,違反了個人隱私法,但不分析這些信息,又可能導致恐怖分子的襲擊,最終以保護個人隱私勝利,但政府還是想執行統一身份認證。
奧巴馬的上任加速了政府數據開放的進程,奧巴馬上任后立即任命首席信息官,由首席信息官在4個月內推出政府大數據網站,在互聯網上為民眾提供開放的政府數據。陽光基金會和個人利用開放數據開發出各種分析工具,充分體現出數據價值。
但公益組織并不滿足開放數據的數量,為了讓民眾監督一個更為公正透明的政府,公益組織要求公開白宮訪客記錄,但這并不是一個簡單的要求。經過公益組織不懈的努力,白宮終于公開了訪客記錄,但公益組織發現了更多的問題,白宮也提出將繼續修改訪客記錄的方式。
大數據有效的監督了政府的公正與民主。民主不是一個結果,而是參與的過程,人民要不斷的爭取才能實現民主。
本書結尾也較詳細的描述除美國外,其它各國通過大數據走向民主的進程,充分說明了這一進程是一個大趨勢。首先,英國緊隨美國后面實施數據開放,雖然晚于美國,但發展飛快,開放的數據量已超過美國。其次,即美、英兩國開放數據之后,更多的國家也加入到其中。20xx年9月20日,8個國家宣布成立“開放政府聯盟”,要想加入需具備4個條件:1.財政透明,2.信息自由,3.財產公開,4.公民參與。截止20xx年4月25日已有50個國家加入。
在大數據時代,數據就是直接的財富,數據分析和挖掘能力就是國家、企業的核心競爭力。中國應該摘下千百年來差不多先生的標簽,盡快趕上西方國家大數據的步伐。
大數據心得體會 篇11
讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來。
“在小數據時代,我們會假象世界是怎樣運作的,然后通過收集和分析數據來驗證這種假想。”“隨著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限于傳統的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
當我們人類的數據收集和處理能力達到拍字節甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規則。兩者似乎是做同一件事?纱髷祿“不是因果關系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在于人有邏輯思維而機器沒有!洞髷祿䲡r代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。
還好我知道自己對什么統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大數據時代的邏輯思維。
大數據心得體會 篇12
4月13日下午,在湖南大學東樓205參加了關于《大數據時代》的讀書交流活動。通過相互交流學習,使我更深層次的理解了大數據時代的利與弊,機遇和挑戰。在寫心得體會前,我想再重新審視一下關于大數據的歷史沿革和現實意義。
首先,最早提出“大數據”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數 據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”“大數據”在物理學、生物學、環境生態學等領域以及軍事、金融、通訊等行業存在已有時日,卻因為近年來互聯網和信息行業的發展而引起人們關注。大數據作為云計算、物聯網之后又IT行業又一大顛覆性的技術革命。云計算主要為數據資產提供了保管、訪問的場所和渠道,而數據才是真正有價值的資產。企業內部的經營交易信息、物聯網世界中的商品物流信息,互聯網世界中的人與人交互信息、位置信息等,其數量將遠遠超越現有企業IT架構和基礎設施的承載能力,實時性要求也將大大超越現有的計算能力。如何盤活這些數據資產,使其為國家治理、企業決策乃至個人生活服務,是大數據的核心議題,也是云計算內在的靈魂和必然的升級方向。
其次,進入20xx年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。它已經上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網的新聞,現身在國內一些互聯網主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。數據正在迅速膨脹并變大,它決定著企業的未來發展,雖然很多企業可能并沒有意識到數據爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業的重要性。正如《紐約時報》20xx年2月的一篇專欄中所稱,“大數據”時代已經降臨,在商業、經濟及其他領域中,決策將日益基于數據和分析而作出,而并非基于經驗和直覺。哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。”
最后,隨著云時代的來臨,大數據(Big data)也吸引了越來越多的關注。著云臺的分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢。大數據分析常和云計算聯系到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。“大數據”在互聯網行業指的是這樣一種現象:互聯網公司在日常運營中生成、累積的用戶網絡行為數據。這些數據的規模是如此龐大,以至于不能用G或T來衡量。大數據到底有多大?一組名為“互聯網上一天”的數據告訴我們,一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多(相當于美國兩年的紙質信件數量);發出的社區帖子達200萬個(相當于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數量37.1萬……,截止到20xx年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,20xx年全球產生的數據量為0.49ZB,20xx年的數據量為0.8ZB,20xx年增長為1.2ZB,20xx年的數量更是高達1.82ZB,相當于全球每人產生200GB以上的數據。而到20xx年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了20xx年,全世界所產生的數據規模將達到今天的44倍。
首先,談談大數據帶給生活的轉變。大數據已經是信息產業發展的必然趨勢,可以說,大數據現在已經開始慢慢滲透入我們的生活,如:現在流行的打車軟件、三維立體化社區的建立、某些從事生產銷售的行業利用大數據來優化規模和實現利益最大化。而我們很多人對大數據還很陌生,只是被動的適應著大數據給生活帶來的改變。大數據時代是以云計算為基礎的,所以,要實現大數據,相關的很多的硬件設備都要更新換代,信息處理系統、信息傳輸系統、信息反饋系統、信息決策系統都將面臨新的挑戰,相關產業都要重新調整產業結構,在那時,可以夸張的說,信息就是黃金,信息就是石油。大數據時代的到來會解放更多的勞動生產力,勢必將會更加加劇生產力過剩的現狀,社會兩極分化現象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數據時代的到來會使人們的生活節奏急速加快,信息的時效性決定了它的流通速率,人們的生活節奏要跟上信息流通的速率,就不得不加快自己的節奏,人們會越來越忙,到那時,就像現在的日本,可能想找個人聽你說說話,真的是一件很難的事。
第二,關于數據管理的看法。大數據時代,數據管理是一件很重要的工作,如何才能避免自己的數據被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識,不主動泄露信息,要管理好自己身邊的信息設備;技防,就是要運用軟件來管理和處理數據,經常檢查更新數據庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數據一定要備份保留,而且應當做到備份與原始文件是物理隔離,無關的信息應當及時刪除,減輕硬盤的壓力。
三、怎么保護自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數據時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠離網絡,不要再公開的社交網絡儲存和展示個人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發一種新的硬件連接器,總是以隨機碼來保護自己真實IP地址,提高網絡安全的可靠性,加強對聯網信息的管理和保護。
不論我們情不情愿,大數據時代都會到來,現實社會是我們高喊著走向大數據時代,其實大數據時代已經向我們走來,所以與其被動接受,不如主動學習,從中找到自己的出路,成為大數據時代的建設者和受益者。
大數據心得體會 篇13
《大數據》不是一本純技術的書籍,作者用美國多年來豐富而詳細的案例說明了大數據的趨勢和發展歷程,大數據的初衷就是將一個公開、高效的政府呈現在人民眼前。書中從美國《信息自由法》說起,其發展歷程充滿了坎坷,經過各個時期信息自由倡議者的努力,終于出現端倪,并迅速成長,充分體現出美國政府的信息必須被公開,以及個人的隱私必須被保護。人類可以“分析和使用”的數據在大量增加,通過這些數據的交換、整合和分析,人類可以發現新的知識,創造新的價值,帶來“大知識”、“大科技”、“大利潤”和“大發展”。
《大數據》開篇講述美國《信息自由法》歷經多任總統,其中有支持者,也有反對者,最后終于簽發,標志都美國進入信息公開及隱私保護的大數據時代。現如今全世界現有60多個國家制定、實施《信息自由法》。
隨著《信息自由法》的頒布,以及現代科技的發展,會產生越來越多的數據。數據主要來源是:1.各行各業通過計算機產生了大量的數據;2. 業務數據3. 民意數據4. 環境數據。并且數據在數量、速度、多樣性三個維度迅速增長,促使數據帝國逐漸興起。
有了這么多數據,應該如何利用?
首先,在治國方面。1.循“數”管理,減少交通事故死亡人數。2.用數據進行醫療福利打假,可為政府節省開支。3.警方通過CompStat系統,分析犯罪數據,預知犯罪地點。
其次,商務智能方面。1.數據倉庫,2.聯機分析(OLAP),3. 數據挖掘,4. 數據可視化。
當然隨著數據的增多,如何收集和使用這些數據,就需要制訂一系列的法則。1.收集法則:減負;2.使用法則:隱私;3.發布法則:免費,4.管理法則:質量。其中數據質量最為重要,為了保證數據質量頒布了《數據質量法》,同時也帶來了困惑,即給商業組織帶來了質疑政府公布數據質量的手段,對于這一手段,滿足其商業利益,是民主與商業組織之間的對抗和沖突。
同時,統一分析和使用大數據與個人隱私產生的沖突。通過中央數據銀行和全國統一ID就獲得某個人一生的行動,違反了個人隱私法,但不分析這些信息,又可能導致恐怖分子的襲擊,最終以保護個人隱私勝利,但政府還是想執行統一身份認證。
奧巴馬的上任加速了政府數據開放的進程,奧巴馬上任后立即任命首席信息官,由首席信息官在4個月內推出政府大數據網站,在互聯網上為民眾提供開放的政府數據。陽光基金會和個人利用開放數據開發出各種分析工具,充分體現出數據價值。
但公益組織并不滿足開放數據的數量,為了讓民眾監督一個更為公正透明的政府,公益組織要求公開白宮訪客記錄,但這并不是一個簡單的要求。經過公益組織不懈的努力,白宮終于公開了訪客記錄,但公益組織發現了更多的問題,白宮也提出將繼續修改訪客記錄的方式。
大數據有效的監督了政府的公正與民主。民主不是一個結果,而是參與的過程,人民要不斷的爭取才能實現民主。
本書結尾也較詳細的描述除美國外,其它各國通過大數據走向民主的進程,充分說明了這一進程是一個大趨勢。首先,英國緊隨美國后面實施數據開放,雖然晚于美國,但發展飛快,開放的數據量已超過美國。其次,即美、英兩國開放數據之后,更多的國家也加入到其中。20xx年9月20日,8個國家宣布成立“開放政府聯盟”,要想加入需具備4個條件:1.財政透明,2.信息自由,3.財產公開,4.公民參與。截止20xx年4月25日已有50個國家加入。
在大數據時代,數據就是直接的財富,數據分析和挖掘能力就是國家、企業的核心競爭力。中國應該摘下千百年來差不多先生的標簽,盡快趕上西方國家大數據的步伐。
大數據心得體會 篇14
有人說生活像一團亂麻,剪不斷理還亂;我說生活像一團亂碼,盡管云山霧罩惝恍迷離,最后卻總會撥云見日雨過天晴。維克托邁爾舍恩伯格就把這團亂碼叫做大數據,在他的這本書里,試圖給出的就是撥開云霧見青天的玄機。
這玄機說來也簡單,就是放棄千百年來人們孜孜追求的因果關系轉而投奔相關關系。說來簡單,其實卻顛覆了多少代人對真理探求的夢想。我覺得作者是個典型的實用主義者,在美帝國主義萬惡的壓迫和洗腦下,始終追逐性價比和利益最大化,居然放棄了追求共產主義真理最基本的要求!不像我們在天朝光芒的籠罩下,從小就開始學習和追求純粹的共產主義唯心科學歷史文化知識啦!這或許就是我們永遠無法獲得諾貝爾獎、永遠無法站在科技最前沿的根本原因吧。其實小學時候,我就想過這個問題,相信所有的人都問過類似的問題,例如現在仍然很多人在問,媽的從來沒人知道我每天擺攤賺多少錢,你們他媽的那人均收入四五千是怎么算出來的。中國是抽樣的代表,因為中國人最喜歡用代表來表現整體,最典型的例子莫過于公布的幸福指數滿意指數各種指數永遠都高于你的預期,你完全不清楚他是怎么來的,一直到最后匯總成三個代表,真心不清楚它到底能代表了啥。說這么多顯得自己是個憤青,其實只是想表達“樣本=總體”這個概念在科技飛速發展的今天,在世界的不同角落,還是會體現出不同的價值,受到不同程度的對待及關注。在大數據觀念的沖擊下,我們是不是真的需要將平時關注的重點從事物內在的發展規律轉移到事物客觀的發生情況上。
大數據的出現,必然對諸多領域產生極大的沖擊,某些行業在未來十年必將會得到突飛猛進的發展,而其他一些行業則可能會消失。這是廢話,典型的三十年河東三十年河西的道理,就像三十年前的數理化王子們,現在可能蜷縮在某工廠的小角落里顫顫巍巍的修理機器;就像三十年前職業高中的學生才學財會學銀行,如今這幫孫子一個個都開大奔養小三攢的樓房夠給自己做墓群的了;當然也不乏像生物這種專業,三十年前人們不知道是干啥的,三十年后人們都知道沒事別去干,唯一可惜的是我在這三十年之間的歷史長河中卻恰恰選了這么一個專業,這也是為什么我現在在這寫讀后感而沒有跟姑娘去玩耍的原因。其實乍一看這個題目,我首先想到的是精益生產的過程控制,比如六西格瑪,這其實就是通過對所有數據的分析來預測產品品質的變化,就已經是大數據的具體應用了。
而任何事物都會有偏差,會有錯誤,也就是說,這全部的數據中,肯定是要出現很多與總體反應出的規律相違背的個體,但是無論如何這也是該事件中一般規律的客觀體現的一種形式,要遠遠好過從選定的樣本中剔除異常值然后得到的結論。換句話說,也大大減少了排除異己對表達事物客觀規律的影響。就好比是統計局統計中國人民的平均收入一樣,這些數怎么這么低啊,這不是給我們國家在國際社會上的形象抹黑么,刪掉刪掉;這些數怎么這么高啊,這還不引起社會不滿國家動蕩啊,刪掉刪掉。所以說,大數據至少對反應客觀事實和對客觀事實做預測這兩個方面是有非常積極地意義的。而這個新興行業所體現的商機,既在如何利用數據上,又在如何取得數據上。
先說數據的利用,這里面表達的就是作者在通書中強調的對“相關關系”的挖掘利用。相關關系與因果關系便不再贅述,而能夠對相關關系進行挖掘利用的企業其實缺不多,因為可以相信未來的大數據庫就像現在的自然資源一樣,必將因為對利益的追逐成為稀缺資源,而最終落在個別人或企業或部門的手中。想想無論當你想要做什么事情的時候,都有人已經提前知道并且為你做好了計劃,還真是一件甜蜜而又令人不寒而栗的事情。
而對于數據的獲取,我覺得必然是未來中小型企業甚至個人發揮極致的創造力的領域。如何在盡可能降低成本的情況下采集到越多越準確的數據是必然的發展趨勢,鑒于這三個維度事實上都無法做到極致,那么對于數據獲取方式的爭奪肯定將成就更多的英雄人物。
現在回頭從說說作者書中的觀點中想到的,P87中關于巴斯德的疫苗的事件,描述了一個被瘋狗咬傷的小孩,在接種了巴斯德的狂犬疫苗后成功幸存,巴斯德成了英雄的故事。這是個非常有意思的案例,因為小孩被狗咬傷而患病的概率僅為七分之一,也就是說,本事件有85%的概率是小孩根本就不會患病。那么小孩的生命到底是不是巴斯德救的,而這疫苗到底是有效沒效,通過這個事件似乎根本就沒有辦法得到驗證。這就好比某人推出個四萬億計劃,但實際上國際經濟形勢就是好轉,哪怕你只推出個二百五計劃,GDP都會蹭蹭的往上漲,而且又不會帶來四萬億導致的嚴重通脹、產能過剩、房價泡沫等問題。那你說這四萬億到底是救了國還是誤了國?回到我自己的工作領域上來,安全工作,我們一直遵循的方向都是尋找因果關系,典型的從工作前的風險評估,到調查事故的Taproot或者五個為什么,無一不是邏輯推理得到結果的產物。而事實上,如果能做到信息的豐富采集和匯總的話,找出事物之間的相關性,對提高工作環境的安全系數是極為有利的。這個點留著,看看可不可以在未來繼續做進一步研究。
大數據心得體會 篇15
《大數據》是去年的一本暢銷書,在20__年的廣州南國書香節上曾有過一瞥,后來又幾次聽聞,一直想好好看看。現在是一個技術奔騰、信息爆炸的社會,大數據這個新鮮熱辣的概念一經推出,就受到了人們極大的熱捧。這也難怪,每天都身處網絡的信息海洋中,常常會有被數據、信息“淹沒”窒息感和無力感,不識廬山真面目,只緣身在此山中,我們向魚兒一樣亟待跳出海面,看看當下網絡之海中正涌動著的大數據暗流,看看這個大家都在談論的大數據到底是個什么東西?
書的扉頁上寫著作者涂子沛對大數據的定義:大數據(big data)指一般的軟件工具難以捕捉、管理和分析的大容量非結構數據,一般以“太字節”為單位。構成大數據的信息主要包括:寬帶普及帶來的巨量日志和通訊記錄,社交網絡每天不斷更新的個人信息,視頻通訊、醫療影像、地理信息、監控錄像等視頻記錄,傳感器、導航設備等非傳統 IT 設備產生的數據信息,以及持續增加的各種智能終端產生的圖片及信息,這些信息呈爆炸性增長,不斷涌入網絡海洋。大數據之大并不僅僅在于容量之大,更大的意義在于:通過對海量數據的交換、整合和分析,發現新的知識,創造新的價值,帶來大知識、大科技、大利潤和大發展。當然這個定義并不是唯一的,Intel試圖用視頻解說的方式告訴我們什么是大數據:《大數據入門:大數據如何產生巨大影響力》。
這本書將美國的奧巴馬大選作為引子,從他的建立透明和開放的政府的雄心壯志講起,陽光是最好的防腐劑,信息公開和公民社會緊密相連,從政府信息公開化的必要性,到如何篩選、甄別、分析、管理、利用海量的政府部門的數據,因為政府部門涉及人類生活的方方面面,也就逐漸引出信息社會大數據的概念,給我們帶來如何應對大數據時代的到來的挑戰和機遇的思考。因為這本書信奉一句至理名言:除了上帝,任何人都必須用數據說話。
麥肯錫20__年6月的全球市場報告———Big Data:The next generation frontier for innovation, competition and productivity是深入了解大數據發端和全貌必看的報告。
就我個人的理解而言,大數據的概念是社會信息化深入發展的一個階段,映射到教育信息化的領域中來,又有哪些關聯和啟示呢?專業領域中常常提到的數據挖掘、個人知識管理都和此有關,學校教育過程是一個有特殊的場景、特定的事物和特殊的角色(學生、教師、教育管理者),隨著學校的信息化進程加快,與教育教學和學習相關的環境數據、業務數據和角色數據也將大量增加,這就是是教育領域中的大數據,如何有效獲取、篩選、管理和利用也成為挑戰和變革的機遇。