數據文化是尊重事實、強調準確性、崇尚理性和邏輯的文化。數據文化的缺失是中國落後的重要原因。建設這種文化,中華文明的面貌就會煥然壹新。(題字)
大數據不是礦藏,而是土壤。開放數據是陸地上的壹條河流。河水流過的地方,就會孕育出發達的數據文明。(采訪)
美國的締造者在人口普查的基礎上構建了數據分散化的方法,不僅調和了民主與共和的矛盾,就人口普查本身而言也是壹種創新。因為各州權力——席位要按人口分配,各州需要向中央繳納的稅收也要按人口分攤,權利和義務可以相互制約:想通過誇大人口基數獲得更多席位的州也要相應承擔更多的稅收義務;同時,那些想通過隱瞞人口增長來避稅的州將失去在州權力分配中應有的席位,這保證了人口普查的公平性和準確性。(P11)
專制暴君為了操縱稅收和財政工作,把會計制度搞得盡可能復雜混亂,但壹個共和國的貨幣制度應該是簡單的,簡單到即使是最普通的人也能方便地使用。換句話說,理想國的目標是讓所有的計算變得簡單,讓每個人都可以在商業活動中成為自己的計算器,而不依賴他人。計算能力不僅是自由經濟的需要,也是自由社會和自由人的需要。(第32頁)
無論是霍爾瑞斯的發明,IBM的崛起,還是第壹臺商用計算機的出現,都離不開美國人口普查產生的龐大數據...讓後人扼腕嘆息的是,壹個政治決策,經過百年的演變,將美國推向了信息技術的巔峰,引領世界進入了新的社會形態。後人應該如何思考、解讀和學習歷史的曲折、奇跡和偉大?(P109)
面對復雜的利益沖突和政治壓力,那就不用說了,讓數據來競爭吧!(142)
當然,總統身邊的幕僚、親信、內閣大臣都看出了端倪。他們都意識到,要想拿到項目和撥款,就必須用數據說話。這在美國政府掀起了壹股數據浪潮,各個政府部門開始大量招聘和雇傭統計學家和經濟學家,以確保自己在“數據競賽”中不掉隊。(P143)
在國會的聽證會上,如果每壹個數據稍有含糊,每壹條邏輯推理的鏈條都被打破,就有可能被虎視眈眈的競爭對手揪出來,受到質疑和挑戰。這種嚴謹而針鋒相對的爭論,最終促進了成本效益評價方法的規範和完善。(P144)
以道德的名義反對生命價值的量化,其實是無知的表現,是對人類根本利益的真正漠視。如何完成這種量化,才是理性人類真正的挑戰。(P146)
如果有壹個明確的民族復興的定義和目標,那麽中國學術界不僅需要量化這個過程,還需要讓百家爭鳴,拿出各種量化模型。原因有三:第壹,只有量化才能管理壹個過程;第二,從美國工程兵和墾荒局的數據競爭可以看出,正是競爭使得量化的過程不斷完善;第三,每個數學模型都有其局限性,多個模型可以互補。(P172)
中日差距的歷史原因在於兩國國民對先進文明的不同態度。日本人認識到自己的不足,坦然面對自己的失敗,真誠向西方學習。因為他們善於學習,源於西方國家的1936統計革命成為壹個亞洲國家崛起的契機。因為善於學習,這個小國爆發出了驚人的能量。從廢墟中崛起,與世界上最強大的國家並駕齊驅,只用了15年...面對日本的崛起,我們中國人應該捫心自問:“為什麽日本做不到?”?!(P210)
壹個國家的開放首先應該指向其內陸...與對外開放相比,對內開放更為重要,它決定著壹個國家的長遠發展和命運。.....對外開放不僅關系到公民的自由和權利,也是政府管理社會、調節市場、服務經濟發展的有效手段。更重要的是,隨著大數據時代的到來,數據將和傳統的“人、錢、物”壹樣,成為重要的生產資料和創新資源。對內開放的程度將決定壹個國家發展的動力和壹個社會創新的活力。(P216)
國與國之間的競爭表面上是科技競爭、經濟競爭,但歸根結底還是國民素質和文化的競爭。沒有健康的、理性的、與時俱進的文化,壹個國家很難強大。這本書的努力,就是試圖在中國把數據這個科技符號變成文化符號,把大數據這個高端精英的話題變成大眾話題,讓數據文化進入中國人的視野,融入中國人的意識和血液。(第338頁)
數據是靜態的歷史,歷史是動態的數據。歷史的碎片是免費的數據;歷史的迷霧是模糊的數據;歷史的盲點是缺失的數據。用數據構建的歷史,總是因為細節的精準而生動。資料越豐富,後世的史學家就越能通過資料再現當時的社會。(第336頁)
我們研究美國,向美國學習,而不是成為另壹個美國。學習始於模仿,但好的學習以超越為目標。對於中國來說,即使“超過美國”也不是最終目標。我們的目標是為世界進步做出更多、更突出、更前沿的貢獻。就像柴洪峰先生說的,我們要講好自己在人類文明史上的故事,重演我們民族的輝煌。(P343)