跳至內容

數據化

維基百科,自由的百科全書

數據化是將均勻、連續的數字比特結構化和顆粒化,形成標準化的、開放的、非線性的、通用的數據對象,並基於不同形態與類別的數據對象,實現相關應用,開展相關活動。

數據化是中文中獨有的一個重要概念,它是在電子化、信息化、計算機化和網絡化等術語之間自然出現的。在很多地方,數據化的概念經常被與量化、數值化的概念相混淆,但實際上在這裏,數據不是指狹義的數量值,而是指可以對應於各種信息對象的,數字比特的結構化集合。

數據化與數碼化

數據化和數碼化不是對立的。數據化這一概念的提出不是對數碼化的否定,而是對數碼化的拓展與推進。數據化關注的焦點更多地集中在數字比特更複雜、更高級的存在形態上。數據化基於由數字比特組合形成的客體——數據。數據是所有數字比特對象的子集,數據化是數碼化進程中的一個方向。

數據化是內生於數碼化的,就像半導體化內生於電子化,就像「數字的」內生於「模擬的」,就像活字印刷術內生於印刷術。在人類文明史中,活字印刷取代印刷術發展早期的雕版印刷,將中文裏的漢字、英文裏的字母和單詞分離出來,成為可以自由組合的、在各種具體的文本中通用的獨立顆粒,這一拓展革命性地提升了印刷的效率,導致了印刷成本的大幅度降低。在早期印刷術發展的基礎上,活字印刷這一偉大發明帶給我們更多靈活性,更大的選擇空間,推動了社會中知識的傳播與普及,加速了人類文明的進程。而數據化的文化意義和社會價值正是與它非常相似的。

在電子化的時代,從「模擬的」轉向「數字的」是一個巨大的飛躍。數碼化是通過對連續時空對象進行離散化實現的。

典型的數據化對象

數碼化對應的基本單元是比特(bits),數據化對應的典型對象則是字節(bytes)和字(words)。其他基本的數據類型還有布爾、雙字、整型、浮點型等,而複合的數據類型則有數組、結構、枚舉、聯合等等。對應於通訊、計算與存儲等具體應用,我們有複雜的高級數據對象,它們是數據包(packet)、類(class)和文件(file)等。

參見