大數(shù)據(jù)時代沒有無效數(shù)據(jù)

5月22日消息,大數(shù)據(jù)廠商Teradata天睿公司CTO寶立明(Stephen Brobst)日前在“2013 Teradata大數(shù)據(jù)峰會”上向騰訊科技表示,不能一味的否定看似無用的數(shù)據(jù),它們同樣蘊含著價值,只是尚未找到價值體現(xiàn)手段,可以用低成本的存儲服務器加以保留。

數(shù)據(jù)均有價值

如何區(qū)分大數(shù)據(jù)的價值?寶立明表示,不能一味地否定無用的數(shù)據(jù),它們同樣蘊含著價值,它們確切的說法應該是低價值密度數(shù)據(jù)。因此,企業(yè)也應該保留這些數(shù)據(jù),只是暫時尚未發(fā)現(xiàn)它的價值,可以用低成本的存儲服務器保留它們。

他舉例說,當人們通過搜索引擎檢索時,會出現(xiàn)一些習慣性的拼寫錯誤。這些錯誤數(shù)據(jù)雖然表面上沒有意義,但通過收集這些數(shù)據(jù)卻可以發(fā)現(xiàn)大量的用戶習慣和規(guī)律。

他表示,人們對于海量數(shù)據(jù)感到困惑,這是因為未能全局掌握整個數(shù)據(jù)只是看到破碎的、零散的、局部的數(shù)據(jù)。這就像通常“給數(shù)據(jù)做提煉總結(jié)”而在總結(jié)的過程中往往會丟失掉大量細節(jié),但是很多有價值的信息正隱藏在具體的細節(jié)當中。

寶立明建議,對于不同價值的數(shù)據(jù)要區(qū)分對待,把價值不高的數(shù)據(jù)存儲在低成本的環(huán)境當中,但是絕對不會把它丟棄,因為假以時日,它還是會有一定的價值會被挖掘出來。

隱私保護仍待解決

在談到對大數(shù)據(jù)的隱私恐慌問題時,寶立明認為,應該對用戶隱私提供一定的保護,例如通過數(shù)據(jù)加密,只讓需要知道數(shù)據(jù)的人了解、接觸或者訪問到這些數(shù)據(jù)。他希望大眾了解,通常通過數(shù)據(jù)挖掘軟件,實際上看到的用戶數(shù)據(jù)或者信息并不針對某個具體的人。

他介紹,很多國家的立法機構或者政府希望通過制定隱私保護法律來實現(xiàn)對用戶信息的保護。但是,由于對數(shù)據(jù)分析不了解,有些法規(guī)最終可能限制了用戶對信息和數(shù)據(jù)的使用。

例如,在某些國家要求電話的呼叫記錄最多只能保持90天,這種呼叫記錄只能夠用于計費目的,就限制了電信運營商對數(shù)據(jù)的保存,不能夠很好地來設計符合消費者或者用戶需求的電信產(chǎn)品,同時給定價方式也帶來很大限制,進而影響市場競爭。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2013-05-22
大數(shù)據(jù)時代沒有無效數(shù)據(jù)
5月22日消息,大數(shù)據(jù)廠商Teradata天睿公司CTO寶立明(Stephen Brobst)日前在2013 Teradata大數(shù)據(jù)峰會上向騰訊科技表示,不能一味的否定...

長按掃碼 閱讀全文