每年頻繁的數據泄露事件總會帶來壹些教訓,其中之壹就是采取數據保護措施永遠不會太遲。幸運的是,公司越來越重視數據隱私,大數據是他們最關註的領域之壹。
就在昨天,微軟五名前員工在接受路透社采訪時表示,微軟的漏洞報告數據在2013年曾被非法入侵,但這壹事件當時並未曝光。
微軟前員工表示,微軟花了壹個多月的時間修復了被黑數據庫中列出的所有安全漏洞,因此泄露的漏洞信息不會對Windows產品的用戶造成太大影響。當時,微軟還聘請了第三方公司對事件進行調查,以查明是否有攻擊者利用泄露的漏洞信息對網絡發動攻擊,但該公司並未發現任何與相關漏洞有關的攻擊。
Mary Shacklett是技術研究和市場開發公司Transworld Data的總裁。作為業內人士,她給企業管理層壹些建議,以確保他們的大數據采用可靠的數據隱私做法。
實現匿名的壹種方法是加密個人識別的數據元素。另壹種方法是找出價值相近的個體的數據,然後平均成壹個綜合收益值,這個綜合收益值會整合到更大的數據分析中。其他方法包括數據修正或屏蔽。
收集政府、企業和個人產生的數字信息為基於知識和信息的決策創造了巨大的機會。在互利的驅動下,數據可以在需要的各方之間交換和發布。然而,在其原始形式下,數據通常包含敏感的個人信息,公布這些數據將侵犯個人隱私。聚合數據發布下的隱私保護是壹個重要且具有挑戰性的問題。現有技術大多采用泛化和整體刪除方法,我們提出部分(partial)刪除方法對聚合數據進行匿名化。這種方法確保了無論攻擊者有多少先驗知識,關於敏感信息的強關聯規則將不再出現在匿名化的數據中。這種方法不僅大大減少了信息損失,而且根據下遊使用場景的要求,提供了傾向於保持原始數據分布或保護挖掘的有用關聯規則的選擇。初步評估表明,我們的方法在保持原始數據分布、保留更多有用的可挖掘關聯規則和僅引入少量虛假規則方面比其他方法好100倍以上,信息損失平均減少30%左右。
以上只是數據隱私方面的部分工作。保護數據隱私的方法更多,比如確定公司內部涉及大數據的部門,定期審核這些部門的數據隱私。最後,在制定和實施數據隱私保護措施時,需要以企業的業務需求和發展為基礎。