??導?讀
近年來,數字經濟迅猛發展成為拉動經濟增長的重要動力。而數據作為數字經濟發展的核心引擎,成為與土地、勞動力、資本、技術并駕齊驅的“新型生產要素”。

數據經紀人主要有三方面的職責:一是受托行權,即數據擁有者可以授權數據經紀人行使權力;二是風險控制,在數據流通交易過程中起到中介擔保作用;三是價值挖掘,挖掘數據要素價值,充當數據價值發現者、數據交易組織者、交易公平保障者、交易主體權益維護者等多重角色。
明晰“數據經紀人”概念后,接下來要解決的就是如何選取“數據經紀人”。經海珠區政務服務數據管理局深入研究,海珠區首創了“數據經紀人”分類分級標準:
-
根據“數據經紀人”自身基礎及業務范圍可劃分為技術賦能型、數據賦能型、受托行權型三個類別;
-
按照企業數據管理能力成熟度等級、信息安全等級保護等級、企業自有(或實際控制)數據規模等條件,以及相關試點企業數據采集和處理是否符合國家相關安全要求等因素,將“數據經紀人”分為三個等級。
2022 年 2 月,美國參議院公布的《刪除法案》(DELETE Act),將數據經紀人定義為“有意收集或獲取與其沒有直接關聯的個人信息的實體,該實體將這些信息用于:1)向第三方提供服務;2)出售、許可、交易、提供參考或其他向第三方提供個人信息并獲取報酬”。
類似的,在美國加州議會于2019年10月頒布的數據經紀人法案中,數據經紀人被定義為“業務是整合和出售與其業務并沒有關聯性的消費者數據”。
但在一些研究報告中,部分機構曾對數據經紀人給出了較為全面的定義。
例如,經合組織(Organization for Economic Co-operation and Development,OECD)在其 2013 年發布的數據市場研究報告中,將數據經紀人定義為“收集并整合個人信息,并將其進行出售以用于各類用途的公司”。類似的,在北約戰略通訊中心發布的一份關于數據經紀人的安全調研報告中將其定義為“收集其他公司所收集的數據,并對此加以整合,最后以商業目的出售這些數據”。而在 FTC 于 2014 年針對數據經紀人發布的報告中,將其定義為“從各種來源收集用戶的個人信息,并匯總、分析及共享這些信息或信息的派生產物,從而用于產品營銷、身份驗證或防范欺詐等用途,并以此類業務為主要收入來源的公司”,這一定義也被挪威的數據保護機構(Data Protection Agency,DPA)所采納。開放社會基金會(Open Society Foundations)則在其2016年發布的研究報告中綜合各種定義以及特征,將其定義為“從數據主體以外的數據源獲得數據,并以提供數據和行為預測為主要收入來源的公司或其他商業組織”。
此外,對于數據經紀人是否能夠構成一個獨立的概念,當前也存在一些不同的聲音。
例如,在美國人口普查局的登記信息中,數據經紀人并非一個單獨的類別,而是根據公司的具體業務而歸入“數據處理”、“信用報告服務”等具體領域。在歐盟,數據經紀人這一概念亦鮮被采用,取而代之的是信息轉售商(information resellers)、數據供應商(data vendors)、信息經紀人(information brokers)、消費者數據分析機構(consumer data analytics)、“數據倉庫”(data warehousing)等一系列代稱。在歐洲議會于 2022 年 4 月通過的《數據治理法》(Data Governance Act,DGA)中亦未采納數據經紀人這一概念,而是采用“數據中介服務提供者”(Data Intermediation Services Provider)、“數據合作社”(Data Cooperatives)、“數據利他主義組織”(Data Altruism Organisations)等相似概念。
數據交易平臺,包括居間型平臺和自營型平臺。前者指本身并不收集和存儲數據,而是主要作為數據交易信息發布的平臺,撮合供需雙方達成并順利履行交易,如上海數據交易所、美國的BDEX以及日本富士通公司的“Data plaza”等。居間型平臺是當前我國數據經紀人的發展形式。
根據中國信通院統計,在 2014-2017 年間,全國各地先后設立了 23 家數據交易所,而截止至 2021 年,國內已經成立了 28 家數據交易所;而隨著數據要素市場化的政策支持力度不斷增加,北京、廣東等地區也掀起了新的數據交易所建設的熱潮。此外,相較于政府主導建設的數據交易平臺所具有高度的封閉性,京東萬象等民間數據交易平臺則更為開放,中小企業也能夠參與到數據交易當中。
自營型數據交易平臺,則是自行從互聯網企業等各種數據源獲取并聚合、處理數據,而后將其出售給其他主體的數據經紀商,例如美國的Acxiom、Corelogic等大型數據經紀人。隨著數據經濟的發展,兩者之間也呈現出融合的趨勢,許多居間型平臺亦拓展其自營業務,直接向需求方出售自己獲取的數據。
數據銀行以個人授權或主動上傳數據作為主要數據來源,其給予個人一定的利益或支付一定的報酬,并將所收集的個人數據提供給其他主體有償使用。此種類型的數據經紀人與當下銀行的運營模式十分類似,其既能夠保證數據共享和流動的合法性,又能夠實現數據的增值,并使個人能夠分享其數據帶來的收益。相較于缺乏透明度和正當性的B2B模式,此種模式更能體現出人在信息社會的中心性。
Mydata模式是當前數據銀行模式的典型代表。Mydata模式是一類以個人為中心的數據管理模式的總稱,其最早的實踐可以追溯到英國的Midata項目,此后出現的Mydata Global等組織則擴大了此種模式的規模。
Midata項目由英國政府和能源、金融等重要行業的頭部企業共同發起,其主要致力于將企業所收集的數據歸還給個人,并以此促進數據的可攜帶性,從而推動個人數據的再利用以及數據服務的不斷創新。在其憲章中,Midata項目圍繞提高數據的通用性以及保障個人對數據的控制權,提出了個人賦權、透明度、可獲取性、數據安全、數據創新等多項原則。但Midata并沒有達到英國政府的預期。而后出現的Mydata模式,以實現個人信息權利、改善數據規制現狀以及打破平臺的鎖定效應為目標,目前已經擴展到歐盟、韓國。
從韓國在金融數據服務領域的實踐來看,市場對此種模式的反應并不熱烈,認為其所提供的數據服務與現有的并無區別。此外,Mydata如何與Google、Apple等大型互聯網企業所構建的自有數據生態進行競爭,如何使用戶從免費的數據服務轉向收費的Mydata賬戶,都是Mydata模式尚待解決的問題,也是未來數據銀行這一數據經紀人模式發展所面臨的困境。
數據合作社,是將提供者自愿共享的數據進行結構化處理、聚合后,允許第三方在其數據上進行分析、研究的一種個人數據管理模式。此外,筆者注意到,大部分文獻在介紹數據合作社這一概念時均會提及“數據使用者需要向數據提供者支付費用或提供更好的服務”。
但在實踐中對于數據使用者是否需要向數據提供者支付費用,或為數據合作社的成員提供更好的服務以免除費用,有不同的意見。例如,成立于瑞士的MIDATA便在其章程當中明確規定,為避免數據倫理問題,其禁止個人通過MIDATA向第三方銷售他們的個人數據或因提供個人數據而獲得折扣、返利等利益的行為。
類似的,在歐洲議會通過的《數據治理法》中,也對“數據合作社”這一數據經紀人模式進行了規定,但其被稱為 “數據利他主義組織”(Data Altruism Organisations)。DGA允許此類組織基于科學研究、醫療保健等公共利益的目的,將經過個人同意而提供的個人數據以及非個人數據用于機器學習、數據分析等用途。但與一般的數據合作社不同,此類組織的公益性質更強,其并不需要向提供數據的個人給予利益的回報。而Driver’s Seat、Fairbnb以及Data Worker’s Union等數據合作社則相反,其將個人數據提供給第三方的同時,需要向第三方收取費用,并將其收入分配給數據提供者或向數據提供者提供更好的服務。
不同的數據經紀人所采用的運營和管理模式并不統一。但其中較為主流的是由購買了數據經紀人組織所發行的股份的會員進行管理,例如瑞士的MIDATA在其章程中規定,每個會員都需要購買一份其發行的股票證書,而MIDATA的重大事項將由這些會員所組成的會員大會進行決定 ;類似的,要成為歐洲的健康數據合作社(Health Data Cooperative,HDC)的一員,個人必須一次性支付一筆會員費,而會員們有權以一人一票的方式對HDC的事項進行決定。而上述兩種模式也并非完全相同,如MIDATA的賬戶所有者身份與會員身份相分離,這意味著擁有MIDATA賬戶并不需要支付費用;而HDC則是會員身份與用戶身份一體化,要擁有HDC賬戶以存儲健康數據,必須事先支付會員費。
數據信托,在不同國家的表現形式不同。美國的數據信托被稱為“信息受托人”,該模式下,并沒有獨立的第三方機構,而是施加給數據處理者一個額外的信義義務。英國的數據信托是一個包含委托人、受托人、受益人的三方機構,是一種提供獨立數據管理的法律結構,受托人代表個人管理個人數據或數據權利,且其管理行為應以委托人的利益為優先。數據信托允許個人或機構將數據的控制權交給一個獨立的機構,同時授權該機構對數據的使用和分享作出決定,而該機構對數據提供者承擔信托責任,即其需要以公正、謹慎、透明和忠誠的原則來管理和分享數據。
數據信托可以有效地平衡數據保護與數據共享之間的關系。在個人數據保護方面,數據信托被認為其能夠通過普遍凝聚個人的力量,從而扭轉當前個人與互聯網巨頭之間實力不平衡的局面,因而被認為是一種可行的數據治理方案,其更是被《麻省理工科技評論》列為2021年的“十大突破性技術”。而在數據流動方面,數據信托能夠拓展數據需求方獲取數據的途徑,從而最大程度地挖掘數據的社會和經濟價值,并最大程度避免因數據流動而帶來的風險和損害。我國學者也對數據信托給予了高度的期待。例如,馮果教授認為數據信托模式有助于實現我國隱私保護的最大化,解決個人信息領域維權困難、維權成本高等突出問題。類似的,翟志勇教授認為英國的數據信托理論和實踐對于我國有著重要的借鑒意義,可以嘗試分領域、分行業地進行數據信托的嘗試。
在當下,許多國家和地區正在對數據信托的試點與推廣表現出極大的興趣。在DGA中,其所提出的“數據中介”(personal data-sharing intermediary)概念與數據信托十分類似,該機構被要求具有獨立性、中立性,且需要對個人承擔信托責任;但其所受到的監管和限制較一般的數據信托要更為嚴格,包括嚴格限制對數據進行二次處理以及派生數據的分享。此外,發展數據信托也被納入加拿大的《數據憲章》(Canada’s Digital Charter in Action)當中。但與政策層面的如火如荼相比較,數據信托的實踐亟待加強。雖然當前已經存在一些向提供數據的個人進行利潤分配的數據經紀人,如Datacoup,但其并不向用戶承擔信托責任。
數據空間,指由個人、企業等數據提供者以及數據中介所組成的組織,組織中的成員遵循統一的數據保護規則以及數據標準,其致力于在成員之間構建互信的關系,從而使數據能夠在數據空間內以較低的成本及阻力進行流通,使數據能夠發揮最大的價值。
數據空間這一概念已經在工業、醫療健康等領域得到實踐。以全球數據空間(International Data Spaces,IDS)為例,作為一個以工業數據共享為主要業務的非盈利組織,其致力于構造一個在可信的合作伙伴之間安全、自主地交換數據的體系;截至 2022 年,已經有包括華為、IBM、奧迪等公司在內的超過 120 個成員加入這一數據空間當中,并且其已經制定并出臺了一系列的數據規則和標準以供組織成員遵守。
類似的,歐盟也正在積極構建歐洲范圍內的健康數據空間。在 2021 年發布的一份評估成員國根據GDPR處理健康數據規則的研究報告中,歐盟委員會認為歐盟需要推動統一的立法,并且在基礎設施、數據兼容性等方面采取更為統一的行動,從而構建一個歐洲健康數據的共享空間(European Health Data Space)。?
數據空間往往較其他類型的數據經紀人更為開放、包容。以全球數據空間協會(International Data Spaces Association,IDSA)為例,其在發布的白皮書中便明確表示IDSA將致力于融入到當前已經存在的系統和標準當中,并與其他的系統保持兼容,而不是重新構建新的系統;且IDSA也并不局限于工業領域,而是同時兼顧橫向的領域擴張和縱向的深入發展。此外,IDSA還以構建數據主權的開放性、全球性標準為其發展原則,任何人都能夠自由使用和參與這一標準,從而滿足中小企業對低成本、低門檻數據市場的需求。
數據開發商,是根據企業或個人的特定需求,對其所提供的軍事、商業等領域的數據提供大數據分析服務,從而挖掘數據的價值,幫助客戶從海量的數據中挖掘出對其有用的數據,并轉換為通俗易懂的輸出結果。與上述類型的數據經紀人不同,數據開發商主要提供的是數據挖掘、分析服務,其競爭優勢更多取決于其所提供的數據分析技術能否契合客戶的需求。
此外,盡管數據開發商都宣稱其數據來源于公開等合法渠道,但是如Palantir等數據開發商所從事的數據分析服務經常涉及國家安全、反恐、軍事等敏感數據,因此其所分析的數據往往是滿足敏感行業的個性化需求,此類數據不能夠如其他數據經紀人一般對外提供。
隨著大數據技術的發展和普及,數據開發商的數量也在不斷增長,除了已經在美國上市的Palantir外,亞馬遜的AWS也提供數據分析服務;在國內,帆軟、神策數據等專門提供數據分析服務的公司規模也在不斷擴大,阿里云、華為云等也提供了數據分析服務。
轉載自:數據觀