如果您不方面閱讀文章,可收聽通過人工智能技術(shù)自動(dòng)生成的語音。此語音技術(shù)由百度廣播開放平臺(tái)(內(nèi)測(cè))提供,歡迎將收聽后的意見反饋給我。 歷時(shí)兩年的微博與脈脈之爭(zhēng)終于有了結(jié)果:法院認(rèn)定脈脈非法抓取、使用微博用戶信息行為構(gòu)成不正當(dāng)競(jìng)爭(zhēng),一審判決脈脈停止不正當(dāng)競(jìng)爭(zhēng)行為,并賠償原告經(jīng)濟(jì)損失等220余萬元。兩年前我有關(guān)注到微博與脈脈的數(shù)據(jù)之爭(zhēng),這在口水戰(zhàn)每天都發(fā)生的互聯(lián)網(wǎng)圈本來不算什么大事。但這次法院判決結(jié)果,還是挺出人意料的。毫不夸張地說,這一事件給互聯(lián)網(wǎng)公司敲響了關(guān)于用戶數(shù)據(jù)保護(hù)的警鐘。 一個(gè)常規(guī)的數(shù)據(jù)抓取糾紛 先簡(jiǎn)單說一下微博和脈脈之爭(zhēng)的來龍去脈。 2014年8月公開鬧掰:微博宣布停止脈脈使用的微博開放平臺(tái)所有接口,理由是“脈脈通過惡意抓取行為獲得并使用了未經(jīng)微博用戶授權(quán)的檔案數(shù)據(jù),違反微博開放平臺(tái)的開發(fā)者協(xié)議”。與此同時(shí),脈脈宣布終止支持微博登錄,并通過一些郵件截圖曝光微博此舉,是因其投資脈脈不成,索要脈脈用戶關(guān)系數(shù)據(jù)受阻后的報(bào)復(fù)。就像所有口水戰(zhàn)一樣,雙方各執(zhí)一詞、真相撲朔迷離。 2015年3月對(duì)簿公堂:微博主體公司于2015年3月將脈脈主體公司告上法庭,微博脈脈之爭(zhēng)升級(jí)。 微博起訴理由主要有脈脈非法獲取和使用微博信息,商業(yè)詆毀等。 在用戶微博登錄脈脈并上傳個(gè)人通訊錄之后,大量非脈脈用戶的微博頭條、昵稱、職業(yè)、教育等信息出現(xiàn)在脈脈上,這些信息并不在微博OPEN API之中,并且在微博停止脈脈所有接口權(quán)限之后,脈脈依然進(jìn)行了相關(guān)數(shù)據(jù)抓取,微博認(rèn)為脈脈通過非法手段獲取信息。除此之外,微博認(rèn)為在雙方“鬧掰”之后脈脈發(fā)表的公開言論對(duì)微博商譽(yù)構(gòu)成了詆毀,脈脈采取了類似于微博加V認(rèn)證的機(jī)制和界面設(shè)計(jì),構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。 法院認(rèn)定,脈脈繞過OPENAPI抓取數(shù)據(jù)的行為,危害到微博用戶信息安全,損害了微博合法競(jìng)爭(zhēng)利益,對(duì)其構(gòu)成不正當(dāng)競(jìng)爭(zhēng),商業(yè)詆毀成立,判決脈脈停止不正當(dāng)競(jìng)爭(zhēng)行為,并賠償原告經(jīng)濟(jì)損失等220余萬元。 類似訴訟在互聯(lián)網(wǎng)行業(yè)屢見不鮮。
這些案例均是某平臺(tái)因內(nèi)容被抓取起訴抓取方,在數(shù)據(jù)為核心資產(chǎn)之一的互聯(lián)網(wǎng)產(chǎn)業(yè),“數(shù)據(jù)糾紛”只會(huì)越來越多。 平臺(tái)用戶數(shù)據(jù)受法律保護(hù) 從法院一審的判決邏輯來看,是否保護(hù)用戶信息已成數(shù)據(jù)糾紛中的法律準(zhǔn)繩。 海淀法院在“世界知識(shí)產(chǎn)權(quán)日”公開宣判這一案件,或許不是巧合。其明確表示,“大數(shù)據(jù)時(shí)代,保護(hù)用戶信息是衡量經(jīng)營(yíng)者行為正當(dāng)性的重要依據(jù),也是反不正當(dāng)競(jìng)爭(zhēng)法意義上尊重消費(fèi)者權(quán)益的重要內(nèi)容。”這表明,用戶權(quán)益被擺在最優(yōu)先位置。 在“人肉”這類網(wǎng)絡(luò)暴力頻發(fā)、用戶資料屢屢泄露的大環(huán)境下,這一判決具有示范意義。平臺(tái)在業(yè)務(wù)設(shè)計(jì)上必須充分考慮用戶信息保護(hù),確保用戶信息不被濫用,隱私數(shù)據(jù)不遭泄露,同時(shí)確保用戶對(duì)個(gè)人信息的使用有知情權(quán)。 在保護(hù)用戶利益之后,才是平臺(tái)利益。 值得注意的是,用戶信息與用戶數(shù)據(jù)并不是一回事,比如你在微信公眾賬號(hào)發(fā)的文章,算是用戶數(shù)據(jù),但你個(gè)人微信昵稱、頭像這些資料,才算是用戶信息。但究竟哪些屬于用戶隱私則很難說,你上傳到平臺(tái)的照片肯定是隱私數(shù)據(jù),但你發(fā)的公開微博就不一定了。那么,不具備“個(gè)人隱私”屬性的數(shù)據(jù)是否受法律保護(hù)呢?如果有人繞過接口,抓取用戶發(fā)的微博而不是個(gè)人信息,會(huì)有不同的結(jié)果嗎? 這里有一個(gè)案例:百度起訴360違反Robots協(xié)議抓取知道、百科等數(shù)據(jù)的糾紛就是這樣的情況,法院尊重Robots協(xié)議和平臺(tái)對(duì)UGC數(shù)據(jù)的權(quán)益,360被判賠償百度70萬元。就是說,UGC內(nèi)容的創(chuàng)建者是誰并不重要,搭建平臺(tái)網(wǎng)站投入運(yùn)營(yíng)、技術(shù)和人力成本,擁有對(duì)數(shù)據(jù)的使用權(quán)和分發(fā)權(quán)。如果第三方網(wǎng)站違背意愿進(jìn)行抓取,就可能被判為不正當(dāng)競(jìng)爭(zhēng)。 數(shù)據(jù)是互聯(lián)網(wǎng)公司的核心資產(chǎn),不論是個(gè)人信息還是UGC數(shù)據(jù)(微博、文章、點(diǎn)評(píng)等),所有這些平臺(tái)數(shù)據(jù)都將受到法律保護(hù),平臺(tái)對(duì)這些數(shù)據(jù)擁有所有權(quán)、使用權(quán)和分發(fā)權(quán)。 互聯(lián)網(wǎng)公司應(yīng)提防數(shù)據(jù)糾紛 互聯(lián)網(wǎng)公司想要利用別家平臺(tái)的數(shù)據(jù)時(shí),必須遵循對(duì)方的公共API協(xié)議,或Robots爬蟲協(xié)議,抑或通過正式協(xié)議合作。數(shù)據(jù)受法律保護(hù)?;ヂ?lián)網(wǎng)公司不能違背某平臺(tái)意愿抓取其數(shù)據(jù)——在技術(shù)上或許并不難,可通過爬蟲等手段繞過限制,實(shí)現(xiàn)數(shù)據(jù)抓取,但這樣做很可能會(huì)吃官司,并且敗訴幾率相當(dāng)高。 因?yàn)閿?shù)據(jù)抓取糾紛而對(duì)簿公堂的案例還不算多,但數(shù)據(jù)抓取行為在互聯(lián)網(wǎng)行業(yè)卻很常見,比如許多平臺(tái)都能看到豆瓣電影評(píng)分?jǐn)?shù)據(jù),再比如一些導(dǎo)購(gòu)網(wǎng)站聚合了電商平臺(tái)的評(píng)論,還有平臺(tái)將微信公眾賬號(hào)所有文章都聚集起來…這些行為理論上來說都有數(shù)據(jù)糾紛的風(fēng)險(xiǎn),如果你做得不夠大平臺(tái)一般也沒這個(gè)精力理你,但萬一你某天做到了呢?況且,很多大公司也這樣干。 對(duì)于數(shù)據(jù)的獲取和使用,不再是一個(gè)技術(shù)問題、商業(yè)問題、道德問題,而是一個(gè)法律問題,所以,請(qǐng)看好你家的爬蟲。 |
|