首頁 行業(yè) 活動 項目 快訊 文娛 時尚 娛樂 科技 汽車 綜合 生活

數(shù)據(jù)造假成“套路” 最終傷害了誰?

2018-11-06 10:26:06 來源:中國青年報

“刷量”“買粉”“偽創(chuàng)作”

數(shù)據(jù)造假成“套路” 最終受傷的是誰

一篇自媒體文章不僅引起了公眾對旅游社區(qū)平臺馬蜂窩點評內(nèi)容抄襲的質(zhì)疑,也捅開了互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)造假的“馬蜂窩”。

在對“是否存在內(nèi)容抄襲或數(shù)據(jù)造假”的質(zhì)疑諱莫如深數(shù)天后,馬蜂窩聯(lián)合創(chuàng)始人兼CEO陳罡承認(rèn),其“在餐飲等點評數(shù)據(jù)方面存在部分問題,但遠(yuǎn)沒有外界所表述的那么夸大”。然而,業(yè)內(nèi)人士指出,互聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)造假遠(yuǎn)比想象的更嚴(yán)重,而且造假套路也呈現(xiàn)“道高一尺魔高一丈”的趨勢。

從最早的電商刷單、刷好評,到之后的微信公眾號買粉、刷閱讀量,再到網(wǎng)絡(luò)直播平臺買流量、App機(jī)器人用戶充數(shù)據(jù),各類數(shù)據(jù)造假的手段不斷翻新,而真實數(shù)據(jù)成為難以獲知的“高度機(jī)密”。

難道沒有機(jī)制可以識別、約束這些“套路”嗎?事實上,一些平臺企業(yè)和投資機(jī)構(gòu)早已嘗試通過反爬蟲 、第三方數(shù)據(jù)調(diào)查等技術(shù)手段預(yù)防和應(yīng)對數(shù)據(jù)造假,但是效果并不好。另外,部分投資機(jī)構(gòu)出于種種考慮,默認(rèn)一些互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)造假行為,甚至與之合謀。技術(shù)難題也隨之成為更加復(fù)雜的人性謎題。

進(jìn)步最快的是造假的方式

在“馬蜂窩事件”中,備受質(zhì)疑的一個數(shù)據(jù)造假“套路”是,不少用戶在其他平臺的旅行攻略、點評內(nèi)容,被搬運(yùn)到馬蜂窩上。實際上,此類做法并不新鮮。

今年7月,生活社區(qū)小紅書通過官方微博指責(zé)大眾點評大量抄襲其用戶的內(nèi)容。具體做法是批量建立虛假賬號,抄襲及搬運(yùn)用戶在小紅書發(fā)布的原創(chuàng)內(nèi)容。據(jù)小紅書估計,抄襲的數(shù)量在百萬條量級。

一些用戶專門為小紅書平臺創(chuàng)作的內(nèi)容被“copy”后,依然留著原本內(nèi)容的影子。小紅書用戶“詹小豬Coco”曾于6月6日發(fā)視頻慶祝小紅書創(chuàng)立紀(jì)念日,“copy”后,文案竟變成了“祝點評生日快樂”,但視頻中用戶說的仍然是“小紅書”,而且6月6日也不是大眾點評的“生日”。

當(dāng)時,大眾點評方面對此回應(yīng)稱,這是因為新上線試運(yùn)營的推薦欄目在未經(jīng)授權(quán)的情況下對相關(guān)內(nèi)容進(jìn)行了違規(guī)轉(zhuǎn)載,已第一時間完成所有內(nèi)容排查與全部清理下線,并通過技術(shù)手段確保該類問題不再出現(xiàn)。

段民(化名)從2002年開始從事數(shù)據(jù)挖掘工作,是國內(nèi)最早一批大數(shù)據(jù)行業(yè)應(yīng)用的開拓者。他告訴中國青年報·中青在線記者,這類搬運(yùn)其他平臺內(nèi)容為己所用的行為,屬于常見的“偽創(chuàng)作”造假套路,即通過網(wǎng)絡(luò)爬蟲軟件,將其他平臺的數(shù)據(jù)和內(nèi)容復(fù)制過來,稍加修改后變成自己的內(nèi)容。與其他造假手法相比,這類做法更隱蔽,需要專業(yè)人士持續(xù)跟蹤 、分析 、比對才能發(fā)現(xiàn)。

段民表示,除“偽創(chuàng)作”以外,互聯(lián)網(wǎng)內(nèi)容平臺常見的數(shù)據(jù)造假“套路”還包括虛報數(shù)據(jù)、“僵尸用戶”、虛假行為等。前兩種“套路”因用戶了解有限,平臺與用戶之間存在一定門檻,往往難以得知;而通過機(jī)器人冒充真實用戶,訪問網(wǎng)站或App從而增加流量或點擊量的虛假行為,是離普通用戶最近的一種造假“套路”。

微博、微信等平臺的“刷量”“買粉”,是其中的典型代表。2016年9月末,因微信官方的后臺調(diào)整行為,屏蔽了公眾號刷量工具的操作,許多自媒體大V的真實用戶和閱讀數(shù)量顯現(xiàn)出來。此前一周平均閱讀量上萬的公眾號,在當(dāng)天最少的閱讀量只有200;此前閱讀量在10萬以上的公眾號,當(dāng)天的閱讀量只有2萬左右。

此外,一些音視頻節(jié)目的播放量也出現(xiàn)造假。此前,在國內(nèi)首起因視頻網(wǎng)站“刷量”而引發(fā)的不正當(dāng)競爭案件中,被告杭州飛益信息科技有限公司針對愛奇藝 、優(yōu)酷土豆、騰訊視頻等主流視頻網(wǎng)站上的視頻內(nèi)容“刷量”,對某個視頻節(jié)目“刷量”1萬次,僅收費(fèi)15元。

上海市徐匯區(qū)人民法院公布的信息顯示,飛益公司多名員工通過多個域名、不斷更換訪問IP地址等方式,連續(xù)訪問愛奇藝網(wǎng)站視頻,在短時間內(nèi)迅速提高視頻訪問量,僅2017年2月1日至6月1日,飛益公司在愛奇藝網(wǎng)站制造了不少于9.5億余次的虛假訪問,按照該公司每萬次15元的刷量收費(fèi)標(biāo)準(zhǔn),共非法獲利上百萬元。

技術(shù)的發(fā)展讓造假成本更低

與“刷量”“買粉”“偽創(chuàng)作”等內(nèi)容平臺的造假手法相比,夸大用戶和產(chǎn)品交易數(shù)據(jù),則是互聯(lián)網(wǎng)平臺上更直接,也更難被發(fā)現(xiàn)的數(shù)據(jù)造假方式。

2015年,有業(yè)內(nèi)技術(shù)人員在知名社區(qū)“知乎”上爆料,通過反向編譯蜻蜓FM安卓版本軟件,他發(fā)現(xiàn)蜻蜓FM軟件中隱藏有名為“普羅米修斯”和“宙斯”的強(qiáng)行自啟代碼。前者可以在用戶不知情的情況下,在手機(jī)后臺啟動無窗口透明界面;后者則可以自主觸發(fā)廣告商的廣告,并回傳給第三方數(shù)據(jù)公司,從而完成“用戶自主點擊廣告”的操作。

因為普通用戶很難發(fā)現(xiàn)這種技術(shù)方法,而且可以提高日活躍用戶數(shù)(DAU)等數(shù)據(jù)指標(biāo),所以該爆料甫一出現(xiàn),便立即引發(fā)關(guān)注。對此,蜻蜓FM曾回應(yīng)稱,相關(guān)代碼是用于新功能上線時進(jìn)行AB對照測試、統(tǒng)計相關(guān)用戶指標(biāo)。

不過,這類說法未能解釋該平臺的日活用戶數(shù)量和廣告點擊量為何突然增加。此前,蜻蜓FM在宣布用戶數(shù)量達(dá)到1.5億的兩個月之后,就宣布用戶數(shù)突破2億,許多業(yè)內(nèi)人士懷疑該數(shù)據(jù)的真實性。

除這類由專業(yè)人士爆料的案例之外,也有一些平臺可能因一些“長相奇怪”的數(shù)據(jù)而引起質(zhì)疑。同樣在2015年,互聯(lián)網(wǎng)農(nóng)業(yè)公司一畝田因出現(xiàn)“9小時前李老板采購了1073741.8235噸洋蔥”“6小時前劉老板采購了999.999噸毛桃”等數(shù)額怪異的交易信息而陷入數(shù)據(jù)造假疑云中。

彼時,一畝田展示了其過去一年的交易后臺數(shù)據(jù),并稱一畝田網(wǎng)站確實還有一些產(chǎn)品和數(shù)據(jù)不夠完善,仍處于數(shù)據(jù)測試階段。

中國首席數(shù)據(jù)官聯(lián)盟專家成員鮑忠鐵表示,許多面向用戶端的互聯(lián)網(wǎng)企業(yè)都希望講述一個快速增長的“獨(dú)角獸”的故事,而市場份額、客戶數(shù)量、日活用戶等數(shù)據(jù)就成了體現(xiàn)企業(yè)估值快速提高的重要指標(biāo)。

鮑忠鐵在移動互聯(lián)網(wǎng)界工作多年,他對一些App宣稱的用戶數(shù)量嗤之以鼻。據(jù)他的觀察,很多App的下載量和用戶量都可以通過技術(shù)手段造假:

因為安卓系統(tǒng)的開放性,破解系統(tǒng)權(quán)限后,一臺平板電腦設(shè)備上甚至可以裝十多個同樣的App,配合不需實名制的虛擬運(yùn)營商電話卡,可以形成十多個看似真實 、獨(dú)立,實則批量化虛假的用戶。而且,由于虛擬運(yùn)營商的手機(jī)號可以包月使用,這樣的造假手法成本得以進(jìn)一步降低。

當(dāng)數(shù)據(jù)造假變成一場合謀

數(shù)據(jù)造假的“套路”如此大行其道,甚至已經(jīng)形成特定的產(chǎn)業(yè)鏈條,為何會出現(xiàn)如此局面?

前海梧桐合伙人王蔚分析,互聯(lián)網(wǎng)企業(yè)比較常見的是在運(yùn)營數(shù)據(jù)上造假,包括用戶數(shù)據(jù) 、產(chǎn)品數(shù)據(jù) 、財務(wù)數(shù)據(jù)等,因為這類數(shù)據(jù)可以幫助企業(yè)獲得激烈競爭中的優(yōu)勢地位,提升業(yè)務(wù)合作報價。

此外,早期互聯(lián)網(wǎng)企業(yè)的投融資估值一般采用流量法或市銷率法,夸大的運(yùn)營數(shù)據(jù)一般會對應(yīng)更高的估值。王蔚表示,在運(yùn)營數(shù)據(jù)造假以外,還有不少互聯(lián)網(wǎng)企業(yè)在融資經(jīng)歷 、融資金額等方面也會造假。“我們都習(xí)慣了,官宣融資額除以510有可能更接近真實數(shù)據(jù)。”

王蔚認(rèn)為,除互聯(lián)網(wǎng)企業(yè)自身競爭需求和融資需求驅(qū)動外,投資人作為另一重要的參與方,在數(shù)據(jù)造假問題上也不是沒有責(zé)任的。由于財務(wù)投資者需要在投資互聯(lián)網(wǎng)公司時“低買高賣”,有時候為了推高企業(yè)估值以便實現(xiàn)股權(quán)退出,也會成為數(shù)據(jù)造假的協(xié)同者。

值得注意的是,投資機(jī)構(gòu)在企業(yè)數(shù)據(jù)造假中扮演的角色非常微妙。在成為某些企業(yè)的投資者之前,也會通過一些技術(shù)手段發(fā)現(xiàn)或破解刷量、刷粉等數(shù)據(jù)造假的手法。

遠(yuǎn)瞻資本合伙人秦崗表示,由于許多公司數(shù)據(jù)“注水”,大多數(shù)投資機(jī)構(gòu)不再將企業(yè)自己公布的數(shù)據(jù)作為評判一個創(chuàng)業(yè)公司或產(chǎn)品的主要指標(biāo),可能會聘請第三方數(shù)據(jù)機(jī)構(gòu)來開展盡職調(diào)查,以驗證各項數(shù)據(jù)指標(biāo)的真實性。

不過,秦崗也指出,這類做法一般出現(xiàn)在投資項目比較成熟的中晚期,或投資金額較大的情況下。對于早期創(chuàng)業(yè)項目,或投資金額不夠大的項目,很多投資機(jī)構(gòu)往往沒有相應(yīng)的預(yù)算。

鮑忠鐵表示,對于網(wǎng)站、App的真實運(yùn)營數(shù)據(jù),網(wǎng)絡(luò)運(yùn)營商一清二楚。“App什么時間打開,什么時間關(guān)閉,裝在哪些設(shè)備上,通過運(yùn)營商的DPI數(shù)據(jù)是可以解析出來的。”但令人遺憾的是,這類真實數(shù)據(jù)往往得不到重視,一些VC投資機(jī)構(gòu)、第三方數(shù)據(jù)公司也不會充分利用這些數(shù)據(jù)。“沒人做這個事情,因為對別人只有害、沒有利。”

鮑忠鐵也注意到,有些第三方監(jiān)測軟件或第三方數(shù)據(jù)咨詢公司有時也會充當(dāng)數(shù)據(jù)造假的“幫兇”。一些在業(yè)內(nèi)頗有名氣的第三方數(shù)據(jù)咨詢公司所公布的特定App的下載量、月活用戶等數(shù)據(jù),也經(jīng)常被質(zhì)疑。

例如,國內(nèi)知名數(shù)據(jù)研究機(jī)構(gòu)艾瑞咨詢曾發(fā)布的數(shù)據(jù)產(chǎn)品,就被今日頭條、“大姨媽”等平臺質(zhì)疑可能弄虛作假。2017年年底,艾瑞咨詢聯(lián)合美柚App發(fā)布的《2017年中國女性生活形態(tài)研究報告》顯示,美柚的月度總有效使用時長占據(jù)所有經(jīng)期管理類App的95%,這也意味著,“大姨媽”等其他經(jīng)期管理App的閱讀有效使用時長加起來還不到5%,這被“大姨媽”指責(zé)為“收錢說瞎話”。

“造假是‘多贏’的”,這已經(jīng)成為數(shù)據(jù)產(chǎn)業(yè)鏈病態(tài)發(fā)展的一個奇怪結(jié)論。重慶大學(xué)網(wǎng)絡(luò)與大數(shù)據(jù)法治戰(zhàn)略研究院院長齊愛民分析,企業(yè)運(yùn)營數(shù)據(jù)和融資數(shù)據(jù)“好看”了,既方便部分投資機(jī)構(gòu)退出,也能讓“刷量”的水軍商家從中牟利;內(nèi)容方可以通過大量刷取點擊量,炮制市場火爆的假象,進(jìn)而吸引真實用戶的目光;平臺方也需要通過這種假象來營造優(yōu)質(zhì)平臺的形象,從而進(jìn)一步吸引廣告投放。

鮑忠鐵認(rèn)為,刷單等數(shù)據(jù)造假行為的根本原因,還是“to VC”的創(chuàng)業(yè)模式泛濫,無論創(chuàng)業(yè)團(tuán)隊還是投資機(jī)構(gòu),都希望快速將企業(yè)估值做大,針對這類作假行為,相應(yīng)的監(jiān)督還缺乏執(zhí)行力。

王蔚表示,數(shù)據(jù)造假屬于不正當(dāng)獲益的商業(yè)手段,最終仍需要社會埋單,但很難用道德約束或行業(yè)自律的方法去治理,或許還是“底線管理”原則更加適用:從立法上界定清楚“數(shù)據(jù)造假”和“商業(yè)欺詐”違法犯罪行為之間的聯(lián)系,抬升“數(shù)據(jù)造假”的獲益成本。(王林 張均斌)

關(guān)鍵詞:

上一篇:服務(wù)消費(fèi)勢頭強(qiáng)勁 將成為新的經(jīng)濟(jì)增長點

下一篇:你能區(qū)分感冒和鼻炎嗎?

責(zé)任編輯:

最近更新

點擊排行
推薦閱讀