4個(gè)數(shù)據(jù)分析陷阱&如何避免它們
被曲解的數(shù)據(jù)甚至?xí)`導(dǎo)我們最好的人。看看數(shù)字營(yíng)銷常見(jiàn)的四種數(shù)據(jù)分析陷阱,以及如何批判性思考并避免它們的一些敏銳的技巧。
數(shù)字營(yíng)銷是一個(gè)自豪的數(shù)據(jù)驅(qū)動(dòng)的領(lǐng)域。然而,作為SEO,我們經(jīng)常有這樣的不完整或有問(wèn)題的數(shù)據(jù)的工作,我們最終做出錯(cuò)誤的結(jié)論,我們?cè)噲D證明我們的論點(diǎn)或量化我們的問(wèn)題和機(jī)會(huì)。
在這篇文章中,我將概述4個(gè)在我們行業(yè)中普遍存在的數(shù)據(jù)分析陷阱,以及如何避免它們。
1。妄下結(jié)論
今年早些時(shí)候,我做了一個(gè)關(guān)于品牌知名度的排名因素研究,我發(fā)布了這個(gè)警告:
“……域名權(quán)威(或品牌搜索量,或其他任何東西)與排名正相關(guān)的事實(shí)可能表明以下任何一個(gè)或全部:
鏈接導(dǎo)致網(wǎng)站排名好
排名好導(dǎo)致網(wǎng)站獲得鏈接
大約第三個(gè)因素(例如站點(diǎn)的聲譽(yù)或年齡)會(huì)導(dǎo)致站點(diǎn)同時(shí)獲得鏈接和排名。
我~
但是,我想更深入地研究這個(gè)問(wèn)題,并給你一個(gè)分析這些框架的框架,因?yàn)樗匀挥泻芏?。帶,例如,最近的這項(xiàng)研究由石廟,你可能在這張前10或蘭德的微博看到這篇優(yōu)秀的文章,或討論SEMRush最近的直接交通研究。說(shuō)得很清楚,我不是在批評(píng)這兩項(xiàng)研究,但我想提請(qǐng)大家注意我們?nèi)绾谓忉屗鼈儭?/p>
首先,我們會(huì)遭受一點(diǎn)確認(rèn)偏差-我們都太急于喊過(guò)“相關(guān)性與因果關(guān)系的區(qū)別é”當(dāng)我們看到成功的網(wǎng)站,關(guān)鍵字,但也同意當(dāng)我們看到研究的東西我們認(rèn)為是有效的或是做同樣的事,如鏈接。
第二,我們不能批判性地分析潛在的機(jī)制。選擇不只是因果關(guān)系或巧合。
在你根據(jù)相關(guān)性得出結(jié)論之前,你必須考慮各種可能性:
完全符合
反向因果關(guān)系
共同原因
線性度
廣泛的適用性
如果這些都沒(méi)有任何意義,那就夠公平了-它們是行話。讓我們舉一個(gè)例子:
我警告你不要吃奶酪,因?yàn)槟憧赡軙?huì)死在你的床單,我不得不檢查它是不是有下列:
完全巧合-有可能這么多數(shù)據(jù)集進(jìn)行了比較,有些是必然的相似?為什么,這正是Tyler Vigen所做的事情!是的,這是可能的。
相反的因果關(guān)系——我們有可能走錯(cuò)方向嗎?例如,也許你的親人,在哀悼你的床單相關(guān)死亡,吃大量的奶酪來(lái)安慰自己?這似乎不大可能,所以讓我們給它一個(gè)通行證。不,這是不大可能的。
聯(lián)合因果關(guān)系-是否有可能在這兩個(gè)因素背后有第三個(gè)因素?也許增加財(cái)富會(huì)讓你更健康(所以你不會(huì)死于營(yíng)養(yǎng)不良),也會(huì)導(dǎo)致你吃更多的奶酪。這似乎很合理。是的,這是可能的。
線性-我們比較兩個(gè)線性趨勢(shì)?線性趨勢(shì)是一個(gè)穩(wěn)定的增長(zhǎng)率或下降率。任何兩個(gè)隨時(shí)間大致線性的統(tǒng)計(jì)數(shù)據(jù)都會(huì)有很好的相關(guān)性。在上面的圖表中,我們的統(tǒng)計(jì)數(shù)據(jù)都呈直線上升趨勢(shì)。如果用不同的尺度繪制圖,它們可能看起來(lái)完全不相關(guān),像這樣,但是因?yàn)樗鼈兌加蟹€(wěn)定的速率,它們?nèi)匀皇呛芎玫南嚓P(guān)性。是的,看起來(lái)很有可能。
廣泛的適用性-是否有可能這種關(guān)系只存在于某些利基情景中,或者至少在我的利基情景中不存在?也許,例如,奶酪,這對(duì)一些人來(lái)說(shuō),這是足以創(chuàng)造這種相關(guān)性,因?yàn)楹苌儆写矄渭m纏死亡呢?是的,這似乎是可能的。
所以我們有4個(gè)“是”答案和5個(gè)檢查中的一個(gè)“不”答案。
如果你的例子沒(méi)有從5個(gè)檢查中得到5個(gè)“不”的答案,那就是失敗,你不能說(shuō)這項(xiàng)研究已經(jīng)確立了奶酪消費(fèi)的排名因素或致命的副作用。
一個(gè)相似的過(guò)程應(yīng)該適用于案例研究,這是另一種關(guān)聯(lián)的形式——你做出改變的關(guān)系,以及一些好的(或壞的)。發(fā)生。例如,問(wèn):
我排除了其他因素(例如外部需求、季節(jié)性因素、競(jìng)爭(zhēng)對(duì)手犯錯(cuò)誤)嗎?
我是不是通過(guò)做我想做的事情來(lái)增加流量,或者是我同時(shí)意外地改善了其他因素?
這樣做是因?yàn)樘囟蛻?項(xiàng)目的特殊情況嗎?
2。失蹤的情況下
如果我告訴你我今天的交通流量是每周20%周,你會(huì)說(shuō)什么?祝賀?
如果去年這個(gè)時(shí)候上升20%呢?
如果我告訴你,它已經(jīng)上升了20%年,直到最近呢?
有趣的是,一個(gè)小小的環(huán)境能完全改變這一點(diǎn)。這是另一個(gè)案例研究的問(wèn)題和他們邪惡的倒雙胞胎,交通下降分析。
如果我們真的想了解是否感到吃驚的事,積極的或消極的,我們需要把它比作我們的期望值,然后計(jì)算出我們的預(yù)期偏差是什么是“正常的”。如果這開(kāi)始聽(tīng)起來(lái)像統(tǒng)計(jì),這是因?yàn)樗墙y(tǒng)計(jì)-事實(shí)上,我寫的關(guān)于測(cè)量變化早在2015的統(tǒng)計(jì)方法。
但是,如果你想偷懶,一個(gè)好的經(jīng)驗(yàn)法則就是縮小并增加前幾年。如果有人向你展示可疑放大的數(shù)據(jù),你可能會(huì)想用少量的鹽。
3.相信我們的工具
你會(huì)根據(jù)你的競(jìng)爭(zhēng)者隨意操縱的數(shù)字做出數(shù)百萬(wàn)美元的商業(yè)決定嗎?嗯,你有機(jī)會(huì),這個(gè)號(hào)碼可以在谷歌分析中找到。我已經(jīng)在其他地方廣泛地討論了這個(gè)問(wèn)題,但是大多數(shù)分析平臺(tái)都存在一些主要問(wèn)題:
他們很容易操縱外部
他們?nèi)绾稳我夥纸M進(jìn)入會(huì)話
他們對(duì)AD阻滯劑有多么脆弱
他們是如何在抽樣下表現(xiàn)的,他們是多么明顯
例如,你知道谷歌分析API V3可以大量樣本數(shù)據(jù),同時(shí)告訴你數(shù)據(jù)取樣,超過(guò)一定的交通量(~ 500000在日期范圍)?我也沒(méi)有,直到我們遇到它,同時(shí)構(gòu)建蒸餾ODN。
類似的問(wèn)題存在于許多“搜索分析”工具中。我的同事Sam Nemzer寫了一堆關(guān)于這個(gè)-你知道最秩跟蹤平臺(tái)的報(bào)告完全不同的排名?或者是事實(shí)上的關(guān)鍵詞被谷歌(因此工具像SEMRush和統(tǒng)計(jì),太)是不等價(jià)的,不一定有大量引用?
理解我們使用的工具的優(yōu)點(diǎn)和缺點(diǎn)是很重要的,這樣我們至少可以知道它們何時(shí)定向準(zhǔn)確(如他們的見(jiàn)解引導(dǎo)你朝正確的方向),即使不是完全準(zhǔn)確的。我真的可以在這里推薦的是,他在SEO(或任何其他數(shù)字頻道)一定意味著理解在你測(cè)量平臺(tái)的力學(xué)這是為什么所有的新開(kāi)始在蒸餾結(jié)束學(xué)習(xí)如何分析審計(jì)。
對(duì)根問(wèn)題最常見(jiàn)的解決方案之一是合并多個(gè)數(shù)據(jù)源,但是…
4。結(jié)合數(shù)據(jù)源
有許多平臺(tái)將“擊?。ㄎ刺峁?rdquo;匯集兩個(gè)或更多的數(shù)據(jù):
分析
搜索控制臺(tái)
關(guān)鍵詞廣告
排名跟蹤
這里的問(wèn)題是,首先,這些平臺(tái)沒(méi)有相同的定義,第二,具有諷刺意味的是,(沒(méi)有提供)往往打破他們。
讓我們先處理定義,舉個(gè)例子——讓我們看一個(gè)帶通道的登陸頁(yè)面:
在搜索控制臺(tái)中,這些數(shù)據(jù)被報(bào)告為單擊,并且當(dāng)多個(gè)維度(例如關(guān)鍵字和頁(yè)面)或過(guò)濾器被合并時(shí),可能會(huì)受到嚴(yán)重的、不可見(jiàn)的采樣的攻擊。
在谷歌分析,這些報(bào)告使用最后非直接點(diǎn)擊,這意味著你的有機(jī)交通包括一系列直接會(huì)話,超時(shí),恢復(fù)中間會(huì)話,等等,這是沒(méi)有進(jìn)入黑暗的交通,廣告阻斷劑,等等。
在AdWords,大多數(shù)報(bào)告使用上的AdWords點(diǎn)擊和轉(zhuǎn)換,可以定義不同的。此外,如以上所述,關(guān)鍵字卷被捆綁。
排名跟蹤是特定位置的,并且不一致,如上文所述。
很好,雖然它可能不是精確的,但你至少可以得到一些定向有用的數(shù)據(jù),考慮到這些限制。然而,關(guān)于“(未提供)”…
大多數(shù)的登陸頁(yè)面都會(huì)得到不止一個(gè)關(guān)鍵詞的流量。這些關(guān)鍵字中的一些很可能比其他關(guān)鍵字轉(zhuǎn)換得更好,尤其是當(dāng)它們被打上烙印的時(shí)候,這意味著即使是最徹底的點(diǎn)擊率模型也不會(huì)對(duì)你有所幫助。那么你怎么知道哪些關(guān)鍵詞是有價(jià)值的呢?
最好的答案是,從這些關(guān)鍵詞AdWords數(shù)據(jù)概括,但它是非常不可能的,你有所有這些組合的關(guān)鍵詞和網(wǎng)頁(yè)數(shù)據(jù)分析。從本質(zhì)上講,報(bào)告的工具會(huì)給出一個(gè)非常大膽的假設(shè),即給定頁(yè)面對(duì)所有關(guān)鍵字的轉(zhuǎn)換是相同的。有些人比其他人更透明。
再說(shuō)一遍,這并不是說(shuō)那些工具沒(méi)有價(jià)值,而是需要仔細(xì)地理解。唯一的方法,你可以可靠地填補(bǔ)這些空白所創(chuàng)造的“不提供”將花費(fèi)大量的付費(fèi)搜索,以獲得體面的體積,轉(zhuǎn)換率,并跳出率估計(jì)為所有關(guān)鍵字,即使如此,你還沒(méi)有固定的不一致定義問(wèn)題。
獎(jiǎng)金的事:平均等級(jí)
我看得太頻繁了。三個(gè)問(wèn)題:
比起一個(gè)高容量查詢(百萬(wàn)加),你更關(guān)心十個(gè)非常低容量的查詢(10個(gè)月或更少的搜索)失去排名嗎?如果答案不是“是的,我絕對(duì)更關(guān)心十個(gè)低容量查詢”,那么這個(gè)度量不適合你,你應(yīng)該考慮一個(gè)基于點(diǎn)擊率估計(jì)的可見(jiàn)性度量。
當(dāng)你開(kāi)始排名100的關(guān)鍵字你沒(méi)有排名之前,這是否使你不高興?如果答案不是“是的,我討厭新關(guān)鍵字的排名”,那么這個(gè)指標(biāo)不適合你——因?yàn)檫@會(huì)降低你的平均排名。當(dāng)然,你可以把所有非排名關(guān)鍵字當(dāng)做位置100,就像一些工具允許的那樣,但是,2個(gè)平均排名位置的下降真的是表示你的1/50個(gè)登陸頁(yè)面已經(jīng)被索引的最好方法嗎?同樣,請(qǐng)使用可見(jiàn)性度量。
你喜歡比較你的表現(xiàn)和你的競(jìng)爭(zhēng)對(duì)手嗎?如果答案不是“不,當(dāng)然不是”,那么這個(gè)指標(biāo)就不適合你——你的競(jìng)爭(zhēng)對(duì)手可能擁有更多或更少的品牌關(guān)鍵詞或長(zhǎng)尾排名,而這將導(dǎo)致比較的偏差。同樣,使用可見(jiàn)性度量。
結(jié)論
希望你發(fā)現(xiàn)這個(gè)有用??偨Y(jié)的主要結(jié)論:
批判性地分析相關(guān)和案例研究,看看你是否可以把它們解釋為巧合,如反向因果關(guān)系,作為聯(lián)合因果關(guān)系,通過(guò)引用第三個(gè)相互關(guān)聯(lián)的因素,或者通過(guò)生態(tài)位適用性來(lái)解釋。
不要看交通的變化而不看上下文-你會(huì)預(yù)測(cè)這個(gè)時(shí)期,以及有多少誤差?
請(qǐng)記住,我們使用的工具有局限性,并研究如何影響它們顯示的數(shù)字。“這個(gè)數(shù)字是怎么產(chǎn)生的?“這是一個(gè)重要的組成部分,這個(gè)數(shù)字意味著什么?”“
如果你最終結(jié)合了多個(gè)工具的數(shù)據(jù),記住要弄清楚它們之間的關(guān)系——將這些信息視為定向而不是精確。