找對證據:指標、樣本、時間窗口
「回購率從 15% 掉到 12%。」這句話一丟出來,很多會議室空氣就開始緊張。因為 3 個百分點聽起來很糟,好像品牌忠誠度正在崩。但如果你沒有先問樣本量夠不夠、比較基準是什麼、這個時間窗口是不是本來就波動大,你很可能會把正常噪音,誤判成必須立刻出手的大事。
數據分析最危險的地方,不是沒有資料,而是證據看起來像證據。指標很多、數字很精確、圖表很漂亮,會讓人誤以為自己已經站在事實上。其實真正要練的是:什麼證據足夠支持結論,什麼證據還只是提示。這一課要把三件事拆開講清楚:你選了什麼指標、你用了什麼時間窗口、你的樣本和對照到底夠不夠。
指標不是越多越好,而是要能回答問題
好指標不是「大家都在看」,而是「它真的能幫你判斷」。如果你的問題是活動有沒有帶來高品質流量,那只看點擊數就不夠;如果你的問題是新品上市有沒有成功,那只看首週營收也不夠。指標的工作,是替業務問題找一個可觀測的代理訊號,而不是把 dashboard 塞滿。
先分清楚兩組常見概念。第一組是領先指標和落後指標。領先指標比較早出現,像商品頁點擊率、加入購物車率、首購券領取率,通常可以提早告訴你方向;落後指標像營收、回購率、毛利,離最終結果更近,但反應也更慢。第二組是絕對數和比率。訂單數、營收是絕對數;轉換率、回購率、ROAS 是比率。很多誤判,都是因為把這幾種東西混著看,卻沒有說清楚自己要回答什麼。
拿台灣電商最常見的檔期來說,如果雙 11 檔前一週新品頁 CTR 很高,這是領先指標,表示素材或商品有吸引力;但如果加車率和結帳率沒跟上,你就知道熱度沒有順利往後段漏斗傳。再看另一個情境,品牌 LINE 群發點擊數成長 40%,但點擊率持平,表示只是發送量變大,不代表內容變好。你如果只抓到「成長 40%」,很容易講錯故事。
可以先用這個簡單框架辨識:
時間窗口決定你看到的是趨勢,還是噪音
同一組資料,換一個時間窗口,故事可能完全不同。週比適合抓近期異動,但很容易被活動日、週末結構、廣告檔期影響;月比比較穩,但可能掩蓋掉關鍵轉折;去年同期能處理季節性,但如果今年檔期排程、通路結構和去年差很多,也不能直接照抄。時間窗口不是報表設定而已,它會直接改變你做出的結論。
電商最常見的錯誤,是拿一個短期波動硬講成趨勢。像是某保養品牌週五直播後,週末網站停留時間暴增,週一有人就說「新版內容策略有效」。但如果你把窗口拉成四週滾動平均,會發現停留時間其實沒明顯改善,只是直播流量本來就更愛停在頁面上。反過來,如果你只看月比,可能又會錯過某個運費政策調整後,行動版結帳率在三天內明顯下滑。
時間窗口的選擇,要跟業務節奏對齊。快時效的廣告素材、直播導購、推播開信,適合看日或週;回購、會員成長、品類滲透,通常要看月或季;遇到節慶,還要加一層節慶校正。例如中秋檔禮盒銷售,拿九月第一週直接比八月最後一週,本來就容易誤判,因為需求結構不同。
樣本量太小時,先懷疑自己,不要先懷疑世界
你不一定要會統計公式,但你要有直覺:樣本少,結論就不穩。只有 50 個客戶的回購率,從 15% 掉到 12%,很可能只是幾個人買或沒買就造成波動;App 新功能只上給 300 個會員看三天,CTR 漲 20%,也還不夠支持你全面 rollout。樣本量少的時候,數字最容易看起來戲劇化。
實務上很好用的原則是:當分母很小、時間很短、切得很細時,把數字當成訊號,不要當成判決。訊號的意思是你可以留意、可以追蹤、可以加資料,但還不要急著宣布勝負。這對營運和行銷特別重要,因為你們每天都在看即時資料,很容易被短期上下震盪帶著走。
另一個直覺檢查法是問自己:「如果只多幾筆訂單,結論會不會翻掉?」如果答案是會,那這個數字就還不夠穩。這個判斷很土,但很有用,尤其是在新品、小眾品類、會員分層或 A/B 測試剛起步時,能幫你擋掉很多過早樂觀或過早悲觀。
你不是要變成統計學家,而是要養成證據分級的習慣。
想像一個母嬰品牌在官網測試新版結帳頁。第一天新頁面轉換率 3.8%,舊頁面 3.1%,看起來很棒。但如果那天新頁只分到 120 位訪客,而且剛好多是回購客,這個差距根本不能說明什麼。更合理的做法,是先看流量是否隨機、客群是否接近、樣本是否累積到足夠穩,再決定要不要下結論。
有比較,才有判斷
很多人看資料是單點閱讀,只看「這個數字高或低」。但分析真正有力量的地方,是比較。沒有比較,你根本不知道這個數字代表正常、偏高、偏低,還是只是結構不同。比較可以是前後比、分群比、對照組比,也可以是基準比。你要學會問:我現在手上的數字,究竟是跟誰比才有意義?
最基本的比較,是前後對照。但前後對照不夠時,就要加分群和對照組。假設你看見整體轉換率上升,就以為新首頁改版成功;結果一分群,發現其實是回購客佔比增加,真正的新客轉換率反而下降。這種「整體看起來變好,分群後故事反過來」的情況,就是經典的 Simpson 悖論。你不需要背名字,但你一定要對這件事有警覺。
看這個電商分群例子就夠直覺:
同樣道理也適用在通路。整體 ROAS 變好,可能只是因為品牌關鍵字廣告花得更多;整體客單上升,可能只是高單價品類佔比拉高。你如果沒有對照和分群,就很容易被總表騙。
指標有時會誤導你,特別是看起來很合理的那種
以「網站停留時間」為例,它到底是好指標還是壞指標?答案是:看情境。如果你在看內容頁、品牌故事頁、保養教學頁,停留時間可能有價值,因為它反映內容被閱讀。但如果你在看結帳流程,停留時間越長不一定越好,可能代表使用者卡住、找不到下一步、正在猶豫或頁面載入慢。指標不會自帶意義,是情境賦予它意義。
另一個常見誤導指標是「加入購物車數」。如果你只看加車數,可能覺得某檔活動成功;但若加車率上升是因為優惠門檻設計成大家先放車裡等折扣,最後結帳率沒有跟上,這個指標就只是把期待放大了。再比如 App 推播開啟率,有些內容很聳動,開啟率很好,但進來後停留短、轉換差,這種流量不見得有業務價值。
真正成熟的做法,不是丟掉這些指標,而是替它們加上上下文。停留時間要搭配頁面類型、轉換位置和退出率;加車數要搭配加車到下單的落差;推播開啟率要搭配回訪後的瀏覽深度與轉單。你不是在追求完美指標,而是在避免把單一指標看成全部真相。
AI 協作:學了這個,跟 AI 怎麼配合?
這一課可以讓 AI 幫你整理「還缺哪些證據」,但最後仍要靠你判斷哪些比較在你們的業務情境下才算公平。
你的人類優勢:
- 你知道哪些時間窗口跟檔期節奏、補貨週期、投放節奏有關
- 你知道哪些分群在你們公司真的有商業意義,不是切好看的
可以這樣跟 AI 說:
我在判斷『回購率從 15% 掉到 12%』是否真的值得下結論。請你幫我列一個證據檢查表,分成三塊:指標選對了嗎、時間窗口合理嗎、樣本和對照夠嗎。背景是台灣電商品牌,最近剛結束母親節檔期,新客佔比提高,主力品類補貨也有延遲。請提醒我有哪些情況下,這個 3 個百分點只是噪音。
練習題
本課重點回顧
- 指標要能回答問題
- 時間窗口會改變故事
- 樣本少時先保守判讀
- 沒有比較就沒有結論
- 單一指標很容易誤導
互動示範
挑戰任務
給你一組電商品類月營收變動資料,請判斷『是否有足夠證據下結論』,並列出你還要補看的對照。你可以自行設定一個保養品、服飾或母嬰品牌情境。
拿『網站停留時間』這個指標,分別在內容頁、商品頁、結帳頁三種情境下,討論它是好指標還是壞指標,為什麼。
請你設計一個會出現 Simpson 悖論的電商案例。先寫整體數字,再寫至少兩個分群後的數字,最後解釋如果只看總表,會得到什麼錯誤結論。