找對證據：指標、樣本、時間窗口

「回購率從 15% 掉到 12%。」這句話一丟出來，很多會議室空氣就開始緊張。因為 3 個百分點聽起來很糟，好像品牌忠誠度正在崩。但如果你沒有先問樣本量夠不夠、比較基準是什麼、這個時間窗口是不是本來就波動大，你很可能會把正常噪音，誤判成必須立刻出手的大事。

數據分析最危險的地方，不是沒有資料，而是證據看起來像證據。指標很多、數字很精確、圖表很漂亮，會讓人誤以為自己已經站在事實上。其實真正要練的是：什麼證據足夠支持結論，什麼證據還只是提示。這一課要把三件事拆開講清楚：你選了什麼指標、你用了什麼時間窗口、你的樣本和對照到底夠不夠。

指標不是越多越好，而是要能回答問題

好指標不是「大家都在看」，而是「它真的能幫你判斷」。如果你的問題是活動有沒有帶來高品質流量，那只看點擊數就不夠；如果你的問題是新品上市有沒有成功，那只看首週營收也不夠。指標的工作，是替業務問題找一個可觀測的代理訊號，而不是把 dashboard 塞滿。

先分清楚兩組常見概念。第一組是領先指標和落後指標。領先指標比較早出現，像商品頁點擊率、加入購物車率、首購券領取率，通常可以提早告訴你方向；落後指標像營收、回購率、毛利，離最終結果更近，但反應也更慢。第二組是絕對數和比率。訂單數、營收是絕對數；轉換率、回購率、ROAS 是比率。很多誤判，都是因為把這幾種東西混著看，卻沒有說清楚自己要回答什麼。

拿台灣電商最常見的檔期來說，如果雙 11 檔前一週新品頁 CTR 很高，這是領先指標，表示素材或商品有吸引力；但如果加車率和結帳率沒跟上，你就知道熱度沒有順利往後段漏斗傳。再看另一個情境，品牌 LINE 群發點擊數成長 40%，但點擊率持平，表示只是發送量變大，不代表內容變好。你如果只抓到「成長 40%」，很容易講錯故事。

可以先用這個簡單框架辨識：

時間窗口決定你看到的是趨勢，還是噪音

同一組資料，換一個時間窗口，故事可能完全不同。週比適合抓近期異動，但很容易被活動日、週末結構、廣告檔期影響；月比比較穩，但可能掩蓋掉關鍵轉折；去年同期能處理季節性，但如果今年檔期排程、通路結構和去年差很多，也不能直接照抄。時間窗口不是報表設定而已，它會直接改變你做出的結論。

電商最常見的錯誤，是拿一個短期波動硬講成趨勢。像是某保養品牌週五直播後，週末網站停留時間暴增，週一有人就說「新版內容策略有效」。但如果你把窗口拉成四週滾動平均，會發現停留時間其實沒明顯改善，只是直播流量本來就更愛停在頁面上。反過來，如果你只看月比，可能又會錯過某個運費政策調整後，行動版結帳率在三天內明顯下滑。

時間窗口的選擇，要跟業務節奏對齊。快時效的廣告素材、直播導購、推播開信，適合看日或週；回購、會員成長、品類滲透，通常要看月或季；遇到節慶，還要加一層節慶校正。例如中秋檔禮盒銷售，拿九月第一週直接比八月最後一週，本來就容易誤判，因為需求結構不同。

樣本量太小時，先懷疑自己，不要先懷疑世界

你不一定要會統計公式，但你要有直覺：樣本少，結論就不穩。只有 50 個客戶的回購率，從 15% 掉到 12%，很可能只是幾個人買或沒買就造成波動；App 新功能只上給 300 個會員看三天，CTR 漲 20%，也還不夠支持你全面 rollout。樣本量少的時候，數字最容易看起來戲劇化。

實務上很好用的原則是：當分母很小、時間很短、切得很細時，把數字當成訊號，不要當成判決。訊號的意思是你可以留意、可以追蹤、可以加資料，但還不要急著宣布勝負。這對營運和行銷特別重要，因為你們每天都在看即時資料，很容易被短期上下震盪帶著走。

另一個直覺檢查法是問自己：「如果只多幾筆訂單，結論會不會翻掉？」如果答案是會，那這個數字就還不夠穩。這個判斷很土，但很有用，尤其是在新品、小眾品類、會員分層或 A/B 測試剛起步時，能幫你擋掉很多過早樂觀或過早悲觀。

你不是要變成統計學家，而是要養成證據分級的習慣。

想像一個母嬰品牌在官網測試新版結帳頁。第一天新頁面轉換率 3.8%，舊頁面 3.1%，看起來很棒。但如果那天新頁只分到 120 位訪客，而且剛好多是回購客，這個差距根本不能說明什麼。更合理的做法，是先看流量是否隨機、客群是否接近、樣本是否累積到足夠穩，再決定要不要下結論。

有比較，才有判斷

很多人看資料是單點閱讀，只看「這個數字高或低」。但分析真正有力量的地方，是比較。沒有比較，你根本不知道這個數字代表正常、偏高、偏低，還是只是結構不同。比較可以是前後比、分群比、對照組比，也可以是基準比。你要學會問：我現在手上的數字，究竟是跟誰比才有意義？

最基本的比較，是前後對照。但前後對照不夠時，就要加分群和對照組。假設你看見整體轉換率上升，就以為新首頁改版成功；結果一分群，發現其實是回購客佔比增加，真正的新客轉換率反而下降。這種「整體看起來變好，分群後故事反過來」的情況，就是經典的 Simpson 悖論。你不需要背名字，但你一定要對這件事有警覺。

看這個電商分群例子就夠直覺：

同樣道理也適用在通路。整體 ROAS 變好，可能只是因為品牌關鍵字廣告花得更多；整體客單上升，可能只是高單價品類佔比拉高。你如果沒有對照和分群，就很容易被總表騙。

指標有時會誤導你，特別是看起來很合理的那種

以「網站停留時間」為例，它到底是好指標還是壞指標？答案是：看情境。如果你在看內容頁、品牌故事頁、保養教學頁，停留時間可能有價值，因為它反映內容被閱讀。但如果你在看結帳流程，停留時間越長不一定越好，可能代表使用者卡住、找不到下一步、正在猶豫或頁面載入慢。指標不會自帶意義，是情境賦予它意義。

另一個常見誤導指標是「加入購物車數」。如果你只看加車數，可能覺得某檔活動成功；但若加車率上升是因為優惠門檻設計成大家先放車裡等折扣，最後結帳率沒有跟上，這個指標就只是把期待放大了。再比如 App 推播開啟率，有些內容很聳動，開啟率很好，但進來後停留短、轉換差，這種流量不見得有業務價值。

真正成熟的做法，不是丟掉這些指標，而是替它們加上上下文。停留時間要搭配頁面類型、轉換位置和退出率；加車數要搭配加車到下單的落差；推播開啟率要搭配回訪後的瀏覽深度與轉單。你不是在追求完美指標，而是在避免把單一指標看成全部真相。

AI 協作：學了這個，跟 AI 怎麼配合？

這一課可以讓 AI 幫你整理「還缺哪些證據」，但最後仍要靠你判斷哪些比較在你們的業務情境下才算公平。

你的人類優勢：

你知道哪些時間窗口跟檔期節奏、補貨週期、投放節奏有關
你知道哪些分群在你們公司真的有商業意義，不是切好看的

可以這樣跟 AI 說：

我在判斷『回購率從 15% 掉到 12%』是否真的值得下結論。請你幫我列一個證據檢查表，分成三塊：指標選對了嗎、時間窗口合理嗎、樣本和對照夠嗎。背景是台灣電商品牌，最近剛結束母親節檔期，新客佔比提高，主力品類補貨也有延遲。請提醒我有哪些情況下，這個 3 個百分點只是噪音。

練習題

本課重點回顧

指標要能回答問題
時間窗口會改變故事
樣本少時先保守判讀
沒有比較就沒有結論
單一指標很容易誤導

互動示範

DEMO 1可以修改程式碼試玩

DEMO 2可以修改程式碼試玩

挑戰任務

Task 1

給你一組電商品類月營收變動資料，請判斷『是否有足夠證據下結論』，並列出你還要補看的對照。你可以自行設定一個保養品、服飾或母嬰品牌情境。

Task 2

拿『網站停留時間』這個指標，分別在內容頁、商品頁、結帳頁三種情境下，討論它是好指標還是壞指標，為什麼。

Task 3

請你設計一個會出現 Simpson 悖論的電商案例。先寫整體數字，再寫至少兩個分群後的數字，最後解釋如果只看總表，會得到什麼錯誤結論。

← BackNext Lesson →