[QOTD]若是第一次就做得很好那就太可惜了吧, 因為
沒有指標存在的話, 如何知道改善的幅度為何
呢?
*1
在博客來推動推薦購買的反應來看, 正面與負面
評比約是 4:1, 且負面有半數不是針對信, 而是認為
博客來發太多廣告信了等等的抗議信, 但這也不是我
能控制的, 因為我已經強調太多次了, 廣告信 (eDM)
是兩面刃, 能帶來業績, 但也會趕走顧客, 雖然我在
技術顧問的角色是盡量讓產品經理(PM)讓他們自己決
定發送量而不受限, 但常常聽到許多人在抱怨, 雖然
這些抱怨有 3 成是假的 (例如自己為了拿 ecoupon
主動訂電子報但似乎忘記了), 只是我是認為這真的
是很傷腦筋的一件事.
這次的薦購有些意見, 我是打算把這篇文章當成
工作底稿, 講個詳細一點, 以後可以用 CNP (copy
and paste) 及 Referral 就好.
1. 有關買過的問題:
A: 這次的演算法沒有去扣掉使用者買過的, 這的確
是考慮到效率的因素, 但就第一次發送的經驗,
瓶頸應該不是出在這邊, 所以第二次會優先扣除
使用者買過的商品.
2. 有關類別的問題:
A: 有些使用者認為我們沒有考慮到他買的類別, 事
實上這次的確是完全沒有考慮到使用者買的類別
屬性, 但這個演算法本身就無法考慮類別屬性,
若說要加權, 還不如先將使用者先做類別分析後
, 然後把這清單分成兩種: 一個是使用者常買類
別與使用者不常買的類別清單, 這樣比加權等等
有意義多了.
3. 有關如何產生的問題:
A: 有些人認為部份是隨機亂數或有特定取向, 但這
邊澄清是毫無此事, 完全沒有亂數的可能性, 也
沒有加入人工操弄的因子, 完全是靠使用者的消
費記錄來做判斷.
4. 有關 ecoupon 的問題:
A: 當然有些人直接希望給 ecoupon, 在第二次發送
的確會給 ecoupon, 而看我能不能爭取到 25 到
30 元的, 有時覺得給個 20 元似乎不夠大方,
但要給到 50 元是有點困難啦.
5. 有關訊息內容的問題:
A: 作者加入是很重要, 因為有些時候, 書名是不熟
的, 但卻是很熟悉的作家, 只是還在思索欄位與
版面的放置, 因為不是所有的都是書, 雖然書占
了七成沒錯.
6. 有關發送量的問題:
A. 因為有推薦的人, 必然是購買過四本書以上的人
, 這占所有會員的 1/2 到 1/3, 所以並不是所有
人都會收到這個推薦購買, 當然要把 4 降到 3
是有可能的, 但 3 已經是個極限了, 所以這若是
不到 4 或 3 的人, 應該加入其他商品來計算,
例如購物車或下次再買.
7. 有關回饋的問題:
A: 甚至本來就會設計一個回饋選項, 讓大家選擇這
個推薦是好還是壞, 然後從好壞來去再回饋, 但
這個回饋機制應該不太可能強過購買的喜好, 頂
多應該加個買過或擁有的書庫資料, 來做再計算
或扣除, 而不感興趣的就直接拿掉就好.
8. 有關其他因素的問題:
A: 再來是否加入搜尋關鍵字或瀏覽記錄的計算, 我
認為是沒必要的, 應該說這的確要再用新的演算
法產生另一個清單, 當然以後會不會合併清單或
怎合併再說, 但有時本來就保持一些單純是有必
要的, 像例如曾經實驗的同作者新書就應該是獨
立發送.
9. 有關個人化的問題:
A: 的確這次打了 ”博客來 資料探戡中心”, 的確是
宣誓從這邊發送的, 沒有一個人的信會一樣, 若
真的一樣的話就是有人在博客來的消費行為一模
一樣, 且每個時間算出來的內容也不同, 因此可
以肯定重覆率不到 1 %, 當然像 CIA 的關鍵字
10. 有關覺得推薦的書的問題:
A: 這書單是從跟使用者接近的人來擴散, 但因為這
樣的擴散往往會因為一兩個80%一樣, 但20%完全
不一樣的完全不一樣部份發生問題, 尤其是性別
, 職業等等所發生的差異, 尤其是內容是以興趣
為主的話.
除了薦購的建議外, 事實上也收到不少意見, 例
如 ”較貴”, ”運費”, ”大陸看不到”, ”某些作家與作
品沒有”, 等等的意見, 不是我能處理的, 都丟給其
他 PM 來回覆了.
*2
當然這次的發送多少有點急就章 (原因又可參見
技術與清談), 所以從我的角度來看, 從可以給我文
案到開始發送大約是給我兩個工作天, 或對別人是四
個工作天, 但離我預期的時間表已經過半個月了, 雖
然這是兩年前寫好的程式, 但也不是拿來直接用, 也
因此寫了快十隻輔助程式, 也把計算的演算法從三版
變成四版, 但也是打算做些實驗, 所以刻意內容留下
很多的改善空間來以後完成, 若是第一次就做得很好
那就太可惜了吧, 因為沒有指標存在的話, 如何知道
改善的幅度為何呢?
只是最可惜的是瀏覽頁面與 RSS 還是還沒做出
來, 不然應該會更有趣一點, 只是也終於開始發送了
, 也是好事啦...:)
[連結]
1. 薦購的開始
http://blog.yam.com/genehong/archives/1532466.html
2. 技術與清談
http://blog.yam.com/genehong/archives/1464642.html
[TAG]博客來, Data Mining, 資料探勘, 書, Books
**********************************************
*1
05/18/06 11:14 am, 才要到竹圍站, 我今天是
10:51 出發, 過了 20 mins 捷運才發動, 應該算是
個記錄, 例如是過馬路時剛好紅燈, 到站時前一班剛
走, 還更詭異的晚了 4 分鐘才起動, 本來應該是 10
到 15 分鐘的路程, 變成了到 20 分鐘, 還真不容易
阿.
*2
05/18/06 08:04 pm, 現在過中正紀念堂, 但不
知怎的今天比較累, 雖然昨天算早睡, 又晚起, 做的
事也沒比往常多, 但我知道是這樣的 Content
Switch 內容轉換真的是令人累的.
*3
05/18/06 08:18 pm, 真的有點睏, 看就先睡了
或是打完 PSP 棒球吧.