内容提要:
1. Claire的独立站遇到一个问题:Explore & Exploit
2. 用你的大脑模拟算法,让独立站在短期获得高收益本文共约2200字,预计阅读时间3-5分钟。
Claire经营着一家初创品牌公司,有一个面向海外市场的独立站,同时也是名设计师。
目前该独立站的商品A销量不错,该商品的详情页有很好的转化效果。
但同时,设计师出身的她灵感不断。通过用户调研、用户深度访谈、咨询业内专家,Claire收获很多,又设计出了两个版本的详情页卖点说明图文素材。
Claire对自己的设计很满意,但是怕用户调研可能以偏概全;业内专家的背景经验也不是和自己的商品完全同品类,也许经验会水土不服。
于是,Claire去询问两个联合创始人Leon和Ada的意见。Leon是个老派商人;Ada是一个数据科学家。
Leon:“Claire,很幸运啊,没多久就摸到了一个好方案。现在公司还年轻,钱要花在刀刃上,就用老的页面,发挥它的最大价值吧!”
Ada:“新素材很棒啊!不过确实,我们两个代表不了用户。你可以用A/B测试,几个版本的商品详情页同时上线,通过转化效果选一个好的版本啊。基于贝叶斯算法的A/B测试能够得出具有‘置信度’的最佳版本。”
💡 Tip:A/B 测试,通过统计学方法, 验证新创意对于想提升的指标是否起到了效果, 以得出更好的版本。
- 基于统计学, 相较于人肉观察更加科学严谨, 能帮助避免马太效应
- 如果利用贝叶斯统计,则一定程度上便于理解(目前Ptengine中采取的算法)
这让Claire陷入了两难:
Leon说的没错,对于小公司来说,生存是第一要务。有了收入,才有资本实现自己其他的想法,比如雇佣更专业的人才、研发新的产品、优化包装等等。
Ada的方法虽然奔放、有风险,但是在这样多变和不确定的市场环境下,一切都是短期的——也许一周后,老的页面就没有好转化了。总不能等问题浮出水面了再解决,这样太被动。
而且团队也需要一个一锤定音的数据结论来对齐思路、避免陷入争论、公说公有理、婆说婆有理。A/B测试是一个很科学的方法。
Claire面对的是一个典型的EE问题,Explore & Exploit Problem——探索利用问题。
- 冒险,也就是测试新版本页面,会消耗成本, 而且不一定会带来收益上的提升。最差情况下,甚至不如采取Leon的方案
- 不冒险可能会导致错过新创意可能带来的收益增长。不适应市场变化注定会被淘汰
Leon代表着完全利用,而Ada代表着完全探索。那么,有没有折衷的方法呢?
不如我们做一个类比,看看这个问题怎么解决:
如图:
- 共有5台抽奖机(Claire的不同页面版本)
- 每一台的中奖概率固定(短期内各个版本的转化不变)
- 每一台的中奖概率各不相同(不同页面版本有好有坏)
- 拉动一次摇臂(每有一个用户访问)会有两种结果:中奖/未中奖(转化/未转化)
问:如何在1000次(页面红利期)摇奖机会内,尽可能多的中奖?
这里的EE困境:
- 该拉哪一个?目前中奖率最高的是哪一个?
- 要不试试别的?
请跟着笔者的思路,看看这个方法能不能解决问题:
- 第一阶段:每个抽奖机摇动10次,看看5个抽奖机的概率如何
- 第二阶段:第一阶段抽奖机3的中奖概率最高。那在第二阶段,抽奖机3摇动10次,其他抽奖机摇动5次
- 第三阶段:综合第一阶段和第二阶段,抽奖机2的中奖概率最高。那在第三阶段,抽奖机2摇动15次,其他抽奖机摇动5次
- 以此类推,在每个阶段都综合前一阶段的中奖概率,给中奖概率高的机器更多摇动次数
- 这样的话我们既可以知道哪台抽奖机中奖概率高,并多摇动它;且尽量避免运气因素
如果再精细一些,我们还可以调整每个阶段对与各个抽奖机的摇奖次数,进一步提升中奖次数。
如果你的脑海中模拟了上述几个阶段,那恭喜你!你已经用大脑模拟了一遍强化学习中的Bandit算法,也算是半个算法科学家啦!
💡 Tip:Reinforcement Learning强化学习, 目前人工智能研究的重要方向之一。源于心理学和数学, 在博弈论, 运筹学, 控制论等领域有深入研究。 工业应用: 车辆调度, 生产管理, 推荐系统, 游戏AI 等等。
这样的话,Claire的问题是不是得到了解决呢?通过bandit算法:
- 利用好版本,让Leon满意
- 如果有新的创意加入测试,算法也会给新版本机会,让金子发光,Ada也会很开心
相对于A/B测试,Bandit算法让好版本发挥更大作用。
如图所示,Option A转化最好,绿色代表Option A的生效面积。6天之内Bandit算法自动给Option A更多机会,带来的绿色面积比A/B测试大得多。
当然,算法比我们所说的困难得多。
核心的问题是:上面的抽奖机问题中,在每个阶段,给中奖率高或低的摇奖机多少次机会才更合理?
- 在第二阶段,应该摇动抽奖机3几次更好?其他抽奖机各摇几次?
- 在第三阶段,应该摇动抽奖机2几次更好?其他抽奖机各摇几次?
- 在第n阶段,应该摇动抽奖X几次更好?和第二阶段摇动抽奖机3的次数、第三阶段摇动抽奖机2的次数是否应该相同?
不过这些你都不用担心啦!Ptengine的算法科学家已经开发完成了Bandit智能分流测试功能,将于2023年9月5日,也就是今晚发布内测版本:
如果你希望尝试鱼和熊掌兼得的Bandit,优化独立站、保证效率,欢迎在下方阅读原文处留下联系方式,或者添加Ptengine助手微信~
Ptengine是Ptmind(北京铂金智慧)出品的Martech产品,通过用户分析,可视化结果呈现,与用户个性化自动互动等功能,让营销,运营,产品成为以用户数据为中心的综合一体,实现 营销自动化 需要免费试用Ptengine,
可以添加微信(nanxipeng)直接对接客户经理