专栏名称: 运筹OR帷幄
致力于成为全球最大的运筹学中文线上社区
今天看啥  ›  专栏  ›  运筹OR帷幄

服务运营|MNL-Bandit:分类选择的动态学习方法

运筹OR帷幄  · 公众号  ·  · 2024-06-21 12:14
    

文章预览

文献链接: https://doi.org/10.1287/opre.2018.1832 01 研究背景 我们考虑一个动态分类选择问题,其中零售商在每一轮中提供N种可替代产品的子集(分类)给消费者,消费者根据多项式logit (MNL)选择模型从这些产品中选择一种。零售商观察这种选择,目标是动态学习模型参数,同时优化长度为T的销售范围内的累积收入。我们将这种探索-利用公式称为MNL-Bandit问题。 本文中,我们给出了一种新的有效的算法,可以同时探索和利用任何问题参数,而无需先验知识。此外,该算法是自适应的,在“良好分离”的情况下,它的性能接近最优,在这种分离不需要保持的一般参数设置中。 02 模型建立 1.购买概率: 零售商有N个产品, 𝑖: 𝑖∈{1,2,⋯ , 𝑁},在 t 时刻选择提供产品组合S_t⊂{1,2,⋯ , 𝑁}。消费者在 t 时刻的购买选择c_t∈ S_t∪{0}。消费者的购买概率p_i (S)为 2.预 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览