今天看啥  ›  专栏  ›  zartbot

基于强化学习的模型商品化推荐系统及MaaS盈利模式分析

zartbot  · 公众号  ·  · 2025-02-22 23:00
    

文章预览

周末稍微休息一下, 在高铁回家的路上想到一个好玩的事情, 如果大模型本身商品化以后, MaaS如何构建一个新的基于模型的在线交易商城? 这个想法来自于论文 《Prompt-to-Leaderboard》 [1] 论文的想法是, Berkeley做了一个模型, 这个模型自己没有问答能力,但是用了chatbot arena的评分QA对去训练, 让它知道什么问题该找哪个模型回答, 后面可以挂着Gemini/ChatGPT/DSv3等进行服务. 然后这么一搞, 它的ELO评分高出一大截. 本质上可以把它理解为另外一种类型的MoE, 只是Expert本身扩展成了大模型. 有点类似于以前搜广推基于业务的MoE方式. 那么紧接着, 渣B想到了一个非常邪恶的想法, 从一个博弈论以及强化学习的视角来构建一个新形态的大模型商品化的MaaS是否成立? 大致的做法如下, 有卡的同学可以做一点实验, 写一篇论文出来: 用户侧 用户提供一个输入, 然后由一个MaaS的模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览