文章预览
TLDR 征集真实业务场景的数据集,样本量至少1k,期望能有10k。数据已经脱敏,可以公开。 数据集用途:后续我对各家LLM模型的横评和Agent策略框架demo的演示中使用。仅会公开我发文用来测试的数据集,其他未入选数据不会公开。 回报:对于入选的数据集场景,我可以提供对该场景的免费顾问,并可以直接可以采用我发文公开的测试结果和代码方案。由于目前有代表性的数据集不多,所以在公开之后大概也会在未来得到其他人对该场景数据的其他研究。也可以不通过我,直接公开数据集。 目的 征集真实场景的数据集是因为我认为LLM相关的工作和横向比较应该基于接近于真实场景的问题和测试数据上进行。在企业内有不少这样的场景,但公开的数据集很少,并且与LLM应用适合的场景贴近度不高。所以才面向有真实业务场景数据,且可以公开一部分
………………………………