文章预览
这段时间,大模型行业是越来越热闹了。 前不久各家还纷纷大打价格牌,阿里云也一口气把大模型的体验门槛降到了脚底板级别。这还没完,就在昨天阿里云又抛出王炸,推出了最新的开源模型Qwen2系列。 为什么说它是王炸呢,最核心的原因还是在于它的模型能力。 上海人工智能实验室推出的OpenCompass是业内公认最权威的模型测评榜单之一,收录了全球上百个开源大模型的性能测试结果并给出了排名,其中 阿里云在今年2月推出的通义千问Qwen1.5在这个榜单中排名第8,领先了一众闭源同行,比如文心4.0、豆包pro、混元pro等。 而这次推出的Qwen2比Qwen1.5又要提升一大截。根据官方披露, 通义千问Qwen2系列模型大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。 在MMLU、GPQA、HumanEval、GSM8K、BBH、MT-Bench、Arena Hard、LiveCodeBench等国际权威测评中,Q
………………………………