专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

率先测了一把阿里「世界最强」数学大模型后,我深吸一口气。。

夕小瑶科技说  · 公众号  ·  · 2024-08-20 16:05

主要观点总结

本文介绍了拍搜赛道的广泛用户群体以及阿里推出的多模态模型Qwen2-Math在拍照搜题功能上的应用。文章通过多个测试案例对Qwen2-Math的能力进行了评估,包括简单计算、代数、概率、几何以及多模态能力。测试结果显示,该模型在计算和代数问题上表现良好,但在概率和几何图形方面的能力有待提高。文章还提到了国家9年义务教育对数学能力的定义,并对阿里未来在数学AI模型方面的进一步发展表示期待。

关键观点总结

关键观点1: 拍搜赛道服务于多个学习场景,包括K12学段的学生、老师、家长以及大学生、考研、考公等。

传统教培企业如作业帮、猿辅导在拍搜赛道深耕,互联网巨头如阿里、字节也推出了相关产品。

关键观点2: 阿里发布了世界最强数学模型Qwen2-Math,并为其提供了处理图片文本能力的多模态demo。

Qwen2-Math在math数据集上表现优秀,超过其他闭源模型和大型开源数学模型。

关键观点3: 通过多个测试案例对Qwen2-Math的能力进行了评估,包括计算、代数、概率、几何以及多模态能力。

该模型在计算和代数问题上表现良好,但在概率和几何图形方面的能力有待提高。

关键观点4: 文章提到国家9年义务教育对数学能力的定义。

作者对阿里未来在数学AI模型方面的进一步发展表示期待。


文章预览

夕小瑶科技说 原创 作者 | 海野 打开APP Store,各种搜题软件太多了! 拍搜赛道不止服务于K12学段的学生、老师、家长等广大的用户群体,大学生、考研、考公等任何学习场景都有需求。 除了作业帮、猿辅导等传统教培企业一直在拍搜赛道深耕,一些互联网巨头这些年也纷纷入局推出产品,比如阿里的夸克搜索也上线了拍照搜题功能,还有字节的闪电搜题和Gauth(面向海外市场的AI教育产品)。 大模型爆火以来,AI教育创企和产品也是多了很多,比如MathGPT、Solvely、Answer.ai等,数学作为大模型需要攻克的场景之一,出现了很多专攻数学的大模型。 比如,今天的主角: Qwen2-Math-72B 。 上周,阿里就发布了一个世界最强数学模型,在math数据集上一骑绝尘,远超各种闭源模型,甚至超过了其他大型开源数学模型。 模型具体信息移步今日的推文《阿里推出世 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览