文章预览
评测集社区 CompassHub 作为司南 OpenCompass 大模型评测体系的重要组成部分,旨在打造创新性的基准测试资源专区,致力于简化并加快研究人员和行业人士搜索和使用评测集的过程。评测集社区 CompassHub 目前已收录了学科、推理、知识、代码等 14 个子维度的评测集,欢迎大家探索。 为了将评测集社区 CompassHub 收录的优秀评测集更好的展现给大家,OpenCompass 联合 OpenMMLab、 ModelScope 、 MLNLP、机器之心、开源中国、Datawhale 共同发起 AI Spot 学术分享会之 NeurIPS 2024 评测基准论文专场直播! 本次分享聚焦于第 38 届神经信息处理系统年度会议(NeurIPS 2024)的优秀论文,将于 1 月 16 日晚 19:00 至 21:00 进行直播。届时,入选人工智能领域顶级会议 NeurIPS 2024 的 ConvBench、GTA、MMDU、MMLongBench-Doc 四个评测基准的作者们将倾情分享,欢迎大家点击下方按钮预约观看。 N
………………………………