专栏名称: 赛尔实验室
哈尔滨工业大学社会计算与信息检索研究中心
今天看啥  ›  专栏  ›  赛尔实验室

哈工大发布“珠算”代码大模型

赛尔实验室  · 公众号  · 程序员  · 2024-09-17 14:21

主要观点总结



关键观点总结



文章预览

1. 引言 从DeepMind发布的AlphaCode[1]在竞赛级编程能力上超越人类平均水平之日起,代码大模型便广受关注。与此同时,OpenAI发布的CodeX[2]更是展示出了代码大模型具有超越传统编程范畴的数值推理、逻辑推断、工具调用等高阶能力,进一步引爆了对该领域的研究与讨论。以BigCode StarCoder[3]为代表的开源项目对完善该领域的研究生态做出了卓越的贡献。然而,目前开源代码大模型提升编程能力的同时会严重损害通用语言能力。为此,哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)推出了 “珠算”代码大模型 ,其以2.7B参数在 代码与通用语言平均性能 上均超越了DeepSeek-Coder-1.3B[4]、Yi-Coder-1.5B[5]、Stable Code-3B[6]、Granite-3B-Code[7]等参数量3B及以下的代码大模型,希望通过 开放权重、训练细节以及配套的微调适配平台与插件 ,助力开源社区的发展。相关 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览