专栏名称: 数据与算法之美
数据与算法之美--分享数据算法相关的学习教程、软件资源、视频课程、经验分享、通知文件等。涵盖大数据、Python、数据挖掘、人工智能、互联网前沿、计算机相关知识。期待与大家共同学习,共同进步!
今天看啥  ›  专栏  ›  数据与算法之美

清华北航博士生「强迫」Gemma-2说中文!弱智吧、角色扮演、数学问题表现惊喜

数据与算法之美  · 公众号  ·  · 2024-07-08 07:47

文章预览

   新智元报道   编辑:编辑部 【新智元导读】 谷歌的Gemma 2刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了Gemma 2 9B/27B模型的中文通用对话、角色扮演、数学、工具使用等能力。 众所周知,很多国外LLM一直存在非英语歧视问题,英语和其他语言在LLM中存在的性能差距有时可以用悬殊来形容。 之前就有网友发现, GPT-4o分词器语料库中,中文数据污染非常严重 ,赌博色情网站是一个也不少,严重影响了我们用中文和AI机器人好好聊天。 最近发布的Gemma 2模型虽然既开源又强悍,但比较遗憾的是,其中文水平相较英文水平还有一定的距离。 不过,我们可以用微调来解决,Fine-tune it! 7月1日,Gemma 2刚发布4天,清华大学的一名人工智能博士生王慎执就在X上隆重推出了一款微调模型Gemma-2-9B-Chinese-Chat。 Gemma-2-9B-Chinese-Chat ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览