专栏名称: GitHubStore
分享有意思的开源项目
目录
今天看啥  ›  专栏  ›  GitHubStore

现代文转古文大模型

GitHubStore  · 公众号  ·  · 2024-09-03 08:32

文章预览

项目简介 输入现代汉语句子,生成古汉语风格的句子。基于荀子基座大模型,采用“文言文(古文)- 现代文平行语料”中的部分数据进行LoRA微调训练而得。 欢迎访问以下链接试用: https://modelscope.cn/studios/chostem/ancient_Chinese_text_generator https://huggingface.co/spaces/cofeg/ancient_Chinese_text_generator_1.5B 模型链接: ModelScope Hugging Face 完整的LoRA微调工作流 运行  pip install -r requirements.txt  安装依赖(pytorch 未列出,需要先通过  nvcc --version  命令查看自己电脑的 CUDA 版本,然后到 pytorch 官网安装对应 CUDA 版本的 pytorch) 下载要微调的基座大模型 准备现代文-古文对照数据,放入 data/original 文件夹中 在  config/config.py  文件中配置好基座模型路径和名称、数据路径、微调后的模型存放路径和名称、训练使用cuda还是cpu等 运行  get_data.py ,将原始数据处理为 json 格式并 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览