文章预览
今天是2024年8月22日,星期四,北京,天气晴。 社区建设方面,社区将在本周六2024-08-24晚7点半, 举行老刘说NLP技术社区第31讲《手写llama3--从model到pretrain》,由社区成员分享,欢迎大家参加 , 手搓的llama模型,并接入示例的预训练数据的全流程讲解 。 接下来, 我们来回顾一下昨日昨日大模型产业、开源进展。 并且来看看Text2SQL的一个数据合成思路。 总会有一些收获,大家一同加油。 一、昨日大模型产业、开源进展回顾 产业进展方面, OpenAI正式推出GPT-4o微调服务 ,https://openai.com/index/gpt-4o-fine-tuning/ ,https://x.com/OpenAIDevs/status/1825938486568038569 ,https://news.ycombinator.com/item?id=41301673 开源方面, 微软发布Phi-3.5系列模型 ,包括Phi-3.5 Mini Instruct、Phi-3.5 Vision Instruct和Phi-3.5 MoE,并且支持128K上下文。 Phi-3.5 Mini Instruct拥有3.8B参数,适用于移动设备等环境 。 P
………………………………