文章预览
生成式AI 一、 OpenAI发布季第二天:强化微调,少量样本训练专家模型 1. 强化微调(RFT)通过强化学习优化模型在特定任务上的推理能力,支持少量样本训练; 2. 开发者可根据领域需求,通过自定义数据和评分器微调模型,提升其准确性和推理能力; 3. 该技术适用于专业领域如法律、金融等,且目前处于Alpha测试阶段,明年将开放。 https://mp.weixin.qq.com/s/7uqmsBP6D1rIysFW7dBtcQ 二、 Meta重磅开源Llama 3.3-70B:性能大涨,成本降10倍 1. Meta开源Llama 3.3-70B,性能与Llama 3.1-4050B相当,但推理和部署成本大幅降低; 2. Llama 3.3-70B在多个基准测试中超越谷歌、OpenAI等竞争对手,提升数学、常识和指令遵循能力; 3. Meta计划投资100亿美元建设AI数据中心,支持未来Llama 4模型的训练需求。 https://mp.weixin.qq.com/s/pZR6waThwmeVR7VoTybkjg 三、 换掉Flux?马斯克自研文生图模型Aurora
………………………………