文章预览
🏆基座模型 ①项目:OmniSQL ★OmniSQL是一个自动化且可扩展的文本到SQL数据合成框架,旨在生成高质量的文本到SQL数据集。 其核心数据集SynSQL-2.5M是首个百万级跨领域文本到SQL数据集,包含超过250万条多样且高质量的数据样本,涵盖16,000多个不同领域的数据库。OmniSQL还提供了三种规模的强大文本到SQL模型:7B、14B和32B,并在微调过程中整合了Spider和BIRD等高质量人工标注数据集。 ☆一键收藏: https://sota.jiqizhixin.com/project/omnisql ②项目:Diagnosis Zero ★Diagnosis Zero项目旨在复现和探索DeepSeek R1 Zero在罕见病诊断任务中的应用。 项目利用Rare Arena数据集,通过GRPO训练模型。给定患者的病历,模型通过链式思维提示进行推理后给出诊断。项目的主要目标是研究不同规模的Qwen2.5-Instruct模型在训练过程中的表现。 ☆一键收藏: https://sota.jiqizhixin.com/project/diagnosiszer
………………………………