2024-09-26 20:58
本条微博链接
【像专家那样大规模提升预训练数据质量:一个基于语言模型的数据提炼框架,能自动清洗和改进大量数据示例,提升模型性能,适用于不同领域,高效且节省资源】'ProX - Official Repo for "Programming Every Example: Lifting Pre-training Data Quality Like Experts at Scale"' GitHub: gair-nlp/ProX #数据提炼# #预训练# #语言模型# #大规模处理#
………………………………