文章预览
2024-09-18 13:00
本条微博链接
WordLlama - 一个开源、快速、轻量级(16MB)的 NLP 工具包,用于模糊重复数据删除、相似性和排名等任务,并针对 CPU 进行了优化🔥 在基准测试中表现优于 GloVe 300d 等热门词模型,同时体积明显较小(默认模型为 16MB,而 GloVe 300d 则为 2GB) 提供“Matryoshka Representations”来调整嵌入维度,并支持二进制嵌入模型以加快计算速度 所需资源极少,在 CPU 上运行迅速,适用于各种 NLP 任务,包括分类、
………………………………