专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

WordLlama - 一个开源、快速、轻量级(16MB)的 N-20240918130047

斌叔OKmath  · 微博  ·  · 2024-09-18 13:00
    

文章预览

2024-09-18 13:00 本条微博链接 WordLlama - 一个开源、快速、轻量级(16MB)的 NLP 工具包,用于模糊重复数据删除、相似性和排名等任务,并针对 CPU 进行了优化🔥 在基准测试中表现优于 GloVe 300d 等热门词模型,同时体积明显较小(默认模型为 16MB,而 GloVe 300d 则为 2GB) 提供“Matryoshka Representations”来调整嵌入维度,并支持二进制嵌入模型以加快计算速度 所需资源极少,在 CPU 上运行迅速,适用于各种 NLP 任务,包括分类、 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览