DIY自动分类“错题集”：一种基于视觉词汇的文本分类法

量子位 · 公众号 · AI · 2017-09-23 13:50

文章预览

作者：曹阳敏万达网络科技 | 资深研发经理量子位已获授权编辑发布转载请联系原作者一年多以前我脑子一热，想做一款移动应用：一款给学生朋友用的“错题集”应用，可以将错题拍照，记录图像的同时，还能自动分类。比如拍个题目，应用会把它自动分类为”物理/力学/曲线运动”。当然，这个项目其实不靠谱，市场上已经有太多“搜题”类应用了。但过程很有趣，导致我过了一年多，清理磁盘垃圾时，还舍不得删掉这个项目的“成果”，所以干脆回收利用一下，写篇文章圈圈粉。源码地址： https://github.com/caoym/odr 这个项目，核心要解决的问题就是文本分类。所以最初想到的方案是先 OCR 图片转文本，然后分词，再计算 tf-idf，最后用 SVM 分类。但这个方 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【[115星]Awesome-Medical-VLMs-and--20250502122857

13 小时前

AI前线 · 阿里最新开源模型Qwen3到底能不能打？不妨上「通义App」亲自试试

2 天前

黄建同学 · 马斯克让大模型学会了第一性原理下周，Grok 3.5 将发布早期-20250429224017

3 天前

黄建同学 · Rig 是一个 Rust 库，用于构建可扩展、模块化LLM 驱动-20250429221040

3 天前

黄建同学 · 谷歌 76 页 PPT《Agents Companion》-20250429190033

3 天前

英式没品笑话百科 · 有没有比迈克尔在健怡可乐中加糖更好的无背景声笑话？（——美剧《办-20240906145911

7 月前

偶俚张家港 · 优秀！恭喜张家港30名学生

3 周前