专栏名称: 数字游牧日常
顶级摄影器材分享
目录
今天看啥  ›  专栏  ›  数字游牧日常

AI挑战2025之四(上):数据自主可控,我们需要新的“五笔输入法”吗?

数字游牧日常  · 公众号  ·  · 2024-11-18 10:20
    

文章预览

当这几天一些rumor开始表达出对于模型Scaling law的担忧时,数据问题被再次关注到。这当然是过去、现在以及未来都会面临的巨大挑战,至少是之一。但是数据问题的复杂性也意味着一篇的篇幅难以讲清楚,所以,我拆分成两个视角,一是数据本身的视角,二是站在我们自身的视角。 今天,是站在我们自身的视角。 从哪里开始,从王码和五笔字型,这两个很多人可能都没有听说过的古早名词开始。 时间退回到九十年代初,当计算机被叫做“电脑”开始被更多引入到中国,慢慢进入普通家庭时。所有人面对的第一个问题,就是输入:面对一个全是英文字母的键盘,和一个只显示英文的显示器,手足无措。 那是第一次妥妥地感受到来自“语言的压制”。要显示中文,就需要两个字节,然后利用与英文字母相同的点阵方式来显示。如下面由Claude生成的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览