字:
关灯 护眼
优秀小说 > 重生之乘风而起 > 第三千一百零八章 统一码大会

第三千一百零八章 统一码大会

    第三千一百零八章 统一码大会 (第3/3页)

个维度的信息量,这是声音记录类字符型文字所无法表达的。”

    “除了记录的效率,还有读取的效率。”麦小苗在台上侃侃而谈:“中国有个成语叫做‘一目十行’,意思就是中文信息的读取可以是面积式的,图形化的。”

    “四叶草实验室做过一个有趣的实验,那就是将固定中文词汇的排列顺序予以打乱,然后制作出文本交给读者阅读,读者们可以惊奇地发现,混乱的词汇语序搭配正确的中文语法,并不会对阅读理解造成任何影响。”

    “也就是说,‘实验’和‘验实’在文章里的作用是一样的,错误的排序会被中文使用者在下意识层面完成自动纠正。”

    “人类的大脑在阅读时主要涉及两条通路,一条叫背侧通路,主要进行语音识别,一条叫腹侧通路,主要进行视觉处理和语意连接。”

    “大家在阅读字符型文字的时候,需要先将文字转化为语音,然后通过背侧通路接收;而在阅读表意型文字的时候,则是两条通路同时进行,所以才能够达到‘一目十行’的效果,信息的提取效率也得到了极大的提高。”

    “作为识别工具,汉语的‘六书’法,又提供了强大的功能,瀚文大字库的所有表意文字,拆分开来,都是‘字根’,而这些字根里边,也涵盖了巨大的信息量。”

    “比如鸟字旁的字,可以圈定一个大概的理解范围,大家可以发现汉字里这类文字,大多和鸟,飞翔这类特性相关,而字符型文字很难做到这一点。”

    “对此有人会产生一种直觉,认为汉字的高效,与汉字特别多有关。”麦小苗微笑道:“然而这是一种错觉。英文总词汇量超过一百万,而且目前还在以每年四千到八千的数量增长。而中文常用字大约3500个,基本上只需要掌握这三千五百字,就能够自由组合,并且完成中文世界里百分之九十以上信息量的交互,这也是瀚文基准字库的范围。”

    “这一点重要不重要呢?我只举一点重要性,那就是中国人基本无需重构专业语言,学习另一套专业词汇,就可以自由地进行跨专业的学习。”
『加入书签,方便阅读』