使用字母文字的人真是幸福,他们无缝地进入了计算机时代,而汉字文化圈(包括中日韩在内)的人就没那么好运气,中文输入的研发一直没有中断,但自从拼音输入法被刚刚发明出来之后,一直也没有取得更重大的突破。即使是拼音输入法,现在的词语排序也相当的不科学,唐宁自己打字的时候都感觉很不爽,他决定做点什么。
为了取得科学的数据,就应该对中文词语在各种出版物中出现的频率进行统计,最好是根据出版物的种类划分出不同的领域,当用户在输入时,输入某个特定的词就会触发某学科的词库优先级提高,比如提到“蛋白质”时,触发生物学的词库,提到“动量”时触发物理学词库,提到“约翰”时触发外国人名词库,等等。
而为了开发出自动计算词语频率的程序,就必须先开发出中文分词的程序,为此,唐宁让开发小组先开发了一个“分词竞赛程序”,向参赛者提供从大清新闻报里某篇文章中随机提取出来的一个句子,让参赛者把句子分拆成一个个的词语。所有的参赛者都必须是在中文方面拥有比较高的造诣的人,最后统计他们所拆句子谁最接近最多人的选择,那种拆分方法很可能就是最佳拆法,此人胜出,有奖。
这个方法很有趣,被选定为中文高手的参赛者玩得很开心,一不小心还能得到小奖品。为了将这个游戏扩展到更大的人群中,唐宁向中国的大学捐赠一千台pc,要求校方制定每个师生都有机会接触到这个时代最先进的产品,而每个用户注册时都来玩十分钟拆词游戏,所以的“游戏”数据都会被统计,所有的师生都有机会得到奖品,最高奖项是赠送pc机十年使用权,次奖依次降低,9、8、7……最后还有11个月、10个月……反正奖品全部是pc使用权,既是奖励机制,又是普及pc的好方法。
岩琦弥太郎知道唐宁的这个计划之后,知道自己该干点什么了,他向日本的大学捐赠了500台pc,同样想用这种方案来为日本人开发出优秀的输入法。唐宁不懂日语,又不好意思驳贝加尔俱乐部成员弥太郎的面子,只好请自己的高徒法拉第小姐出山主持日语输入法的开发,后来,林菲尔连韩文输入法的大旗也接过来了,并且她觉得所有成年人的语言能力都不弱,可以在她的网吧帝国里开展这个有趣又有建设性的竞赛活动。
朝鲜的局势仍然是半岛被大清与大日本分割,时有暴力事件发生,不过,林菲尔可以先在与朝鲜接壤的朝鲜语流行地区实验她的想法,因此增加了在盛京和吉林的计算机公馆份额。
林菲尔甚至脑洞大开,终于想到自己应该做一个什么样的网站——博彩网。她把分词游戏变成了一个博彩项目,成为一个充满文人气息的商业模式,深受学生们、年轻人们的欢迎。
即可以帮助自己的母语发展输入法,又有机会中奖,跟“既收嫖资又立牌坊”有一拼,哪能不火呢?而且林菲尔深收师傅的影响,慈善只有跟商业模式结合才能持久,所以她发展了这个史无前例的博彩项目,并声称项目所有的运营费用由她来捐赠,而彩友们真金白银拿钱出来的参赛费收入除了缴纳税收之外100将用于奖励。
而此时,李鸿章大人终于做了一件好事,他请林老板将这个项目的公司在北京注册,大清国政府将对这个项目免税。经此一事,总理府跟温莎共济会的关系终于转暖。
这个项目所有人都欢迎,从慈禧太后到曾国藩、郭嵩涛、恭亲王、胡雪岩,几乎没有任何一个不和谐的声音,简直是又一个史无前例,大清国一片普天同庆的格局。上面提到的这些人甚至都亲自去买彩票“参赛”了。第一个赛季结束,曾国藩居然还获得了不错的奖,pc一年的使用权,这比花钱去买还让人高兴。而慈禧太后那错别字连篇的水平肯定只有名落孙山的份儿。
根据每个国家的不同,netape首页的网站推荐会有不同,这个时候,博彩网光荣地被列在推荐之列,这是屈指可数的光荣。而club中的分词社团也成为官方的大社团,每天有很多彩民在上面讨论拿不准的句子。用博彩来持续“招新”的策略真是取得了巨大的成功。
唐宁对小师妹的工作简直太满意了,光是用这个神主意来统计词频显然大材小用,可以继续扩展,下一个竞赛项目是近义词和反义词大赛。他向网民们解释,这种大赛的数据将会帮助计算机程序慢慢地理解语言的含义,将来可用于智能查找,普通的程序不可能理解近义词而只能理解完全一模一样的等资料的可用性。因此,词义理解工程是提高资料查找效率的利器。
显然,这项大赛可以扩展至可以在全球范围内大出风头了,而林老板聪明地秉持着纯公益性的出发点,将博彩网建成了全球访问量最大的网站之一。
在大清,博彩网的应用更是绝让人想不到,它还发布了房产博彩项目,起因是为山西清华大学建立校园,因为这将是大清最著名的私立大学,由神级科学家唐老板发起的当然不可能低调。清华大学最后选址在平遥城不远的黄土高原上,原来是一块人口比较少的贫瘠之地,可是从天空上看上去它的黄土路美得令人窒息,这打动了唐老板,决定在这九曲十八弯的黄土的腹地建造浪漫主义大学校园。
山西省政府把大片的无人耕种的黄土出让给清华大学,象征性地占大学1的