中文分词基本概念

英文是以词为单位的,词与词之间上靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am a student,翻译成”我是一个学生”。计算机可以很简单的通过空格知道student是一个单词,但是”学”,”生”假如分开来,计算机是无法理解的。必须把他们合在一起才变得有意义。把中文的汉字序列切分成有意义的词,就是中文分词。再比如”研究生命”,可以划分为”研究生/命”,也可以是”研究 /生命”,假如是人脑可以很明显的判断出这里后者的划分更加的确切,但是计算机要做到这一点却是相当的困难。

现有的分词算法有3种:基于字符串匹配的分词算法、基于理解的分词算法和基于统计的分词算法。

什么是中文分词
Continue reading “中文分词基本概念”

google Ajax API 的使用

试了一下google搜索Ajax,发现使用非常方便,主要将下面的示例代码放到html源文件中就可以使用google ajax搜索插件了。

只需改变searchControl.execute("abc");语句中的关键词(abc)就可以改变google
ajax搜索页面显示的搜索结果。简直就是傻瓜式的。

=========================================================

Continue reading “google Ajax API 的使用”

物质Vs精神—-思考Vs信息

相比20,30年前,我们的物质生活得到了很大的提高。无论是衣食住行,柴米油盐,还是开门七件事,都不会在困扰我么了。现如今物质已经是很丰富了。

对于精神生活而言,现如今是信息时代,资讯时代,或是网络时代,信息爆炸已经不足以概括当今信息丰富的程度了。我们每天可以获得大量的信息,资讯。当我们打开电脑,连上网络,铺天盖地的都是信息。

我们拥有过去任何一个时代都无法比拟的信息,那为什么我们还时常会感到空虚,无聊呢? 为什么开心网上有那么多人热衷于买卖人口,校内网上面那么多人在挑战那些无聊的游戏。

很显然资讯信息不等于人的精神生活。
Continue reading “物质Vs精神—-思考Vs信息”

windows IIS 下面 drupal的url重写文件 httpd.ini

还是不太好用啊

[ISAPI_Rewrite]

RFStyle New

# http://www.isapirewrite.com/
RepeatLimit 32
# Block external access to the httpd.ini and httpd.parse.errors files
RewriteRule /httpd(?:\.ini|\.parse\.errors).* / [F,I,O]
# Block external access to the Helper ISAPI Extension
Continue reading “windows IIS 下面 drupal的url重写文件 httpd.ini”

KDS 详解

常遇KDS,不明其意,故google之,得一解,觉尚可,录如下:

KDS即pchome.net电脑之家网站论坛中宽带山版块的拼音缩写。
宽带山来源于宽带上网,因此版民风彪悍,所以此版中的用户被称谓tf(即土匪),所以宽带上网版块又被称作了宽带山。
KDS目前已经成为最重要的上海本土民生论坛之一。 
尽管对于kds而言,有着很多人并不认同,但其精髓就在于彪悍的论坛,不需要解释!
诚然喜欢kds的tf需要的仅仅是赤诚的心、彪悍的神经外加一套耐用的键鼠(该论坛的精髓仅在于首页,需要不断的刷新!)
该论坛的优势在于你发的主题贴很快会有回复,因为一帮死忠长期驻守。
Continue reading “KDS 详解”