找到柳比歇夫

by 沈蚊 on 十一月 8, 2007

下午到家,惯例打开电脑,连接ADSL,运行Firefox,浏览Bloglines上的RSS订阅……

忽然看到李笑来老师(注1)在找一个叫做“柳比歇夫”的前苏联昆虫学家——自信搜索能耐了得,不禁“搜指大动”,又做了回人肉搜索引擎。

待找到结果,自是得意洋洋,兴奋之余,手一抖(注2),看到的自己的历史记录,觉得颇有趣味,遂记录下来,供在研究搜索引擎或语义网的同学研究:

问题定义:前苏联昆虫学家柳比歇夫的全名及英俄文写法

拆分关键字:柳比歇夫/昆虫学/苏联

搜索引擎:谷歌(Google.cn

搜索工作从16:58至17:17,历时20分钟,共进行了12次搜索,具体流程如下(注3):

1、搜索关键字“柳比歇夫
翻了10页以上,发现大多数都是在讲苏联作家格拉宁以柳比歇夫为主人公的小说《奇特的一生》,其中提到了他最(?)大的成就“时间统计法”;

2、搜索复合关键字“苏联 昆虫学 柳比歇夫 时间统计法
翻了2页,得到柳比歇夫的生卒年“1890-1972”;

3、穿越到百度知道,搜索关键字“柳比歇夫
翻了3页,都是名人名言;

4、回到谷歌,搜索关键字“时间统计法”,加参数“ site:wikipedia.com
汗自己一个;

5、搜索关键字“时间统计”,带双引号,加参数“site:wikipedia.org
看了1页,没有相关性;

6、搜索关键字“统计法”,带双引号,加参数“site:wikipedia.org
看了1页,有日文出现;

7、搜索关键字“统计法”,带双引号,加参数“site:zh.wikipedia.org
看了1页,没有相关性;

8、搜索关键字“柳比歇夫”,带双引号,加参数“site:zh.wikipedia.org
看了1页,没有;

9、搜索复合关键字“Soviet Entomology Time Statistics
翻了3页,打开了一些貌似相关的PDF,没有相关性;

10、搜索复合关键字“Soviet Entomology Time Statistics 1890-1972
翻了3页,又打开了一些貌似相关的PDF,没有相关性;

11、搜索复合关键字“Time Statistics 1890-1972
看了3页,没有相关性;

12、搜索复合关键字“Entomology 1890-1972
第1页第3个,一个俄罗斯网站的英文版,大功告成!XD

纵观整个流程,实际上只有4步是有效的:拆分关键字、第2步、查字典(实际上是在第9步开始前)、第12步——其他都是在绕远路。

最后留下两个问题:

  1. 绕的远路是无用功么?
  2. 为什么会这样呢?

注:

  1. 李笑来,新东方讲师(请注意新东方和德云社的区别),写过很多对年轻人很有帮助的文章,Blog地址为:http://www.xiaolai.net
  2. 我装了Firefox的扩展All-in-One Sidebar,并设置了鼠标激活显示侧栏。
  3. 该流程是依Firefox历史记录逆推而非实时记录的,所以可能有一些不很准确的地方,敬请谅解。

闲话

“人肉搜索引擎”是个奇妙的东东。想当年混mnbvc的时候,我也像很多人一样,充当人肉搜索引擎,赚取MP,美其名曰“赏金猎人”。反观百度知道、雅虎知识堂之类的产品,其实都是这么个原理儿。

在我回顾历史记录的时候,搜索关键字“柳比歇夫”时看到李笑来老师的该篇Blog已被收录在第6页,收录时间是“2小时前”,当时的时间是17:33。

该Blog发布时间是15:11,我回复时间即17:17,历时2小时6分钟。


分享到:



7 comments

我原以为你会俄文,然后通过中文名字读音反推俄文近似拼法再找到的。

看了才恍然大悟。

by leox on 2007 年 11 月 13 日 at 19:28. 回复 #

近似拼法对于搜索引擎来说是一个挺大的台阶呢。

by 沈蚊 on 2007 年 11 月 13 日 at 23:16. 回复 #

1. 我认为绕远路不是无用的,而是为了得到答案,必须经历的思考和试错过程。

2. 让我解释,如果是简单问题,可能最初的直觉就能帮你找到答案;如果问题很复杂,可能就要象上面一样反复试错,直到出现“灵机一动”的点子。(可参考 G. Polya, How to solve it)

3. 如果这个试错过程有机械的规律的话,那么就可以预测 Goolge 的开发员们将会了解这个规律,从而省去楼主的试错过程。

by greenhope on 2011 年 1 月 18 日 at 10:48. 回复 #

1. 就目的而言,其实是无用功——由于不具备明确导向性造成的思考与操作成本提升。

2. “现阶段”搜索引擎的终极(?)目标并不是让用户去思考,而是一步直达——Google之所以是Google,是因为即使没有机械规律,也要解决这个问题。

by 沈蚊 on 2011 年 1 月 19 日 at 00:11. 回复 #

谢谢你的进一步解释,我承认你的说法更实际一些。

首先,你的真正目标是寻找“柳比歇夫”这个人相关的英文资料,而不是试图总结一种搜索罕见信息的规律。

其次,我用机械规律去理解Google的实力,也过于狭隘。

最后,我想说的是,之所以你绕远路不是无用的,是因为这个人的信息本来就难找,以Google目前的实力也还没做到。但是,你的搜索过程中可能包含了Google改进搜索框”理解力”的信息

by greenhope on 2011 年 1 月 19 日 at 23:05. 回复 #

感谢楼主啊,我正在深入的研究他的时间统计法,搜索历程和你差不多

by flynngao on 2011 年 2 月 7 日 at 14:55. 回复 #

请问楼上是怎么做的?我最近尝试了一下他的方法,坚持起来有点困难,但我日后仍然希望继续。另外,楼上的玉米好像不能用啊。

by greenhope on 2011 年 2 月 20 日 at 16:46. 回复 #

Leave your comment

Required.

Required. Not published.

If you have one.