找到柳比歇夫
by 沈蚊 on 十一月 8, 2007
下午到家,惯例打开电脑,连接ADSL,运行Firefox,浏览Bloglines上的RSS订阅……
忽然看到李笑来老师(注1)在找一个叫做“柳比歇夫”的前苏联昆虫学家——自信搜索能耐了得,不禁“搜指大动”,又做了回人肉搜索引擎。
待找到结果,自是得意洋洋,兴奋之余,手一抖(注2),看到的自己的历史记录,觉得颇有趣味,遂记录下来,供在研究搜索引擎或语义网的同学研究:
问题定义:前苏联昆虫学家柳比歇夫的全名及英俄文写法
拆分关键字:柳比歇夫/昆虫学/苏联
搜索引擎:谷歌(Google.cn)
搜索工作从16:58至17:17,历时20分钟,共进行了12次搜索,具体流程如下(注3):
1、搜索关键字“柳比歇夫”
翻了10页以上,发现大多数都是在讲苏联作家格拉宁以柳比歇夫为主人公的小说《奇特的一生》,其中提到了他最(?)大的成就“时间统计法”;
2、搜索复合关键字“苏联 昆虫学 柳比歇夫 时间统计法”
翻了2页,得到柳比歇夫的生卒年“1890-1972”;
3、穿越到百度知道,搜索关键字“柳比歇夫”
翻了3页,都是名人名言;
4、回到谷歌,搜索关键字“时间统计法”,加参数“ site:wikipedia.com”
汗自己一个;
5、搜索关键字“时间统计”,带双引号,加参数“site:wikipedia.org”
看了1页,没有相关性;
6、搜索关键字“统计法”,带双引号,加参数“site:wikipedia.org”
看了1页,有日文出现;
7、搜索关键字“统计法”,带双引号,加参数“site:zh.wikipedia.org”
看了1页,没有相关性;
8、搜索关键字“柳比歇夫”,带双引号,加参数“site:zh.wikipedia.org”
看了1页,没有;
9、搜索复合关键字“Soviet Entomology Time Statistics”
翻了3页,打开了一些貌似相关的PDF,没有相关性;
10、搜索复合关键字“Soviet Entomology Time Statistics 1890-1972”
翻了3页,又打开了一些貌似相关的PDF,没有相关性;
11、搜索复合关键字“Time Statistics 1890-1972”
看了3页,没有相关性;
12、搜索复合关键字“Entomology 1890-1972”
第1页第3个,一个俄罗斯网站的英文版,大功告成!XD
纵观整个流程,实际上只有4步是有效的:拆分关键字、第2步、查字典(实际上是在第9步开始前)、第12步——其他都是在绕远路。
最后留下两个问题:
- 绕的远路是无用功么?
- 为什么会这样呢?
注:
- 李笑来,新东方讲师(请注意新东方和德云社的区别),写过很多对年轻人很有帮助的文章,Blog地址为:http://www.xiaolai.net。
- 我装了Firefox的扩展All-in-One Sidebar,并设置了鼠标激活显示侧栏。
- 该流程是依Firefox历史记录逆推而非实时记录的,所以可能有一些不很准确的地方,敬请谅解。
闲话
“人肉搜索引擎”是个奇妙的东东。想当年混mnbvc的时候,我也像很多人一样,充当人肉搜索引擎,赚取MP,美其名曰“赏金猎人”。反观百度知道、雅虎知识堂之类的产品,其实都是这么个原理儿。
在我回顾历史记录的时候,搜索关键字“柳比歇夫”时看到李笑来老师的该篇Blog已被收录在第6页,收录时间是“2小时前”,当时的时间是17:33。
该Blog发布时间是15:11,我回复时间即17:17,历时2小时6分钟。


7 comments
我原以为你会俄文,然后通过中文名字读音反推俄文近似拼法再找到的。
看了才恍然大悟。
by leox on 2007 年 11 月 13 日 at 19:28. #
近似拼法对于搜索引擎来说是一个挺大的台阶呢。
by 沈蚊 on 2007 年 11 月 13 日 at 23:16. #
1. 我认为绕远路不是无用的,而是为了得到答案,必须经历的思考和试错过程。
2. 让我解释,如果是简单问题,可能最初的直觉就能帮你找到答案;如果问题很复杂,可能就要象上面一样反复试错,直到出现“灵机一动”的点子。(可参考 G. Polya, How to solve it)
3. 如果这个试错过程有机械的规律的话,那么就可以预测 Goolge 的开发员们将会了解这个规律,从而省去楼主的试错过程。
by greenhope on 2011 年 1 月 18 日 at 10:48. #
1. 就目的而言,其实是无用功——由于不具备明确导向性造成的思考与操作成本提升。
2. “现阶段”搜索引擎的终极(?)目标并不是让用户去思考,而是一步直达——Google之所以是Google,是因为即使没有机械规律,也要解决这个问题。
by 沈蚊 on 2011 年 1 月 19 日 at 00:11. #
谢谢你的进一步解释,我承认你的说法更实际一些。
首先,你的真正目标是寻找“柳比歇夫”这个人相关的英文资料,而不是试图总结一种搜索罕见信息的规律。
其次,我用机械规律去理解Google的实力,也过于狭隘。
最后,我想说的是,之所以你绕远路不是无用的,是因为这个人的信息本来就难找,以Google目前的实力也还没做到。但是,你的搜索过程中可能包含了Google改进搜索框”理解力”的信息
by greenhope on 2011 年 1 月 19 日 at 23:05. #
感谢楼主啊,我正在深入的研究他的时间统计法,搜索历程和你差不多
by flynngao on 2011 年 2 月 7 日 at 14:55. #
请问楼上是怎么做的?我最近尝试了一下他的方法,坚持起来有点困难,但我日后仍然希望继续。另外,楼上的玉米好像不能用啊。
by greenhope on 2011 年 2 月 20 日 at 16:46. #