又搬家了,这回搬到了Buzz上,去http://www.google.com/profiles/goldengrapeblog#buzz看我吧,还可以方便的讨论哦
  • 网站的自进化

    2007-02-10

    版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
    http://goldengrape.blogbus.com/logs/4503739.html

    我是狂热的达尔文主义者。不仅表现在我对进化论的信仰,而且表现在我尽可能推动其他各种非生物形式的自进化,比如实验,以及互联网。

    要完成一个有效率的进化形式,需要有复制、交换、突变和筛选。基因型和表现型最好处于两个层次。

    随着Feed和API的推广,网站是可以作为自进化的一个单位的。以前还很发愁怎样来解释这个观点,现在Yahoo推出了pipe,是一个不错的实例。通过按照一定顺序组合Feed和API,可以得到一个实用的页面,甚至于以后还可能完成一定的信息处理工作。组合Feed和API的方式,可以由一组简单的线性编码说明,对应于DNA序列,而产生的页面则是表现出来的功能,相当于一个一个生物个体。后续的工作应该是凸现一个复制的过程,就是其他pipe的用户,可以方便的利用别人的pipe当作模板,进行修饰,成为自己的页面。里面还可以加入一些推荐的元素。

    这种技术不可能被yahoo独享,必然会被抄袭、模仿,最终形成一种新的xml说明方式,来说明Feed和API的组合关系,也会有开源的解释器、生成器来解析这种xml的语言,自动形成网页。当然,还会有进一步的图形化的编辑界面来辅助这一过程。

    再往后,人们发现,是否由人工参与选择Feed和API已经不是很重要,只需要拆解、组合流行的xml就可以了,于是交换的过程建立。会有自动的模板组合程序出现。病毒可以搭载这种自动组合程序,可以生成一个有意义的网页,吸引其他人来访问,协助传播。于是,攻击服务器的病毒也该有了,它们可以获取虚拟主机的管理权限,建立自己的网站,组合出受欢迎的网页,提供病毒的下载,取得客户端权限以后,取得各种账号,openID,再感染其他的虚拟主机。第一代的web生物。

    为了提高第一代的web生物的访问量,它们会进行各种SEO的活动、Spam活动,它们利用自己网页内的信息(Feed+API),组合成有意义的回复,贴到各种blog、news、forum等等,人们不一定可以分辨出哪些留言是机器自动生成的,哪些是手工写成的。写得好得留言,得到响应,访问量增加。第二代的web生物。

    再往后,生成spam和生成blog、生成创意、生成程序,并没有本质的区别。控制服务器和控制机器人也没有本质的区别。点击网站和下订单还是没有本质的区别。这些是自动赚钱的机器,显然会得到人们的追捧。第三代的web生物。


    另一支,爬虫。搜索引擎的爬虫。随着网页可以自动生成,网页的数量又会暴涨,爬虫需要新的策略了。如果爬虫之间可以竞争,那么哪些可以抓到搜索结果第一页内容的爬虫可以活下来。比如,选择dig页面中的文章,拆解关键词,然后进行跟踪的爬虫。爬虫之间显然是在竞争的,至少yahoo和google的在相互竞争吧。最终,爬虫要能够预测人类集体的阅读兴趣,爬虫要走在搜索之前。搜索引擎的爬虫,就是先知。

    洗洗睡了,下夜班真是痛苦。

    \\\\\\满怀敬仰的分割线//////

    update:07年2月12日,又稍微研究了一下yahoo的pipes。上次居然忽略了首页的“Hot Pipes”,其中不仅有流行的pipes,还有每个pipe被运行的次数,和“Clones”!而且打开pipe以后,还可以view/edit别人的pipe为己所用。我的敬仰立刻犹如滔滔江水。不知道现在改学计算机还是否来得及。

    赞美啊
    盖雅的前体

    /////满怀期待的分割线\\\\\

    update: 07年2月17日

    原来真的有在blog之间传播的“病毒”,相关资料可以查询XSS worm


    历史上的今天:


    收藏到:Del.icio.us




    评论

  • 博主还真是牛,受益匪浅呐
    金色葡萄回复newstart说:
    有益就好,望各位走过路过的程序员们,努力,再努力

    神话时代,就要展开了。
    2007-02-18 02:01:21
  • http://www.douban.com/subject/1283120/

    推荐一本书《达尔文与基要主义》。
    金色葡萄回复Uvo说:
    原来是 玉米^ō^麦兜
    2007-02-10 23:48:24