2010年1月27日

利用twit和google进行分步布文档发布和检索

    本篇文章介绍如何利用twitter和google的工具进行分步式文档发布和检索,包括电子书、BT种子、电驴链接,其它文档类型同理。
    twitter的特点是:1、随时随地可发布;2、可利用tag进行检索。
    这里利用google的以下工具:docs支持在线文档存储、共享、浏览;搜索支持twitter的实时搜索。
   
一、电子书发布
1、将电子书(建议格式为txt/doc/pdf,最好是pdf)上传到google docs的共享文件夹中,得到其共享链接。
2、将电子书的关键词和链接发布到twitter上,格式为:#twitlib #作者 #书名 #语言 #类型 #关键词 链接。
如#twitlib #michael crichton #state of fear #english #novel #sci-fi  http://docs.google.com/fileview?id=0B-hxuQ1jJs7IZTBjNmIwMzEtOGM1ZS00OTBjLWFiZTktNmUyNDc4ODc4ODJi
注:google docs的链接长没有问题,twitter客户端会自动转换成短网址。
3、发布后马上可以通过twitter检索关键词twitlib检索到。
4、发布后数分钟可以在http://twitlib.tweetwally.com/看到此推。
5、发布后可以通过google realtime search进行检索,可以补充关键词:

二、BT种子发布
1、将BT种子上传到google docs的共享文件夹中,得到其共享链接。
2、将BT种子的关键词和链接发布到twitter上,格式为:#twitbt #关键词,如:
#twitbt #美剧 #24小时? ?8季 http://torrent.zoink.it/24.S08E05.720p.HDTV.x264-IMMERSE.[eztv].torrent
3、可以在http://twitbt.tweetwally.com/看到更新。
其它步骤同电子书。

三、电驴链接发布
1、直接将电驴链接加上关键词发布到twitter上,格式为:#twitemule #关键词,如:
#twitemule ed2k://|file|[24小时.第八季].24.S08E05.HDTV.XviD-FQM.avi|367498630|276c4773e4944827a3d9622ecd811c85|/
2、可以在http://twitemule.tweetwally.com/看到更新。
其它步骤同电子书。




2010年1月17日

谈谈GOOGLE: PAGERANK, MONEYRANK, POLITICRANK,用户隐私



作为GOOGLE的重度用户,从技术的角度谈谈它吧,主要讲两点:PAGERANK和用户隐私。
GOOGLE搜索功能的核心技术就是PAGERANK,谷歌黑板报有详细介绍。简单地来说,每个页面的重要性是由其它页面对它的引用(链接)次数来决定的。我们知道在早期,互联网是由N多的网页通过链接来实现的,因此GOOGLE索引尽可能多的网页,每个链接相当于一张选票,如果很多的网页链接指向同一个特定网页,那么可以理解为很多网页都认为它有价值,因此GOOGLE就提高了它的PAGERANK值。GOOGLE就根据这种原理的算法为每一个网页进行排名,然后根据用户输入的关键字进行检索。
而百度的算法我称之名MONEYRANK,即根据金钱进行的排名,假如用户输入一个典型的商用产品关键词,百度检索结果的前几页全部都是广告,而这些广告的排序依据是投入广告的金钱数额。我来举个例子好了,比如说杭州集中国内很多的电动车生产商,厂商A想做2010年的广告,百度销售告诉厂家购买"电动厂"关键字广告,每次点击五毛就可以排在第一位了,于是厂商A就买了,效果很好,但是过了没几天就排到后面了,再过一个月就排到第二页了,于是再和百度联系,发现每次点击要九毛才能排到第一,于是加钱,但是所有的厂家都面临同样的困境,因此多交的钱等于白花了,没有任何价值,最终受益的是有绝对规模优势的企业,强者更强。(补充一个小故事,前面说的厂家A发现自己两个月就花完了一年的网络营销费用,于是很恼火,后来心生一计,营销人员没事就去点击竞争对手的百度关键字,让对方白白花钱,最终的结局是双输。)
而CCTV的算法我称之为POLITICRANK,即根据政治重要性而编排节目的播出顺序,这个就不说了,大家都明白是怎么回事。
总结一下,GOOGLE搜索是一个技术工具,百度搜索是一个广告工具,CCTV是一个宣传工具,分别服务于网民、广告主、政府。

下面再来谈谈为什么用户隐私对于GOOGLE来说如此重要。
GOOGLE的目标是整合所有的网络数据,在其发展的早期,网络是N多网页的集合,或者说网络=网页+链接。
但是随着互联网的发展,特别是WEB2.0的出现,网页的重要性降低了,一些数据是非公开的,一些数据是实时调整的。GOOGLE从长远目标考虑,必须整合网页之外的大量数据。它之所以推出GMAIL/READER/DOCS/PICASA等工具,就是希望用户最终将数据汇集到GOOGLE的数据中心,因此GOOGLE希望用户免费使用它的数据存储与在线计算,是与其长远目标一致的。
GOOGLE的产品是非常优秀的,它承受的最多攻击是记录了太多用户的隐私数据,因而人们担心隐私的安全。
如果GOOGLE不能承诺用户其隐私的安全性,那么人们就不会放心地使用它的网络工具,那么网络数据就会从GOOGLE的数据中心流失,那么10年后GOOGLE的地位就不能得到保证。
总结一下,PAGERANK是GOOGLE这一个10年成功的关键,而用户隐私是GOOGLE未来成功的基石。

GOOGLE: PAGERANK, MONEYRANK, POLITICRANK,用户隐私

谈谈GOOGLE: PAGERANK, MONEYRANK, POLITICRANK,用户隐私

作为GOOGLE的重度用户,从技术的角度谈谈它吧,主要讲两点:PAGERANK和用户隐私。
GOOGLE搜索功能的核心技术就是PAGERANK,谷歌黑板报有详细介绍。简单地来说,每个页面的重要性是由其它页面对它的引用(链接)次数来决定的。我们知道在早期,互联网是由N多的网页通过链接来实现的,因此GOOGLE索引尽可能多的网页,每个链接相当于一张选票,如果很多的网页链接指向同一个特定网页,那么可以理解为很多网页都认为它有价值,因此GOOGLE就提高了它的PAGERANK值。GOOGLE就根据这种原理的算法为每一个网页进行排名,然后根据用户输入的关键字进行检索。
而百度的算法我称之名MONEYRANK,即根据金钱进行的排名,假如用户输入一个典型的商用产品关键词,百度检索结果的前几页全部都是广告,而这些广告的排序依据是投入广告的金钱数额。我来举个例子好了,比如说杭州集中国内很多的电动车生产商,厂商A想做2010年的广告,百度销售告诉厂家购买“电动厂”关键字广告,每次点击五毛就可以排在第一位了,于是厂商A就买了,效果很好,但是过了没几天就排到后面了,再过一个月就排到第二页了,于是再和百度联系,发现每次点击要九毛才能排到第一,于是加钱,但是所有的厂家都面临同样的困境,因此多交的钱等于白花了,没有任何价值,最终受益的是有绝对规模优势的企业,强者更强。(补充一个小故事,前面说的厂家A发现自己两个月就花完了一年的网络营销费用,于是很恼火,后来心生一计,营销人员没事就去点击竞争对手的百度关键字,让对方白白花钱,最终的结局是双输。)
而CCTV的算法我称之为POLITICRANK,即根据政治重要性而编排节目的播出顺序,这个就不说了,大家都明白是怎么回事。
总结一下,GOOGLE搜索是一个技术工具,百度搜索是一个广告工具,CCTV是一个宣传工具,分别服务于网民、广告主、政府。

下面再来谈谈为什么用户隐私对于GOOGLE来说如此重要。
GOOGLE的目标是整合所有的网络数据,在其发展的早期,网络是N多网页的集合,或者说网络=网页+链接。
但是随着互联网的发展,特别是WEB2.0的出现,网页的重要性降低了,一些数据是非公开的,一些数据是实时调整的。GOOGLE从长远目标考虑,必须整合网页之外的大量数据。它之所以推出GMAIL/READER/DOCS/PICASA等工具,就是希望用户最终将数据汇集到GOOGLE的数据中心,因此GOOGLE希望用户免费使用它的数据存储与在线计算,是与其长远目标一致的。
GOOGLE的产品是非常优秀的,它承受的最多攻击是记录了太多用户的隐私数据,因而人们担心隐私的安全。
如果GOOGLE不能承诺用户其隐私的安全性,那么人们就不会放心地使用它的网络工具,那么网络数据就会从GOOGLE的数据中心流失,那么10年后GOOGLE的地位就不能得到保证。
总结一下,PAGERANK是GOOGLE这一个10年成功的关键,而用户隐私是GOOGLE未来成功的基石。