当前位置:清远传媒网 > 国内新闻 > 正文

拿来主义,奇虎游走于规则边缘的冷暴力

清远传媒 www.gdqynews.com   发布时间:2014-08-07 16:08:46   作者:gdqy

  Robots协议是什么?简单来说就是有关网络爬虫的一个协议,用于规范网络爬虫的行为,网站通过Robots协议告知爬虫哪些页面可以抓取,哪些页面不可以抓取。Robots协议在经世界互联网技术邮件组发布以后,几乎得到了所有搜索引擎的认可。Robots协议虽然不是一个国际标准,但事实上已经成为了业内一种普遍遵守的规范。

  Robots协议,共同遵守的行业准则

  关于这个Robots我想其实没什么好争议的,简单来说就是我的内容不想被你抓取,那你就没有权力抓取。这就是业界都默认自觉遵守的一个行业准则秩序,一旦有人破坏那么对整个互联网无疑都是灾难性的。Robots协议提供了一种保护互联网内容和隐私的手段,借助该协议,实现了网站与搜索引擎之间的一种平衡,维护了正常的网络秩序。

  其实在中国互联网业界就存在这么一个破坏者——360,在平时其对外总是以一种颠覆者的形态示人,在面对巨头时往往扮演一个弱者的形象,以博取用户的同情。但360违反Robots协议抓取百度的内容,其实并不像其标榜的那么伟大,归根到底其实只是不正当的市场竞争行为。

  这种Robots协议之争作为普通用户的我们其实本不应该插足,但是我们所担忧的是一旦这种行业规范被打破,我们的信息会不会因此被随意抓取,所有关于我的隐私将会变得犹如脱光的少女一般在外人面前展露无遗,而这无疑不是我所想要的。不管这场为时很久的官司最终结果是什么,在我看来360已经注定是一场输家。

  道德尴尬,不劳而获的利益诱惑

  360大量抓取了百度贴吧、知道、问答等内容,且不论这些内容到底是谁生产的,单单就说百度数十年花费的人力物力,这已经不能用海量资源来形容了。360肆意抓取别人内容,这是典型的不劳而获,一定程度上甚至会助长整个互联网不尊重知识版权的恶俗。拿来主义,对中国互联网简直就是一场灾难性的毁灭。我国的互联网协会订立了关于Robots协议的自律性公约,这个公约仅对参加了这个公约的企业具有约束力。

  作为国内三大搜索引擎之一的360不可能不清楚公约背后是行业准则的建立,在我看来360即使打赢了官司,但也仍然构成了理论上的侵权,直接撕毁了互联网协会协议的合理性,就如同在车马路上行驶,大家都靠右行驶,如果有人看到左边有空就走左边势必会造成一种混乱。既然目前大家都遵守这样一个规则,那么这个秩序就形成了,如果容忍破坏者,那么这个秩序也就被破坏掉了。在我看来360即使打赢了官司,但也仍然构成了理论上的侵权,直接撕毁了互联网协会了苦心。这是属于典型的不正当竞争行为

  用户隐私,恐慌之下的颇为无奈

  作为用户其实我们很在意自己的隐私不被泄露,但往往面对互联网公司肆意抓取我们的信息也会显得颇为无奈,因为这在业界可能都是一件再常见不过的事情。但是当我们知道360能够通过搜索抓取到很多网站不允许搜索引擎收录的内容时,或许只有恐慌才能形容我当下的心情。

  早前,有工程师曾详细揭露360如何绕过Robots协议,利用浏览器记录并上传用户数据和上网行为,并形成自己的网址库,再用伪装和隐藏过的爬虫来抓取快照,生成搜索结果。这也意味着只要用户通过360浏览器访问过一个网页,无论是私人账号信息,还是公司内网机密数据,都会被360浏览器记录下来,并被360搜索爬虫抓取。

  由于360搜索并不遵守搜索引擎通用的Robots协议,导致很多网站出于安全和隐私的考虑,不允许搜索引擎抓取的一些内网信息也泄漏在了360搜索上,这些隐私甚至可能包括银行帐号、密码、内部邮件等一些信息。用户曾经反馈,公司原本需要动态口令访问的内部网站现在也能被360搜索抓取,360搜索还抓取一些知名网游的后台订单、电子优惠券编号等信息,甚至IBM lotus domino 邮件系统后台和个人邮件文件存储地址也能在360中搜索到。

  内容版权,未经同意的肆意抓取

  360是否不遵守Robots协议,我想很多人都会和我一样的态度,那就是关我什么事情。不过360强行抓取百度知道、百度百科、百度贴吧、百度旅游等内容,却对我造成了实质性的伤害。诚然我们知道这些内容,绝大多数都是用户UGC生产的,可能我们并不是什么专业,生产的内容也非常小白化,但正如那句“再小的个人也有版权”一样,这些内容虽然足够卑微,但版权却从法律角度和道德角度都是属于我个人。360即使作为搜索引擎也没有肆意转载的权力。

  我们在百度平台生产内容,是因为认同这个平台,希望能够认识更多的志同道合之人,而360却在未经用户允许的情况下,完全不顾用户感受的肆意抓取,这对我们其实是一场打击。我们看微博、微信、雪球、知乎等平台,其实道理差不多,我们在这里生产内容,是因为这个平台价值的认可,内容的使用权只是赋予给这个平台而已。但如果别的平台转载,那就是典型的盗版侵权,追求法律责任其实也不为过,毕竟谁也不想自己辛苦生产的内容成为别人的嫁衣。