为什么违反Robots协议的搜索引擎最可怕？

清远传媒 www.gdqynews.com 发布时间：2014-08-07 16:36:47 作者：gdqy

　　Robots协议是搜索引擎的立命之本，如果不遵守Robots协议，无异于脱缰之马，对正常秩序的危害后患无穷。事实上，几乎所有的搜索引擎公司都会自觉遵守Robots协议，不管是Google、Yahoo、微软必应，还是百度、搜狗，在Robots协议这个问题上，大家都按照国际规范来做事，让蜘蛛不会去触碰抓取Robots协议中明文禁止抓取的内容。哪怕是再怎么有利于丰富充实搜索结果的信息，只要有Robots文件在，蜘蛛也能遵守规则，对其“视而不见”。

　　正因如此，Robots协议是国内外绝大多数网站的“保护神”，不管是后台URL，还是各种敏感信息或不愿意被搜索引擎收录分享的内容，只需在Robots文件里加上一笔，就可以放心大吉。

　　然而，市场竞争中，有些后来的搜索引擎，却往往因为急于上位或受利益驱使，在不告知对方的情况下，就擅自违反Robots协议，偷偷的抓取收录Robots文件中禁止抓取的内容，这就已经不只是道德层面的“缺德”，更是一种很恶劣的不正当竞争行为了。

　　虽然在国外还没有见到过这种不靠谱的搜索引擎存在，但国内却有这么一个官司，说的就是不违反Robots的事儿。

　　2013年10月中旬，百度诉奇虎360违反“Robots协议”抓取、复制其网站内容侵权一案在北京市第一中级人民法院开庭审理。百度认为，360搜索在未获得百度公司允许的情况下，违反业内公认的Robots协议，抓取百度旗下百度知道、百度百科、百度贴吧等网站的内容，已经构成了不正当竞争，并向奇虎索赔1亿元。

　　这个事情要刨根问底，实际上要再后退一年，从360在2012年8月推出搜索引擎说起。由于360的搜索结果中包含着百度百科、百度知道等多个百度产品内容。百度就不愿意了。双方当时的矛盾焦点主要集中于是否应该遵守Robots协议的问题。奇虎360公司认为，Robots协议不具有法律效力，也非强制性规范，搜索引擎公司可以不遵守Robots协议。并且百度百科、百度知道的内容是最优质的网络内容，其搜索结果中应该包括百度相关产品。百度公司表示，奇虎360违反Robost协议抓取大量百度内容，要求360遵守Robots协议停止收录使用百度产品的信息内容。

　　后来，在行业协会的调解下，包括双方在内的多家互联网公司签署了12家搜索引擎服务企业在北京签署了《互联网搜索引擎服务自律公约》，公约规定，对于本公约公布前违反robots协议抓取的内容，在收到权利人符合法律规定的通知后，及时删除、断开侵权链接。

　　然而，签署了公约后的360仍然坚持自己的观点，继续抓取收录百度的上述内容。后来也就有了刚才所说的不正当竞争诉讼。

　　是不是不正当竞争，双方僵持不下，法庭也没有当即宣判。

　　算算日子，宣判日期估计也快到了。

　　据国家知识产权战略实施研究基地主任、北京大学知识产权学院常务副院长张平在《法制日报》发表的最新署名评论认为，Robots协议是一种单方声明,但是业界都共同遵守,成为一种行业惯例,如果上升到经营的角度,就是一种商业的规范。司法判决要给人们的行为一个指引,否则,司法机关自身也很难去判断行为的正确与否。在没有明确法律规定的情况下,法院应该去支持依靠技术规范建立起来的秩序,即违反Robots协议的行为应当适用不正当竞争一般条款。

　　由此来看，违反Robots协议的搜索引擎不仅有危及隐私保护的隐患，而且也有极大的触犯法律的可能。而哪怕单从道德层面看，不遵守全球业界规范的公司，本身就无法给用户安全感，让人觉得可怕。

>>上一篇：robots第一案启示：违反爬虫协议无异于行业“毒瘤”

>>下一篇：百度诉360不正当竞争案一审宣判：360判赔70万