首页 > 科技 > 一段爬虫导致公司200多人被抓,图一时方便可能触及法律红线

一段爬虫导致公司200多人被抓,图一时方便可能触及法律红线

近几年爬虫技术迅速崛起,成为了互联网从业者的标配技能,对于程序员来讲,谁还没有写过几段爬虫呢?爬虫抓取的数据虽然方便但可要谨慎使用,不然一不小心就会触及法律红线。

之前在互联网圈子里传播很广的一篇文章《只因写了一段爬虫,公司200多人被抓!》就是描述爬虫的。一位程序员在领导的要求下写了一段爬虫批量从网上的一个接口抓取数据,爬虫开发完后测试没有问题,小明就将程序上传到了公司服务器。随后经过调整将原来的将爬虫的线程数,由原来比较小的值调到一个比较大的值。直到被窃取数据的公司发现报警,该员工都没有意识到自己的错误。

可想而知,大家对于爬虫的使用和范围也只是停留在抓取数据上面,而没有在意它的使用范围。其实法律对爬虫已有明确规定。

网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意...

也就是必须在提前告知收集的方式、范围、目的,并经过用户授权或同意后,才能采集使用,也就是我们常见的各种网站与 App 的用户协议中关于信息收集的部分。

从合法公开渠道,并且不明显违背个人信息主体意愿,都没有什么问题。但如果通过破解、侵入等“黑客”手段来获取数据,那也有相关法律等着你

刑法第二百八十五条第三款规定的“专门用于侵入、非法控制计算机信息系统的程序、工具”:

(一)具有避开或者突破计算机信息系统安全保护措施,未经授权或者超越授权获取计算机信息系统数据的功能的;

国家互联网信息办公室发布了《数据安全管理办法》征求意见稿


那么什么才是爬虫的使用范围呢?

网络运营者采取自动化手段访问收集网站数据,不得妨碍网站正常运行;此类行为严重影响网站运行,如自动化访问收集流量超过网站日均流量三分之一,网站要求停止自动化访问收集时,应当停止。

即使是现在python火遍全网的的时候安全还是第一要义,平时多了解爬虫使用的范围,以及约束条件这样才能避免踩雷,抽空可以在云立方官网查看关于爬虫的其他相关系,或许能有意外收获呢?

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/381835.html