网络小爬虫莫堕落成小扒手

  蔡恩泽

  10月21日,杭州警方对51信用卡委托外包催收公司涉嫌寻衅滋事等犯罪开展调查。有媒体披露,外包催收公司通过恐吓、滋扰等软暴力催收的过程中,数据爬虫公司违规获取的通讯录、地址定位等个人敏感信息也是主要帮凶。

  近日,多家大数据风控服务商被查。9月6日,杭州的魔蝎数据科技有限公司监管部门查处。数日后,公信宝的运营公司杭州存信数据科技有限公司被公安机关查封,聚信立的运营公司上海诚数信息科技有限公司下发暂停爬虫业务的通知。

  此轮监管风暴正值2019年国家网络安全宣传周9月16日开幕的前夕。中央网信办官员杨春艳披露,截至目前,已收到8000条针对APP违法违规收集使用个人信息的举报,其中实名举报占到近1/3。

  聚信立官网显示,截至目前,其用户总量1.5亿+,覆盖人群14亿+,合作机构3300+,日均查询220万+,总查询10亿+,还精心建立了黑名单库1200万+。聚信立合作的商户有30家,包括百度、小米、万达、京东数科、点融网、浦发银行信用卡、兴业消费金融、中银消费金融、包商银行。巨大的灰色利益链条隐藏于庞大的数据业务之中。

  公信宝被查,就是因为非法收集支付宝、微信、京东、淘宝、信用卡账单、芝麻信用分、学信数据等,恣意盗窃网民的信息,特别是交易用户敏感数据。公信宝流传在市场上的一份2018年产品价格服务表明码标价,清清楚楚地介绍了不同数据的等级和单价,联手与P2P平台合作,从中牟利。

  在大数据防控公司中,低成本获取数据的捷径是爬虫技术。追溯爬虫的发展历史,20年前,搜索引擎、数据分析、聚合导航等业务,都是爬虫技术发挥作用,这是爬虫技术的荣耀。但荣耀不能陶醉,甚至忘乎所以,要守得住法律底线。

  爬虫技术本身并不是“害虫”,正像搜索引擎一样,作为一种计算机技术,具有技术中立性,因而,在法律上爬虫技术一向游离于法律禁区之外。问题是这个技术由谁来掌握,有没有得到用户授权,把“爬”来的数据用在什么地方。而眼下一些“小爬虫”为了商业利润铤而走险,处心积虑突破监管红线。像APP欺诈经营,“下载即发红包”,这已成为欺诈的广告词,条件是你必须慷慨地允许它偷看昵称、头像等个人敏感信息,甚至厚颜无耻地要求让其浏览相册等,十足的流氓性。

  在数据安全存在严重漏洞的互联网大环境中,爬虫技术往往成为信息来源违法、滥用等问题的打手,危害社会,扰乱金融秩序。

  眼下,多数网贷公司选择爬虫来做风控,爬一次1-3元,大多用在用户失联后来催款,有的甚至施加暴力,像51信用卡委托外包催收公司涉嫌寻衅滋事。本次警方对数据行业的高压调查,与近半年各省市集中打击“套路贷”也有很大关系。

  大数据风控公司提供借贷人的信息,从法律角度上讲,其实是要负连带责任。如果那些信息不是通过授权爬得,更是要负直接法律责任。道理很明白,“公开的数据,你去爬那是捡,但是私密的数据,你去爬那就是偷。”

  网络小爬虫一旦堕落为“小扒手”就要吃官司。《网络安全法》规定,未经授权爬取用户手机通讯录超过50条记录,公司法人最高可获刑3年;未经授权读取用户公积金社保记录超过5万条的,公司法人最高可获刑7年。

  有鉴于此,大数据防控公司的小爬虫一定要注意,合规才能生存,如果沦为“小扒手”,不仅名声难当,还要进班房。小爬虫们一定要从51信用卡委托外包催收公司涉嫌寻衅滋事案中汲取教训。

特色专栏

热门推荐