大数据时期,玩“爬虫”能够冒犯的三宗罪

挡不住的超载,禁不完的超重

初步分析,上跨桥侧翻是运输车辆超载所致。据估算车辆载重在120吨至180吨间,一辆现代重型主战坦克仅在60吨左右。根据现行规定,车辆上路的重量必须在49吨及以下,超过上述重量必须经过有关部门报批。且超载车辆严重破坏公路、桥梁等公共设施,给公路、桥梁结构带来灾难性的打击。挡不住的超载 击退“百吨王”,“十吨王”又冒头。

本文泉源:导师:冉晋,整理:一本学院

近来网上撒布一个顺口溜:爬虫玩得好,牢狱进得早。数据玩得溜,牢饭吃个够。

自2019年9月以来,多家着名公司相干职员被抓或被观察,这些机构均触及大数据风控营业和爬虫手艺的应用。由此,大数据营业的合规正当题目、爬虫手艺的合理应用题目,引起了大数据和金融科技行业的迥殊注重。

爬虫手艺违规吗?开展营业究竟存在哪些风险点?

近日,在一本学院的风控与助贷营业课堂上,上海瀛东状师事件所的高等合伙人及治理委员会成员冉晋状师,迥殊就大数据行业的合规正当题目举行了深切解读。以下为部分内容整理。

 “爬虫”本中立,数据应庇护

一、国民个人信息不可侵占

如今国度对数据行业和数据相干营业的整理异常严肃。

近来有如许一个案例:X公司是某快递公司的分包效劳商,可以登录该快递公司的背景查询快递信息。X公司的一位员工自行开辟了一个爬虫软件,应用这家快递公司给的权限暗码登录背景体系,抓取了背景25万条用户信息。

这个案件被发明后,开辟爬虫软件的员工被定为正犯抓捕,公司法人被定为从犯一同抓捕。公司法人没有介入这件事,不是第一义务人,但仍然是义务关联方。从判刑上来看,正犯是3-7年量刑,从犯是1-2年量刑。可见,数据平安的题目是触及全行业的,不仅限于金融科技领域。

二、爬虫手艺只是中立的东西

近来被查的大数据风控机构,都触及爬虫手艺。一时间,网络爬虫手艺被推到了风口浪尖。

在大数据行业内被广泛应用的网络爬虫手艺,究竟是什么呢?实在,网络爬虫,是互联网时期被广泛应用的一项网络信息汇集手艺。该项手艺最早应用于搜索引擎领域,是搜索引擎猎取数据泉源的支持性手艺之一。简朴来讲,它包含三个步骤:网络信息、数据存储和信息提取。“爬虫”作为一种计算机手艺,理论上来讲具有手艺中立性,在执法上也从未被明令制止。它不像计算机病毒,计算机病毒自身就是负面的、损坏性的,而爬虫是中立的。

那末应用爬虫手艺有什么风险呢?如果在猎取数据的过程当中,没法鉴别哪些数据可以爬取,哪些数据制止爬取,甚至为爬取数据而破解被爬效劳器的防护步伐,或许损坏被爬效劳器的信息体系,就会触及羁系红线。

数据爬虫主要触及的三类罪名

对爬虫手艺应用不当的企业,可以触及的罪名有三个:

一、侵占国民个人信息罪

1.爬取的数据信息属于国民个人信息领域

国民个人信息,是指以电子或许其他体式格局纪录的,可以零丁或许与其他信息连系辨认特定自然人身份,或许反应特定自然人运动状态的种种信息,包含姓名、身份证件号码、通信通信联系体式格局、住址、账号暗码、财富状态、行迹轨迹等。

2.应用爬虫手艺猎取的国民个人信息为不法猎取的

应用爬虫手艺网络国民个人信息数据,应当取得被网络人的赞同,尤其是在数据中包含身份证号、信用信息等敏感数据的状态下,还需要取得昭示赞同。同时,应用网络破绽不法下载、不法购置等行动,都属于“不法猎取”国民个人信息。

3.不法猎取国民个人信息到达“情节严重”以上的范例

不法猎取、出卖或许供应行迹轨迹信息、通信内容、征信信息、财富信息五十条以上,不法猎取、出卖或许供应留宿信息、通信纪录、康健生理信息、生意业务信息等其他可以影响人身、财富平安的国民个人信息五百条以上,不法猎取、出卖或许供应上述划定之外的国民个人信息五千条以上,都属于“情节严重”。

4.相干执法根据:《刑法》第253条

【侵占国民个人信息罪】违背国度有关划定,向别人出卖或许供应国民个人信息,情节严重的,处三年以下有期徒刑或许拘役,并处或许单处分金;情节迥殊严重的,处三年以上七年以下有期徒刑,并处分金。

违背国度有关划定,将在履行职责或许供应效劳过程当中取得的国民个人信息,出卖或许供应给别人的,遵照前款的划定从重处分。

盗取或许以其他要领不法猎取国民个人信息的,遵照第一款的划定处分。

单元犯前三款罪的,对单元判处分金,并对其直接担任的主管职员和其他直接义务职员,遵照该款的划定处分。

合规发起:

应用爬虫手艺猎取国民个人信息的,应当严厉遵守相干执法、行政律例、部门规章的划定,不然极易落入“不法猎取”国民个人信息的执法风险领域。

另外,关于在国民个人信息已正当公然的状态下,应用爬虫手艺对其举行抓取是不是组成不法猎取这一题目,临时没有明白答案,但《民法典人格权编》(草案三次审议稿)第816条写到:行动人网络、处置惩罚自然人自行公然的或许其他已正当公然的信息不负担民事义务,然则该自然人明白谢绝或许处置惩罚该信息损害其严重好处的除外。从立法走向上来推断,网络已正当公然的个人信息应不属于违法,但在立法尚不完美的阶段,仍发起郑重应用爬虫手艺抓取公然的个人信息。

二、组成不法猎取计算机信息体系数据罪

1.应用爬虫手艺侵入计算机信息体系猎取数据,或采纳其他手艺手段猎取计算机信息体系数据

你年纪轻轻的,为什要考公务员?

“年纪轻轻地干什么不好?考什么公务员?”刘梦问过她的大学室友,一个考了两次终于上岸的公务员。张晨有点慌了,她从来没想过原来考公务员是件竞争这么激烈的事情。“仿佛一夜之间,公务员代表的那种安稳成为了所有人梦寐以求的东西。”“大家要么去给钱多的大厂,要么就是考公务员或者事业单位之类的,似乎选择就在钱和稳之间。”两人最近一次聊起这个话题,张晨已经完全接受了“考公务员”这件事情。

任何构造或个人不得伤害计算机信息体系平安;不得损坏计算机及其相干的配套的装备、设备(含网络)平安,损坏其运转环境平安、信息平安,影响其功用平常发挥。因而企业若在爬取数据时,存在伤害计算机信息体系平安的行动,包含破解被爬企业的防抓取步伐、加密算法、手艺庇护步伐等,则很有可以被认定为“侵入或以其他手艺手段猎取计算机信息体系数据”。

2.不法猎取计算机信息体系数据到达“情节严重”以上的范例

猎取付出结算、证券生意业务、期货生意业务等网络金融效劳的身份认证信息十组以上,或猎取其他的身份认证信息五百组以上的,均属于“情节严重”。

3. 相干执法根据:《刑法》第285条

【不法侵入计算机信息体系罪】违背国度划定,侵入国度事件、国防建设、尖端科学手艺领域的计算机信息体系的,处三年以下有期徒刑或许拘役。

【不法猎取计算机信息体系数据、不法掌握计算机信息体系罪】违背国度划定,侵入前款划定之外的计算机信息体系或许采纳其他手艺手段,猎取该计算机信息体系中存储、处置惩罚或许传输的数据,或许对该计算机信息体系实行不法掌握,情节严重的,处三年以下有期徒刑或许拘役,并处或许单处分金;情节迥殊严重的,处三年以上七年以下有期徒刑,并处分金。

【供应侵入、不法掌握计算机信息体系顺序、东西罪】供应特地用于侵入、不法掌握计算机信息体系的顺序、东西,或许明知别人实行侵入、不法掌握计算机信息体系的违法犯罪行动,而为其供应顺序、东西,情节严重的,遵照前款的划定处分。

单元犯前三款罪的,对单元判处分金,并对其直接担任的主管职员和其他直接义务职员,遵照该款的划定处分。

合规发起:

严厉制止经由过程手艺手段绕过效劳器的接见限定,或破解被爬网站为庇护数据而采用的加密算法及手艺庇护步伐,从而对被爬网站受庇护的计算机信息体系中的数据举行爬取。

若被爬网站设定了猎取数据信息的步伐(包含实名认证、账号暗码、内部权限等),爬虫企业应防备经由过程捏造实名认证或盗取账号暗码、内部权限的情势猎取数据。

防备或郑重抓取身份认证信息(网络金融效劳的身份信息10组/其他身份认证信息500组)

三、不法侵入计算机信息体系罪

1.供应数据信息的网站为国度事件、国防建设、尖端科学手艺领域的计算机信息体系;

高频应用的网站,如“国度企业信用信息公示体系”“中国裁判文书网”“中国实行信息公然网”以及各地政府网站等,都属于“国度事件”网站的执法领域内。

2.对计算机信息体系具有侵入行动

(1)只需有侵入行动,而不管侵入行动的效果。

(2)现在司法诠释未对“侵入”举行详细的定义,但平常法院在认定上主要有两种体式格局:1)以不法手段登录网站,猎取底本不应有权限猎取的数据信息;2)将歹意顺序、不法文件等发送至网站,对网站的平常运转发生影响。

(3)在爬取此类网站的公然数据时,不存在“侵入”计算机信息体系的情况。但当批量爬取数据信息时,需迥殊关注是不是会对网站的平常运转发生影响,切不可跨越红线。

本年曾有报导称,裁判文书网数据被爬取后标价售卖。因为裁判文书网被许多手艺公司经由过程爬虫体系无限定并发接见猎取数据,形成网站负荷过大,平常用户没法接见。最高人民法院发文称,为了匹敌爬虫手艺,更好地确保平常用户接见机能,相干方面已采用多种体式格局,包含验证码手艺等,防备爬虫功用。

合规发起:

对大数据公司,迥殊是大数据风控企业来讲,猎取“裁判文书网”“实行信息公然网”的数据异常广泛且主要,但爬取这类国度事件网站的信息时应当尤其谨慎,迥殊是在网站已采用相干“反爬步伐”的状态下,仍强行歹意打破防护步伐爬取数据,对网站运转形成影响的,均可以组本钱罪。

除上述执法风险之外,应用爬虫手艺手段还可以发生组成不正当竞争、侵占信息网络流传权等执法风险。

相干律例根据:

1.《最高人民法院 最高人民检察院关于解决侵占国民个人信息刑事案件适用执法若干题目的诠释》第1条

2.《网络平安法》第41条、第42条

3.最高人民法院、最高人民检察院关于解决侵占国民个人信息刑事案件适用执法若干题目的诠释》第1、3、4、5条

4.《信息平安手艺 个人信息平安范例》第3.6、5.1、5.3、5.5条

5.《刑法》第253条

6.《刑法》第285条

7.《最高人民法院、最高人民检察院关于解决伤害计算机信息体系平安刑事案件应用执法若干题目的诠释》第1条

8.《计算机信息体系平安庇护条例》第3、7条

本文泉源:导师:冉晋,整理:一本学院

被忘记的APP:5亿人都在用,照样上不了市

事实上,在当前A股IPO环境下,营收和利润不达标的IPO都是一种赌钱。不幸的是,墨迹天色赌输了。“这是我手机主界面置顶第一的APP,也是我主动下载的,天天看2到4次,总时长差不多1到2分钟。”关于高度依靠广告收入的墨迹天色而言,这就意味着其APP上的广告能够基础没人看。报告期内,公司广告营收占比高达97%以上。关于过分依靠广告收入、营业单一的题目,墨迹科技进行了风险提醒。

Up Next:

被忘记的APP:5亿人都在用,照样上不了市

被忘记的APP:5亿人都在用,照样上不了市