来源:21世纪经济报道
2023-09-28 15:57:20
(原标题:反不正当竞争与数据抓取,合法性边界如何确定?)
21世纪经济报道 记者郑雪 北京报道
新一轮人工智能的快速发展,离不开数据、算力和算法,其中海量数据更是人工智能应用持续“涌现”的重要基础。与此同时,随着信息技术的进一步发展,数据已成为当前企业竞争中最重要的一环,然而企业间数据爬取纠纷不断。
近日,市场监管总局公布9起网络不正当竞争典型案例,其中一起案例涉及数据爬取。数据抓取相关案件频频出现,同时多以《反不正当竞争法》进行约束。数据要素逐渐发挥更加重要作用,数据爬取的合法性边界又该如何确定?
近日,市场监管总局公布9起网络不正当竞争典型案例,其中天津面兜兜网络科技有限公司不正当竞争案便是一起因数据抓取而引起的案件。
天津面兜兜网络科技有限公司(下称当事人)通过开发上货助手软件,提供商品信息数据“一键搬家”服务,在不同购物平台的服务市场上线运营并收取软件使用费。该软件通过调用第三方接口的方式,在未经数据源购物平台及平台内经营者同意的情况下,爬取数据源购物平台商品信息数据,并一键上传至其他具有竞争关系的购物平台。截至案发,该软件共爬取商品信息数据942万余条。
当事人的行为违反了《中华人民共和国反不正当竞争法》第十二条第二款第(四)项的规定,依据该法第二十四条的规定,责令当事人停止违法行为,处罚款100万元。
网络爬虫,对于普通人而言并不陌生,普通人甚至可以通过网络上的爬虫课程培训实现爬虫。具体来看,网络爬虫是一种自动化浏览网络程序,其按照一定的规则,自动地抓取网络信息的程序或者脚本。一方面,网络爬虫可以高效提升数据搜集的能力;但另一方面,虚假网络流量、个人信息安全、增大服务器压力等也引发了担忧。
网络爬虫技术发展过程中,行业也约定俗成逐渐形成了一项“君子协议”,即robots协议。通过robots.txt文件便可以判定目录下的哪些内容可以抓取,哪些不可以抓取。但需要注意的,robots协议并不具有强制力。
中国政法大学光明新闻传播学院助理教授张璐在接受21世纪经济报道记者采访时表示,数据爬取中蕴含着数据流通自由这一数字社会的重要价值,数据抓取本身并不违法,但是不可否认的是,不正当的数据抓取行为会损害个人权益、经济利益、公共利益等。
正如市场监管总局评析,数据抓取在互联网领域是常用的技术,能够实现高效、自动地进行网络信息的读取、收集等行为的技术手段,其设计本意在于提高信息交换速率。而部分商家利用“爬虫”程序窃取他人店铺相关信息,直接挪用他人劳动成果,属于新型网络不正当竞争行为。
数据价值正在不断凸显,而且在企业竞争中变得越来越重要。可以看到的是,随着技术的发展和互联网经济的发展,数据爬取案件逐渐频发多发。从中国数据不正当竞争第一案,发生在2016年的“新浪微博诉脉脉不正当竞争案”起,各大互联网公司就数据爬取相继对簿公堂。
2016年,大众点评网因百度地图、百度知道大量抄袭、复制大众点评网的用户点评信息,故以不正当竞争为由将百度公司告上法庭,后法院判定百度侵权,要求百度赔偿大众点评经济损失300万元及合理费用23万元。
2017年,深圳谷米公司将武汉元光公司告上法庭。两家都专注于公交实时信息领域研究和开发。谷米认为,武汉元光公司未经许可,利用网络爬虫技术,大量获取谷米经整合形成的公交车行驶实时数据,构成了不正当竞争。最终判令被告元光公司赔偿原告谷米公司50万元。
2019年,因对用户头像、昵称等用户数据归属存有分歧,已经达成合作的腾讯、抖音及多闪法庭相见。腾讯认为,抖音的短视频社交产品“多闪”,在未经授权的情况下,超越权限使用用户数据构成不正当竞争。2019年,滨海新区人民法院支持腾讯诉求;今年8月,该案再次开庭审理。
“在清晰的产权界定缺失的情况下,反不正当竞争法为数据提供了经济赔偿的救济,具体包括商业秘密和一般条款两种保护途径。在欠缺数据作为财产权的规范依据以及商业秘密的保护门槛较高的情况下,许多企业开始援引反不正当竞争法的一般条款来对抗未经授权的数据盗用行为。”张璐说道。在她看来,爬虫技术涉嫌构成不正当竞争行为纠纷的问题实质是具有竞争关系的经营者之间的数据竞争行为。反不正当竞争法主要通过事后禁止可识别的不当竞争行为来维护市场秩序。
目前来看,相关数据抓取案件多适用于《反不正当竞争法》相关法规,多通过《反不正当竞争法》第二条一般条款以及第十二条第二款第(四)项这一兜底性条款作出回应。
“数字经济时代,数据是重要的生产资料,数据爬取者可能在竞争中轻易取得不对称优势,扰乱市场竞争秩序,甚至导致‘劣币驱逐良币’的不利局面。信息技术与配套商业模式的快速演进可能催生诸多新型不正当竞争行为,作为公平竞争秩序的守护者,《反不正当竞争法》会对此类情况进行回应。”北京大成律师事务所高级合伙人邓志松说道。同时他也表示,不当的数据爬取还受到《个人信息保护法》等法律的规制,其中情节严重的还可能触犯《刑法》构成犯罪。
反不正当竞争法是规范市场竞争行为的基础性法律。在2017年、2019年进行两次修订后,2022年11月,《反不正当竞争法(修订草案征求意见稿)》(以下简称修订草案征求意见稿)公开征求意见。修订草案征求意见稿第十八条针对商业数据的抓取做了更加细化的规定。
北京师范大学法学院博士生导师、中国互联网协会研究中心副主任吴沈括认为,针对数据抓取,反不正当竞争法会提出相应的规则。一个突出趋势是对数据要素的合规、依法流转利用的认可,以及应当遵循的必要和法定规则的合规性重视。
今年以来随着人工智能的快速发展,数据爬取纷扰再次搅动竞争。今年6月,openai面临集体诉讼, openai从互联网上窃取了3000亿个单词,它们来自书籍、文章、网站和帖子——包括未经同意获得的个人信息;chatgpt还被曝能够翻越付费墙,获取隐藏的全文;随后8月,openai公布自己的网络爬虫程序gptbot,并表示网络爬虫将从互联网上收集公开可用的数据,但会过滤掉需要付费的内容来源或个人身份信息的消息来源,以及有违反其规定的文本来源。
邓志松对21世纪经济报道记者表示,在数据爬取案件中,爬取方与被爬取方的大部分诉求是截然对立的。例如在数据权属方面,爬取方往往更倾向于认为网络数据都是“公开”的、可利用的,而被爬取方更强调数据的所有权,认为数据是其财产、知识产权或商业秘密。再如数据使用目的,爬取者认为是为提供更优质的服务,而在被爬取者眼中此类行为则可能涉嫌不正当竞争行为。
“目前爬虫技术的相关实施行为构成不正当竞争的情形主要包括:运用黑客技术破解其他经营者服务器端获取数据的行为、超越双方协议规定越权爬取竞争对手服务器数据的行为、通过爬虫软件截取其他经营者的用户流量导致广告收入受损等违法属性较为明显的行为类型。”张璐说道。
数据爬取案件多发、频发的背后,需要回答数据爬取合法性边界如何确定的问题。
张璐认为,如何进行数据抓取以及判断其合法性边界是一个权益衡量的结果。在她看来,数据爬取的合法性问题是一个需要具体分析(case by case)的问题,司法实践中不仅存在类似案件不同判决的情形,也存在像美国领英和hiq一个案件多次反复的情况。尤其在数据权属仍不明确的当下,数据爬取问题的边界更为复杂。
具体实践中,又该如何判定?吴沈括对记者表示,数据爬取的边界主要通过三点判定:一是数据来源的合法性。这和数据类型属性相关,比如数据属于个人数据、公共数据还是企业商业秘密等都会有所影响。二是数据获取方式。不能用超越法定限度的手段获得,不能违背相关协议。三是数据获取之后的用途。数据获取之后不能用于非法目的,比如非法交易、出售,或者用于其他超越最初授权的商用。
需要注意的是,对于数据爬取的有效规制并不是单一工程,而是一项系统工作。邓志松表示,对数据爬取的全面有效规制是一项横跨多个部门法的系统性工程。合理厘定数据爬取的合法性边界,需要考虑数据来源、数据类型、使用目的和方式等因素。如爬取个人数据可能涉及个人信息的收集和处理,进而受到《个人信息保护法》的规制。
21世纪经济报道
2023-09-28
21世纪经济报道
2023-09-28
21世纪经济报道
2023-09-28
21世纪经济报道
2023-09-28
21世纪经济报道
2023-09-28
21世纪经济报道
2023-09-28
证券之星资讯
2023-09-28
证券之星资讯
2023-09-28
证券之星资讯
2023-09-28