自动版权执法下算法合理使用的必要性及推进

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

自动版权执法下算法合理使用的
必要性及推进
华哉
内容提要：人工智能算法推动网络版权执法朝着自动化识别和屏蔽侵权内容的方向发展，网络服务提供者普遍采用的内容过滤机制在自动屏蔽涉嫌侵权内容时不会考虑涉嫌侵权内容是否属于版权合理使用，阻碍了合理使用制度在自动版权执法环境中继续发挥作用。

因此，将版权合理使用判定规则植入智能算法中，以算法推进版权合理使用决策，确保合理使用制度和相关规则能在自动版权执法环境下继续适用成为亟待解决的问题。

本文在分析算法合理使用必要性和挑战性的基础上，提出推进算法合理使用的建议方案。

关键词：人工智能算法自动版权执法版权过滤措施合理使用制度
Abstract:Artificial intelligence algorithm is promoting the online copyright enforcement towards automatic identification and shielding of infringing content.The content filtering mechanism commonly used by internet service providers,while automatically shielding the content,does not consider whether the alleged infringing content is fair use under copyright law.The automated content filtering mechanism hinders the fair use system to play its role in online copyright enforcement.Therefore,it is imperative to implant the fair use rules into the intelligent algorithm to promote the formation of algorithmic fair use and ensure that the fair use system and relevant rules can continue to be applied in the context of automated copyright enforcement. Based on the analysis of the necessity and challenge imposed by the algorithmic fair use,the paper makes some proposals on how to promote the algorithmic fair use.
Key Words:artificial intelligence;algorithms;automated copyright enforcement;copyright content filtering;fair use system
智能算法是近年来版权研究的热门词。

人工智能这一概念最早由美国计算机科学家约翰•麦卡锡及其同事于1956年达特茅斯会议上提出，指让机器能够与人类做同样的行为。

①人工智能的本质是建立在大数据基础上自主学习、分析和决策的算法。

②算法是以部分现实世界为研究对象的一种抽象的简化数学结构，其运算机理是用数学语言建构数学模型来描述实际现象。

③
智能算法引发了诸多版权问题，其中一个问题产生于智能算法运作下的在线侵权内容自动过滤
作者简介：华劭，同济大学上海国际知识产权学院副教授
基金项目：国家社科基金青年项目“数字网络时代重混创作版权法律制度研究”(17CFX078)。

①腾讯研究院、中国信息通信研究院互联网法律研究中心、腾讯AILab、腾讯开放平台；《人工智能—
—国家人工智能战略行动抓手》，中国人民大学出版社2017年版，第4页。

②李婕：《垄断抑或公开：算法规制的法经济学分析》，载《理论视野》2019年第1期，第66页；狄晓斐：《人工智能算法可专利性探析—
—从知识生产角度区分抽象概念与具体应用》，载《知识产权》2020年第6期，第81-96页。

③姜野、李拥军：《破解算法黑箱：算法解释权的功能证成与适用路径—
—以社会信用体系建设为场景》,载《福建师范大学学报(哲学社会科学版)》2019年第4期，第84页。

•34・
自动版权执法下算法合理使用的必要性及推进
机制，内容过滤机制能自动屏蔽涉嫌侵权的内容，而不会考虑和判断涉嫌侵权内容是否落入不视为侵权的版权合理使用范畴。

因而是否能将版权合理使用判定规则植入智能算法中，以算法推进版权合理使用决策，确保合理使用制度及相关规则能在自动版权执法环境下继续适用成为亟需解决的问题。

本文将在分析算法合理使用必要性和挑战性的基础上，提出推进算法合理使用的建议方案。

一、算法合理使用的必要性
(-)内容过滤机制引发假阳性错误遏制合理使用
自1998年《美国千年数字版权法案》(DMCA)通过以来，通知一删除规则一直是网络服务提供者规避间接侵权责任的重要避风港规则之一。

为用户提供内容存储空间的网络服务提供者在不知道或不应当知道用户上传侵权内容，且未从用户侵权行为直接获得经济利益的前提下，只要版权人向其发出屏蔽侵权内容或删除侵权链接的通知，其立即进行屏蔽或删除，则无须承担帮助或替代侵权的间接侵权责任。

通知一删除规则的实施以及智能技术的发展使得版权人采用智能算法技术自动检测和发送要求屏蔽或删除涉嫌侵权内容的通知，导致大量通知涌入网络服务提供者，网络服务提供者疲于应付。

例如，谷歌仅2016年2月一个月收到的要求屏蔽或删除涉嫌侵权内容或链接的通知就超过7500万份。

④
网络服务提供者担心因未及时屏蔽或删除侵权内容而承担侵权责任，开始采取智能算法运作下的内容过滤机制，主动筛查可能侵权的用户上传内容。

内容过滤机制的通常做法是：网络服务提供者先建立正版作品数据库；用户上传内容时，网络服务提供者通过技术措施扫描该内容，确定是否含有正版作品数据库中的内容；如果有，则阻止用户的上传行为。

©YouTube于2007年建立的Content ID系统便是一款典型的内容过滤机制。

YouTube数据库中存有版权人提供的作品样本，Content ID 系统通过24小时不间断对比用户上传内容与作品样本的匹配度，查找涉嫌侵权内容；比对查找完成后，版权人可以选择是屏蔽或删除内容，是与网络服务提供者分享广告收益，抑或是追踪内容浏览次数。

⑥内容过滤机制在屏蔽或删除涉嫌侵权内容后，会阻止相同内容之后被重复上传。

网络服务提供者主动采用的内容过滤机制于2019年被《欧盟数字化单一市场版权指令》纳入立法中。

该指令第17条第4款和条文解释(66)第4段规定在线内容分享服务提供者应对未经授权通过信息网络传播作品的行为承担责任，除非服务提供者表明：他们已尽最大努力获取授权；尽最大努力确保版权人提供给服务提供者相关和必要信息的具体作品不被获取；在收到版权人充分证实的通知后，立即从其网页上禁止访问或删除通知作品，并且尽最大努力防止该作品之后被上传。

⑦尽最大努力防止被删除作品之后被上传实则要求在线内容分享服务提供者采取内容过滤机制对上传内容进行过滤筛查。

内容过滤机制虽然能降低网络服务提供者应对海量通知和用户上传内容侵权的成本，但是却可能屏蔽或删除并非侵犯版权的内容(包括已被版权人授权上传的内容、落入合理使用范畴的内容、
④Chris Welch,Google Received Over75Million Copyright Thkedown Requests in February,The Verge(7March2016),https://www.theverge. com/2016/3/7/11172516/google-takedown-requests-75-million.
⑤崔国斌：《论网络服务商版权内容过滤义务》，载《中国法学》2017年第2期，第215页；朱晓睿：《版权内容过滤措施与用户隐私的利益冲突与平衡》，载《知识产权》2020年第10期，第64-76页。

⑥黄炜杰：《“屏蔽或变现”：一种著作权的再配置机制》，载《知识产权》2019年第1期，第35-36页；谭洋：《在线内容分享服
—基于〈欧盟数字化单一市场版权指令〉》,载《知识产权》2019年第6期，第66・80页。

务提供商的一般过滤义务—
⑦Directive(EU)2019/790of the European Parliament and of the Council of17April2019on Copyright and Related Rights in the Digital Single Market and Amending Directive96/9/EC and2001/29/EC,Article17(4).
•35-
扣识迪•2021年第4期
落入公有领域的内容以及侵犯他人隐私权等其他权利却并未侵犯版权的内容），产生统计学意义上的假阳性错误（false positive）。

假阳性错误与假阴性错误（false negative）是统计学上的第一类错误和第二类错误。

假阳性错误即错误的肯定（如错抓好人、错误地诊断本不存在的病）；假阴性错误即错误的否定（如错放坏人，有病没诊断出来）。

⑧就这两类错误而言，内容过滤机制所产生的是假阳性错误，阻碍了合法内容的传播分享，限制了用户的表达自由。

合理使用制度在激励创作和保护表达自由方面发挥着重要作用。

首先，合理使用制度在获得授权的交易成本大于使用他人作品创作所产生价值时能发挥作用。

这是因为获得授权成本过高，后续创作价值又较小，后续创作者便不太可能获取授权使用他人作品进行创作。

合理使用制度能保证后续创作者无须获得授权也能合理使用他人作品进行创作。

其次，部分后续创作意在评论、批评甚至讽刺原作品，不可能获得原作者授权，鉴于评论、批评等自由表达的创作具有促进文化多样性等社会价值，合理使用制度能保证这类创作不因无可能获得授权而枯萎。

内容过滤机制引发的假阳性错误遏制了合理使用制度在在线内容创作和传播中的适用。

在网络服务提供者普遍采用内容过滤机制以及内容过滤机制被纳入法律规范的情况下，合理使用制度在版权理论上仍然存在，却在实践中化为乌有。

⑨内容过滤机制能及时筛查、删除与作品数据库相匹配的上传内容，没有为考虑和判断上传内容是否落入合理使用范畴留下任何空间。

（-）反通知机制失效无法救济错谋的内容移除
反通知是DMCA通知一删除规则中的一项修正错误屏蔽或删除的机制，同时也被我国《信息网络传播权保护条例》所吸收。

用户上传内容因版权人通知被网络服务提供者屏蔽或删除后，其可以向网络服务提供者发出反通知，说明所屏蔽或删除内容没有侵权。

反通知应当包括：用户签名、所移除内容及其位置；用户善意相信其上传内容被错误移除的声明；用户的姓名、地址及电话等联系方式。

⑩网络服务提供者收到反通知后，如果版权人在10天至14天内未通知网络服务提供者其已提起侵权诉讼，则网络服务提供者将恢复被移除内容。

⑪
反通知在通知一删除规则适用中很少被用户提起，归因于三个主要原因：第一，反通知程序过于复杂，对版权法规则不了解的用户很难发起反通知；第二，发起反通知存在披露用户个人信息的风险（例如，YouTube就提醒用户发起反通知后的用户个人信息会传至版权人处）；第三，用户会因发起错误的反通知而承担赔偿责任。

⑫虽然版权人也可能因发起错误的移除通知而承担赔偿责任，但相较于处于弱势经济地位的个体用户而言，对视听作品、音乐作品、文字作品享有版权的权利人通常是具有一定经济实力的公司，更有能力承担因错误通知而带来的风险和损失。

所以，反通知虽然理论上可以救济因版权人错误通知给用户造成的伤害，但实际中却很难发挥作用。

尤其对于时效性强的内容，即便用户在内容被移除后发起了反通知，仍须等待10天至14天，视版权人是否提起侵权诉讼而决定是否恢复被移除内容，极大地阻碍了时效性内容的发布和传播。

在网络服务提供者自愿或必须采取内容过滤机制的大环境下，反通知更难发挥其作用，几近失效。

内容过滤机制由智能算法自动识别与数据库中作品匹配的内容并进行过滤，而非由版权人发出
⑧《假阳性错误和假阴性错误---笔记》，载简书网2019年3月21日，https://www.jianshu.eom/p/f8e5ee346ec9.
⑨Ben Depoorter,Robert Kirk Walker,Copyright F alse Positives,89Notre Dame Law Review319,335(2013).
⑩Copyright Act of t he United States,Section512(g)(3);《信息网络传播权保护条例》第16条。

⑪Copyright Act of t he United States,Section512(g)(2).
⑫Niva Elkin-Koren,Fair Use by Design,64UCLA Law Review1082,1092(2017).
•36・
自动版权执法下算法合理使用的必要性及推进
通知后再对侵权内容进行屏蔽或删除，鉴于通知一删除规则下的反通知是针对版权人发出的通知，用户无法针对不存在版权人通知的内容过滤机制而发出反通知。

同时，用户在使用网络服务提供者提供的平台服务时，已接受了网络服务提供者制定的格式条款，难以针对服务提供者的自动过滤提起异议。

例如，在YouTube的Content ID系统中，涉嫌侵权的用户只能在选择对侵权通知提出异议的情况下，才能发起反通知，否则用户只能默示让版权人屏蔽或删除涉嫌侵权内容或分享内容传播所得收益。

此外，网络服务提供者基于与合作公司签订的协议，即使收到涉嫌侵权用户发出的反通知，表明上传内容落入不视为侵权的合理使用范畴，网络服务提供者因受制于合约义务也不会恢复由其合作公司享有版权的被移除内容。

⑬
反通知本是纠正错误移除的一项机制，其能让落入合理使用范畴的被移除内容恢复，保障合理使用制度在通知一删除规则中仍能适用。

但反通知机制在实际运用中的缺失以及在内容过滤机制下的失效，使得合理使用制度在智能算法支配的自动版权执法环境下完全丧失了效能和存在空间。

(三)
智能算法运用已成版权及隐私保护领域的必然趋势
随着大数据和机器学习技术的发展，算法在人工智能时代逐渐脱离纯粹的工具性角色，具有了自主性和认知特征。

⑭机器学习使智能算法产生了从原始数据中提取模式的能力，这种能力即为智能算法自己获取知识的能力。

⑮算法被广泛地运用于包括法律行业在内的各类行业中，例如，诊断疾病、银行贷款评估、证券风险识别、律师尽职调査、法院预测罪犯未来犯罪风险等。

®早在二十世纪九十年代，美国法学学者Joel Reidenberg和Lawrence Lessig就提出将法律规则编程为计算机算法并进行运用的设想。

JoelReidenberg在《信息法：通过技术制定信息政策规则》一文中提出利用技术为信息政策规则的制定提供解决方案；©LawrenceLessig在《代码2.0：网络空间中的法律》一书中对算法替代法律在网络空间中进行行为规制进行论述。

⑱如前所述，智能算法主导的内容过滤机制已成为网络环境自动版权执法的趋势。

它解决了网络服务提供者面对海量侵权移除通知的应接不暇，节省了网络服务提供者消除网络平台侵权的成本，降低了网络服务提供者因屏蔽或删除侵权内容不及时而须承担侵权责任的风险。

《欧盟数字化单一市场版权指令》进一步将算法主导的自动版权执法机制纳入立法，将这一趋势变为必然。

此外，在隐私保护领域，“通过设计保护隐私”(Privacy by Design)这一概念早在二十世纪九十年代中期便由加拿大安大略省前信息和隐私专员Ann Cavoukian博士提出，并于2018年被纳入《欧盟通用数据保护条例》中。

“通过设计保护隐私”机制实则是将算法运用于隐私保护，要求企业将隐私保护的规则内置于产品或服务中，隐私和数据保护贯穿于产品或服务的整个生命周期，从产品生产和服务提供源头掐断侵犯隐私的情形，更好地保护个人隐私和信息数据。

因此，我国研究者又将该机制称为"隐私内置机制”=⑲
“通过设计保护隐私”机制体现了Lawrence Lessig所提出的算法替代法律进行行为规制。

该机
⑬Andy Maxwell,YouTube's Deal with Universal Blocks DMCA Counter Notices,Torrent Freak(5April2013),https:/// youtube-deal-with-universal-blocks-dmca-coimter-notices-130405/.
⑭张凌寒：《算法规制的迭代与革新》,载《法学论坛》2019年第2期，第20页。

⑮周志华：《机器学习》，清华大学出版社2016年版，第2页。

⑯同注释⑫，第1096-1097页。

⑰Joel Reidenberg,Lex Informatica:The Formulation of I nformation Policy Rules Through Technology,76Texas Law Review553,553-594(1998).
⑱［美］劳伦斯•莱斯格：《代码2.0：网络空间中的法律》，清华大学出版社2018年版。

⑲桂畅旎：《欧盟〈通用数据保护法案〉的影响与对策》，载《中国信息安全》2017年第7期，第91・93页。

•37
扣识迪•2021年第4期
制共有七条原则，其中前五条原则恰好说明了算法内置用以规范行为的要求：(1)主动而非被动，预防而非补救(Proactive not Reactive;Preventative not Remedial)；(2)将隐私保护作为默认设置(Privacy as Default Setting)；(3)隐私保护嵌入设计中(Privacy Embedded into Design)；(4)完整功能：正和而非零和(Full Functionality:Positive-Sum,not Zero-Sum),寻求以一种正和和双赢的方式实现所有合法利益和目标，而非通过过时的、零和的方式进行不必要的权衡；(5)端对端安全性：全生命周期保护(End-to-End Security:Full Lifecycle Protection),在信息的首个元素被收集之前就嵌入进系统中的“通过设计保护隐私”机制安全地延伸至所收集数据的整个生命周期。

@《欧盟通用数据保护条例》第25条以立法形式确认了“通过设计保护隐私”机制，要求数据控制者以有效的方式实施适当的技术和组织措施保护数据主体的权利。

@
鉴于智能算法在法律规则适用和网络环境执法过程中发挥功效已成为网络服务提供者等商业主体以及欧盟等地区立法者所认同的必然趋势，在自动执法环境下将合理使用法律规则转化为智能算法，确保合理使用制度在自动执法过程中的实际运用势在必行。

以色列学者Niva Elkin-Koren因此提出了与“通过设计保护隐私”概念相对应的“通过设计保护合理使用”(Fair Use by Design)。

㉒究其实质，就是利用智能算法推进自动合理使用决策。

二、算法合理使用的挑战性
(一)
合理使用灵活性难融入算法确定性中
美国普林斯顿大学计算机科学学者Kevin Wayne将算法定义为一种有限、确定、有效的并适合用计算机程序来实现的解决问题的方法。

据其定义，算法具有有限、确定和有效的核心特征，有限性指算法必须能在执行有限步骤后终止；确定性指算法的每个步骤都有确切定义；有效性指算法中执行的任何步骤都可以被分解为基本的、可执行的操作步骤。

@
合理使用制度与确定性强的算法有所不同。

就合理使用制度而言，虽然存在灵活度高的美国合理使用(fkiruse)制度和相对稳定的欧洲国家版权权利例外(copyright exceptions),美国的合理使用判定方法对其他国家权利例外判定的影响越来越大。

我国《著作权法》采用了与德国等欧洲国家一致的穷尽列举式方法规定权利例外，列举了十二种具体的使用他人作品无须经过权利人授权并且无须向权利人支付费用的例外情形，这十二种例外同时须符合不影响他人作品正常使用、不得不合理损害权利人合法利益的三步检验标准。

2020年11月修订后的《著作权法》第24条才在十二种具体例外之外增加了兜底性例外“法律、行政法规规定的其他情形”，以应对可能出现的其他例外情形。

由于修法前过于确定的例外规定无法应对司法实践中出现的所有可能情形，我国法院早已逐步
⑳Ann Cavoukian,Privacy by Design:Strong Privacy Protection-Now,and Well into the Future-A Report on the State of P bD to the33rd International Conference of D ata Protection and P rivacy Commissioners y IPC(November2011),https://www.ipc.on.ca/wp-content/uploads/Resources/ PbDReportpdf.后两条原则为(6)可视性和透明度：保持开放性(Visibility and Transparency:Keep it Open),“通过设计保护隐私”机制旨在确保所有利益相关方，无论其商业实践或技术如何，实际上都根据其陈述的承诺和目标进行操作，并进行独立验证；(7)尊重用户隐私：以用户为中心(Respect for User Privacy:Keep it User-Centric),“通过设计保护隐私”机制要求设计者和运营者通过提供强有力的隐私默认、适当通知和采用方便用户的选项等措施最大化地保护用户个人利益。

®Regulation(EU)2016/679of the European Parliament and of the Council of27April2016on the Protection of Natural Persons with regard to the Processing of Personal Data and on the Free Movement of Such Data,and Repealing Directive95/46/EC(General Data Protection Regulation), Article25.
㉒同注释⑫，第1094页。

㉓蒋舸：《作为算法的法律》，载《清华法学》2019年第1期，第65-66页。

・38・
自动版权执法下算法合理使用的必要性及推进
突破确定性例外的限制，借鉴吸收美国判定合理使用的四要素平衡法。

我国最高人民法院于2011年发布的《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》第8条已提及法院判定权利例外时可“考虑作品使用行为的性质和目的、被使用作品的性质、被使用部分的数量和质量、使用对作品潜在市场或价值的影响等因素……"。

美国司法实践在判定第一点要素“使用行为的性质和目的”时，延伸出转换性使用，即考察新作品是否仅仅取代了原作品，还是基于进一步的目的或不同特征增加了新内容，改变原作品而采用了新的表达方式、含义和信息，也就是说，使用原作品创作新作品的目的和特点是否以及在何种程度上是转换性的。

⑭我国北京、上海、广东的人民法院在进行权利例外的分析时，已经提及“转换性使用”的字眼。

例如，在王莘诉谷翔公司和谷歌公司案中，北京市高级人民法院认可扫描整本图书及提供图书片段属于转换性使用;㉕在上海美术电影制片厂诉浙江新影年代文化传播有限公司、华谊兄弟上海影院管理有限公司案中，上海知识产权法院判定将二十世纪八十年代动画片人物形象缩小用于电影海报背景构成转换性使用；@在李向晖诉广州华多网络科技有限公司案中，广东省广州市南沙区人民法院认可了将景点照片缩略图用于介绍网络游戏的转换性。

@
四要素平衡法以及转换性使用判定的采用增加了合理使用判定的灵活性，将合理使用判定从确定性强的一刀切似的具体例外规定带入灵活度高的个案分析。

四要素平衡法中决定是否属于合理使用的核心要素在于使用行为的性质和目的是否具有转换性，使用部分的“质”与“量”占原作品的比例，以及使用对作品潜在市场或价值的影响。

其中，除了使用部分的量占原作品的比例能通过算法比对决定以外，其余要素很难通过确定的算法判定。

例如，算法可以将新作品与原作品相似处低于20%设定为合理使用用以判定使用原作品的数量，却难以判定相似的20%部分中是否存在属于原作品核心“质”“量”的部分，也难以判定使用原作品是否存在转换性，以及是否影响到原作品的潜在市场或价值。

因为使用是否增加了新的表达含义和信息、是否会替代原作品，取决于对人文和艺术表达的理解，而非算法更擅长的定量判断。

算法确定性与合理使用灵活性之间的区别正如规则(rule)与标准(standard)之间的区别一样。

规则是确定的法律要求，往往通过立法事先颁布，易于理解和执行，但缺乏灵活性；标准是可延展的与事实相关的指向，往往由法院或其他裁判机关事后依据案件事实决定，具有灵活性，却缺乏足够的可预见性和清晰度。

㉘算法的有限、确定和有效与立法规则对概念的清晰界定和释义遥相呼应，算法的设计须程序员事先知晓清晰确定的规则才能将法律语言转化为计算机代码。

而合理使用制度的真正运用通常是在使用者未经授权使用作品引发版权人启动侵权诉讼之后，法院根据使用的实际情况采用三步检验标准以及四要素平衡法进行分析判断，最终得出使用行为是否侵权的结论。

算法设计无法事先将不断出现的新的使用情形和法院的事后分析纳入其中。

(-)算法偏见带来技术阻碍
智能算法依赖于机器学习。

机器学习包含有无监督学习和监督学习能力，无监督学习应用于聚
㉔Campbell v.Acuff-Rose Music,510U.S.569(1994).
®王莘诉北京谷翔信息技术有限公司、谷歌公司案，北京市高级人民法院民事判决书(2013)高民终字第1221号。

@上海美术电影制片厂诉浙江新影年代文化传播有限公司、华谊兄弟上海影院管理有限公司案，上海知识产权法院民事判决书(2015)沪知民终字第730号。

㉗李向晖诉广州华多网络科技有限公司案，广州知识产权法院民事判决书(2017)粤73民终85号。

@Dan L.Burk,Algorithmic Fair Use,86University of Chicago Law Review283,287(2019).
•39・。