本文原载于《交大法学》2019年第3期。徐小奔,中南财经政法大学知识产权研究中心专职研究员、讲师、法学博士。杨依楠,中南财经政法大学知识产权学院2018级硕士研究生。为编辑实惠,原文引注已略去,如需了解更多,您可自行查看原文。若欲转载,请联系《交大法学》微信公众号(SJTUJDFX)。
□徐小奔、杨依楠
目次
导论
一、复制与剖析:人工智能深度学习行为的著作权涵义
(一)复制:作品剖析行为的前提
(二)知识增值:作品剖析行为的结果
二、人工智能深度学习中作品剖析的著作权定性
(一)从复制到接触:作品在互联网中的原貌呈现
(二)人工智能深度学习中知识增值的独立性
三、人工智能深度学习中作品剖析的合理使用
(一)美国合理使用判别标准的历史演进
(二)我国人工智能深度学习中合理使用的制度安排
结语
摘要:
自由地剖析数据是通过深度学习发展人工智能的前提。如果人工智能剖析的对象恰好是作品,则不可避免地须要对其进行扫描与复制,由此形成著作权的侵权争议。互联网时代,作品以数据的方式进行传播。由于作品在借助上存在非竞争性的特性,人工智能可以借助于机器剖析不断从作品中开掘出新的价值,满足不同主体的特定须要。尽管深度学习中对作品的剖析行为与原作品息息相关,但机器剖析后产生的价值既不是对作品的原貌呈现,也不是对作品内容的演绎性抒发,而是独立的、新的作品增值。作品增值的结果是对作品思想层面的借助,但是知识增值的过程——深度学习则不可避免地要对作品进行转换性使用,可划入合理使用的范畴。将人工智能深度学习列入合理使用除了与合理使用规则演变的历史趋势相一致,也符合著作权法激励创新的目的,更有助于人工智能产业的健康发展。
关键词:
人工智能;深度学习;作品;合理使用;权利限制
导论
算法自由是当下人工智能技术发展的阶段性目标。深度学习的奇特之处在于通过模仿人类脑部神经元的分层结构,自动从海量数据中获取具有多层抒发的特点。换言之,传统算法须要人工预先确定学习对象的特点,深度学习则可以通过算法手动建立特点,使机器可以不在人类的干预下从数据中开掘出有价值的内容。以人工智能学习写作为例,为了生成与某一作者相像风格的文章,人工智能系统须要首先输入该作者所有的文章并对其进行数据剖析。经过词频统计以及关键词提取,若机器发觉该作者的文章中常常使用许多幽默、诙谐的词句,那么都会将该作者的写作风格标记为诙谐,并对其常用的成语和行文习惯进行保存,生成相应的模版。一旦须要生成相像的文章,只须要提供素材,机器才会手动依照其自我生成的模版将素材嵌入到合适的位置。久而久之,人工智能通过剖析标记大量相同主题的文章,甚至可以对比不同作者的写作内容,形成自己对某一风格的奇特理解。在人工智能自发提取数据特点的过程中,由于缺少人为设置的特点标准,因此很容易出现偏差。只有最大限度地拓展训练数据的范围及数目,才能有效降低数据误差,从而保障人工智能自发提取数据特点的准确性。因此,能自由地获得、使用数据是通过深度学习来发展人工智能的前提和关键。
人工智能在剖析数据的过程中可能面临着著作权侵权的窘境。一般而言,无论是自然人对作品剖析还是人工智能的机器剖析,其主要的目的是理解作品的内在思想并产生新的思想以实现知识的更新。从这个意义上看,作品剖析主要是对作品思想的借助,依据思想抒发二分法的著作权保护范围标准,作品剖析应该是自由的。但是,所有的作品剖析前提是接触作品,这便不可避免地涉及对作品抒发的使用,换言之,正是通过作品抒发的使用能够理解作品思想,由此便形成著作权争议。具体而言,所有的机器学习都须要事先汇总并输入数据,并在人工智能系统中产生数据副本。如果输入的数据中包含着大量未经著作权人授权使用的作品,那么这些行为可能会构成对著作权人复制权的侵害。对于动辄输入数千万份数据的人工智能产业主体来说,事先获得许可的做法似乎面临着偏低的交易成本,一旦被认定为侵权,成千上万份作品的损害赔付甚至会让人工智能产业面临破产。为了解决人工智能产业发展的窘境,日本于2018年2月对《著作权法》进行了修订,增加了“灵活的权力限制条款”,原则上容许互联网和高科技企业可以不经著作权人同意直接使用作品。此外,美国、德国、欧盟等国家和地区也纷纷在知识产权新政报告中进行检讨,意在为人工智能剖析作品扫清障碍。由此,必须搞清人工智能深度学习中对作品的剖析行为的著作权法性质,才能为发展人工智能产业提供合理的制度建议。
一、复制与剖析:人工智能深度学习行为的著作权含意
(一)复制:作品剖析行为的前提
现代著作权制度设计的基本逻辑是将作品这一具有公共物品特点的客体转变成私人财产,并通过市场交易使作者或则著作权人获得酬劳,激励更多的人从事职业创作,最终促使社会文化的繁荣。从市场经济的角度看,作品之所以能成为商品进行流通,是因为作品具有使用价值,即作品才能满足人的某种主观偏好。例如,美术作品通过腰线与色调搭配可以使人获得视觉上的愉悦,音乐作品则通过对音符、和弦、节奏的连结为人们营造触觉上的奇特体验。因此,著作权交易的本质即是作者将作品的使用价值让渡给消费者,从中获得交易价值,从而促使作者进行持续创作。康德曾强调作品是“作者向自己的读者的讲话”,作品的彩印是出版商“以作者的名义”将作者的言论“带到公众中”的过程。可以说,作者与读者之间交流的实现在于作品在读者眼前原貌呈现,使读者据此了解作者的意图。此时,通过作品原貌呈现的以满足读者需求的使用价值可以被称为作品的原初价值。
在著作权法诞生之初,受制于当时的技术条件,作品在通常情况下难以与其载体相分离,作者与读者之间的交流必须借助于占有作品的物质载体能够实现,也即作品的使用价值必须附着在有形复制件之上。消费者只有占有作品的复制件,才能直接阅读、欣赏负载其上的作品。因此,复制权是现代著作权制度的原初性、基础性权力。也即是说,在以彩印、出版为作品核心传播形式的时代,复制行为就是将作品复制件从一变多的过程。在1886年《保护文学和艺术作品伯尔尼公约》(以下简称为《伯尔尼公约》)制定之初,作品的传播途径主要有公开演出和彩印出版两种方式,伴随着彩印技术与出版产业的发展,印刷与出版成为作品能否在全球范围内传播的主要手段。因此,《伯尔尼公约》构建了以复制权为核心的作者经济权力体系。《中华人民共和国著作权法》(以下简称为《著作权法》)第10条第5项将复制权定义为“以彩印、复印、拓印、录音、录像、翻录、翻拍等方法将作品制做一份或则多份的权力”,就是承袭了以有形载体为作品传播形式的定义模式。如此一来,作者只要控制了作品的复制,就相当于间接地控制了作品的传播,进而通过大量彩印、销售作品复制件获利。从创新激励的制度原理角度来看,如果权利人未能垄断作品复制件的供给,则会导致其他人在不进行创作的情况下获得复制件,取代作者的地位与消费者进行交易,这将严重损害作者的市场利益,消耗作者的创作动力。因此,为了激励创作,著作权法限制了彩印复制件的行为,赋予作者对作品复制的垄断性权力。从表面上看,复制权在著作权法上的含意是作品通过有形载体的原貌呈现,但背后真正的价值基础在于这些重现的方式可以直接满足市场中消费者对作品的特定的使用需求,实现作者向读者的知识传递。
(二)知识增值:作品剖析行为的结果
人工智能的深度学习从运行模式上看就是对数据的机器剖析过程,在这一过程中实现了对数据价值进行挖掘,并在数据的原始价值之上挖掘出新的价值,即知识增值。知识增值主要形成于以下几种机器剖析方法。第一种方法是对数据的基本再利用,即将原先用于某一特定目的而生产的数据运用于另一目的,这也是知识增值最常见的途径。譬如院校可以挖掘校园卡流水数据用于贫困生的认定。第二种形式为混和数据,是指叠加两种主题不同的数据集,用新的方法进行重组。相比于数据的部份,数据的总和常常更有价值,因此,重组后的数据价值会超过原有的单一主题的数据集。丹麦将使用手机用户的数据集与特定类型的疾病病人的数据集交叉比对,发现两者相关性的反例就属于数据重组。第三种方法是创造扩展性数据,换言之,从数据形成之初就设计它的可扩展性,实现相同数据集的多种用途。例如,商店中的监控数据既可以避免诈骗风波的发生,又能观察消费者在每位货架逗留时间的长短,以调整货品的摆放位置与摆放方法,从而提高消费者的订购意愿。第四种方法则关注数据的摊销价值,虽然信息具有一定的时效性,然而旧数据一直存在强悍的价值可供挖掘。具言之,同比数据的估算与数据走势的观察均依赖于旧数据的支撑。从企业收益的增长率到国外生产总额的环比、环比下降,再到人类人口增长率及月球二叠纪与间冰期的周期性研究,无一不是借助了数据的摊销价值。第五种形式则是挖掘数据的副产品。在用户获取信息时,数据生产者可以捕捉到用户进行检索的全过程,例如用户在搜索引擎键入关键字后,选取了哪一页的哪一个链接,浏览了哪些页面,或者直接舍弃检索。新浪微博便通过剖析用户搜索内容的数目设计了“排名算法”,即“热搜排行榜”,对某一内容进行搜索浏览的用户人数越多,该内容在热搜榜上的排行也就越靠前。可见,随着时代发展和技术进步,越来越多的数据信息被创造生成,越来越多的使用者得以接触数据并借助,数据价值呈数目级下降。这些知识增值行为的共同特征在于赶超数据的一般用途(原初价值)而开掘出新的、与原初价值相独立的用途。
人工智能通过深度学习形成的知识增值,相较于通过占有作品有形载体(复制件)而获得的作品原初价值具有显著的不同。受制于复制件的物质形态,对作品原初价值的借助,以占有作品有形载体为前提。因此,在时空上,作品载体的使用在不同主体之间具有竞争性。作品数据化以后脱离了有形载体的限制,对作品的借助呈现出非竞争性的特征,数据的具体用途除了不会受制于特定形态,在二次借助中也不会形成价值减损,只要才能被使用者获取并满足使用者的须要,就能形成与数据原初价值所不同的知识增值。可见,数据的借助次数影响了数据的价值,经手数据的主体越多,二次借助的形式也就越多样,这意味着数据满足了更多使用者的需求,使得数据在传播中不断形成增值。正是源源不断的数据传播及整合才创造了更大的利益。由于不同的使用者对数据具有不同的需求,而生产数据的主体出于行业壁垒、地域差别、技术限制等诱因,永远没法用尽数据的所有潜在用途。数据借助对使用者来说意味着作出具体的选择:将其应用于哪一领域,基于何种目的,用于解决何种问题。做出特定选择的时刻,数据便满足了使用者的这一特定需求,数据价值也就得以实现。
在没有人工智能的时代,人也可以通过剖析数据而挖掘知识增值,但是人对作品的剖析与人工智能深度学习中的机器剖析,从作品原初价值的消耗上来看具有截然不同的意义。人对作品的剖析是接触、阅读、理解作品的过程,其知识增值是人归纳、分析、综合后的智力产出。单就作品剖析的过程本身而言,其既是人获取知识的目的,也是创造新知识的手段,是原初价值与知识增值的双重满足。以文献学术剖析为例,人在阅读、分析文献的过程中,哪怕没有得到任何知识输出(知识增值),也下降了自我知识的积累。这种知识的积累构成了文献分析者对作品原初价值的主观需求,也因而成为向作者付费的基本理据。但是,就人工智能的深度学习而言,机器剖析是执行既定算法的结果。人工智能可以按照不同的算法分辨信息摄取重点,具备单纯地进行机械剖析与搜集的能力,从作品中不断挖掘出新的价值。由于人工智能不是主体,不能觉得人工智能通过深度学习获得了知识积累如同人的知识积累一样具有主观偏好性,是一种主观效用上的需求。人工智能对数据的剖析本身只能是为了实现另一个目的(如剖析市场上消费者对诙谐作品的需求)而采取的一个纯粹的技术手段。换言之,人们不会对人工智能深度学习的过程本身评价其价值性,而只有在输出内容以后,才能判定是否有价值。如果剖析结果具有偏见或涉及用户隐私,那么这一输出结果便难以使用,也就不具有任何价值。
从著作权法上的作品借助角度而言,人工智能深度学习形成的知识增值可以分为以下两种类型:第一种是基于创作目的,通过学习、模仿并进行创作而形成的数据价值。人工智能可以学习人类作品并生成与之类似的内容,例如对音乐进行曲调、节奏、音色等方面的剖析与模仿,结合新的素材生成新的音乐。通过更多的内容创作,人工智能得以繁荣文化市场,满足消费者多元的精神文化需求。第二种是不以创作为目的,基于不同剖析主体的需求,从作品蕴涵的独创性抒发和思想内涵中挖掘出的全新数据价值。例如,由于部份地区空气质量检测站点的检测值存在误差,而科研人员发觉空气污染可以通过肉眼进行直观地观察,于是诞生了借助数据剖析技术从摄影作品中检测细颗粒物数值的创意。·通过以上剖析不难发觉,人工智能深度学习的结果是否具有价值是以能够满足特定主体的需求为判定标准,仍然属于使用价值的范畴。
二、人工智能深度学习中作品剖析的著作权定性
人工智能深度学习中机器剖析所形成的知识增值是在作品原初价值之外挖掘新价值的过程,但其实其是借助作品原初价值以后的产物,由此便须讨论人工智能深度学习的知识增值与作品原初价值之间的关系,如果机器剖析所产生的知识增值还能独立于作品的原初价值,便不会侵害权力人的复制性权力,因此权利人企图分享数据价值也就缺少合理性基础。
(一)从复制到接触:作品在互联网中的原貌呈现
在著作权法的历史上,各国对著作权进行立法分类时,均以“复制”为首要概念,复制权除了是世界第一部著作权法的立法成因,也贯串彩印时代整个著作权立法的灵魂。在彩印技术时代,复制是作品使用的基本形式与前提。权利人要获得利益,必须提早彩印大量作品的复制件,才能进行出版销售,而使用者进行学习、欣赏也必须以占有复制件为前提。可见,在著作权法诞生之初,由于作品的载体方式局限于有体物,导致获取作品使用价值的形式与有体物基本相同,二者均需依赖对特定物品的占有,作品作为知识产品的无形性特点在此时彰显得并不显著。然而知识产品与有体物本质上依然存在区别:前者可以复制,即可以从一份转变成无穷多份,使之具有非排他性特点,这一特点造成了知识产品领域搭便车行为层出不穷。由于作品的使用价值才能通过交易产生作者的市场利益,部分投机商便利用彩印技术对早已出版发行的图书进行大量复制,投放进原作品的市场,以获得巨额收益。为了在印刷术时期划分传统物权与著作权之间模糊的边界,从而更全面地保护作者利益,“复制”的概念应运而生。在纸质彩印时代,鉴于复制技术价钱的昂贵,只有大量的商业性复制才能落入著作权人的复制权范畴,个人碰巧的、零星的复制不会对作者的商业性传播导致实质影响,故此著作权法倾向于将私人复制行为归为合理使用行为。
伴随着信息技术的发展,人类步入网路时代,作品脱离了有形载体以虚拟的数字化方式存在于网路空间。数据信息的大量交互促使复制成本极低,用户还能轻松获取作品的数字化复制件。因此,在网路环境下,作品得以脱离化学载体,而以数据信息的方式存在、传播。与此同时,作品使用价值的载体也从复制件演化为数据信息。与传统环境中订购有形复制件相比,人们开始习惯于通过数据方式进行阅读与观赏,作品的价值也在数据传播中得以彰显。正是在这一时期,传播方法的改革引起了对著作权人权力保护重点的转变,即从以复制权为核心转变为以信息传播权为核心。从《伯尔尼公约》对“播放权”的权力内容进行扩张,到《世界知识产权组织版权条约》(以下简称为“WCT”)增加了对权力人网路播放行为的保护,再到我国颁布《信息网络传播权保护条例》,均是对信息网路环境下大量作品传播行为的回应。可见,传播技术的发展扩宽了著作权人获取利益的途径,前数字技术时代,作品价值以复制为依托,而当下却可以通过对作品的演出、信息网路传播、改编等多种形式实现。从复制权到信息网路传播权,权利边界看似发生了变化,但权力内涵的指向是相同的,即无论是以有形载体传播为媒介的复制权(也可扩充解释为包含出版发行权),还是以互联网为传播媒介的信息网路传播权,都是以作品在读者眼前的原貌呈现为其使用价值的实现方法。从侵权行为的角度上看,所有侵犯作品在市场中原貌呈现需求的行为都在原则上被划定在法律严禁的范畴之内,仅在例外性的情况下由法律基于公共利益的审视而通过著作权合理使用、法定许可、强制许可等制度给以排除作者对作品原初价值的控制。因此,信息网路传播权,实质上是传统传播环境下复制权的延展,二者的共通性在于对作品的原貌呈现。从逻辑上看,在著作权法的语境下,“复制”或“信息网路传播”的内涵不应涵盖所有的作品接触行为,如果并非以原貌呈现为目的对作品进行接触,并且这些接触和使用没有对作品原初价值在市场中的需求形成不利影响,则原则上不应将之列入著作权人信息网路传播权的权力范围。
(二)人工智能深度学习中知识增值的独立性
如前所述,机器剖析形成的知识增值基于作品而形成,与原作品息息相关,然而,并不能因而其实地觉得机器剖析的知识增值应该落入作品原初价值的市场需求之中。二者之间的独立性促使人工智能深度学习而剖析作品的行为应被划分在以原貌呈现为内涵的信息网路传播权的保护范围之外。但是,人工智能对作品的剖析行为能够被列入著作权法上的演绎性权力成为新的争议点。《著作权法》第10条第14—16项规定了三种演绎性权力,即改编权(改变作品,创作出具有独创性的新作品的权力)、汇编权(将作品或则作品的片断通过选择或则编排,汇集成新作品的权力)以及翻译权(将作品从一种语言文字转换成另一种语言文字的权力)。鉴于著作权法上思想抒发二分法的根本性规定,作品的内容是属于自由使用的公有部份,著作权保护的是作品中具有独创性的抒发部份。演绎性权力是在基本不改变作品内容的情况下对作品艺术抒发方式的再创作,比如将文字作品改编为动漫,或者将一个人的多篇独立文字作品汇编成作品选集。如果说复制权是作品内容与抒发的原貌呈现,那么演绎性权力是作品抒发方式的改变,但基本不改变作品的内容,是作品内容通过新的抒发方式实现的原貌呈现,这种演绎性的创作行为也被称为对作品的表达性使用行为。从作品的原初价值角度来看,演绎作品与原作品之间的关系实质上是同一作品内容的不同抒发方式,无论是改编、翻译还是汇编,都没有实质性地创造新的内容。正为此,演绎作品因其抒发上的独创性而获得完整的、独立的著作权,但又因内容上的一致性而要求诠释行为必须获得作者授权。换言之,作者演绎性权力就是对作品相同内容以何种抒发方式向公众原貌呈现的法律控制。换句话说,演绎性行为并没有跳脱出原貌呈现的作品原初价值的范畴。
机器剖析的知识增值多种多样,但将其类型化后则可以归纳为两种价值类型。第一种人工智能创造的价值类型是类作品创作的数据价值,即通过对特定类型作品的海量学习,输出与其风格、要素相像的新内容。例如,微软人工智能小冰于2017年5月发表了一本名为《阳光失了玻璃窗》的长诗。这本书中除了有对景色的描画,更有对主观思绪的抒发。据谷歌技术人员称,小冰学习了1920年以来519位现代诗人的现代诗,训练超过10000次,积累了200亿次的对话量,能够写出具有后现代风格的类似新月派隐喻的句子。虽然小冰在学习过程中提取了后现代散文的写作风格与特定抒发,但小冰写出的散文却不会与原作品的独创性抒发相同,仅仅是对写作模式的模仿。具体而言,小冰通过对近百年来的现代诗的写作方式进行总结,生成一套特定的剖析模型,即对各类隐喻的描述方式。例如,何种事物象征着忧伤的心绪,何种事物能抒发喜悦的情感。当使用者要求机器创作特定风格的散文时,人工智能便会选取对应的剖析模型,输出全新的内容。理论上,诸如风格、主题、体裁等属于高度具象的思想,是著作权法上思想抒发二分法中被划定在公有领域的部份,任何公有领域的思想都应该被自由使用。实践中,市场中同一风格的作品成千上万,如果觉得作品的原初价值囊括风格、手法等作品内容,则会极大制约创新。可见,人工智能生成的类作品内容并不会取代原作品的受众与市场,这种知识增值不应落入著作权人的专有权力范畴。
人工智能的第二种数据价值是通过对作品的非表达性使用而创造的数据价值。例如,通过相片辨识空气中细颗粒物的数值,谷歌翻译通过用户输入的作品内容提升翻译的准确率。对于作品的著作权人而言,这些借助形式既不属于简单的复制,也不属于传播或改编,而是非著作权法意义上的使用,其市场价值的挖掘有赖于使用者的奇特背景,并非通常著作权人才能发觉并进行发展的市场。即便微软全文使用了用户翻译的作品,其生产的内容是在后续用户使用翻译软件键入错误词组时进行正确内容的提示,或在翻译结果中手动忽视输入错误,呈现正确的译文。对其他用户而言,其自始至终都未接触到微软复制的原作品,甚至并未意识到微软的提示服务是基于对往年翻译作品的学习,因此,谷歌的使用方法不可能影响原作品的正常销售,其所创造的价值属于全新的翻译市场。因此,当人工智能以非表达性使用的方法创造数据价值时,也没有影响原作品著作权人的既有市场利益。
综上,无论是生成类似作品的内容,还是以非表达性使用的形式输出全新的数据信息,机器剖析所创造的知识增值与作品的原初价值之间是高度独立与分离的产物,二者不存在演绎性权力意义上的牵连性,也意味着在通过机器剖析实现知识增值的过程中接触、利用作品的行为并不会对作品的原初价值的市场交易形成法律上的侵犯。
三、人工智能深度学习中作品剖析的合理使用
既然机器剖析形成的知识增值并未影响到作品的原有价值与市场利益,那么著作权人通过复制权去控制人工智能的使用行为,并企图分享增值利益,便不具备正当性基础。这一正当性基础的缺位可使人工智能深度学习行为落入著作权制度中的合理使用范畴。
(一)美国合理使用判别标准的历史演进
“合理使用”作为公众对作品自由使用的权力,是对专著财产性权利的法定限制。合理使用的判别标准最早由美国法院在1841年提出,经过一百多年来司法判例的确认和建立,这一判别标准最总算1976年被法典化。这就是1976年《美国版权法》第107条的“四要素”规定。根据该条规定,在特定案件中评判对作品的使用是否构成合理使用时,应考虑以下四个要素:(1)该使用的目的与特点;(2)该版权作品的性质;(3)所使用的部份的数目,以及与作品作为一个整体的关系;(4)该使用对版权作品潜在市场或价值所形成的影响。然而,法条的灵活性造成了司法实践中适用标准的混乱与适用形式的机械化。部分法院像做物理题一样,根据四项要素创立的数目来判定是否构成合理使用。为了解决这一问题,“转换性使用”的概念应运而生。
转换性使用形成于1994年美国联邦最高法院的坎贝尔案,如今已成为日本合理使用案件最重要的判别标准。坎贝尔案涉及对作品的戏仿性使用,并由此形成了“转换性使用”的概念。所谓“转换性使用”,是指若使用行为用新的抒发、意义或信息改变了原作品,可以视为合理使用,不再屈从于对原作品的使用数目或使用性质的限制。转换性使用主要有三种类型,分别为内容上的转换性使用、目的性转换性使用以及功能转换性使用。以二次借助行为是否进行了创作为标准,可将上述三种使用行为界定为两类:其一为进行了创作行为的创作性转换性使用,是指后创作行为使用原作品创作出新的抒发,包括内容上的转换与目的上的转换。其二为没有创作行为的功能转换性使用,即二次借助行为没有进行任何创作,仅仅是实现了对作品的不同功能借助,例如日本的论文重复率检查系统Turnitin。然而,无论是以内容、目的还是功能作为判定标准,都可能会出现适用上的混乱。首先,在创作性转换性使用中,所有的创作行为均会形成新的抒发,不可能与原版权作品完全相同,这意味着所有的二次创作行为均构成转换性使用,如此一来,内容是否具有转换性这一判别标准便形同虚设。其次,目的具有极强的主观性,若以目的的转换作为评判诱因,则会出现使用者为避免使用行为构成侵权而夸大使用目的的情形。最后,以功能作为评判转换性程度的标准也存在过分模糊、难以适用的问题,例如,美国将教学与残疾人使用方法认定为功能转换性使用,而司法与行政领域的二次使用则不具有功能转换性。这种界定标准并无合理根据。因此,转换性使用也存在适用的模糊性。
合理使用的判别标准形成变动的缘由,是新技术背景下对作品全新借助形式的激励。换言之,判断标准的变化折射出的是著作权立法观念的变化,即互联网时代对创新激励的日渐注重。从坎贝尔案中的戏仿作品到人工智能的非表达性使用,均是对原作品的全新借助形式。因此,合理使用通过评判二次借助生成的内容或目的是否具有转换性,目的在于判别新的生成物是否会与原作品产生竞争,本质上依然是出于鼓励创作的目的。只有当二次借助行为具有充足的创新性,才能创造出全新的市场,从而防止步入作品的原有市场与其产生竞争,侵扰著作权人的市场利益。具体而言,转换性使用中的目的性转换与功能转换归根结底都是为了对作品受众进行分辨,不同的目的与功能会吸引不同的用户群体,如果受众存在差别,那么其所属市场也就不会相互竞争,从而不会影响著作权人的市场利益。与其说是二次使用形成了新目的与新功能,不如说是挖掘了作品的潜在市场。
(二)我国人工智能深度学习中合理使用的制度安排
美国著作权法中对合理使用的规定是概括式的标准设定,即通过立法概括式规定合理使用的判定标准,而具体类型则由法院在适用标准时进行个案认定。我国著作权制度的立法选择走的是类型化的公路。《著作权法》第22条规定了十二种合理使用的类型,但未明示合理使用的认定标准。在实践中,我国法官对合理使用行为的认定主要有两项基本标准:一是必须在行为模式上被认定为符合《著作权法》第22条规定的十二种行为模式之一;二是在行为性质的认定上接受了《美国版权法》第107条所确立的四要素判定理论,并且主要指出“不得不合理损害著作权人的市场利益”。随着互联网经济的发展,网络环境下对作品的借助形态愈发复杂,许多时侯无法被归类为任何一种法定模式,此时法官主要通过对行为性质的认定来确认合理使用行为的存否。譬如在王莘诉微软图书馆著作权侵权纠纷案中,法院觉得:虽然微软图书馆在搜索结果中显示了上诉版权作品的部份片断,但这些使用并未使浏览用户相对完整地得知作者的思想爱情,无法满足读者的阅读需求,因此,用户会通过订购方法获取原作品。可见,谷歌对原作品进行部份内容的提取,客观上并不会取代上诉作品的市场销售,也不会影响著作权人所获取的市场利益。此种在裁判中有意忽视对合理使用类型的阐述,在合法性上存在重大隐患。在人工智能产业快速发展的当下,未来可能呈现出越来越多的作品使用情形,如果不对人工智能深度学习的行为性质进行明晰的立法划分,恐将诱发大量诉讼,无助于互联网产业的健康发展。
对著作权合理使用的认定主要从行为定性与利益定量两个角度展开。从行为定性的角度来看,无论是传统“四要素”判断法,还是近些年深受推崇的“转换性使用”判断法,其背后的逻辑是不能简单从机械解释法条文义的角度判定作品接触、引用、利用等行为是否涵摄于复制、演绎、表演、信息网路传播等著作权法定权力的范围之内,并据此认定其侵权有无。更加科学的做法是从功能主义的角度,结合著作权法鼓励创新的立法目的,从作品借助行为与著作权法定权力所预期的市场交易行为之间的关系入手,考察是否具备合理使用的特点。从利益定量的角度来看,判断合理使用的关键在于比较、考察合理使用行为对作品原初价值形成了如何的数目上的影响。在前述系列案件的裁判中,法官们共同的认识是:著作权法所创设的各项财产性权利,实际上是对市场交易实践的类型化产物,也即意味着法律赋于著作权人拥有相对固定的赢利模式。如果某种未经许可的作品借助行为对作品的既有市场产生取代,那么将会减损权利人的利润,打击权利人的创作动力,不符合著作权法的立法目的。因此,对权利人的原有市场进行保护具有正当性。但是,潜在市场则是非传统性、较难发展的市场,对潜在市场的开掘不应该被视为立法者赋于著作权人法定权力的保护范围。因为这些市场的发觉不是作者在创作之初基于著作权法的诸项权力所合理预见的市场利益。正如Campbell案中,以“原创作品的创作者是否一般会发展”来划分原有市场与潜在市场。也即是说,即便二次利用者发觉了作品的潜在用途并攻占了这一市场,也不会影响权利人的创作积极性。合理使用的定性与定量是一体两面的关系,我国当前法庭对互联网合理使用的认定集中于定量分析,但也应正面回应定量背后的定性问题。
如前所述,人工智能深度学习行为所形成的知识增值在定量上与作品原初价值之间互相独立,也不具有演绎性权力那样的牵涉关系。在定性问题上,人工智能深度学习尚未能被《著作权法》及《信息网络传播保护条例》中对合理使用行为的类型所囊括,是一种新型的合理使用行为,可以被视为转换性使用。具言之,无论是输出类作品内容的二次借助,还是对作品的非表达性使用,均构成转换性使用。首先,人工智能生成类作品内容具有内容上的转换性。投资者与设计者开发创作型人工智能的本意便是减少人类作者的创作压力,以高效的数据剖析与内容输出对人类作品进行补充。即便人工智能生成物的著作权定性一直存在争议,但学者大都觉得,在忽视作者身分的情况下,人工智能输出内容的艺术价值早已达到了与人类作品相仿的地位。可见,在人工智能通过数据剖析生成的内容中存在人类版权作品意义上的独创性抒发。尽管这种抒发是从数据剖析中习得,但这并不影响机器输出物中已经包含了创新内容,具有内容上的转换性,可以构成转换性使用。其次,人工智能剖析数据的非表达性使用方法具有功能上的转换性。如前所述,功能转换性使用是指二次借助中不存在任何创作行为、仅改变了作品借助功能的使用方法。人工智能通过数据重组、叠加、副产品挖掘等非创作性手段,从满足读者的文学艺术须要转变为提供教育、医疗、住房等实用性建议,使源数据具有了全新的功能,实现了与作品本身的使用价值截然不同的数据价值,构成功能转换性使用。
另一方面,从产业发展与保护竞争的角度来看,随着技术的发展与生活方式的改变,作品总会形成全新的用途,如果将基于作品形成的全部价值赋于著作权人,会导致其垄断作品之上的全部产业。垄断一旦实现,将会造成许可费用畸高,带来严重的市场失灵。不仅这么,由于作品的借助形式与使用人的特质息息相关,使用者的性别、年龄、行业、地域、受教育水平等诱因均会影响其对潜在用途的挖掘,因此,著作权人自己很难实现对作品的全方位借助。将基于作品形成的全部价值均分配给著作权人,将会严重缩小作品的潜在市场,不利于新产业的发展。因此,若二次借助形成的价值属于潜在市场,那么则需认定其构成合理使用,以激励使用者对原作品不断进行价值挖掘,促进新兴产业的发展。人工智能生成类作品内容的功能催生了微软小冰、京东“莎士比亚”、百度“创作脑部”等大批人工智能“创作者”的诞生,而对数据的非表达性使用方法更是层出不穷。这些对作品的使用方法并非原作者一般会发展的市场领域,相反,他们属于新兴的人工智能市场。因此,将才能形成独立数据价值的机器剖析行为认定为转换性使用,才是激励创新与推动产业发展的应有之义。
结语
人工智能在深度学习过程中未曾获取作品任何的原初价值,因此,机器剖析行为形成的数据价值不同于往年的作品借助所形成的价值类型,对作品的集中复制未能落入著作权人复制权的规制范围,故而权利人企图分享机器剖析的知识增值缺少正当性。其次,从经济学角度来看,既然作者早已可以基于现有的利益分配获得合理的回报因而保持继续创作的动力,若将基于作品的利益不合理地过度分配给著作权人,可能会造成交易成本偏高而影响在后创新。因此,为实现著作权法激励创新的立法本意,应将机器剖析行为认定为转换性使用,如此,才能保障人工智能产业的发展动力与基础。
随着传播技术的发展,著作权法由过去单一的激励作者创新逐步转变到激励对作品的多样借助而形成的创新价值,正因这么,世界各国纷纷对人工智能深度学习作品保持着包容的心态。虽然我国现行《著作权法》对于合理使用的规定属于封闭式列出,人工智能无法以一种正当路径步入合理使用范畴;但《著作权法》第三次修订草案降低了合理使用的概括式条款,为原先封闭的标准平添了开放性与灵活性,这为人工智能学习作品被认定为合理使用提供了制度抓手。未来,我国甚至可以尝试借鉴德国的制度安排,为人工智能使用作品的行为设置专门的条款,有助于为司法实践中的具体裁判提供更为明晰的指引。产业实践的创新须要法律制度的同步转型,深度学习正在推进人工智能从科技试验深入到实际的社会生产环节,正如每一次技术革命都促使著作权制度往前发展一样,人工智能深度学习中的合理使用问题只是一个开始,我们当下正处在著作权制度发展的新时期。由于数据可以脱离载体自由流通,法律调整数据关系的思路正在从控制、占有转向鼓励流通和使用,在面对人工智能带来的新问题时,我们既要坚持专著权法的基本理念与历史逻辑,也要更新观念尝试突破,让著作权法成为新时期加快社会文学艺术发展的基石。