新闻中心
News Center
全文2638字 | 推荐阅读时间6mins
文 | 知识产权法律实务研发中心-王梓丞
近日ChatGPT的横空出世,在业界掀起了惊涛骇浪,似乎无所不能的ChatGPT让撰写邮件、论文、脚本、制定商业提案,创作诗歌故事,甚至敲代码、检查程序错误都变得易如反掌。但ChatGPT是否真的能替代人类了呢?
(这是ChatGPT为成都写的诗?)
(这是模仿杜甫为成都写的重阳诗?)
这是红星新闻在对ChatGPT采访中要求为成都写的诗歌和模仿杜甫的诗,但茶馆里的烤鸭是成都街头常见的场景?重阳诗也很明确不属于杜甫的风格。由此可见ChatGPT创作的作品,虽然具有高效、快速的特点,但还是缺乏人类的情感和思考,因此ChatGPT在艺术创作领域仍有很长的路要走。
人工智能的迅速发展使得法律落后于技术的现象尤为突出,也由此引发法律从业者提前去思考ChatGPT进一步发展所面临的法律问题。不过在此之前还需要简单通俗的介绍下ChatGPT的技术发展和创作的完整过程。
ChatGPT的智能性来源?
传统AI的机器学习采用的是监督学习,即在“有答案”的数据集上学习,比如早期的机器翻译模型就是不断地将中文送入到模型中,模型会给出一个英文的输出,这个时候我们对比一下英文的输出与标准答案的差距,如果差距比较大就需要调整模型参数。
GPT则是对自然语言提出一种新的训练范式,即现通过海量的数据的无监督学习来训练一个语言模型,在一个上下文中预测下一个词。由于GPT的底层借用了表达能力很强的Transformer,经过长时间发展的海量无标记自然语言数据就可以训练出来对语言有了相当深入地理解的模型。在完成模型微调之后,GPT还需要在人类的帮助下训练一个奖赏网络,这个奖赏网络具有对多个聊天回复好坏进行排序的能力。利用这个奖赏网络可以进一步通过强化学习(reinforcement learning)优化了聊天模型。在这一通操作之后,ChatGPT就变成了我们现在看到的这样子。
由此可见ChatGPT并没有那么神秘,它本质上还是将海量的数据结合表达能力很强的Transformer模型对自然语言进行了一个非常深度的建模。对于一个输入的句子,ChatGPT就是在这个模型参数的作用下生成一个回复,这使它能够根据给它的提示生成旨在处理各种包括语言翻译、问答和文本摘要在内的任务,生产出类似人类的文本,进而形成语言生成、上下文学习和世界知识三方面的能力。它具有主动承认错误并听取意见优化答案、质疑不正确的问题、以及支持连续多轮对话的特征。这些功能特征极大提升了对话交互模式下的用户体验。
ChatGPT创作成果引发的法律问题
(1)ChatGPT所创作的诗歌能不能算作品?
我国著作权法第2条规定,中国公民、法人或者非法人组织的作品,不论是否发表,依照本法享有著作权。已经明确规定“作品”必须是人类的智力成果,纯粹的自然风光和声音虽然可能很优美、具有欣赏价值,以至于可以被称为“大自然的杰作”,但它不是人类智力创作的结果,也就不是著作权法意义上的作品,由此可见ChatGPT所创作的诗歌也不能算为作品。
同时有记者在ChatGPT对话框输入“土耳其地震最新消息”时,ChatGPT回答称,它无法访问最新的事件进展,因为其当初在进行模型训练时,数据只更新到2021年,这说明ChatGPT的创作内容还无法做到从无到有。不可否认的是ChatGPT所创作的诗歌在“独创性”上是具备的,但正如本文开篇所提到的两首诗歌一样怪怪的,说明在“创”的高度和灵活度上ChatGPT还有所欠缺。
(2)ChatGPT可以称为作者吗?
ChatGPT作为虚拟主体,既非公民、法人也不是相关非法人组织,甚至不如那只拿起相机给自己拍照的猕猴,都不能作为著作权的主体享受法律保护,但可能也有人说对ChatGPT提问的人、ChatGPT的开发者能否成为作者呢,答案同样是否定的,著作权法规定著作权人必须是对作品的创作做出贡献的人,而提问的人只是简单提出一个问题,最终的展现成果是由ChatGPT根据自主学习所创作的。ChatGPT的开发者只是相关程序代码的作者,对于ChatGPT的开发者所创作的成果也未作出贡献。
其实在ChatGPT出现前的五年间,包括美国在内的多个国家都对人工智能的发明或是创造作品能否能够被授予版权进行了激烈的讨论,最典型的案例莫过于由英国萨里大学Ryan Abbott教授,以及美国发明家斯蒂芬·泰勒(Stephen Thaler)博士等人开发的人工智能DABUS(“device for the autonomous bootstrapping of unified sentience,统一感知的自动引导装置”)系统。目前包括美国、英国、德国、澳大利亚等国都不接受人工智能所创作的成果被赋予版权保护。
(3)ChatGPT所创作的成果数据是否合规?
ChatGPT的工作原理,其依靠巨量的自然语言本文,ChatGPT需要对语料库中的数据进行挖掘和训练,ChatGPT需要将语料库中的内容复制到自己的数据库中,相应的行为通常在自然语言处理领域被称之为“文本数据挖掘”。当相应的文本数据可能构成作品的前提下,文本数据挖掘行为是否侵犯复制权当前仍存在争议。在此基础上,若用户在输入请求范围限缩到与已识别或者可识别的自然人有关的各种信息,则有侵害他人个人信息权益的风险。
(4)ChatGPT所创作的成果是否侵权的关键点?
正如ChatGPT所称其所创作的诗歌是通过大量的文本数据训练来模拟人类诗人的写作风格并利用机器学习技术生成的,从诗歌内容来看,其所创作的诗歌只能是在已有作品上的创新,根据限定的条件调用相应的元素,如开篇的描述成都的茶馆、烤鸭等(却没有调用熊猫、麻将等成都常用代表元素),然后按照在准确度、细节描述和上下文连贯性的处理后形成相应的内容内容。由此可见,ChatGPT是在现有训练库通过深度学习针对元素、场景的综合调用,没有涉及完整故事情节或者桥段的调用,这在著作权法意义上还只是具体的文字表达,暂还不涉及著作权侵权的问题,一旦开发者将调用片段的长度和宽度放大到有相当长度的片段还是会涉及著作权侵权问题,也会涉及到侵权主体限定的问题。
因此,现阶段的法律规定无法对ChatGPT所创作的成果提供法律保护,ChatGPT因为不是适格主体可能不会涉及侵权,但对ChatGPT所创作的成果进行使用则可能受到法律的规制。
ChatGPT对哪些行业带来挑战性?
较为经典的案例是有博主在ChatGPT上咨询商标侵权时,里面各种复杂情形让无所不能的ChatGPT崩溃,给出的回答是请咨询专业的律师和专家。由此可见ChatGPT会对主要职责是信息搜集、提炼和重组等简单重复、规则性强的工作岗位会带来挑战性。但对于诸如法律行业等专业性较强,需要结合丰富经验进行争议判断的领域,ChatGPT还是无法给与答案,也不能很好的理解用户真正的需求。但不可否认的是,ChatGPT还是展现了对于法律法规和案例的精准引用,而且可以预见随着数据的不断增加以及后台模型升级,未来的ChatGPT和得理问答的回答将会越来越智能,越来越精确。因此各位以专业为生存技能的律师同行们一方面要善于运用人工智能工具来提高工作效率,另一方面更需要加强执业能力、语言能力、人际沟通能力等人工智能无法企及的方向学习,才能更好的提升客户信任度和满意度。正如荀子在《非相篇》中所述:人之所以为人者,何已也?曰:以其有辨也。而这正是ChatGPT所无法代替的根本。
- 作者简介 -
王梓丞-合伙人
擅长领域:
知识产权,公司商事,军民融合,争议解决
荣誉与资质:(包括但不限于)
首批次高级知识产权师职称
四川省知识产权师资人才
成都市知识产权规划发展专家
广西自治区知识产权中青年专家
Mail:
zicheng.wang@sgla.com
特别声明
“中联成都”所刊登的文章仅代表作者本人观点,不得视为上海中联(成都)律师事务所或其律师出具的正式法律意见或建议。如需转载或引用文章的任何内容,请联系公众号沟通授权事宜,并于转载时在文章开头处注明来源于公众号“中联成都”及作者姓名。未经本所书面同意,也不得转载或使用文章中包含的任何图片或影像。如您有意就相关主题进一步交流或探讨,欢迎与本所联系。