导 读
最近ChatGPT出圈成为话题,作为数据法律师,被朋友和同行问及的更多,于是我想从自己的角度跟大家分享作为一个数据法律师对ChatGPT现象的一些思考和感悟。称作思考和感悟,一方面意味着本文可能与数据法律实务关联性不大,另一方面也因此内容可能比较散、属于有感而发,提前请大家不要抱有太大的希望,纯属漫谈。
什么是ChatGPT?
谈论这个东西的时候,我们大概首先需要知道这是个什么东西,它当然有一段长长的名字和严谨的学理上的分类和定义。但是,如果用一个不明白的名词来解释另外一个不明白的名词是完全没有意义的。这就好比你要向一个非佛教徒解释什么是“空”,你跟他说“空”就是“真空妙有”、“非空非有”,相当于什么也没有说。我在这里尝试用大家能够理解的方式解释什么是ChatGPT,当然这种解释是学术和不严谨的。
ChatGPT大概就是一个基于大量数据训练产生的内容自动生成人机交互系统,目前来说他是以语言方式与交互方进行交流的。不排除很快他就能够用图形、音乐、甚至其他各种你想到或者想不到的形式。这个系统里面包含了两个我们并不陌生的智能系统:人机交互和内容生成。人机交互我们并不陌生,比如我们iPhone手机上的Siri,比如你导航软件里的“小德”,或者家里的“小爱同学”……所有我列的这些都是一种人机交互。内容生成我们也不陌生,比如美颜、声音模仿,都是内容生成。
那为什么ChatGPT会忽然这么火爆呢?原因是它能把这两者“自动”地结合起来!如果你仔细分析,你会发现在ChatGPT之前的这些人机交互,基本上机器就是为你在搜索答案,并且将所有搜索到的答案列给你让你自己选择,它不具备信息的进一步筛选、分析、整理的能力。而此前的自动生成,软件需要你提供生成变量,如果你的数据不具备可以直接采取的变量,软件就无法生成结果,软件不具备自己分析并产生生成变量的功能。但ChatGPT不是,它首先通过你的问题自动处理和分析数据库里的所有信息,然后生成出一个最佳的答案。这个答案不是从数据库中采集到任何一个既有答案,是它自己生成的。并且这种回答基于此前数年的“训练”,相当符合我们人类的语言习惯了。
由于它是有机的、自动的生成新反馈信息,而不是机械地复制既有的网络信息,因此我们就看到诸如“北密西根大学教授发现班级里最好的论文出自ChatGPT之手”、“谷歌面试官发现ChatGPT能通过18万美元年薪的工程师招聘”、以及据说“全美有89%的学生用ChatGPT写作业”之类的状况层出不穷。因为ChatGPT有比你大得多的信息数据库,然后它会“理解”问题,还会归纳、总结、分类、表述答案。
是不是感觉像是一个无所不知的神?!
会有著作权问题吗?
有潜在的问题,但尚无定论!
虽然ChatGPT确实“生成”了新的信息,但这些信息都来自于数据库的既有信息,这些信息本身是有人类创作者的,它们可能是你我发表的论文、视频和语音、书籍和文献……总之它不是凭空地自己“想”出来的答案。因此,ChatGPT并不具备完整的独创性。有点类似于技术专利——新的技术往往基于过去的技术基础。所以如果ChatGPT实际上是在借助别人的著作权进行创作的话,那么是否存在对这个著作权的授权使用问题呢?
但是如果进一步去看,我们哪一个人的认知作品不是建立在别人的基础之上呢?著作权法保护的是作品内容及其表达方式,但无法也无意进一步保护那些作品背后的思想和逻辑推理。所以,如果ChatGPT足够“聪明”的话,它是完全可以不去“抄袭”既有作品的。因此,对于ChatGPT所产生的信息是否存在著作权侵权的问题上,按照现有的规则来看,这或许不是一个法律问题而仅仅是技术问题,只要避免“抄袭”就完事儿了。
但问题还没有完,还有另外一方面——我们使用ChatGPT的回答(甚至未来创造出的音乐、图像)是否会侵犯它的权利(或者说它的所有者OpenAI的权利)?
讨论清楚这个问题的前提是我们要知道ChatGPT的成长机制。ChatGPT不是一个固定的软件,称之为人工智能说明它会学习、会成长。在ChatGPT的构架上是通过“训练”和“反馈”两套机制来学习和成长的。OpenAI的软件工程师们通过“训练”使其具备强大的数据处理能力学会如何将这些数据归纳、总结、分类、表述成它自己的“语言”;而我们这些使用者在人机交互的时候,也同时在通过“反馈”机制训练它,比如给他的回答点赞或者不赞,或者对它的回答进行评论,或者在它回答以后通过进一步的问题加以追问。所有这些反馈信息,都成为“训练”ChatGPT的一部分——换而言之,ChatGPT在借助与我们的交互成长。要知道ChatGPT是迄今为止唯一一个在短短2个月的时间里快速发展到1亿用户的软件!每时每刻在全球各地都有数以百万计的用户在通过“提问-反馈-再提问”的方式协助ChatGPT快速成长。因此从这个角度而言,我们每个人都是ChatGPT作品的“共同作者”。作为共同作者来说,使用自己参与创作的作品,不需要著作权授权。
但我们的这种“共同创作”对于ChatGPT产生的具体作品而言,比如一篇它所生成的论文,到底有多少参与成分?这个问题,从技术上说我们很难加以证明。反之比较容易的是,你确实从ChatGPT里引用了它生成的内容,而且这些内容你无法找到其他更早的“作者”。因此,就单一作品而言,使用人承担的侵权风险要比OpenAI大得多。
我个人认为:对于人工智能所产生的作品最终是否应当被认定为该系统所有者的著作权,即便当下有一些建立在现有法律体系下的案例和判决,这个问题仍然有待确定。
这对于现代科技社会来说是一个巨大的挑战,它需要科学家、法学家、政治家等社会最高智慧人群的共同参与和讨论以获得结论,而这个结论可能将会影响到人类社会的未来!
本期作者
朱凯
上海中岛律师事务所 高级合伙人
zhukai@ilandlaw.com
执业领域:公司股权,商事争议诉讼与仲裁,境内外M&A,TMT与数据合规
李伟伟
上海中岛律师事务所 律师
电话:(021)80379999
邮箱:liubin@ilandlaw.com
地址:上海市浦东新区银城中路68号时代金融中心27层
加入我们:liubin@ilandlaw.com