챗GPT 학습자료 이용의 저작권 문제
챗GPT를 학습시키기 위해서 크롤링을 통해 웹사이트에서 수집한 자료의 양은 약 570 Gbyte라고 알려져 있다. 이것은 향후 버전이 업이 되면 계속 늘어날 예정이라고 한다. 이미지나 동영상 등 용량이 큰 저작물을 포함하지 않은 텍스트 기준으로 한 자료라는 것을 감안할 때 엄청나게 많은 크기가 된다. 인터넷에서 올라와 있는 자료, 저작물 대부분이 저작권법상 보호받는 저작물이기 때문에 해당 저작물의 수집, 저장, 학습 과정에서 발생하는 전송 등의 과정을 고려해 볼 때 학습자료에 대한 저작권 문제가 발생할 수 있다. 실례로 벌써 학습한 자료를 바탕으로 소설을 창작하는데 원작물과 유사한 이슈 등이 발생하고 있다. 단, 인공지능의 학습자료의 데이터 마이닝 과정에서 이루어지는 저작물 이용행위가 공정이용에 해당하는지는 향후 법적으로 검토가 필요한 사안이다.
현재 현행 저작권법 규정상 인공지능AI 학습, 머신러닝을 위한 저작물 이용에 관한 직접적으로 적용할 수 있는 저작권 제한 규정은 존재하지 않으므로 일반적인 제한 규정이라 할 수 있는 제35조의 5(저작물의 공정한 이용)가 적용이 가능한 상황이다. 다만, 제35조 5를 적용함에 있어 해당 이용행위가 상업적 이용에 해당하는지, 그리고 변형적 이용으로 볼 수 있는지 여부, 기존 시장에 대한 대체 가능성 등에 대한 법원의 해석 및 판단에 따라 달라질 수 있다. 미국의 일반적 공정이용 규정적용과 관련해서 전자적 검색 목적으로 또는 표절 조사의 목적으로 디지털 복제를 하고 보관하는 행위에 대해 공정이용의 적용을 긍정한 Author Guild. Inc. V. Google. Inc. 사건 등을 참고할 수 있을 것이다.
챗GPT에서의 창작물, 결과물에 대한 학습자료의 출처표시 의무
저작권에 대한 국제협약인 베른협약에 따르면 기본적으로 저작물의 인용과 같은 지적재산권의 제한의 경우, 출처 표시를 의무로 규정하고 있다. 대한민국 저작권법 제37조에서도 출처 표시를 의무하고 있다. 오픈AI사가 개발한 챗GPT에서는 ChatGPT에 의해서 생성되는 창작물이 기존 창작물을 조합한다고 하지만 일부분 또는 대부분을 그대로 모방표현하는 것을 배제할 수 없으며 이경우에는 학습자료의 출처표시 의무 문제가 발생할 수 있다. 현재 서비스에서는 어떠한 출처를 표시를 하고 있지는 않다. 챗GPT에서 학습한 저작물 중 Creative Cmmons License 저작물이나 오픈소스 라이선스들은 기본적으로 출처나 저작권자 등을 표시하도록은 하고 있다. 챗GPT와 유사한 방법으로 Database로 구축된 정보를 크롤링하여 학습데이터를 수집해서 서비스를 한다면 향후 Database 제작자의 권리 침해가 발생할 수도 있다. 현시점에서 미국에는 이와 같은 권리가 없지만 우리나라에서 챗GPT와 동일한 방법으로 학습자료를 수집한다면 저작권법 제4장 Database제작자의 권리 침해가 발생할 수 있다.
오픈 AI사 챗GPT의 학습자료와 오픈소스 문제
오픈소스는 기본적으로 인터넷상에 공개되어 있어서 누구나 자유롭게 사용할 수 있다고 생각하지만 GPL, LGPL, Apache 라이선스, BSD 라이선스 등 다양한 오픈소스 라이선스가 적용되어 있다. 만약 챗GPT가 학습한 소스코드들이 이러한 오픈 소스를 적용해서 사용해서 창작하였을 경우에 과연 오프소스 라이선스의 사용조건을 지키지 않았다면 저작권 침해 문제가 발생할 수 있다. 현재 OpenAI 오픈에이아이 챗GPT의 이용약관을 보면 '사용자가 입력하고 출력한 콘텐츠에 대한 권리, 소유권, 이권을 가지고 있으며, 출력한 콘텐츠에 대한 모든 책임은 사용자에게 있음'이라고 명기하고 있기 때문에 만약 사용자가 챗GPT로 창작한 소스를 공개적으로 배포, 저작권 이슈가 발생 시에는 오로지 사용자에게 귀속됨을 알 수 있다.
오픈소스와 학습자료 관련해서 분쟁사례
2022년 11월 프로그래머 메튜 버터릭과 조셉 세이버리 로펌이 "마이크로소프트사와 OPEN AI사는 오픈소스 라이선스 조건을 위반했고, 오픈소스 프로그래머들이 이룬 작업으로 이익을 얻고 있다"라고 주장하면서 이 두 개 회사를 상대로 집단소송을 제기하였다. 2022년 1월 Getty image사는 Stability AI사가 공식 허가를 받지 않고 Getty image사의 소유한 이미지 수백만 장을 인공지능 학습에 이용하였다고 주장하면서 재산권 침해 소송을 제기하였다. 이외에 앞으로 저작권 관련 소송은 계속 이어질 것으로 예상되어진다.
'ChatGPT & AI technology' 카테고리의 다른 글
Kaiber AI Image 처리 기술을 이용한 인공지능 영상생성기술 (0) | 2023.05.03 |
---|---|
삼성전자 개발직군 사내에서 OPEN AI(社)의 ChatGPT 사용금지 (0) | 2023.05.02 |
대한민국 군대의 현대화의 핵심 AI 인공지능 기술 (0) | 2023.04.21 |
2023년도 인서울 인공지능 AI 학과 입학경쟁률 (0) | 2023.04.19 |
Tiktok 틱톡 AI 기술 알고리즘과 추천프로세스 (1) | 2023.04.17 |
댓글