생성형 AI는 영화, 방송 등 콘텐츠 제작에서 혁신을 일으키고 있으나 저작권 침해와 윤리적 논란이 발생하고 있다. AI 학습 과정과 결과물에 대한 저작권 쟁점이 중요한 이슈로 떠오르고 있으며, 이에 대한 법적 규제와 보상 체계 마련이 필요하다. AI 발전과 저작권 보호 간의 균형을 위한 새로운 패러다임과 법 개정이 요구된다.글. 이재훈(성신여자대학교 법학부 교수)
들어가며
생성형 AI(Generative AI)는 대규모 데이터셋(Data Set)에 기반한 딥러닝(Deep Learning) 기술을 활용하여 이용자가 요구하는 새로운 콘텐츠를 제시하는 AI 기술이다. 2022년 11월 공개된 ChatGPT를 비롯하여 Gemini, Stable Diffusion 등 생성형 AI는 인간의 창작물과 유사한 수준의 결과물을 산출해 내고 있다. 가령, ChatGPT는 영화 각본을 써 내려가고, 감독처럼 카메라, 배우 위치와 표정, 조명 활용 방법을 제시한다. RadioGPT는 인터넷에서 정보를 수집하여 방송 대본을 자동으로 생성하고 스스로 음성을 만들어 내 내레이션을 진행하기도 한다.
특히, 방송산업은 타 분야에 비해 이미지, 음악, 영상 등 방송콘텐츠에 대한 생성형 AI의 활용이 적극적인 분야다. 드라마나 영화에서 노년기에 접어든 배우가 전성기 시절 모습으로 되돌아가 젊어지거나, 심지어 이미 세상을 떠난 배우가 다시 스크린에 나오는 경우가 있다. 현실에서는 불가능한 일이지만 이제 생성형 AI를 활용하면 영상에서는 얼마든지 가능하게 되었다. 영상 제작에서 활용된 AI는 눈으로 보고도 믿지 못할 장면과 이전과 다른 신선한 연출로 시청자의 이목을 끄는 사실적인 구현 방식으로 즐거움과 감동까지 전달하고 있다.
[그림 1] 분야별 생성형 AI 시장 점유율
그러나 이에 대한 우려의 목소리도 만만치 않게 제기된다. 2024년에 개봉한 <에이리언: 로물루스>에서는 2020년에 별세한 영국 출신 배우 이안 홈(Ian Holm Cuthbert)이 생성형 AI를 통해 출연하게 되었다. 이안 홈의 얼굴과 목소리를 생성형 AI 기술로 재현해 새 캐릭터 루크(Rook)를 탄생시킨 것인데, 사실 루크를 연기한 건 실존하고 있는 배우 대니얼 베츠(Daniel Betts)다. 그의 얼굴 움직임과 목소리 연기를 캡처해 생성형 AI를 활용하여 이안 홈의 모습으로 변형한 것이다.
[그림 2] 인공지능 주요개념과 생성형 AI 관계
이안 홈의 출연에 대해 언론에서는 주로 윤리적인 문제를 언급하였으나, 생성형 AI의 산출물이 생성되는 일련의 과정을 고려할 때, 생성형 AI의 활용에서 해결해야 할 가장 중요한 쟁점 중 하나는 바로 저작권 문제다. 당장 위 영화에서도 생성형 AI가 사망한 이안 홈의 초상, 음성 등을 활용해 콘텐츠를 생산하는 것과 관련한 저작재산권 소유 문제, 생성형 AI가 학습 단계에 사용하는 과거 저작물에 대한 보상 여부와 방법, 대니얼 배츠에의 저작권 부여 여부, 생성형 AI를 활용해 만들어진 새 캐릭터 루크에 대한 저작권 문제 등이 주요한 현안일 것이다. 생성형 AI 기술의 급속한 발전으로 인하여 「저작권법」에 따른 권리를 둘러싼 분쟁이 다양해지고, 때로는 기존 법률 체계 내에서 해결할 수 없는 공백이 증가하는 등 생성형 AI 활용으로 인한 혼란이 가중되고 있으며, 이는 오히려 생성형 AI 활용을 위축시킬 수 있다.
생성형 AI가 학습을 위한 데이터 수집에서 산출물을 만들어 내기까지의 일련의 과정은 [그림 3]과 같이 5단계로 나눠볼 수 있으며, 해당 절차에서 저작권과 관계된 쟁점은 크게 2가지 단계, 즉 생성형 AI 학습 단계와 생성형 AI의 결과물 산출 단계로 구분할 수 있다.
[그림 3] 생성형 AI 관련 절차
생성형 AI와 관련한 저작권 쟁점
① 생성형 AI 학습 단계 – 데이터 수집부터 모델 평가 및 최적화 단계(1단계~4단계)
「저작권법」은 저작자의 권리를 보호하는 것과 함께 저작물의 공정한 이용을 도모하여 문화 산업의 향상 발전에 이바지함을 목적으로 한다. 이에 「저작권법」 제10조에 따라 저작자는 자신의 저작물에 대한 재산권을 가지게 되어 자신의 권리를 보호받고, 같은 법 제46조에 따라 저작재산권자는 다른 사람이 자신의 저작물을 이용하고자 한다면 저작물의 이용을 허락할 수 있고, 허락을 받은 자는 허락 받은 범위 내에서 그 저작물을 이용할 수 있다.
한편, 일반인의 문화 향유 및 문화 산업 향상을 목적으로 저작자의 재산권 행사가 일부 제한된다. 가령, 방송 등에서 시사 보도를 하는 과정에서 보이거나 들리는 저작물은 보도를 위한 정당한 범위 안에서 저작권자의 허락 없이 사용이 가능하고(「저작권법」 제26조), 학교의 입학시험에 필요한 경우에는 정당한 범위 내에서 공표된 저작물을 저작권자의 허락 없이 사용(「저작권법」 제32조)할 수 있다.
생성형 AI가 학습을 목적으로 저작물을 이용하는 경우에는 어떨까? 생성형 AI 모델 구축을 위한 학습 과정에는 대량의 데이터가 필요하고, 학습 데이터는 다양한 유형의 데이터로 구성되는데, 이러한 데이터에는 「저작권법」 상 보호되는 저작물(어문, 음악, 미술 등)이 포함될 수 있다. 이 경우에 타인의 저작물을 무단으로 이용할 경우 저작재산권 침해 책임을 질 수 있으므로, 생성형 AI가 데이터를 수집하는 과정에서 저작물이 포함된 경우 저작권자로부터 이용허락을 받아야 하거나 해당 저작물 사용이 저작재산권 제한 사유에 해당하여야 하지만, 이에 대해 저작권자를 확인하여 개별적으로 이용허락을 받는 것은 현실적으로 불가능하다. 결론적으로 생성형 AI가 학습을 위한 데이터를 수집하는 과정에서 저작물의 사용이 저작재산권 제한 사유에 해당하는지 여부가 관건이 된다.
현행 「저작권법」은 생성형 AI가 학습을 목적으로 저작물을 이용하는 경우를 개별 저작재산권의 제한 사유로 명시적으로 규정하고 있지 않다. 이에 생성형 AI에 관한 저작재산권 제한 규정을 두어 생성형 AI의 학습과 관련된 저작재산권 제한 사항을 신설하자는 움직임도 있었다. 생성형 AI의 학습 데이터 중 저작물에 대한 저작재산권 제한과 관련하여 일정한 요건 하에 저작권자로부터 별도의 이용허락 없이도 저작물을 사용할 수 있도록 허용하자는 내용이다. 이른바 텍스트 및 데이터 마이닝(TDM, Text and Data Mining) 규정이다. 해당 내용으로 「저작권법」 개정안이 제21대 국회에서 발의되기도 하였으나 임기 종료와 함께 폐기되었고 아직 제22대 국회에서는 해당 내용이 재차 발의되지는 않은 상황이다.
물론, 생성형 AI의 학습과 관련하여 저작재산권이 제한되는 사유를 포괄적인 형태로 정하고 있는 공정이용 규정(「저작권법」 제35조의5)의 적용이 가능한지 여부가 쟁점이 될 수 있다. ‘공정이용(Fair Use)’은 디지털·네트워크 시대의 급변하는 기술적 환경에 적절하고 탄력적으로 대처하기 위해 「저작권법」에 저작재산권을 제한하는 일반 조항으로서 도입한 것이다. 이러한 공정이용 규정은 기술의 발전으로 등장하는 새로운 저작물 이용 문제를 신속하게 해결할 수 있고, 성문 규정의 무리한 해석을 줄일 수 있다는 점, 저작권의 독점으로 인한 시장 실패를 보완할 수 있다는 점 등의 장점이 있다. 반대로 공정이용 규정으로 인해 법적 불확실성이 증대한다는 점, 공정이용 항변이 남용되면 사법적 판단에 부담이 커진다는 점, 저작권 보호가 위축된다는 점 등의 단점이 있다.
생성형 AI의 학습과 관련한 저작물 이용을 저작재산권 제한 사유인 공정이용으로 볼 수 있을지에 대해서는 학계 대립이 있다. 또한 생성형 AI의 학습에 저작재산권의 공정이용 규정이 적용되는지 여부를 직접적으로 판단한 법원의 판례도 아직 없다.
② 생성형 AI의 결과물 산출 단계 – AI 산출물 도출(5단계)
현행 「저작권법」에서는 생성형 AI 산출물의 저작물성을 인정하지 않는다. 다만 생성형 AI 산출물에 수정·증감 또는 편집·배열 등의 작업을 통하여 인간의 창작성이 부가된 경우 해당 부분에 대해서는 저작물성이 인정될 수 있다. 또한 생성형 AI 산출물들을 선택하고 배열 또는 구성한 것에 창작성이 있으면, 편집저작물로서 저작권이 인정될 수도 있다. 저작물에 대한 저작권 발생에 관한 요건으로 저작권 등록 행위가 필수는 아니지만, 생성형 AI가 산출한 부분이 무엇이고, 저작권자가 창의적으로 추가한 부분이 무엇인지를 구분하여 저작물을 등록하는 것도 필요할 수 있다.
다만, 위와 같이 생성형 AI 산출물에 인간의 창작성이 부가된 경우 내지는 생성형 AI 산출물에 대해서도 저작물성이 인정되는 경우를 가정한다면, 이와 같은 생성형 AI를 활용한 저작물이 기존의 저작물과 같거나 유사하다고 판단되는 경우에는 저작권 침해 문제가 제기될 수 있다. 다만, 「저작권법」은 이와 같은 저작권 침해에 관해 구체적인 조항을 두고 있지 않고 판례를 통해 요건을 구체화하고 있으므로 침해 여부도 판례를 기초로 판단해야 한다.
저작권침해소송에서 원고(저작권 침해를 주장하는 자)는 저작권 침해의 요건을 주장·증명하여야 한다. 요건은 크게 원고가 주장하는 자신의 피침해대상이 저작물인 점, 원고 자신이 저작권자인 점, 그리고 피고(생성형 AI의 저작물성이 기존 저작물과 같이 인정되는 경우를 가정한다면, 이를 활용하여 저작물을 만든 자)가 원고의 저작권 등 권리를 침해한 점을 들 수 있을 것이다. 그리고 여기서 저작권 침해 행위에 해당하려면 피고가 원고의 저작물에 접근하여 원고의 저작물과 동일하거나 실질적으로 유사한 작품을 제작하는 등 「저작권법」이 정한 유형의 행위 방법으로 이용하였어야 한다.
그러나 생성형 AI 산출물이 기존 저작물과 같이 약간의 유사성만 있다고 모두 저작권 침해로 본다면 생성형 AI를 활용한 활동이 과도하게 제약될 우려가 있기 때문에 어느 범위에서 저작권 침해를 인정할 것인지가 핵심적인 판단 대상이 될 수밖에 없다. 이를 위해 비교 대상인 생성형 AI 산출물이 저작물이라는 것과 해당 저작물이 생성형 AI의 학습 과정에서 원고의 저작물인 피침해저작물에 접근하여 만들어졌다는 것이 각각 입증되어야 하고, 그 전제에서, 두 저작물 사이의 “실질적 유사성”을 심리하게 된다.
실질적 유사성 여부를 판단하려면 우리 판결들에서 전형적으로 설시되는 바와 같이 작품 속의 특정한 행이나 절 또는 기타 세부적인 부분이 복제됨으로써 양 저작물 사이에 문장 대 문장으로 대칭되는 유사성이 있는 경우와 작품 속의 근본적인 본질 또는 구조를 복제함으로써 전체로서 포괄적인 유사성이 인정되는 경우를 모두 파악하여야 한다.
실질성 유사성의 판단은 선행적으로 유사성 여부 판단 대상의 설정이 중요하다. 예컨대 ‘사랑은 아무나 하나 사건(대법원 2004. 7. 8. 선고 2004다18736 판결)’에서 “표현에 해당하고 독창적인 부분, 즉 ‘보호받는 표현’만을 가지고 대비”하여야 한다고 설시한 부분이 이에 해당한다. 이는 <드림하이> 사건(대법원 2015. 8. 13. 선고 2013다14828 판결)에서 다시 확인된 것으로 대법원은 원심이 창작성을 인정한 원고 음악저작물의 일부는 피고가 제시한 저작물과 가락 및 리듬이 유사하고, 화성은 일반적으로 사용되는 정도의 것이어서 두 사건의 원고 저작물에 독창적인 부분이 없는데도 이를 창작성 있는 것으로 보고 피고 저작물과 비교한 것은 부당하다고 지적한 바 있다. 즉, 생성형 AI 산출물이 기존 저작물을 학습하여 새로운 저작물을 생성했다고 하더라도 기존 저작물에서도 실제 보호받는 표현이 무엇인지를 구체적으로 정하지 않고 이를 단순히 비교하는 것은 옳지 않다는 해석이 가능하다.
만일 원고 저작물에 창작성이 있는 부분의 존재가 인정되고 또 획정된다면 과연 피고인 침해혐의자의 저작물과 어느 정도 유사하여야 ‘실질적’으로 유사한 것인지의 판단 문제가 제기된다. 이는 창작성의 인정 문제와는 또 다른 차원의 쟁점으로 실무적으로 저작권침해소송에서 가장 중요하고도 난해한 법적 판단의 영역이라고 할 수 있다.
다만 이에 대하여는 저작물의 종류마다, 침해의 방법 등 사안의 성격마다 각각 고려하여야 할 요소가 많으므로 일률적으로 말하기는 어렵다. 추후 생성형 AI의 산출물에 관한 논의에는 또 다른 해석이 이루어질 가능성도 있으나, 우선 기존의 실질적 유사성을 판단하는 방식에 관해 간략히 정리해보고자 한다. 첫째, 보호받지 못하는 요소를 제거한 후 판단에 들어가는 ‘분석적 접근법’이 있다. 이를 컴퓨터프로그램 저작권침해사건에서는 ‘추상화(Abstraction)-여과(Filtration)-비교(Comparison)의 3단계 테스트’로 불리기도 한다. 현재 어문·음악저작물 등에도 적용되고 있으며, 우리 대법원도 이에 가까운 방법을 사용하는 것으로 평가받고 있다. 둘째, ‘전체적 접근법’으로 양 저작물의 유사성을 보통의 관찰자 혹은 일반 수요자의 관점에서 전체적인 느낌과 관념을 기준으로 판단하는 것이다. 셋째, ‘2단계 접근법’으로 1단계에서는 보호받는 표현인지 여부를 묻지 않고 저작물 전체를 놓고 비교 검토한 후 2단계에서 그러한 베끼기가 원고 저작물의 보호받는 표현을 피고가 불법적으로 이용한 부당한 이용에 해당하는지를 통상의 관찰자에 의한 청중테스트로 판단한다.
생성형 AI의 발전과 저작권 보호 사이의 균형 모색
생성형 AI에 관한 저작권 쟁점에 있어 생성형 AI 사업자·기존 저작권자·생성형 AI 이용자 간 발생할 수 있는 분쟁에 관하여 사전적인 균형을 맞추는 것이 상당히 중요하다. 단순히 생성형 AI 사업자에게 학습 데이터에 대한 적법한 권한을 확보할 것을 요구한다면 생성형 AI 사업이라는 신산업에 과도한 부담을 안길 수 있다. 반면, 저작권자에게 저작재산권을 과도하게 제한한다면 저작권자 입장에서는 저작물에 대한 보상을 제대로 받을 수 없게 된다. 이는 생성형 AI 이용자에게는 결국 중장기적으로 좋은 품질의 생성형 AI를 활용하지 못하는 결과를 초래할 수 있다. 따라서 생성형 AI가 선택이 아닌 필수인 이상 생성형 AI 시장에서의 경쟁력을 유지하기 위해 저작권 보호와 생성형 AI 발전을 함께 고려한 새로운 패러다임이 필요하다.
특히, 최근 만화나 웹툰을 원작으로 한 다수의 영화, 드라마 등 방송 콘텐츠가 흥행에 성공하면서 드라마, 영화 등과 관련하여 관련 저작물의 시장성이 커지고 있어 장르 간의 교류가 활발해지는 경향이 두드러지고, 특히 생성형 AI를 활용함으로써 기존의 장르 내에서의 전통적인 표절 시비 외에도 타 장르로의 표절 논의나 지금까지 겪어보지 못한 저작권 이슈 분쟁도 적지 않을 것으로 예상되므로 그 특성을 고려한 논의가 요구된다. 생성형 AI 산출물에 대한 저작권 분쟁 이슈에서 주목할만한 사항이라 할 수 있다.
이에 생성형 AI의 발전과 저작권 보호 간 균형과 상생 방안으로서 ① 생성형 AI가 학습에 활용하는 저작물에 관한 합리적인 관리 및 보상 체계 마련, ② 생성형 AI 사업자와 기존 방송콘텐츠 저작권자 간의 지속적이고 즉각적인 소통과 대응, ③ 비용 문제로 학습 데이터 구축과 접근이 어려운 생성형 AI 스타트업과 중소기업의 학습 데이터 확보 지원 방안 마련과 함께 ④ AI 시대에 걸맞은 공정이용 개념의 확장 및 이를 반영한 「저작권법」 개정, 그리고 그 이전 과도기를 위하여 적절한 공정이용 가이드라인이 필요하다고 보인다.
생성형 AI 이용자의 경우, 기존 저작물과 같거나 유사한 산출물을 만들어 냄으로써 타인의 저작권을 침해할 가능성이 존재한다. 따라서 ① 기존 저작물과 유사한 산출물을 공연, 전시, 배포, 공중송신 등 외부로 공표하여 기존 저작권자의 저작권을 침해하지 않도록 각별히 유의하고, ② 생성형 AI 산출물을 방송콘텐츠로 활용하려는 경우 관련 생성형 AI 관련 정책·가이드라인을 확인하고 이를 준수하여야 하며, ③ 산출물을 활용하거나 인용할 시 기존 저작물의 출처를 기재하는 것의 필요성이 더욱 강조될 전망이다.
참고자료
- 문화체육관광부·한국저작권위원회, 『생성형 AI 저작권 안내서』, 2023.12.27.
- 한국방송통신전파진흥원, 『미디어 이슈 & 트렌드』, 2023.3.
- Precedence research, Generative AI Market Size, Share, and Trends 2024 to 2033, 2024.4.

- 이재훈 (성신여자대학교 법학부 교수)
- 서울대학교 기계항공공학부 학·석사를 졸업하고 서울대학교 로스쿨 2기로 변호사 생활을 시작하였다. 과학기술, 문화예술 및 엔터테인먼트 등 특화된 전문 분야에서 자문 업무를 수행하였고, 지식재산권, 방송통신 관계 법령 등에 학술적, 실무적 관심이 많다. 현재는 성신여자대학교 법학부 교수로 재직 중이다.