Browse Archives | About the Journal | Editorial Board | For Contributors | e-Submission |
ISSN : 1226-7953 (Print) / 2287-9137 (Online)
Sorry.
You are not permitted to access the full text of articles.
If you have any questions about permissions,
please contact the Society.
죄송합니다.
회원님은 논문 이용 권한이 없습니다.
권한 관련 문의는 학회로 부탁 드립니다.
[ Special Paper ] | |
JOURNAL OF BROADCAST ENGINEERING - Vol. 28, No. 4, pp. 400-409 | |
Abbreviation: JBE | |
ISSN: 1226-7953 (Print) 2287-9137 (Online) | |
Print publication date 31 Jul 2023 | |
Received 05 Jun 2023 Revised 12 Jul 2023 Accepted 12 Jul 2023 | |
DOI: https://doi.org/10.5909/JBE.2023.28.4.400 | |
생성형 인공지능에 의한 콘텐츠 저작과 유통 환경의 변화에 따른 정책 제언 | |
방준성a)
; 조병철b), ‡
| |
a)한국전자통신연구원 | |
b)동아방송예술대학교 | |
Policy Proposals in Response to Changes in the Authoring and Distribution Environment of Contents by Generative Artificial Intelligence | |
Junseong Banga)
; Byung Chul Chob), ‡
| |
a)ETRI | |
b)Dong-Ah Institute of Media and Art | |
Correspondence to : ‡조병철(Cho Byung Chul) E-mail: bccho@dima.ac.kr Tel: +82-031-670-6816 | |
Copyright © 2023 Korean Institute of Broadcast and Media Engineers. All rights reserved. “This is an Open-Access article distributed under the terms of the Creative Commons BY-NC-ND (http://creativecommons.org/licenses/by-nc-nd/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited and not altered.” | |
Funding Information ▼ |
본 논문에서는 생성형 인공지능에 의한 콘텐츠 저작 환경의 변화에 대해 살펴보고 이에 따른 유통 환경의 변화를 예측해 보고자 한다. 생성형 인공지능은 사용자 입력과 유사한 혹은 새로운 출력 결과물을 생성한다. 초거대 인공지능 인프라에 의해 생성형 인공지능도 멀티모달의 복잡 지능을 갖는 형태로 진화하고 있다. 생성형 인공지능 도구를 이용하면 콘텐츠 저작의 생산성이 향상과 유통 환경의 잠재적인 변화를 이끌 수 있으나 콘텐츠 산업 분야의 전반에 사회적인 부작용을 초래할 수도 있다. 따라서, 본 논문에서는 디지털 아우라의 재발견을 바탕으로 콘텐츠 분야 산업발전과 지속가능한 생태계를 위해 전략적 핵심 쟁점을 모색한다.
This paper examines the impact of generative artificial intelligence (AI) on content authoring and its potential to improve productivity in the content industry. Generative AI, capable of generating outputs similar to or distinct from user input, is evolving into a form with multi-modal complex intelligence, thanks to hyper-scale AI infrastructure. While generative AI tools have the potential to improve productivity in content production and bring about changes in the distribution environment, they can also have social side effects within the content industry. In particular, through the exploration of Digital Aura's rediscovery, we explore into key strategic issues concerning the industry's development in the content sector and the establishment of a sustainable ecosystem.
Keywords: Generative AI, Contents Authoring, Distribution, AI Ethics, Digital Aura. |
인공지능(Artificial Intelligence: AI)은 임의의 작업을 자동적 혹은 지능적으로 수행하기 위해 인간의 지각, 학습, 추론 등의 능력을 모방하여 구현한 컴퓨터 시스템 혹은 기술이다. 딥러닝(deep learning) 기술의 발전으로 인공지능은 산업 전 분야의 디지털 전환(Digital transformation)에 기여하고 있다. 인공지능 기술이 기존에는 특정 작업의 절차 자동화나 복합 정보처리 등에 주로 활용되었으나, 최근에 인공지능 기술은 창작의 도구로도 활용되며 앞으로 미디어·콘텐츠 산업 생태계의 변화를 이끌 것으로 예상된다.
생성형 인공지능(Generative AI)은 사전에 학습된 데이터 기반으로 입력과 유사한 혹은 새로운 출력 결과물을 생성하는 기술이다. 출력의 결과물로 텍스트(Text), 이미지(Image), 비디오(Video), 오디오(Audio) 그리고 코드(Code) 등이 있을 수 있다[1]. 생성형 AI는 다음과 같은 기능들을 수행할 수 있다. 풍경 이미지를 다른 스타일의 새로운 풍경 이미지로 생성하거나 인물의 얼굴 이미지를 이용하여 새로운 초상화를 생성하는 것뿐 아니라 텍스트를 바탕으로 그림을 생성(Text-To-Image)할 수 있다. 자연어 생성(Natural Language Generation) 기능을 통해 뉴스 기사, 시, 짧은 글 등의 작성에 이용될 수 있으며 한 언어에서 다른 언어로 텍스트를 번역할 수 있다. 음성합성(Text-To-Speech)을 통해 사람의 목소리, 새로운 음악, 음향 효과 등도 만들어낼 수도 있다. 그랜드-뷰-리서치(Grand View Research)에 따르면 전 세계 생성형 AI의 시장 규모는 2022년 101억 달러(약 13조 1천억 원)에서 연평균 34.7%씩 성장하여 2023년 1,093억 7천만 달러(약 141조 7천억 원)에 이를 것으로 전망하고 있다[2]. 이처럼 인공지능이 이끄는 디지털 기술 혁명은 전 세계의 디지털 경제 성장을 견인해 왔다. 현 과학기술정보통신부도 「2023년 글로벌 과학기술 강국, 디지털 모범국가 실현」에 관한 디지털 혁신 전략을 천명한 바 있다[3].
이러한 정부의 디지털 혁신 전략 발표에도 불구하고 글로벌 콘텐츠 생산 및 유통의 가치사슬 변화와 디지털 핵심기술 패권을 둘러싼 미국과 중국의 치열한 경쟁으로 미래 디지털 기술의 불확실성은 더욱 가중되고 있다[4]. 그랜트 쿠퍼(Grant Cooper)의 주장에 따르면 생성형 AI의 출현으로 개인 프라이버시 및 저작권 침해, 그리고 유해성 콘텐츠 양상 증가와 같은 사회적 부작용이 심화될 가능성도 농후해지고 있다[5].
따라서, 본 논문에서는 생성형 AI에 의한 콘텐츠 저작과 유통 환경의 변화에 대한 정책 제언을 위해 전략적 핵심 쟁점을 모색하고자 한다. II장에서는 생성형 AI에 의한 콘텐츠 저작 환경의 변화에 대해 살펴본다. III장에서는 저작 방식의 변화에 따른 유통 환경의 변화를 예측한다. IV장에서는 발터 벤야민(Walter Benjamin)이 제시한 이론적 논거를 통해 콘텐츠 분야 산업발전과 지속가능한 생태계를 형성하기 위한 핵심 쟁점을 담는다. V장을 끝으로 본 논문을 마무리한다.
디지털 기술의 발전과 인터넷의 보급은 콘텐츠의 생산과 소비 방식을 변화시켜왔다. 미디어 기업들은 디지털 플랫폼을 활용하여 소비자 및 생산자와 상호작용을 하기도 한다. 소셜미디어를 통해 정보를 얻고 의견을 나눌 수 있으며 유튜브(YouTube)나 스트리밍 플랫폼을 통해 영상 콘텐츠 공유도 가능하다. 블로그(Blog), 팟캐스트(Podcast) 등을 통해 각 개인은 창작 콘텐츠를 전 세계 사람들과 공유할 수 있게 되었다. 이는 미디어 환경의 변화를 의미하기도 한다.
미래학자 피터 힌센(Peter Hinssen)은 그의 저서 「뉴 노멀(New Normal)」(2010)에서 뉴 노멀 시대의 고객 전략을 제시한 바 있다[6]. 그는 미디어가 다양해지고 그 조작이 간편해지게 됨에 따라 콘텐츠가 기하급수적으로 증가하여 그 가치가 저하되었다고 보기도 했다. 또한, 그는 소비자가 잠재적 콘텐츠 생산자가 되고 있음도 지적했다. 저서가 출간되었던 시기가 유튜브(YouTube)와 같은 영상 콘텐츠 서비스 플랫폼이 대세 흐름이었음을 상기할 때, 콘텐츠 창작 활동을 지원하는 AI 서비스 플랫폼이 연이어 등장하고 있는 현재는 콘텐츠에 대한 다른 관점에서의 접근이 절실히 필요하다. 이러한 맥락에서 독일의 철학자 발터 벤야민은 무한생산과 복제가 가능한 시대 작품의 유일무이(唯一無二)성의 가치인 아우라(Aura) 상실에 대한 우려를 표한 바 있다[7]. 특히, 디지털 혁명 시대 아우라 이론에 대한 재검토는 콘텐츠 창작의 위기와 새로운 기회가 동시에 공존하고 있음을 시사한다[8].
초거대 인공지능(Hyper-scale AI)은 대용량 연산이 가능한 컴퓨팅 인프라 혹은 대규모 데이터로 학습된 모델을 기반으로 하여 인간의 지각, 학습, 추론 등의 능력을 구현한 컴퓨팅 시스템이다. 기존의 인공지능 대비 파라미터 수나 학습 데이터셋(Data Set)의 크기를 늘려 성능을 높였다. 기존의 인공지능 기술이 특정 작업(Task) 해결에 집중했었다면, 초거대 AI는 범용 인공지능(Artificial General Intelligence: AGI)을 구현하기 위한 기반이 될 수 있다. 기존 인공지능 기술에서는 인간이 작업별로 데이터를 구축하고 학습 규칙을 입력해야 하는 번거로움이 있어서 각 AI 모델이 인간 지능의 일부를 모방할 수는 있었으나 여러 분야에 범용적으로 활용할 수 없는 한계가 있었다. 범용 AI는 복합지능을 갖는 AI를 만들어 인간과 같이 자연어 이해, 영상 분석 등의 작업을 동시에 처리할 수 있도록 한다. 소프트웨어적으로 개별 작업용 AI 모델 개발 대신에 통합된 하나의 초거대 AI 모델 개발 방식을 택하는데, 이는 하나의 초거대 모델 개발을 통해 다양한 모델들을 개별 운영·관리할 때의 어려움을 극복하고 복합적으로 대응이 가능한 AI 모델을 개발하고자 하기 때문이다. 작업별로 분리된 AI 모델들은 데이터, 학습 규칙 등이 각각 달라 개별 특성에 따른 비용 소모가 발생할 수 있다. 그런데, 하드웨어 측면에서 억 단위 혹은 조 단위 급의 파라미터 처리와 대규모 데이터 학습이 필요한 초거대 AI를 운영하기 위해서는 그 연산량에 따른 막대한 컴퓨팅 파워가 필요하다[9]. 표 1에서와 같이 대량의 텍스트 데이터를 학습한 ‘대규모 언어 모델(Large Language Model: LLM)’은 대화의 패턴을 참조하여 문장 내에 다음 단어가 나타날 확률에 따라 단어를 순차적으로 생성하며 문장을 만든다. OpenAI에서는 대규모 언어 모델로 ‘생성형 사전학습 트랜스포머(Generative Pre-trained Transformer: GPT)’를 사용하여 일반적인 주제에 관해서도 대화가 가능한 ‘챗GPT(ChatGPT)’와 같은 대화형 챗봇 서비스를 제공하고 있다. 구글(Google)은 ‘PaLM(Pathways Language Model)’을 사용하여 대화형 챗봇 서비스로 ‘바드(Bard)’를 공개한바 있다[21]. 메타(Meta)는 ‘LLaMA(Large Language Model Meta AI)’라는 대규모 언어 모델을 공개했다. 앤트로픽(Anthropic)은 2023년 7월 11일에 방대한 데이터를 한 번에 입력할 수 있을 뿐 아니라 코딩 및 산술 작업 성능을 개선하여 자사의 대규모 언어 모델을 사용한 ‘클로드-2(Claude-2)’를 공개했다. 국내에서는 네이버(Naver)가 2023년 하반기에 ‘하이퍼클로바X’를 출시할 계획이다.
Company | Model | # of Parameters |
---|---|---|
OpenAI | DALL-E | Number of 12 billion (Jan. 2021) [10] |
GPT-3 | Number of 175 billion (June 2020) [11] | |
ChatGPT | Number of 175 billion (Nov. 2022) [12] | |
PaLM | Number of 540 billion (April 2022) [13] | |
SwitchTransformer | Number of 1.6 trillion (Feb. 2020) [14] | |
DeepMind | Gopher | Number of 280 billion (Dec. 2021) [15] |
Meta | OPT-175B | Number of 175 billion (May 2022) [16] |
Huawei | PanGu-Alpha | Number of 207 billion (May 2021) [17] |
LG | EXAONE | Number of 300 billion (Dec. 2021) [18] |
Naver | HyperCLOVA | Number of 204 billion (May 2021) [19] |
Kakaobrain | KoGPT | Number of 30 billion (Nov. 2021) [20] |
초거대 AI 인프라가 구축되고 컴퓨팅 파워가 증가되면서 AI는 멀티모달의 복잡 지능을 갖는 방향으로 진화하고 있다. 자연어 기반의 사전학습 방식을 넘어 텍스트와 이미지 쌍의 데이터를 적용한 ‘멀티모달 사전학습 모델(Multimodal Pre-trained Model)’ 연구가 시작되었다. 구글은 텍스트와 이미지를 동시에 이용하는 검색 기능 ‘멀티 서치’에 ‘MUM(Multitask Unified Model)’ 기술을 적용하였다. 최근에는 ‘WebGPT’(OpenAI, `21.12), ‘RETRO’ (DeepMind, `21.12), ‘REALM’(Google, `20.8) 등과 같이 외부 지식에 대한 접근을 통해 기존에 학습된 지식의 한계를 보완하는 초거대 AI 모델들에 관한 연구도 진행되고 있다.
콘텐츠는 기획, 제작 그리고 유통의 단계를 거치며 소비자들에게 도달하여 소비된다. 기획과 제작 단계의 일부분에서 콘텐츠 저작자의 역할이 중요시되고 있다. 생성형 AI는 저작자의 입력과 유사한 혹은 새로운 출력 결과물을 짧은 시간 동안 적은 노동력으로 만들어낼 수 있게 한다. 초거대 AI에 관한 연구가 멀티모달로 확장되고 생성형 AI 기술이 발전하면서 인간의 창작 활동을 지원하는 AI 플랫폼들이 등장하기 시작한 것이다. 텍스트, 이미지 등을 생성하는 것이 가능한 생성형 AI는 개방형 플랫폼(Open Platform)을 통해 카피라이팅, 코드, 광고 그리고 디자인 등의 분야에서 인간의 창의적인 활동을 지원하기도 한다[22].
챗GPT는 생성형 사전학습 트랜스포머(GPT) 기반의 대규모 언어 모델을 이용하는 대화형 AI 서비스이다[23]. 대화하는 방식으로 정보를 획득하고 텍스트를 요약이나 번역할 수 있으며 간단한 프로그래밍도 가능하다. 2022년 11월 GPT-3.5 기반의 챗GPT가 공개되었으며 2023년 3월에 성능 개선이 이루어졌다.
챗GPT가 제공하는 정보를 모두 신뢰하기 어렵지만, 도서의 목차 구성 같은 것은 참조할만하다. 사례로, 챗GPT와 이미지 생성 모델인 미드저니(MidJourney)를 활용한 서적이 출간된 바 있다[24]. 이렇게 생성된 글의 저작권에 대해서는 어느 정도 범위로 어떻게 인정해줄지에 대한 논쟁이 심화될 수 있다. ‘DALL-E’는 Open AI에서 개발한 ‘그림 인공지능’ 변환 서비스이다. DALL-E 1에서는 벡터-양자화된 오토인코더(VQ-VAE)를 코드북 방식으로 활용하였다. DALL-E 2에서는 디퓨전(Diffusion) 모델을 디코더로 사용하여 이전보다 사실적인 묘사가 가능해졌다. 구글의 Imagen 연구 과정에서 해상도 높은 이미지를 생성하는 방법이 개발되었고, 메타 AI(Meta AI)의 Make-A-Scene 연구를 통해 스케치를 통한 이미지 생성 방법도 개발되었다. 이후에, 미드저니(MidJourney), 스테이블 디퓨전(Stable Diffusion) 등과 같은 이미지 생성형 AI 도구들도 등장하였다. 최근 이미지 생성을 넘어 비디오 생성에 관한 연구 결과가 나오고 있다. 메타 AI는 Make-A-Scene의 후속 연구로 Make-A-Video를 통해 16개의 64×64 크기의 프레임을 생성한 후 초고해상화 기술을 통해 768×768 크기의 5초짜리 동영상을 생성하였다. 구글에서는 Imagen Video 및 Phenaki 연구를 통해 16개의 24×48 크기의 프레임을 생성하고 7단계의 업스케일링(Upscaling)을 통해 초당 24 프레임의 1024×768 크기의 영상을 생성하거나 최대 2분 분량의 비디오를 생성하기도 하였다.
이처럼 초거대 AI와 생성형 AI 기술의 발전으로 이미지 및 동영상 생성형 AI 서비스의 등장은 미디어의 저작 환경을 더 빠르게 변화시키고 있다. 인간 사용자의 질의에 의해 글, 이미지 그리고 동영상 등이 AI에 의해 자동으로 생성될 때 창작자의 윤리 및 창작 활동에 대한 심도 있는 고찰이 요구되고 있다. 이미지 생성형 도구를 활용하여 예술 작품처럼 보이는 이미지를 쉽게 생성할 수는 있으나, 이렇게 생성된 이미지들을 법적으로 인정해야 할 것인지에 대한 논의가 진행 중에 있다. 가령, 일부 학자들은 자신의 이미지와 스케치를 입력으로 이미지를 생성하는 경우와 작품 재해석의 관점에서 각국의 저작권법에 따라 저작권을 인정해야 한다는 설득력 있는 주장들을 펼치고 있다[25][26]. 따라서, 미국의 경우에 이미지 생성형 AI 도구인 미드저니에 프롬프트(Prompt)를 입력하여 생성한 디지털 작품에 대해 작품의 저작권을 인정하지 않았지만, 창작자 고유의 이미지 입력과 미드저니를 통해 이미지를 생성했을 때 저작권 승인 및 침해 여부에 대한 심도 있는 검토가 이루어질 필요가 있다.
기존 상업용 영화(Film)와 넷플릭스(Netflix)의 대규모 콘텐츠는 인프라와 인력에 대한 소요 비용 때문에 대규모 자본력을 바탕으로 영화 배급사(Film Distributor) 혹은 OTT 플랫폼(Over The Top Platform) 주도로 제작되었다. 개인 혹은 소규모 그룹의 크리에이터들은 유튜브와 같은 숏폼 콘텐츠(Short-form Contents)들 위주로 제작해 왔다.
그림 1은 생성형 인공지능 도구를 활용한 콘텐츠 크리에이터 역할의 변화를 나타낸 것이다. 콘텐츠 제작 및 유통 시장은 기존에 플랫폼 사업자(Platform Operator), 콘텐츠 기획자(Planner), 제작자(Producer), 콘텐츠 크리에이터(Creator) 그리고 작업자(Maker)로 구성된다. 플랫폼 사업자가 자본과 인프라를 투입하면, 콘텐츠 기획자와 제작자는 새로운 콘텐츠를 기획하고 이를 제작하기 위한 운영 전반을 계획한다. 콘텐츠 크리에이터는 새로운 저작을 시도하거나 콘텐츠 작업자는 기획 의도에 따라 개별 작업을 진행한다. 다음으로, 생성형 AI 도구들이 등장하고 이를 활용하는 것이 가능한 콘텐츠 크리에이터와 작업자들은 그들의 아이디어를 직접 구현할 수 있게 되고, 이들은 크리에이터 겸 콘텐츠 기획자와 제작자의 역할을 할 수 있게 된다. 즉, 기존의 플랫폼들이 개방형 플랫폼으로 확장되거나 혹은 변형되면 콘텐츠 크리에이터들은 퍼블리셔로서의 역할도 가능하다는 것이다.
생성형 AI 도구들은 개별 크리에이터들의 콘텐츠 제작의 효율성을 지원하고 유통 환경에 직접적인 영향을 줄 수 있다. 즉, 콘텐츠 제작 단계에서 생성형 AI에 의한 이미지와 비디오 생성, 대본 생성 등을 통해 다음과 같이 창작의 효율성을 높이고 제작 비용의 절감이 가능하다.
첫째, 개인 혹은 소규모 그룹의 크리에이터들이 새로운 콘텐츠 퍼블리셔(Publisher)의 등장과 함께 제작 및 유통 환경에서 전반적인 영향력을 갖게 될 것이다. 즉, 기존 OTT, 영화 등의 시장에서 기존에는 자본력과 인프라를 가진 대형 배급사나 프로덕션 회사들 위주로 콘텐츠가 제작되었다면 앞으로는 기획력과 아이디어를 가진 크리에이터들이 본격적으로 시장에 개입하고 참여할 수 있는 기회가 더 많아질 것이다. 둘째, 생성형 인공지능 도구들을 활용하는 것이 가능한 콘텐츠 크리에이터들이 증가하고 개방형 플랫폼이 등장하게 된다면 자본력과 인프라에 의해 제한받고 있던 콘텐츠 기획과 아이디어의 실현이 용이해질 것이다. 셋째, 물리적인 공간과 시간의 제약으로 상상 만으로만 머물러 있던 장면들의 제작이 기존 실시간 게임 엔진(Game Engine)과 함께 시너지를 일으키며 다양한 콘텐츠로 구현이 가능할 것이다. 가령, 기존 유니티(Unity), 언리얼 엔진(Unreal Engine) 등의 게임 엔진과 같은 실시간 컴퓨터 그래픽 합성 기술에 의해 제작된 영화나 가상현실(Virtual Reality) 공간이 그러한 가능성을 증명하고 있다[27].
그림 2에서 보는 것처럼 디지털 미디어를 활용하는 콘텐츠 제작에 있어서 생성형 AI 도구들의 활용은 필수가 될 것이다. 크리에이터들은 AI 저작도구들을 이용하여 콘텐츠 제작 범위와 규모를 확대시킬 수 있게 될 것이다. 기존 전통 제작 방식인 레거시 미디어(Legacy Media)를 활용하는 콘텐츠 제작에서 단계별 작업으로 세분화하여 생성형 AI 도구를 적절히 활용하는 방안도 콘텐츠의 완성도와 효용성에 기여할 수 있을 것이다. 이를 위해서는 생성형 AI 도구들을 활용한 결과물들에 대해 콘텐츠 저작권 인정 범위와 보호 방식 등에 대한 법적 근거와 관련 보완 기술이 요구되고 있다.
생성형 AI 기술에 의해 디지털 복제와 무한 생산이 가능하다는 것은 발터 벤야민이 제시한 아우라의 진정한 붕괴를 의미한다. 생성형 인공지능 기술은 윤리적으로 다음과 같은 부정적인 효과를 초래할 수 있다. 첫째, 생성형 AI는 효율성과 생산성을 향상시킨다. 반면, 생성형 AI의 성능이 불안정하거나 창작자가 생성된 콘텐츠를 상세하게 파악할 수 없을 때, 의도하지 않은 혹은 사회에 부정적인 영향을 주는 콘텐츠가 재생산되어 유통되는 문제를 초래할 수 있다. 즉, 방대한 양의 콘텐츠를 빠르고 쉽게 생성할 수 있는 기능을 갖춘 생성형 AI에 의해 가짜 뉴스 및 기타 형태의 잘못된 정보를 생성하여 확산될 경우 사회에 부정적인 영향을 끼칠 가능성이 농후하다. 가령, 스팸 메시지 생성의 자동화가 대표적인 사례가 될 수 있다. 둘째, 2022년 11월에 공개된 챗GPT 활용과정에서 드러난 바와 같이 챗GPT와 같은 AI 도구가 권위로 해석될 수 있는 자신감과 설득력으로 글을 쓴다는 것은 심각한 사회적인 문제를 초래할 수 있다. 개인들이 이를 사실로 받아들이고 웹 공간에 전파할 경우, 거짓 정보가 마치 사실처럼 왜곡되어 확산될 수 있기 때문이다. 가령, 개인이 생성형 인공지능 콘텐츠를 악의적인 목적으로 사용할 경우 사기와 같은 범죄에도 활용될 수 있다. 셋째, 생성형 AI 콘텐츠는 근본적인 특성상 기존 데이터를 기반으로 만들어지기 때문에, 사용된 데이터의 편향성이 반영될 수 있으며, 창작물의 다양성과 참신성에 한계를 드러낼 수 있다. 즉, 생성형 AI는 특정한 의도성을 가진 기능 중심적이며 여전히 도덕적으로 성숙하지 않은 미완성 단계임이 자명하다[28]. 따라서, 개인 창작자는 자신을 향한 내면적 성찰이 절실히 요구되고 있다. 이처럼 생성형 AI 콘텐츠는 최근 다시 회자 되는 아우라의 잠재적 활용 가능성과 부정적인 효과들을 동시에 수반한다. 따라서, 콘텐츠 산업발전의 걸림돌이 될 수 있는 부작용들을 최소화하고 콘텐츠 제작 활성화를 위해 산·학·연 협력 생태계 고도화와 정책 지원이 절실히 필요하다.
4장에서는 발터 벤야민이 제시한 아우라의 가치를 재검토하고 창작자와 소비자의 윤리와 실천을 중심으로 정부의 정책 제언을 위해 다음과 같이 3대 핵심 쟁점을 도출하고자 한다.
홍콩 과학 기술 대학교(Hong Kong University of Science and Technology) 연구자들은 생성형 AI 기술의 확산으로 “환각(Hallucination)’’ 현상을 지적하며 인간의 윤리와 창의성 위협에 대해 경고하고 있다[29]. 최근 엔비디아(Nvidia)는 대규모 언어 모델의 환각을 방지하기 위한 오픈소스 툴킷 ‘니모 가드레일(NeMo Guardrails)’을 공개하였다[30]. 해당 툴킷에서는 ‘환각’의 요인이 되는 요소들이 출력에 포함되지 않도록 답변 과정을 재정의하여 생성하도록 개선되고 있다. 이처럼 발터 벤야민이 제시한 아우라가 콘텐츠 원본의 가치를 훼손하는 부정적인 의미가 아니라 콘텐츠의 질적 가치를 높이기 위한 새로운 도전과 기회로 활용될 필요가 있다. 따라서, 다음과 같은 예비 창작자와 소비자의 권리와 책임이 요구된다.
첫째, 콘텐츠 창작자가 의도적으로 정보의 정확성을 훼손할 수 없도록 ‘책임 있는 인공지능(Responsible AI)’을 실현해야 할 것이다. 창작자의 인문학적 통찰력과 비판적 사고가 그 어느 때 보다 절실히 요구되고 있기 때문이다. 가령, 생성형 AI 모델은 대규모 데이터셋으로 수집할 때 단순하게 인터넷에서 긁어서 활용할 가능성이 높다. 저작권 문제뿐만 아니라 편향 이슈에 대한 고려도 필요하다. 생성형 AI의 출력은 학습된 데이터에 의존적으로 편향될 수 있는데, 이들의 개별적 확인도 쉽지 않기 때문이다. 둘째, 콘텐츠 창작자를 위한 교육 프로그램 가이드라인(Education Program Guideline)이 검토되어야 할 것이다. 생성형 인공지능 시스템이 매우 폭력적이거나 선정적인 이미지를 합성하여 청소년에게 유해한 정보를 제공할 가능성이 크기 때문이다. 이러한 예상 가능한 사회적 부작용을 해결하기 위해 공학 중심의 인공지능 대학원에 머물러 있는 인력양성 지원정책의 변화가 필요하다. 즉, 관련 교육 전문가 의견수렴을 통해 콘텐츠 창작 관련 대학교 학부까지 정책 지원의 확대가 마땅하다.
셋째, 콘텐츠 창작자와 생성형 AI 개발자를 위한 활용 프로그램 가이드라인을 마련해야 할 것이다. 단순히 콘텐츠 생성이 아닌 텍스트 생성, 음성 생성에서 또 다른 윤리적 이슈가 발생할 가능성도 크기 때문이다. 이미 해외 선진국을 중심으로 수준별 교육 프로그램 연구 성과물들이 등장하고 있다[31]. 향후, 생성형 AI 기술에 의해 영상, 음성, 텍스트 그리고 센싱 정보(Sensing Information)와 같은 멀티모달(Multi-modal) 출력을 갖는 미디어 생성시 더 복잡한 문제가 초래될 것이다. 따라서, 단기적, 중장기적 관점에서의 체계적인 교육 프로그램 연구 개발이 요구된다.
웹 3.0(Web 3.0)시대 메타버스와 같은 새로운 지각 방식을 제공하는 스마트 공간들이 구현되고 있다. 생성형 AI의 출현은 콘텐츠 소비자의 관점에서 다음과 같이 새로운 경험을 제공하는 아우라의 가치 변화와 더불어 메타버스와의 성장과 시너지를 예고한다. 첫째, 생성형 AI는 기술적인 특성으로 메타버스 참여자들의 청각에 대한 인식과 경험에 대한 인식으로 감각의 확장을 유도하는 기술로 이해될 수 있다. 이러한 감각의 확장은 시공간적 의미까지 내포하는 아우라의 이중성을 의미한다. 즉, 유일무이한 가치로서의 아우라를 위협했던 탈아우라는 참여자들에게 새로운 감각의 유희를 선사할 수 있기 때문이다[32]. 이처럼 발터 벤야민의 아우라는 인간의 새로운 지각의 변화를 예고하고 있다. 둘째, 생성형 AI와 메타버스와의 시너지는 새로운 디지털 공간에서의 아우라 확산이라는 의미로 재해석될 수 있다. 메타버스는 현실 세계의 단순한 재현으로만 그치는 것이 아니라 그 이전에 경험할 수 없었던 새로운 경험을 참여자들에게 제공할 수 있어야 할 것이다. 이러한 논증은 참여자들의 지각과 감각을 확장시키는 K-POP 콘서트 혹은 몰입형 콘텐츠(Immersive Content)가 주목받는 이유를 반영하고 있다. 셋째, 생성형 AI는 디지털 권력의 분산화를 가능하게 할 수 있다. 1인 버추얼 유튜버의 출현은 메타, 엔비디아가 주도하는 미디어 생태계에서 다양한 경험을 욕망하는 참여자들에게 현실 세계에서 느낄 수 없는 새로운 경험을 제공할 것이다. 이러한 맥락에서 다양한 기술과 능력을 보유한 국내 기업과 개인이 지속 가능한 생태계 모델에서 상호 공존하고 협업하는 창작 활성화 지원정책이 필요하다.
생성형 AI는 콘텐츠의 무한 재생산과 다양성에 기여하지만 콘텐츠 저작권, 개인 프라이버시 침해에 대한 문제점 역시 해결되어야 할 과제이다. 한편, NFT(Non-fungible Token)는 대체 불가능한 토큰으로 블록체인(Blockchain)의 탈중앙화(Decentralized)된 특성을 기반으로 하고 있지만 근본적인 한계도 있다[33]. 즉, NFT는 콘텐츠 가치화를 가능하게 하지만 디지털 콘텐츠 소유권 증명을 위해 기획 및 유통 단계에서 해결해야 할 과제들이 있는 것이다. 이러한 한계를 극복하고자 콘텐츠 원본 가치를 증명할 수 있는 디지털 아우라(Digital Aura)인 NFT는 생성형 AI와 결합하여 창작자의 새로운 역할 부여와 기업의 새로운 수익 창출에 기여할 수 있다. 즉, 생성형 AI에 의해 창작된 콘텐츠는 그 가치를 높이기 위한 기획과 유통 전략이 동시에 요구되기 때문이다. 이러한 가치화에 대한 재검토는 웹 3.0 시대 발터 벤야민의 아우라가 다시 재조명받는 원인과 궤를 같이한다. 따라서, 생성형 AI와 관련하여 NFT 정책 지원을 의한 쟁점은 다음과 같이 구성될 수 있다. 첫째, 콘텐츠 기획 단계에서 NFT로서의 가치화가 기대되는 콘텐츠 대상에 대해 선별적으로 관리할 필요가 있다. 모든 콘텐츠가 지적재산권으로서의 가치가 있는 것은 아니기 때문이다. 둘째, 콘텐츠 유통 단계에서 저작물과 NFT가 동시에 안정적으로 유통되기 위한 추가 기술 개발이 필요하다. 유통 단계에서 메타 데이터(Meta Data)로 구성되는 NFT는 창작자의 원본 콘텐츠와 서로 연결되어 있지 않기 때문이다. 따라서, 원본 콘텐츠에 대한 저작권 침해여부, 인증과 검증 절차 등과 같은 추가적인 단계들에 대한 보완 기술 개발이 요구된다. 셋째, 콘텐츠 창작자의 생성형 AI와 NFT 인식 부족에 대한 개선이다. 이를 개선하기 위해 생성형 AI와 콘텐츠 창작자의 협업을 통해 NFT 성공사례를 확장할 필요가 있다. 생성형 AI 기반의 NFT 성공사례가 충분하지 않기 때문이다. 즉, 생성형 AI는 거대 플랫폼이 주도하는 기존 미디어 생태계에서 개인 창작자의 소유권을 인증하는 NFT와 상호보완적인 관계로서의 발전이 요구되고 있다. 이러한 쟁점은 생성형 AI의 역기능에 의한 사회적인 충격을 최소화하고 많은 콘텐츠 창작자에게 창조적이며 산·학·연 협력 생태계 활성화에 기여하는 새로운 기회와 촉매제가 될 수 있을 것이다.
생성형 AI는 콘텐츠 무한 재생산과 다양성 제공이라는 기술적 특징이 있어서, 버추얼 유튜버 및 AI 기반 창작 전반에 콘텐츠 패러다임의 변화를 예고하고 있다. 생성형 AI 관련 창작 도구들은 콘텐츠 창작자에게 편의와 다양한 창작의 기회를 제공하지만, 프라이버시 침해와 시장 왜곡과 같은 사회적인 부작용을 초래하는 양가성(Ambivalence)이 우려되고 있다. 본 연구에서는 이러한 환경 변화를 반영하여 발터 벤야민이 제시한 이론적 논거를 통해 생성형 AI 기반 콘텐츠 저작 및 유통 활성화를 위해 첫째, 창작자의 권리와 책임, 둘째, 새로운 경험의 공간 그리고 셋째, 디지털 아우라의 재발견과 같은 세 가지 쟁점을 도출하였다.
본 연구에서는 경제적 윤리적 이슈 중심으로 관련 문제 도출과 정책과제에 대해 논의하였으나 생성형 AI의 저작물에 대한 법적 이슈에 관한 세부적인 연구 결과를 반영하지 않은 제한적인 연구라는 한계를 지니고 있다. 이러한 한계를 극복하고자 향후 연구내용에서는 생성형 AI 저작물의 법적 이슈에 대해 재검토할 필요가 있다. 즉, 법적인 분쟁 없는 건전한 콘텐츠 생태계를 위해 법적, 윤리적, 경제적 이슈 등 종합적인 관점에서의 학제 간 연구를 이어갈 필요가 있다.
이 논문은 한국전자통신연구원의 기본사업의 일환으로 수행되었음(23ZV1150).This study was supported by the R&D program of ETRI(23ZV1150).
1. | G. Iglesias, E. Talavera, A. Díaz-Álvarez, "A survey on GANs for computer vision: Recent research, analysis and taxonomy," arXiv:2203.11242v2, March 27, 2023. (accessed on May 30, 2023) |
2. | "Generative AI Market Size To Reach $109.37 Billion By 2030", Grand-View-Research, Generative AI Market Growth & Trends, May 2023. https://www.grandviewresearch.com/press-release/global-generative-ai-market (accessed on May 30, 2023) |
3. | Ministry of Science and ICT, Report of the Ministry of Science and ICT in 2023, https://www.korea.kr/docViewer/skin/doc.html?fn=197137173&rs=/docViewer/result/2022.12/28/197137173 (accessed on May 31, 2023) |
4. | Edited by: Mario Esteban and Miguel Otero-Iglesias along with Una Aleksandra Bērziņa-Čerenkova, Alice Ekman, Lucrezia Poggetti, Björn Jerdén, John Seaman, Tim Summers and Justyna Szczudlik, Europe in the Face of US-China Rivalry, A Report by the European Think-tank Network on China (ETNC), pp19-32, January 2020. |
5. | G. Cooper, "Examining Science Education in ChatGPT: An Exploratory Study of Generative Artificial Intelligence," Journal of Science Education and Technology, Vol. 32, pp.444-452, 2023. (accessed on May 31, 2023) |
6. | Peter Hinssen, The New Normal : Explore the limits of the digital world, Mach media, Gent, Belgium, pp.43, 2010. |
7. | Walter Benjamin, The work of Art in the Age of Mechanical Reproduction, CreateSpace, pp.49-70, 2011. |
8. | W. Liu and F. Tao, "Art Definition and Accelerated Experience: Temporal Dimension of AI Artworks," Philosophies, Vol. 7, No. 127, pp.12, 2022. (accessed on May 31, 2023) |
9. | Paresh Kharya et al., "Using DeepSpeed and Megatron to Train Megatron-Turing NLG 530B, the World’s Largest and Most Powerful Generative Language Model," NVIDIA Developer, Technical Blog, Oct. 11, 2021. https://developer.nvidia.com/blog/using-deepspeed-and-megatron-to-train-megatron-turing-nlg-530b-the-worlds-largest-and-most-powerful-generative-language-model/ (accessed on May 29, 2023) |
10. | DALL·E: Creating images from text, https://openai.com/research/dall-e (accessed on 24 January 2023) |
11. | OpenAI Presents GPT-3, a 175 Billion Parameters Language Mode, https://developer.nvidia.com/blog/openai-presents-gpt-3-a-175-billion-parameters-language-model/ (accessed on 24 January 2023) |
12. | ChatGPT vs. GPT-3 and GPT-4: What's the difference?, https://zapier.com/blog/chatgpt-vs-gpt/ (accessed on 24 January 2023) |
13. | Pathways Language Model (PaLM): Scaling to 540 Billion Parameters for Breakthrough Performance, https://ai.googleblog.com/2022/04/pathways-language-model-palm-scaling-to.html (accessed on 24 January 2023) |
14. | Google’s TRILLION Parameters Transformer Model: Switch Transformer, https://medium.com/analytics-vidhya/googles-trillion-parameters-transformer-model-switch-transformer-6b27d6b60920 (accessed on 24 January 2023) |
15. | Language Modeling at scale: Gopher, ethical considerations, and retrieval, https://www.deepmind.com/blog/language-modelling-at-scale-gopher-ethical-considerations-and-retrieval (accessed on 24 January 2023) |
16. | Meta Open-Sources 175 Billion Parameter AI Language Model OPT, https://www.infoq.com/news/2022/06/meta-opt-175b/ (accessed on 24 January 2023) |
17. | Huawei has created the world’s largest Chinese language model, https://aibusiness.com/nlp/huawei-has-created-the-world-s-largest-chinese-language-model (accessed on 24 January 2023) |
18. | LG's Hyperscale AI ‘EXAONE, https://www.aitimes.kr/news/articleView.html?idxno=23585 (accessed on 24 January 2023) |
19. | Naver's Hyperscale AI 'HyperCLOVA', https://www.navercorp.com/promotion/pressReleasesView/30546 (accessed on 24 January 2023) |
20. | Kakaobrain's Hyperscale AI 'minDALL-E', https://www.kakaocorp.com/page/detail/9638 (accessed on 24 January 2023) |
21. | Google Bard explained: What this AI-powered ChatGPT competitor can do https://www.androidpolice.com/google-bard-explained/ (accessed on 19 July 2023) |
22. | A. Jabbar, X. Li, and B. Omar, "A Survey on Generative Adversarial Networks: Variants, Applications, and Training," arXiv:2006.05132v1, June 9, 2020. (accessed on May 30, 2023) |
23. | Open AI. ChatGPT: Optimizing Language Models for Dialogue. Available online: https://openai.com/blog/chatgpt/ (accessed on 24 January 2023) |
24. | J. Bang, “Artificial Intelligence Technology for Expanding Metaverse Services,” KICS: Information and Communications Magazine, Vol. 39, No. 2, pp. 64-73, Jan. 2022. https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11032345 (accessed July 1, 2022) |
25. | K. Hristov, "Artificial Intelligence and the Copyright Dilemma," IEDA: J. Franklin Pierce for Intellectual Property, Vol. 57, No. 3, pp.431-454, 2017. |
26. | S. Yanisky-Ravid, "Generating Rembrandt: Artificial Intelligence, Copyright, and Accountability in the 3A Era-The Human–Like Authors are already here–A New Model," Michigan State Law Review, pp. 659-726, April 24, 2017. |
27. | G.-Y. Kim and B.-K. Lee, "Comparative Analysis of Three-Dimensional Real-Time Rendering Methods," Journal of The Korea Society of Computer and Information, Vol. 27, No. 1, pp. 23-32, January 2022. |
28. | D.-L. Anderson, Machine Intentionality, the Moral Status of Machines, and the Composition Problem, Part of the Studies in Applied Philosophy, Epistemology and Rational Ethics book series (SAPERE,Vol.5), pp. 331-333, 2012. |
29. | Z. Ji, N. Lee, R. Frieske, T. Yu, D. Su, Y. Xu, E. Ishii, Y. Bang, W. Dai, A. Madotto, and P. Fung, "Survey of Hallucination in Natural Language Generation," ACM Computing Surveys, Vol. 1, No. 1, pp. 3-7, 2022. (accessed on May 31, 2023) |
30. | Nvidia’s New Solution Could Address AI ‘Hallucination’ Issues https://sourceability.com/post/nvidias-new-solution-could-address-ai-hallucination-issues (accessed on July 20, 2023) |
31. | R. Peres, M. Schreier, D. Schweidel, and A. Sorescu, "On ChatGPT and Beyond: How Generative Artificial Intelligence May Affect Research, Teaching, and Practice," Int. Journal of Research in Marketing, Vol. 40, No. 2, pp. 269-275, June 2023. (accessed on April 30, 2023) |
32. | K. Vassilev, The Aura of the Object and the Work of Art: A Critical Analysis of Walter Benjamin’s Theory in the Context of Contemporary Art and Culture, Arts, pp.11, Vol.12, No.59, 2023. |
33. | J. Bellagarda, and A. M. Abu-Mahfouz, "Connect2NFT: A Web-Based, Blockchain Enabled NFT Application with the Aim of Reducing Fraud and Ensuring Authenticated Social, Non-Human Verified Digital Identity," Mathematics, Vol. 10, No. 21, Oct. 23, 2022. (accessed on April 30, 2023) |
- 2013년 : 광주과학기술원(GIST) 정보통신공학과 공학박사
- 2013년 ~ 현재 : 한국전자통신연구원(ETRI) 기술사업화부 책임연구원
- 2016년 ~ 현재 : 과학기술연합대학원대학교(UST) 인공지능학과 부교수
- 2022년 ~ 현재 : 한양대학교 과학기술윤리법정책센터 기술전문위원
- 2022년 ~ 현재 : 메타버스미래포럼 운영위원
- ORCID : https://orcid.org/0000-0003-1446-7755
- 주관심분야 : Contextual Computing, AI Ethics, Voice Bot, Computer Vision, XR
- 2004년 2월 : 광운대학교 전자공학과 공학박사
- 2019년 8월 : 고려대학교 영상문화학과 문학박사
- 2002년 9월 ∼ 현재 : 동아방송예술대학교 콘텐츠학부 교수
- 2019년 1월 ∼ 현재 : 한국방송·미디어공학회 상임이사
- 2022년 1월 ∼ 현재 : 메타버스미래포럼 콘텐츠 분과위원장
- ORCID : https://orcid.org/0000-0002-4552-1534
- 주관심분야 : Realistic Contents, XR, Technology Policy, Philosophy of Technology