Journal of Broadcast Engineering
[ Special Paper ]
JOURNAL OF BROADCAST ENGINEERING - Vol. 31, No. 1, pp.26-40
ISSN: 1226-7953 (Print) 2287-9137 (Online)
Print publication date 31 Jan 2026
Received 03 Dec 2025 Revised 05 Jan 2026 Accepted 05 Jan 2026
DOI: https://doi.org/10.5909/JBE.2026.31.1.26

다중 Gaussian Splats 객체의 패키징 및 개별 DRM 적용을 위한 glTF 컨테이너 포맷 구조

양이삭a) ; 안승혁a) ; 박민수a) ; 류은석a),
a)성균관대학교 실감미디어공학과
glTF Container Format Structure for Packaging and Individual DRM Application in 3D Gaussian Splatting
Isaac Yanga) ; Seung Huk Ahna) ; Minsu Parka) ; Eun-Seok Ryua),
a)Department of Immersive Media Engineering, Sungkyunkwan University

Correspondence to: 류은석(Eun-Seok Ryu) E-mail: esryu@skku.edu Tel: +82-2-760-0677

Copyright © 2026 Korean Institute of Broadcast and Media Engineers. All rights reserved.
“This is an Open-Access article distributed under the terms of the Creative Commons BY-NC-ND (http://creativecommons.org/licenses/by-nc-nd/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited and not altered.”

초록

최근 3D Gaussian Splatting (3DGS)은 실사 수준의 렌더링 품질과 빠른 속도를 바탕으로 6자유도 (6 Degrees of Freedom, 6DoF) 실감 미디어 서비스의 핵심 기술로 부상하고 있다. 현재 3DGS 데이터는 비정형화된 PLY 포맷으로 몰입형 장면을 저장하기 때문에 장면을 구성하는 개별 객체의 독립적인 관리 및 선별적인 저작권 보호를 위한 표준화된 체계가 부족하다는 한계를 갖는다. 이에 최근 국제 표준화 기구에서는 범용 3D 컨테이너 포맷인 GL transmission format (glTF)에 3DGS를 통합하여 호환성을 확보하려는 논의가 진행되고 있다. 본 논문에서는 이러한 표준화 동향에 발맞춰 다중 3DGS 객체를 glTF의 계층적 노드 구조로 패키징하고 각 객체별로 상이한 digital rights management (DRM) 정책을 적용할 수 있는 glTF 포맷 구조를 제안한다. 제안하는 구조는 3DGS의 속성 데이터를 glTF 버퍼 뷰에 매핑하고, 객체 단위로 고유한 키 ID (key ID)를 할당하여 세밀한 접근 제어를 수행한다. 제안 포맷의 효용성을 검증하기 위해 보안성, 시각적 품질, 성능을 포함하는 정량적 평가 프레임워크를 구축하여 실험을 수행하였다. 실험 결과 원본 대비 PSNR 36.22dB의 고화질을 유지하면서도 객체별로 100%의 키 독립성을 확보해 안전하고 효율적인 3D 자산 유통이 가능함을 확인하였다.

Abstract

Recently, 3D Gaussian Splatting (3DGS) has emerged as a key technology for 6 degrees of freedom (6DoF) immersive media services due to its photorealistic rendering quality and real-time performance. However, current 3DGS data is primarily distributed in unstructured PLY formats. While object separation is theoretically possible, the lack of a standardized container structure limits the efficient independent management of individual objects within a scene and poses challenges for selective copyright protection. In response, international standardization organizations are actively discussing the integration of 3DGS into the universal 3D format, GL Transmission Format (glTF), to ensure interoperability. Aligning with these trends, this paper proposes a glTF format structure designed to package multiple 3DGS objects into a hierarchical node structure and apply individual Digital Rights Management (DRM) policies to each object. The proposed structure maps 3DGS attribute data to glTF buffer views and assigns unique key IDs (KIDs) at the object level, enabling granular access control. To validate the efficacy of the proposed format, a quantitative evaluation framework covering security, visual quality, and performance was established. Experimental results demonstrate that the proposed method maintains high visual quality with a PSNR of 36.23 dB compared to the original, while achieving 100% key diversity per object, thereby proving its potential for the secure and efficient distribution of 3D assets.

Keywords:

Gaussian Splatting, glTF, DRM, Container Format, Copyright Protection

Ⅰ. 서 론

최근 가상현실 (Virtual Reality, VR) 및 증강현실 (Augmented Reality, AR)을 아우르는 확장현실 (Extended Reality, XR) 기술이 급격하게 발전함에 따라, 사용자에게 높은 몰입감을 제공하는 6자유도 (6 Degrees of Freedom, 6DoF) 콘텐츠에 대한 요구가 증대되고 있다. 이러한 실감 미디어 서비스의 핵심은 현실 세계를 얼마나 빠르게 가상 공간으로 옮길 수 있느냐에 달려 있다. 2023년 Kerbl 등이 제안한 3D Gaussian Splatting (3DGS)은 기존 메쉬 (mesh) 기반 렌더링의 복잡한 형상 표현의 어려움이나 인공 신경망 방사형 필드 (neural radiance field, NeRF) 방식이 갖는 학습 및 렌더링 속도의 한계를 개선하며, 실사 수준의 고품질 3차원 몰입형 장면 복원 기술로 주목받고 있다[1]. 그러나 3DGS 기술이 연구 단계를 넘어 실제 상용 서비스로 확장되기 위해서는 해결해야 할 기술적 난제가 존재한다. 첫째, 현재 3DGS는 대부분 PLY 형식의 단일 파일로 몰입형 장면을 생성한다. 이로 인해 장면 (scene) 내에 존재하는 개별 객체의 독립적인 식별과 제어의 난이도가 높다. XR 환경 등에서는 배경, 인물, 사물 등 다양한 객체가 복합적으로 구성되지만 기존 방식은 씬 그래프 (scene graph)와 같은 계층적 구조를 기본적으로 지원하지 않아, 객체 단위의 편집과 상호작용을 효율적으로 처리하기 어렵다는 한계가 존재한다. 둘째, 고품질 3차원 콘텐츠 파일 자산에 대한 저작권 보호 체계가 미비하다. 3DGS 데이터는 텍스처와 기하 정보가 결합된 형태로, 무단 복제 시 원본과 동일한 품질의 자산이 유출될 위험이 크다. 특히 다수의 저작권자가 소유한 자산이 혼재된 경우, 파일 전체를 일괄 암호화하는 방식보다 객체별로 접근 권한을 차등 부여할 수 있는 유연한 보안 기술이 필수적이다.

최근 ISO/IEC JTC1/SC29 산하의 국제표준화기구 moving picture experts group (MPEG) WG3 Systems 그룹에서는 이러한 한계를 구조적으로 해결하기 위해 3DGS 데이터를 범용 3D 컨테이너 포맷인 GL transmission format (glTF) 생태계에 통합하려는 표준화 작업을 본격적으로 추진하고 있다[2]. glTF는 장면 구조 (scene graph)를 정의하는 JSON 포맷과 대용량 기하 정보를 담는 바이너리 (binary) 포맷을 분리하여 설계함으로써, 웹 및 모바일 환경에서의 전송 효율성과 파싱 속도를 극대화한 컨테이너 포맷 표준이다[3]. 현재 진행 중인 논의의 핵심은 비정형화된 3DGS 데이터를 glTF의 체계적인 노드 (node) 계층 및 버퍼 뷰 (buffer view) 구조에 매핑하여 상호 운용성을 확보하는 데 있다.

본 논문에서는 이러한 표준화 동향에 발맞춰, 다수의 3DGS PLY 객체들을 glTF 컨테이너 포맷 기반으로 패키징하고, 각 객체별로 서로 다른 상용 digital rights management (DRM)를 적용할 수 있는 통합 구조를 제안한다. 제안 구조는 개별 3DGS 객체를 glTF의 노드 구조에 매핑하여 독립성을 확보하며, 각 객체의 데이터 버퍼에 고유한 키 ID (key ID)를 할당함으로써 객체 단위의 암호화 및 접근 제어를 수행한다. 제안 시스템의 효용성을 검증하기 위해 단순히 암호화 적용 여부만을 확인하는 것을 넘어 보안성, 시각적 품질, 그리고 시스템 성능을 종합적으로 측정할 수 있는 정량적 평가 지표를 설계하고 실험 결과를 제시한다. 이를 통해 3DGS 기반 실감 콘텐츠가 지적 재산권을 보호받으며 안전하게 유통될 수 있는 기술적 토대를 마련하고자 한다.


Ⅱ. 배경 연구

1. 3DGS 기반 몰입형 장면 표현

3DGS는 3차원 공간을 수많은 3D 가우시안 (Gaussian) 타원체의 집합으로 표현하는 기술이다. Kerbl 등이 제안한 이 기법에서 각 가우시안은 3차원 공간 상의 중심 위치 (Position, 평균 μ), 비등방성 형태를 결정하는 3x3 공분산 행렬 (Covariance, ∑), 불투명도 (Opacity, α), 그리고 시점 의존적 색상 표현을 위한 구면 조화 함수 (Spherical Harmonics, SH) 계수를 속성으로 갖는다. 수학적으로 3D 가우시안의 공분산 행렬 ∑sms 최적화 과정에서 양의 준정부호 (positive semi-definite) 성질을 유지하기 위해 회전 행렬 (R)과 스케일 행렬 (S)로 분해되어 ∑=RSSTRT 형태로 표현된다. 렌더링 과정에서는 이러한 3D 가우시안들이 2D 이미지 평면으로 투영되는데, 이때 뷰 변환 행렬 (W)과 투영 변환의 야코비안 (J)을 이용해 2D 공분산 행렬 ∑가 계산된다. 이후 타일 기반 래스터라이저 (tile-based rasterizer)가 가우시안들을 깊이 (depth) 순으로 정렬하고, 각 픽셀에 대해 불투명도를 고려한 알파 블렌딩 (alpha blending)을 수행함으로써 최종 이미지를 생성한다. 이 모든 과정은 미분 가능하게 설계되어 있어, 렌더링된 이미지와 원본 이미지 간의 손실 함수를 통해 가우시안의 파라미터들을 역전파 방식으로 직접 최적화할 수 있다. 그림 1은 이러한 3DGS의 장면 학습 및 렌더링 과정을 나타낸다.

Fig. 1.

Immersive scene training and rendering process of 3DGS

기존의 신경망 방사형 필드 (neural radiance fields, NeRF)가 다중 퍼셉트론 (multi-layer perceptron, MLP) 신경망을 통해 장면을 암시적으로 표현하고, 렌더링 시 광선 투사 (ray-marching)를 수행하여 막대한 연산 비용과 긴 추론 시간을 요구한다[4]. 반면 3DGS는 포인트 클라우드와 유사한 이산적 데이터 구조를 가지므로 GPU 병렬 처리에 최적화되어 있다. 이를 통해 1080p 이상의 고해상도에서도 30fps 이상의 실시간 렌더링이 가능하다. 그러나 현재 3DGS 데이터의 배포에 주로 사용되는 PLY 포맷은 헤더와 정점 데이터로만 구성된 단순한 구조로, 씬 그래프 정보나메타 데이터를 포함하지 않는다. 이는 씬 내의 개별 객체를 논리적으로 구분하거나 계층적 변환을 적용하는 것을 어렵게 만들며, 특히 저작권 보호가 필요한 상용 콘텐츠로서의 활용에 큰 제약이 된다[5].

2. 3D 컨테이너 포맷 glTF 및 GS glTF 표준화

glTF는 Khronos Group에서 제정한 로열티 프리 3D 장면 전송 표준으로, 다양한 3D 엔진 및 어플리케이션 간 상호 운용성을 보장하기 위해 설계되었다[6]. 3D의 JPEG을 표방하는 glTF는 장면의 구조, 노드 계층, 재질 (material), 카메라 등을 정의하는 JSON 형식의 파일 (.gltf)과 실제 기하학적 데이터를 담는 바이너리 파일 (.bin)로 이원화된 구조를 갖는다. 이는 런타임 어플리케이션이 JSON 파싱을 통해 씬 구조를 빠르게 로드하고, 대용량 바이너리 데이터는 GPU 메모리에 직접 전송할 수 있게 하여 로딩 효율성을 극대화한다. 또한, 필요에 따라 텍스처 이미지 등을 포함하여 단일 바이너리 파일 (.glb)로 패키징하는 기능 또한 지원한다. 그림 2는 이러한 glTF 컨테이너 포맷의 패키징 구조를 나타낸다.

Fig. 2.

Packaging structure of glTF container

이러한 glTF의 유연한 확장성과 범용성을 3DGS에 적용하기 위해, 최근 ISO/IEC JTC1/SC29 산하의 MPEG WG3 Systems 그룹에서는 3DGS 데이터를 glTF 생태계에 통합하려는 표준화 작업을 진행하고 있다. 대표적으로 Qualcomm은 3DGS의 핵심 속성인 위치, 회전, 스케일, SH 계수 등을 glTF의 accessor와 buffer view 구조에 매핑하고, 렌더러가 이를 식별할 수 있도록 새로운 glTF 확장자인 EXT_gaussian_splats를 정의하는 기고를 제안하였다. 이 방식은 기존 glTF 파서와의 호환성을 유지하면서 3DGS 데이터를 표준화된 방식으로 저장하고 전송할 수 있는 가능성을 확인하였다.

더 나아가, 3DGS 자산의 저작권 보호를 위한 보안 메타데이터 확장 또한 제안되었다[7]. 이 제안은 glTF 파일 내 저장된 3DGS 바이너리 데이터의 특정 바이트 범위 (byte range)에 대해 암호화 여부와 키 ID (KID) 정보를 명시하는 구조를 포함한다. 이는 기존 미디어 포맷인 protection scheme info box 개념을 glTF의 JSON 스키마에 도입함으로써, 3DGS를 유료 서비스나 XR 플랫폼의 상용 자산으로 활용되기 위해 선행되어야 하는 DRM 연동 인터페이스를 제공한다.

3. 미디어 파일 저작권 보호를 위한 DRM 동향 및 성능 평가

디지털 콘텐츠의 불법 복제 방지 및 수익 모델 보호를 위한 DRM 기술은 넷플릭스, 유튜브 등 2D 영상 및 오디오 스트리밍 시장에서 이미 성숙 단계에 진입해 있다[8]. 특히 ISO/IEC 23001-7로 표준화된 common encryption (CENC)[9]는 ISO 기본 미디어 파일 포맷 (ISO-based media file format, ISOBMFF) 내에서 암호화된 트랙과 평문 트랙의 혼용을 지원하며, 특정 DRM 벤더 (vendor)에 종속되지 않는 범용적인 암호화 규격을 정의한다. CENC는 AES-128 CTR (counter) 또는 cipher block chaining (CBC) 모드를 사용하여 콘텐츠 데이터를 암호화하며, 라이선스 서버로부터 획득한 콘텐츠 키를 통해 클라이언트 측에서 복호화를 수행한다. 그림 3은 CENC의 암호화의 예시를 나타낸다.

Fig. 3.

CENC encryption syntax (a) Item encryption box of CENC (b) Example of DRM encryption using MPEG-DASH MPD with CENC

이러한 CENC의 메커니즘은 트랙 (track) 혹은 샘플 (sample) 단위의 부분 암호화를 지원하므로, 이를 3DGS glTF 구조에 적용할 경우 객체 단위의 세밀한 접근 제어가 기술적으로 가능하다. 예를 들어, 하나의 glTF 씬 파일 내에서 누구나 볼 수 있는 공용 배경 객체는 평문 (Plaintext)으로 저장하여 로딩 속도를 높이고, 구매가 필요한 프리미엄 캐릭터 객체 데이터는 암호문 (Ciphertext)으로 저장하여 라이선스가 있는 사용자만 렌더링하게 할 수 있다. 그러나 3DGS와 같은 실시간 렌더링 환경에서의 DRM 적용은 순차적으로 디코딩되는 2D 비디오와는 다른 차원의 성능 평가 및 검증을 요구한다[10]. 성능 오버헤드 55측면에서, 암호화 및 복호화 과정이 렌더링 루프의 병목이 되어 frames per second (FPS) 저하를 유발하거나 초기 로딩 시간 (time to first frame, TTFF)을 과도하게 증가시키지 않아야 한다. 메모리 보호 측면에서, 복호화된 3DGS 데이터가 GPU 메모리에 적재된 후 메모리 덤프 공격 등에 의해 탈취될 위험성을 평가해야 한다[11]. 마지막으로 품질 측면에서, peak signal-to-noise ratio (PSNR)[12], structural similarity (SSIM)[13], learned perceptual image patch similarity (LPIPS)[14] 등의 지표를 통해 암호화 및 포맷 변환 과정에서 발생할 수 있는 데이터 손실이 렌더링 화질에 미치는 영향을 정량적으로 분석해야 한다. 따라서 본 논문에서는 이러한 보안성과 효율성, 품질 요소를 종합적으로 고려한 정량적 평가 프레임워크를 활용하여 3DGS glTF DRM 시스템의 실효성을 입증한다.


Ⅲ. 다중 Gaussian Splats 객체의 패키징 및 개별 DRM 적용을 위한 glTF 컨테이너 포맷 구조

본 장에서는 비정형화된 Gaussian Splats (GS) 데이터를 표준화된 구조로 통합 관리하고, 객체별로 독립적인 보안 정책을 적용하기 위한 새로운 glTF 컨테이너 포맷 구조를 제안하며, 그림 4는 본 논문에서 제안하는 다중 GS 객체 패키징 및 개별 DRM 적용을 위한 glTF 컨테이너 포맷 구조를 나타낸다. 제안 구조는 물리적으로 분산된 다수의 GS PLY 데이터를 glTF 씬 그래프로 통합하는 패키징 계층, 데이터 버퍼 레벨에서 선택적 암호화를 수행하는 DRM 계층, 그리고 시스템의 효용성을 검증하는 평가 프레임워크 계층으로 구성된다.

Fig. 4.

glTF-based packaging and individual DRM application system for multi-object 3D Gaussian splatting

1. 다중 Gaussian Splats 객체의 GS glTF 패키징

본 절에서는 다중 GS PLY 객체의 GS glTF로의 패키징 및 포맷 구조를 제안한다. 제안 구조에서의 패키징 기법은 기존 방식의 공간적 제약을 해결하기 위해 glTF의 계층적 노드 시스템을 활용하여 각 GS 객체에 독립적인 좌표계와 속성을 부여한다. 이를 위해 객체 캡슐화 (object encapsulation)와 속성 매핑 (attribute mapping) 과정을 수행한다[15].

제안 구조는 다중 GS 객체의 glTF로의 패키징을 위해 첫 단계로 계층적 노드 구조 매핑 및 캡슐화를 수행한다. 제안 구조에서 최상위 루트 노드 (root node)는 전체 몰입형 장면을 정의하며, 개별 GS 객체들은 루트 노드의 자식 노드 (child node)로 정의된다. 각 자식 노드는 고유한 메쉬 인덱스를 참조하며, 해당 메쉬 내부의 프리미티브 (primitive)는 실제 GS 데이터를 가리킨다[16]. 이때 각 노드는 glTF 표준 명세에 따라 행렬, 이동 변환, 회전 변환, 크기 특성을 독립적으로 보유할 수 있다. 이는 렌더링 엔진이 런타임에 전체 장면을 재구성하거나 원본 데이터를 수정하지 않고 특정 객체의 노드 변환 행렬만을 수정함으로써 위치를 이동하거나 크기를 조절하는 등의 동적 제어가 가능함을 의미한다. 다중 객체 패키징 과정에서 원본 PLY 파일들의 헤더를 파싱하여 개별 객체의 경계 상자 (bounding box) 정보를 추출하고, 이를 glTF의 최소, 최대 접근자 (accessor) 속성에 기록함으로써 렌더링 시 시점 절두체 컬링 (view frustum culling) 효율을 극대화하도록 설계하였다.

Fig. 5.

glTF-based packaging format for multi-object 3D Gaussian splatting

이후 제안 구조는 3DGS 속성 데이터의 버퍼 뷰 매핑 과정을 거친다. 3DGS 렌더링에 필수적인 5가지 핵심 속성인 위치, 회전, 스케일, 불투명도, SH 계수는 glTF의 바이너리 버퍼 (.bin) 내에 저장되며, 버퍼 뷰와 접근자를 통해 구조화된다. 이때 데이터의 명세와 시맨틱 (Semantic) 정의는 기존 3DGS glTF 컨테이너 포맷의 EXT_gaussian_splats 확장을 따른다. 제안 포맷은 해당 확장을 활용하여 렌더러가 일반 메쉬와 3DGS 데이터를 구분하고, 전용 쉐이더 파이프라인으로 연결할 수 있도록 한다. 특히, 본 제안 구조는 데이터의 접근 패턴과 후술할 암호화 효율을 고려하여 속성별 버퍼 분리 전략을 채택한다. 즉, 위치, 회전, 크기의 기하 정보와 불투명도, SH 계수의 색상 정보를 서로 다른 버퍼 뷰로 분리하여 저장함으로써 렌더러가 기하 정보만을 우선 로딩하여 충돌 처리에 활용하거나, 저사양 기기에서 고차항의 SH 계수 로딩을 생략하는 등의 최적화를 지원한다. 또한, 이러한 분리 구조는 DRM 적용 시 기하 정보는 평문으로 유지하여 씬의 구조적 가시성은 확보하되, 고품질 텍스처 정보인 SH 계수만 선택적으로 암호화하는 유연한 보안 정책 수립을 가능하게 한다.

2. 다중 Gaussian Splats 객체의 개별 DRM 적용

본 절에서는 논리적인 객체 단위로 구조화한 다중 GS 객체에 대한 개별 DRM 적용 단계에 대하여 서술한다. 제안 구조는 구조화된 버퍼 뷰에 대해 암호화 기술을 적용함으로써 실질적인 데이터 보호와 세밀한 접근 제어를 수행한다. 이는 MPEG CENC 표준의 샘플 기반 암호화 개념을 3D 그래픽스의 버퍼 구조에 이식한 것으로, 본 연구에서는 최근 MPEG 표준화 동향에 따라 제안된 보안 메타데이터 구문을 다중 객체 시나리오로 확장하여 적용한다.

그림 6은 본 절에서 제안하는 다중 GS 객체의 개별 DRM 적용 포맷을 나타낸다. 전통적인 파일 암호화가 컨테이너 전체를 단일 키로 암호화하여 구조적 불투명성을 야기하는 것과 달리, 제안하는 기법은 버퍼 뷰 단위의 부분 암호화를 수행한다. 암호화의 대상은 헤더 및 씬 그래프가 포함된 glTF의 JSON 텍스트 영역을 제외한 실제 3DGS 속성 데이터가 담긴 바이너리 (.bin) 영역으로 한정된다. 구체적으로 유료 에셋과 같이 저작권 보호가 필요한 특정 객체의 버퍼 뷰 데이터 스트림에 대해 AES-128 CTR 모드 또는 CBC 모드 암호화를 수행하는데, 이 방식의 핵심은 구조적 투명성 유지에 있다[17]. 파일의 뼈대를 이루는 JSON 데이터와 무료 배경과 같이 보호가 필요 없는 일반 객체의 버퍼는 평문 상태로 유지되므로, 렌더러는 암호화 키가 없는 상태에서도 씬의 전체 계층 구조를 파싱하고 비암호화 객체들을 정상적으로 렌더링할 수 있다. 반면 암호화된 객체 데이터는 복호화 전까지 의미 없는 노이즈 형태로 존재하거나 렌더링 파이프라인에서 배제됨으로써 자산의 기밀성을 보장한다.

Fig. 6.

glTF-based individual DRM application format for multi-object 3D Gaussian splatting

개별 객체마다 서로 다른 보안 등급과 라이선스 정책을 적용하기 위해, 제안 구조는 객체와 키 간의 유연한 매핑 프로토콜을 정의한다. 이를 위해 암호화된 각 버퍼 뷰에 대응하는 glTF 확장 객체 내에 encryption_info 메타데이터 필드를 추가한다. 해당 필드는 복호화에 필요한 핵심 정보인 키 ID, 초기화 벡터 (initialization vector, IV), 그리고 적용된 암호화 스키마 (scheme) 정보를 포함한다. 렌더러의 파싱 과정에서 encryption_info가 감지되면 추출된 KID는 DRM 클라이언트 모듈 (client DRM module, CDM)로 전달된다. CDM은 라이선스 서버에 해당 KID에 대한 권한을 요청하고 유효한 라이선스 (content key)를 획득할 경우에만 해당 버퍼 뷰를 메모리 상에서 복호화 한다. 이러한 다중 키 식별 구조를 통해, 하나의 glTF 파일 내에서 평문으로 표현된 무료 객체는 무료 사용자에게 공개하고, 라이선스 키를 통해 암호화된 유료 객체는 프리미엄 라이선스 보유자에게만 렌더링을 허용하는 등 장면 내 객체별로 독립적인 저작권 관리가 가능해진다.


Ⅳ. 실험 결과

본 절에서는 제안 시스템의 파이프라인 중 카메라 취득 관련 설정 및 동기적 카메라 취득 모듈에 대하여 설명한다. 실험 데이터셋 생성 및 렌더링 검증을 위해 사용된 가상 카메라는 1920x1080 해상도를 가지며, 렌더링 시점은 원본 데이터셋의 총 10개 시점의 test view 경로를 따랐다. 특히 3DGS 렌더링 품질에 영향을 미치는 뷰 의존적 효과 (view-dependent effects)를 검증하기 위해, 각 카메라는 60도의 수평 시야각 (field of view, FoV)을 기준으로 설정하였다. 다시점 카메라의 배치가 완료된 후 다시점 영상을 취득하기 위해서는 카메라별로 상이한 설정들을 통일할 필요가 있다. 이는 같은 모델의 카메라와 렌즈를 사용하더라도 카메라별로 색상 영역에서 차이가 발생할 수 있으며, 또한 취득 공간에서의 조명 환경이 다를 수 있기 때문이다. 따라서 다시점 영상 취득 이전에 취득 시 시스템을 이루는 카메라들의 취득 관련 설정들을 최대한 균일하게 통일하는 전처리 단계가 선행되어야 한다. 본 논문에서는 카메라 및 렌즈의 영상 취득 관련 설정 및 파라미터들을 카메라 취득파라미터라 칭한다.

1. GS glTF DRM 정량적 평가 프레임워크

본 절에서는 제안 구조의 GS glTF 패키징 및 DRM 암호화 성능의 정량적 평가를 위한 프레임워크를 제안한다. 설계된 포맷과 DRM 시스템이 상용 서비스 수준의 품질과 보안성을 충족하는지 검증하기 위해서는 다각도의 성능 평가가 필수적이지만, 기존의 2D 미디어 콘텐츠 보호를 위한 보안 연구에서 사용되는 대부분의 평가 지표들은 단일 미디어에 국한되거나 렌더링 품질을 고려하지 않았다. 이에 본 연구에서는 기존의 보편적인 화질 및 성능 지표들을 3DGS 환경에 맞게 재해석하고, 보안 강도를 측정할 수 있는 새로운 척도들과 결합하여 이원화된 평가 프레임워크를 구축하였다. 평가는 파일의 구조적 안전성을 진단하는 정적 분석의 Phase 1과 실제 렌더링 환경에서의 보안 및 성능을 측정하는 동적 분석의 Phase 2로 구분된다. 그림 7은 이러한 정적 분석과 동적 분석 단계로 이루어져 있는 GS glTF DRM 정량적 평가 프레임워크를 나타낸다.

Fig. 7.

Subjective metric framework for quality assessment of proposed multi-object GS glTF DRM

Phase 1인 정적 분석 단계에서는 렌더링 이전 단계인 파일 자체의 무결성과 적용된 암호화 정책의 구조적 적합성을 중점적으로 진단한다. 정적 분석 단계는 암호화 밀도 (encryption density, Ed)와 키 다양성 (key diversity, kdiv)을 측정한다. 암호화 밀도는 전체 파일 크기 대비 실제 암호화가 적용된 데이터 영역의 비율을 의미한다. 이는 불필요한 메타데이터의 암호화를 지양하고 핵심 자산만을 효율적으로 보호하고 있는지를 나타내는 척도로, 전체 파일 크기를 Sizetotal, 암호화된 데이터의 크기를 Sizeencrypted라 할 때 암호화 밀도 Ed식 (1)과 같이 정의한다. 식 (1)은 암호화 밀도가 복호화 연산 부하와 비례하고 보안 취약점과 반비례함을 시사한다[18].

Ed=SizeencryptedSizetotal×100(%)(1) 

키 다양성 kdiv는 장면 내 보호 대상 객체의 총 개수 (Nobj) 대비 사용된 고유 콘텐츠 키의 개수 (Nkey) 비율을 나타낸다. 키 다양성 kdiv식 (2)와 같이 정의한다. 키 다양성 정의식에 의해 계산된 kdiv 값이 100%인 1.0에 수렴할수록 모든 객체가 독립적인 키로 관리되어 단일 키 유출이 전체 장면의 보안 붕괴로 이어지지 않는 견고한 시스템임을 의미한다.

Kdiv=NkeyNobj(2) 

Phase 2인 동적 분석 단계에서는 실제 렌더링 환경에서 발생하는 시스템 부하와 시각적 품질 변화를 실시간으로 측정하여 사용자 경험에 미치는 영향을 분석한다. 동적 분석 단계는 메모리 보호 강도 (memory protection level)와 보안 오버헤드 효율성 (security overhead efficiency)을 측정한다. 메모리 보호 강도는 복호화된 3DGS 데이터가 GPU 메모리에 적재된 상태에서 외부 프로세스에 의한 메모리 덤프 (dump) 공격에 노출되는지 여부를 검증한다. 이를 정량화하기 위해 본 논문에서는 Lee 등이 제안한 DRM 소프트웨어 보안성 평가 모델을 준용하였으며, 보호된 메모리 영역 (protected memory region)의 비율과 메모리 덤프 시도 시 차단 성공률을 가중 합산하여 0과 1 사이의 값으로 정의하였다[11]. 이는 보호된 미디어 경로 (protected media path) 내에서 데이터가 얼마나 안전하게 격리되어 처리되는지를 정량적으로 평가하는 지표이다. 보안 오버헤드 효율성은 DRM 적용이 실시간 렌더링 성능에 미치는 영향을 수치화한 것이다. 원본 PLY 렌더링 시의 평균 프레임 레이트를 FPSref, DRM 적용 glTF 렌더링 시의 프레임 레이트를 FPSdrm이라 할 때, 보안 오버헤드 효율성 η식 (3)과 같이 계산된다. 보안 오버헤드 효율성 η가 0에 가까울수록 보안 모듈 구동에 따른 성능 저하가 미미함을 나타낸다.

η=1-FPSdrmFPSref(3) 

이후 동적 분석 단계에서는 시각적 무결성 (visual integrity)을 측정한다. 이는 포맷 변환 및 암호화/복호화 과정에서의 데이터 손실 유무를 판단하기 위해 측정되며, 본 논문에서 수행하는 시각적 무결성은 렌더링된 이미지의 최대 신호 대 잡음비인 PSNR과 구조적 유사도인 SSIM으로, 두 정량적 평가 지표를 종합적으로 측정함으로써 제안 구조가 원본 콘텐츠 고유의 가치를 저해하지 않음을 입증한다.

2. 변조 탐지율 측정 시나리오

암호화 밀도와 키 다양성 산출이 완료되면, 정적 분석 단계에서는 변조 탐지율 (tamper detection rate)을 측정한다. 변조 탐지율은 비인가된 제3자가 바이너리 데이터를 임의로 수정하거나 헤더 정보를 조작했을 때 시스템이 무결성 검증 (integrity check) 메커니즘을 통해 이를 탐지하고 렌더링을 차단하는 성공률을 측정하여 파일의 신뢰성을 입증한다.

본 논문에서는 이를 측정하기 위해 실제 보안 위협을 가정한 두 가지 공격 시나리오를 설계하였다. 첫째는 메타데이터 변조 공격 (metadata tampering)으로, glTF JSON 헤더 내 encryption_info 필드에 명시된 키 ID나 초기화 벡터 값을 임의로 변경하여 라이선스 인증 체계를 교란하거나 우회 접근을 시도하는 방식이다. 둘째는 바이너리 페이로드 변조 공격 (binary payload tampering)으로, 암호화된 바이너리 데이터 스트림의 특정 바이트를 무작위 값으로 덮어쓰거나 비트를 반전하여 데이터의 무결성을 물리적으로 훼손하는 방식이다. 이러한 두 가지 공격 시나리오를 기반으로 실험을 수행하였을 때 측정되는 변조 탐지율은 DRM 클라이언트 모듈의 라이선스 요청 단계 및 복호화 전처리 과정 중 발생하는 체크섬 불일치 및 포맷 오류 식별의 정확도와 비례하며, 이는 비인가된 데이터 수정 시도로부터 원본 콘텐츠의 신뢰성을 보장함을 입증한다[19].

3. 실험 결과

본 절에서는 정량적 평가 프레임워크에 따라 제안 구조의 성능을 검증한다. 실험은 MPEG Gaussian splats coding (GSC) common test conditions (CTC) 표준 데이터셋들을 재조합하여 People in Library라는 다중 GS 객체 데이터셋을 구축하였다[20]. 해당 데이터셋은 대규모 실내 공간을 묘사하는 Library 시퀀스를 배경 (background) 객체로 설정하고, 내부에 Lego_bugatti, Lego_ferrari, Cricket_player, Tennis_player, Tango_duo 시퀀스 등 5종의 서로 다른 특성을 가진 GS PLY 객체들을 캐릭터 (character) 객체로 배치하여 패키징하였다[21]. 그림 8은 제안 구조 성능의 검증을 위해 사용한 데이터셋을 나타낸다.

Fig. 8.

MPEG GSC CTC datasets used for evaluation of proposed structure(a) Library (b) Lego_bugatti (c) Lego_ferrari (d) Cricket_player (e) Tango_duo (f) Tennis_player

실험 시나리오는 XR 콘텐츠 스트리밍 서비스 환경을 가정하여, 배경인 Library 객체는 무료 콘텐츠로 가정해 평문 plaintext로 유지하고, 5개의 캐릭터 객체는 구매가 필요한 유료 자산으로 분류하여 제안 구조를 통해 각각 서로 다른 콘텐츠 키로 암호화하였다. 실험 환경은 MPEG WG3 Systems Scene Description 그룹의 3DGS 표준화 기고에서 제공하는 레퍼런스 소프트웨어인 mpeg-ply2gltf와 mpeg-3d-renderer를 기반으로 구축하였다. Mpeg-ply2gltf 변환기의 소스 코드를 수정하여 다중 PLY 객체의 병합 및 암호화 패키징 기능을 구현하였으며, 렌더링 검증을 위해 mpeg-3d- renderer를 확장하여 런타임 DRM 복호화 및 다중 키 관리 로직을 통합하였다.

제안 구조의 상용 서비스 적합성을 검증하기 위해 실제 산업계에서 사용되는 상용 DRM 솔루션 중 하나인 Microsoft PlayReady와 Google Widevine을 적용하였다. Lego_bugattiLego_ferrari 시퀀스는 Microsoft PlayReady를, 인물 객체인 Cricket_player, Tennis_player, Tango_duo 시퀀스는 Google Widevine을 적용하여 이종 DRM 환경에서의 상호 운용성을 검증하였다. 표 1은 제안 구조에 대한 정적 및 동적 분석의 종합 평가 결과를 나타낸다[22][23].

Quantitative evaluation results of proposed structure

그림 9는 제안 구조의 보안 성능을 검증하기 위해 수행한 정적 및 동적 분석 세부 지표별 측정 결과를 나타낸다. 정적 분석 단계에서 키 다양성 지표 Kdiv는 100%로 측정되었다. 이는 PlayReady가 적용된 차량 객체들과 Widevine이 적용된 인물 객체들이 완벽하게 독립적인 라이선스 세션으로 분리되어 관리됨을 의미한다. 암호화 밀도 Ed는 29.00%로 기록되었다. 이는 대용량 배경 데이터는 평문으로 유지하면서 핵심 캐릭터 자산의 기하 및 SH 정보만을 선별적으로 암호화하여 효율성을 확보하였음을 시사한다. 또한 메타데이터 변조 및 바이너리 비트 반전 공격 시나리오에서 시스템은 이를 전수 탐지하고 렌더링을 차단하여 변조 탐지율 100%를 탐지하였다.

Fig. 9.

Evaluation results of security metrics

동적 분석 단계에서 보안 오버헤드 효율성 η가 0.1418로 측정되었다. 이는 이종 DRM 동시 구동 및 실시간 복호화로 인해 원본 대비 약 14.18%의 프레임 레이트 저하가 발생하였음을 나타내며, 이러한 프레임 레이트 저하는 실시간성을 유지하는 범위 내에서의 비용으로 판단된다. 메모리 보호 강도는 70%로 측정되어 렌더링 파이프라인 내 중요 데이터 경로가 보호되고 있음을 확인하였다.

그림 10은 세부 지표들을 종합하여 산출한 최종 보안 점수를 나타낸다. 정적 분석 단계에서는 82.25점의 점수를 획득하여 파일 구조적 안전성을 입증하였으며, 동적 분석 단계에서는 44.72점을 기록하여 런타임 성능과의 트레이드오프를 확인하였다.

Fig. 10.

Comprehensive security score and phase achievements

이를 가중 합산한 종합 보안 점수 (comprehensive security score)는 70.99점으로, 제안 구조가 상용 서비스에 적용 가능한 수준의 균형을 갖춘 보안성을 보유함을 시사한다.

그림 11은 제안 구조를 활용한 DRM 적용 방식에 따른 렌더링 결과를 비교를 나타낸다. 그림 11의 (a)는 제안 구조의 객체 단위 암호화를 적용한 glTF 파일을 DRM 미지원 렌더러로 렌더링한 결과를, (b)는 이종 DRM 지원 렌더러로 렌더링한 결과를 나타낸다. 제안 구조는 평문으로 저장된 Library 시퀀스 배경 객체는 정상적으로 렌더링되나 보안이 적용된 차량 및 인물 객체는 노이즈로 마스킹되어 식별이 불가능함을 보인다. 이는 장면의 전체적인 맥락은 제공하되 핵심 유료 자산은 효과적으로 보호하는 선별적 제어가 가능함을 입증한다. 이에 비해 이종 DRM을 지원하는 렌더러로 렌더링하였을 때, 정당한 라이선스를 획득한 후 렌더링하였을 때 서로 다른 DRM으로 보호되는 5개의 캐릭터 객체가 각기 다른 콘텐츠 키로 정상 복호화되어 배경과 전경이 복원된 고품질의 3D 장면으로 복원됨을 확인할 수 있다.

Fig. 11.

Comparison of rendering results by DRM application method of proposed structure(a) Heterogeneous DRM application of multiple GS objects using DRM-unsupported renderer (b) Heterogeneous DRM application glTF rendering of multiple GS objects using heterogeneous DRM-enabled renderers


Ⅴ. 결 론

본 논문에서는 실감 미디어 서비스의 핵심 기술인 3DGS의 상용화 및 안전한 유통을 지원하기 위해 다중 객체 패키징 및 개별 DRM 적용이 가능한 glTF 컨테이너 포맷 구조를 제안하였다. 제안 구조는 비정형화된 GS 객체 PLY 데이터를 glTF의 계층적 노드 시스템에 매핑하여 객체 단위의 식별과 제어를 가능하게 하였으며, 버퍼 뷰 기반의 부분 암호화 메커니즘을 통해 단일 파일 내에서 객체별로 상이한 보안 정책을 적용할 수 있도록 설계되었다. 이를 통해 기존 단일 파일 방식이 갖는 관리상의 한계를 극복하고, XR 서비스 플랫폼 환경에서 요구되는 세밀한 접근 제어와 유연한 비즈니스 모델 구현의 기술적 토대를 마련하였다.

제안 구조의 성능 검증을 위해 MPEG CTC 데이터셋을 기반으로 구축한 People in Library 데이터셋을 활용하여 정량적 및 정성적 평가를 수행하였다. 실험 결과, 100%의 키 다양성을 달성하여 PlayReady와 Widevine의 이종 DRM 환경에서도 객체 간 완벽한 권한 분리가 가능함을 입증하였으며, 29%의 효율적인 암호화 밀도로 핵심 자산을 보호하면서도 원본 대비 PSNR 35.26dB의 고화질을 유지함을 확인하였다. 또한 시각적 비교 실험을 통해, 제안 구조 및 시스템이 미인증 사용자에게는 배경과 같은 제한적 정보만을 노출하고 인증된 사용자에게는 고품질 콘텐츠를 제공하는 선별적 서비스 모델에 적합함을 증명하였다.

향후 연구로는 현재의 정적 객체 지원을 넘어, 시계열적인 형태 변화를 포함하는 동적 GS 시퀀스로 제안 구조를 확장할 계획이다. 특히 최근 진행 중인 MPEG GSC 표준화 동향에 발맞춰, 3DGS 속성 데이터를 MPEG GSC 표준 코덱과 연동하여, 압축된 비트스트림을 glTF 컨테이너에 효율적으로 패키징하고 스트리밍하는 기술로 확장하고자 한다. 이를 통해 대용량 동적 볼류메트릭 콘텐츠의 저장 및 전송 효율성을 극대화하고, 실제 네트워크 스트리밍 환경에서의 실시간 복호화 및 렌더링 안정성을 확보할 예정이다.

Acknowledgments

This work was supported by the National Research Foundation of Korea(NRF) grant funded by the Korea government(MSIT) (No. RS-2024-00457605).

This research was also supported by Culture, Sports and Tourism R&D Program through the Korea Creative Content Agency grant funded by the Ministry of Culture, Sports and Tourism in 2023 (Project Name: Development of content streaming copyright core technology on meta-verse platform, Project Number: RS-2023-00223812, Contribution Rate: 50%)

References

  • B. Kerbl, G. Kopanas, T. Leimkühler, G. Drettakis, “3D Gaussian Splatting for Real-Time Radiance Field Rendering”, ACM Transactions on GraPHICS, Vol. 42, No. 4, pp.1-14, 2023. [https://doi.org/10.1145/3592433]
  • I. Bouazizi, T. Stockhammer, “glTF as a Gaussian Splat format”, ISO/IEC JTC1/SC29/WG03 input document m73557, Daejeon, KR, Jul. 2025.
  • J. S. Dhanjan, A. Steed, “Revisiting the Scene-Graph-as-Bus Concept: Inter-networking Heterogeneous Applications Using glTF Fragments”, 2021 IEEE Conference on Virtual Reality and 3D User Interfaces Abstracts and Workshops (VRW), pp.342-346, 2021. [https://doi.org/10.1109/VRW52623.2021.00068]
  • J. -H. Park, J. -B. Jeong, J. Choi, E. -S. Ryu, Comparison of Neural Radiance Fields-based models for 3D Scene Reconstruction. The Korean Institute of Broadcast and Media Engineers (KIBME) Summer Conference, pp. 93-96, 2023.
  • Y. Jang, H. Park, F. Yang, H. Ko, E. Choo, S. Kim, “3D-GSW: 3D Gaussian Splatting for Robust Watermarking”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), pp.5938-5948, 2025. [https://doi.org/10.1109/CVPR52734.2025.00557]
  • F. Robinet. “glTF: Designing an open-standard runtime asset format fabrice robinet, Re mi Arnaud, Tony Parisi, and Patrick Cozzi.” GPU Pro 360 Guide to 3D Engine Design. AK Peters/CRC Press, 243-260, 2018. [https://doi.org/10.1201/9781351172486-20]
  • I. Yang, S. H. Ahn, E. -S. Ryu (SKKU), W. -C. Park (KETI), Sungheun Oh (DigiCAP), “DRM Encryption in glTF as a Gaussian Splats Format for Copyright Protection of 3D Volumetric Object”, MPEG2025/ m73948, 152nd MPEG meeting of ISO/IEC JTC1/SC29/WG3, Oct. 2025.
  • J. E. Cohen, “DRM and Privacy.” Communications of the ACM, Vol. 46, No. 4, pp.46-49, 2003. [https://doi.org/10.1145/641205.641230]
  • “Text of ISO/IEC FDIS 23001-7 4th edition Common encryption in ISO base media file format file”, ISO/IEC JTC 1/SC 29/WG 3 n00412, Online, October 2021.
  • M. Matczuk, G. Kozieł, S. Kozieł, “A Fragile Watermarking Scheme for Authenticity Verification of 3D Models in GLB Format”, Applied Sciences, Vol. 15, No. 13, pp.1-21, 2025. [https://doi.org/10.3390/app15137246]
  • H. -Y. Lee, J. -G. Kim, “Quality Evaluation Model for Security of DRM Software”, The Journal of Digital Policy & Management, Vol.11, No.5, pp.1-11, 2013. [https://doi.org/10.14400/JDPM.2013.11.5.001]
  • J. Korhonen, J. You, “Peak signal-to-noise ratio revisited: Is simple beautiful?”, 2012 Fourth International Workshop on Quality of Multimedia Experience, pp.37.38, 2012. [https://doi.org/10.1109/QoMEX.2012.6263880]
  • Z. Wang, A. C. Bovik, H. R. Sheikh, E. P. Simoncelli, “Image Quality Assessment: From Error Visibility to Structural Similarity”, IEEE Transactions on Image Processing, Vol. 13, No. 4, pp.600-612, 2004. [https://doi.org/10.1109/TIP.2003.819861]
  • R. Zhang, P. Isola, A. A. Efros, E. Shechtman, O. Wang, “The Unreasonable Effectiveness of Deep Features as a Perceptual Metric”, 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp.586-595, 2018. [https://doi.org/10.1109/CVPR.2018.00068]
  • A. Schilling, J. Bolling, C. Nagel, “Using glTF for streaming CityGML 3D City Models”, Proceedings of the 21st International Conference on Web3D Technology, pp.109-116, 2016. [https://doi.org/10.1145/2945292.2945312]
  • T. Scully, S. Friston, C. Fan, J. Dobos, A. Steed, “glTF Streaming from 3D Repo to X3DOM”, Proceedings of the 21st International Conference on Web3D Technology, pp.7-14, 2016. [https://doi.org/10.1145/2945292.2945297]
  • W. -C. Park, J. H. Jang, M. S. Choi, J. S. Lee, “Development of copyright protection technology in metaverse streaming contents”, The Korean Institute of Broadcast and Media Engineers (KIBME) Summer Conference, Jun. 22, 2025.
  • E. H. Wu, S. Chuang, C. -Y. Shih, H. -C. Hsueh, S. -S. Huanh, H. -P. Huang, “A flexible and lightweight user-demand DRM system for multimedia contents over multiple portable device platforms”, Journal of Software: Practice and Experience, Vol. 47, pp.1417-1441, 2017. [https://doi.org/10.1002/spe.2479]
  • J. Engelbrecht, G. P. Hancke, M. O. Osifeko, “Design and Implementation of an Ilectrical Tamper Detection System”, IECON 2019 - 45th Annual Conference of the IEEE Industrial Electronics Society, pp.2952-2957, 2019. [https://doi.org/10.1109/IECON.2019.8927476]
  • Reagan Koo, Yeong-Gyu Kim, Isaac Yang, Seung Huk Ahn, Eun-Seok Ryu (SKKU), Hahyun Lee, Gun Bang (ETRI), “[GSC][JEE6.1 related] Proposals of Library sequence“, MPEG2025/m74011, 152nd MPEG meeting of ISO/IEC JTC1/SC29/WG4, Oct. 2025.
  • M. A. Gafoor, G. Bregeon, Y. Hajlaoui, M. Kriri, Z. Lahiani, M. Preda (IMT), “[GSC] JEE6.1 Human- and Object-centric indoor dataset captured for Lightweight GSC”, MPEG2025/m73251, 151st MPEG meeting of ISO/IEC JTC1/SC29/WG7, Jul. 2025.
  • Microsoft PlayReady. from https://learn.microsoft.com/en-us/playready/
  • Google Widevine. from https://developers.google.com/widevine/drm/overview?hl=ko/
양 이 삭

- 2016년 3월 ~ 2023년 8월 : 성균관대학교 컴퓨터공학과 학사

- 2023년 9월 ~ 현재 : 성균관대학교 실감미디어공학과 석박통합과정

- ORCID : https://orcid.org/0009-0007-3176-6972

- 주관심분야 : 멀티미디어 통신 시스템, 실감미디어, 볼류메트릭 비디오, 로보틱스

안 승 혁

- 2018년 3월 ~ 2024년 2월 : 동국대학교 산업시스템공학과 공학사

- 2024년 9월 ~ 현재 : 성균관대학교 실감미디어공학과 석사과정

- ORCID : https://orcid.org/0009-0002-4475-6742

- 주관심분야 : 로보틱스, 실감미디어, 포인트 클라우드 압축, SLAM

박 민 수

- 2017년 3월 ~ 2023년 2월 : 동서울대학교 컴퓨터공학과

- 2018년 3월 ~ 2024년 2월 : 동서울대학교 컴퓨터공학과

- 2024년 3월 ~ 현재 : 성균관대학교 실감미디어공학과 석사과정

- ORCID : https://orcid.org/0009-0003-6981-8046

- 주관심분야 : 실감미디어, 3D 재구성, 포인트 클라우드, 메쉬

류 은 석

- 1999년 8월 : 고려대학교 컴퓨터학과 학사

- 2001년 8월 : 고려대학교 컴퓨터학과 석사

- 2008년 2월 : 고려대학교 컴퓨터학과 박사

- 2008년 3월 ~ 2008년 8월 : 고려대학교 연구교수

- 2008년 9월 ~ 2010년 12월 : 조지아공대 박사후과정

- 2011년 1월 ~ 2014년 2월 : InterDigital Labs Staff Engineer

- 2014년 3월 ~ 2015년 2월 : 삼성전자 수석연구원/파트장

- 2015년 3월 ~ 2019년 8월 : 가천대학교 컴퓨터공학과 조교수

- 2019년 9월 ~ 현재 : (현) 성균관대학교 실감미디어공학과 학과장, 지능형 멀티미디어 연구센터 센터장

- ORCID : https://orcid.org/0000-0003-4894-6105

- 주관심분야 : 멀티미디어 시스템, 비디오 코딩 및 국제 표준, HMD/VR 응용분야

Fig. 1.

Fig. 1.
Immersive scene training and rendering process of 3DGS

Fig. 2.

Fig. 2.
Packaging structure of glTF container

Fig. 3.

Fig. 3.
CENC encryption syntax (a) Item encryption box of CENC (b) Example of DRM encryption using MPEG-DASH MPD with CENC

Fig. 4.

Fig. 4.
glTF-based packaging and individual DRM application system for multi-object 3D Gaussian splatting

Fig. 5.

Fig. 5.
glTF-based packaging format for multi-object 3D Gaussian splatting

Fig. 6.

Fig. 6.
glTF-based individual DRM application format for multi-object 3D Gaussian splatting

Fig. 7.

Fig. 7.
Subjective metric framework for quality assessment of proposed multi-object GS glTF DRM

Fig. 8.

Fig. 8.
MPEG GSC CTC datasets used for evaluation of proposed structure(a) Library (b) Lego_bugatti (c) Lego_ferrari (d) Cricket_player (e) Tango_duo (f) Tennis_player

Fig. 9.

Fig. 9.
Evaluation results of security metrics

Fig. 10.

Fig. 10.
Comprehensive security score and phase achievements

Fig. 11.

Fig. 11.
Comparison of rendering results by DRM application method of proposed structure(a) Heterogeneous DRM application of multiple GS objects using DRM-unsupported renderer (b) Heterogeneous DRM application glTF rendering of multiple GS objects using heterogeneous DRM-enabled renderers

Table 1.

Quantitative evaluation results of proposed structure

Phase Metric Value Note
Phase 1
(static)
Encryption density (Ed) 29.00% 35/42 accessor encrypted
Key diversity (Kdiv) 100% 5 unique keys / 5 objects
License verification rate 100% PlayReady & Widevine verified
Tamper detection rate 100% 2/2 attack vectors detected
Phase 2
(dynamic)
Memory protection level 70.00% Secure memory path usage
Screen capture resistance 50.00% Watermark overlay active
Security overhead efficiency (η) 0.1418 About 14.18% performance cost
Quality &
performance
PSNR 35.26dB High visual fidelity
SSIM 0.8482 Structural similarity preserved
File size (glTF) 765.04MB 4.8% reduction vs. original PLY
Time to first frame (TTFF) 27.56sec Includes multi-DRM init time