Journal of Broadcast Engineering
[ Special Paper ]
JOURNAL OF BROADCAST ENGINEERING - Vol. 31, No. 3, pp.393-406
ISSN: 1226-7953 (Print) 2287-9137 (Online)
Print publication date 31 May 2026
Received 11 Mar 2026 Revised 28 Apr 2026 Accepted 29 Apr 2026
DOI: https://doi.org/10.5909/JBE.2026.31.3.393

Rank Order Filter 기반 G-PCC 화면 내 속성값 예측 자격 요건 확장

원성현a) ; 홍정현a) ; 권도완b) ; 권준c) ; 김규헌c),
a)경희대학교 전자공학과
b)LG전자
c)경희대학교 전자정보융합공학과
Rank Order Filter-based G-PCC Intra Prediction Eligibility Extension
Seonghyun Wona) ; Junghyun Honga) ; Dowan Kwonb) ; Joon Kwonc) ; Kyuheon Kimc),
a)Kyung Hee University
b)LG electronics
c)Kyung Hee University

Correspondence to: 김규헌(Kyuheon Kim) E-mail: kyuheonkim@khu.ac.kr Tel: +82-31-201-2442

Copyright © 2026 Korean Institute of Broadcast and Media Engineers. All rights reserved.
“This is an Open-Access article distributed under the terms of the Creative Commons BY-NC-ND (http://creativecommons.org/licenses/by-nc-nd/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited and not altered.”

초록

포인트 클라우드는 위치와 색상 등의 정보를 가지는 다수의 점을 통해 3차원 공간에서 물체를 표현하는 방식이며, 다수의 점으로 인해 방대한 데이터 크기를 지녀 효율적인 압축 기술을 필요로 한다. 이에, 기하적 분포 특성을 활용하여 포인트 클라우드를 압축하는 EG-PCC(Enhanced Geometry-based Point Cloud Compression)에 대한 연구가 진행되고 있다. 현재 EG-PCC는 RAHT(Region Adaptive Hierarchical Transform)를 속성 정보 부호화 방안 중 하나로 활용하고 있으며, 선행된 부/복호화 속성 정보 기반 화면 내 예측을 통하여 효율적인 공간적 중복성 제거를 달성하였다. 이때 화면 내 예측 과정은 예측자의 품질 보장을 위해 예측자의 수에 따른 적격 평가를 수행 중이며, 부적격한 복셀(Voxel)의 경우 화면 내 예측 기법을 적용하지 않는 방향으로 설계되어 있다. 본 논문에서는 예측자 수로 인하여 화면 내 예측 기법을 적용하지 못하였던 속성 정보들에 대해서도, 효율적인 예측 방안을 통한 압축 성능 향상을 달성하기 위해, 예측자 탐색 범위 확장 및 순위 필터(Rank Order Filter)에 기반한 확장된 화면 내 예측 기법을 제안한다.

Abstract

Point cloud represents 3D objects in a 3D space using a set of points containing information such as position and color. Due to the huge number of points, point cloud has massive data sizes and therefore requires efficient compression techniques. Accordingly, research has been conducted on EG-PCC(Enhanced Geometry-based Point Cloud Compression), which compresses point cloud by exploiting geometric distribution characteristics. Currently, EG-PCC employs RAHT(Region Adaptive Hierarchical Transform) as one of the methods for attribute coding and achieves efficient spatial redundancy reduction through intra prediction based on previously encoded/decoded attribute information. In this process, intra prediction performs an eligibility evaluation based on the number of predictors to ensure the quality of the predictor, and the intra prediction technique is not applied to ineligible voxels. In this paper, to improve compression performance through an efficient prediction strategy even for voxels where intra prediction cannot be applied due to the insufficient number of predictors, we propose an extended intra prediction eligibility method based on an expanded predictor search range and a Rank Order Filter.

Keywords:

Point Cloud Compression, G-PCC, RAHT, Intra Prediction, Eligibility

Ⅰ. 서 론

이미지 및 비디오 데이터와 같은 2차원 데이터의 전통적인 표현 방식에서는 카메라를 통해 수집된 데이터를 2차원 평면에 픽셀 단위로 나타낸다. 한편, LiDAR(Light Detection and Ranging) 및 RGB-D 카메라와 같이 3차원 정보를 획득할 수 있는 장치의 발전과 함께 3차원 정보의 렌더링 및 처리 성능이 향상되면서, 3차원 데이터의 전송 및 저장을 위한 포인트 클라우드 형식의 수요가 증가하고 있다. 특히 좌표와 색상 정보를 포함하는 수많은 점으로 구성되어 3차원 정보를 표현하는 포인트 클라우드는 방대한 데이터 크기를 가짐에 따라, 효율적인 압축 기술을 필요로 한다[1][2][3]. 이에 국제 표준화 기구 ISO/IEC JTC 1/SC 29/WG 7 MPEG(Moving Picture Experts Group)의 3DGH(3D Graphics coding and Haptics coding) 그룹에서는 3차원 공간상의 기하적인 분포 특성을 활용하여 포인트 클라우드를 압축하는 G-PCC(Geometry-based Point Cloud Compression) 표준 제정을 완료하였고, 현재 G-PCC의 고도화된 연장선으로 EG-PCC(Enhanced Geometry-based Point Cloud Compression)의 표준화를 진행하고 있다[4][5][6].

EG-PCC는 포인트 클라우드의 속성 정보를 처리하는 방법 중 하나로 RAHT(Region Adaptive Hierarchical Transform)를 사용하고 있으며, RAHT는 속성 정보를 계층적으로 표현하고 점유된 복셀(Voxel)에 대해서만 연산을 수행하여 높은 연산 효율성을 가지는 변환 방법이다[7]. 또한 동일 프레임 내의 공간적 중복성을 효과적으로 제거하기 위해, RAHT는 화면 내 예측 기법을 활용하고 있으며, 이는 3차원 공간에서 인접한 이웃 복셀들의 속성값을 통해 하위 계층의 속성값을 예측하는 방식으로 수행된다. 다만 화면 내 예측 기법은 예측의 정확도를 보장하기 위해, 예측에 활용되는 인접 이웃 복셀들의 수가 사전 정의된 임곗값보다 적을 경우, 예측을 수행하지 않고 원본 속성값을 그대로 엔트로피 부호화하는 방향으로 설계되어 있다. 이에 따라, 본 논문에서는 인접 이웃 복셀 수의 제한으로 인하여 화면 내 예측 기법을 적용하지 못하였던 복셀들에 대해서도, 효율적인 예측 방안을 통한 압축 성능 향상을 달성하기 위해, 일정 거리 이내의 복셀을 탐색하는 예측자 탐색 범위 확장 및 경곗값에 강인한 순위 필터(Rank Order Filter)에 기반한 확장된 화면 내 예측 기법을 제안한다.


Ⅱ. 배경 기술

본 논문에서 제안하는 확장된 화면 내 예측 기법은 RAHT 내부에서 수행된다. 이에, 본 논문의 제안 기법을 설명하기에 앞서, 본 장에서는 RAHT 및 RAHT 기반 화면 내 예측 기법을 소개하고, 제안 기법에서 활용되는 Rank Order Filter에 대해서도 설명한다.

1. RAHT

RAHT는 하르 웨이블릿(Haar Wavelet) 변환을 기반으로 한 3차원 속성 정보 변환 기법이다. 변환 과정에서는 입력 포인트 클라우드를 2 × 2 × 2의 복셀 단위로 규격화한 뒤, 각 축 방향으로 인접한 두 복셀의 속성 정보를 변환 행렬을 통해 저주파 계수(Direct Current, DC)와 고주파 계수(Alternating Current, AC)로 변환한다. 이러한 변환 과정은 저주파 계수에 대해 재귀적으로 수행되며, 최종적으로 하나의 저주파 계수만 남을 때까지 수행된다. 한편, RAHT의 재귀적 연산 특성으로 인해 각 복셀의 속성 정보는 트리 구조를 형성하게 된다. 이때 2 × 2 × 2의 복셀 단위로 규격화된 공간을 부모 복셀이라 하며, 해당 공간을 구성하는 하위 복셀들을 자식 복셀로 지칭한다. 구체적인 RAHT 변환 과정은 수식 (1)과 같이 정의된다.

DCAC=1wi+wjwiwj-wjwiDCiDCj(1) 

수식 (1)DCi, DCj는 2 × 2 × 2 공간 내에서 동일한 부모 복셀을 공유하며 축 방향으로 인접한 i번째, j번째 자식 복셀의 DC 계수를 의미한다. 또한, wi, wj는 각 자식 복셀에 대응하는 가중치로, 각 자식 복셀의 연산에 사용된 점의 개수를 나타낸다. 수식 (1)에 정의된 RAHT 변환은 각 축 방향에 대해 순차적으로 수행되며, 2 × 2 × 2 공간에 속한 자식 복셀들의 속성 정보를 하나의 DC 계수와 최대 7개의 AC 계수로 변환한다.

2. RAHT 기반 화면 내 예측

화면 내 예측은 RAHT 변환을 통해 계층적으로 표현된 부모 계층과 자식 계층의 저주파 계수 간 중복성을 효과적으로 제거하는 기법이다[8]. 이 과정에서는 동일 프레임 내 2 × 2 × 2 공간에 속한 압축 대상 복셀의 저주파 계수를 부모 계층의 이웃 복셀들의 저주파 계수를 이용하여 예측한다. 이후 압축 대상 복셀의 예측된 저주파 계수와 실제 저주파 계수에 각각 RAHT 변환을 수행하여 고주파 계수를 생성한 후, 두 고주파 계수 간의 차이를 계산하여 잔차를 생성한다. 마지막으로, 생성된 잔차 값은 엔트로피 부호화 과정을 통해 비트스트림으로 전송된다. 이때 저주파 계수의 예측이 정확하게 수행될수록 생성된 잔차는 기존 고주파 계수보다 더 낮은 엔트로피를 가지게 되어, 보다 효율적인 압축 과정이 가능해질 수 있다.

그림 1은 화면 내 예측에 사용되는 이웃 복셀의 종류를 나타낸다. 그림 1에서 현재 압축하고자 하는 압축 대상 복셀(Target Voxel)의 예측 과정에서는 부모 복셀(Parent Voxel)의 저주파 계수와 더불어 압축 대상 복셀과 면 또는 모서리를 공유하는 복셀(Coplane Voxel, Coline Voxel)의 저주파 계수를 가중합하여 압축 대상 복셀의 예측값을 생성한다. 이때, G-PCC의 공통 실험 조건(Common Test Condition, CTC)[9]과 참조 소프트웨어 TMC13v30[10]에서는 이웃 복셀의 가중합 과정에서, 압축 대상 복셀과 공간적으로 가까울수록 더 큰 가중치를 부여하고 있다. 이는 공간적으로 가까운 복셀일수록 공간적 상관성이 더 높다는 가정을 기반으로 한 설계이다. 또한, 예측에 사용되는 이웃 복셀이 압축 대상 복셀보다 먼저 복호화되고 해당 이웃 복셀의 자식 복셀 중 압축 대상 복셀과 면 또는 모서리를 공유하는 자식 복셀이 존재할 경우, 이웃 복셀 대신 해당 자식 복셀을 예측값 생성을 위한 가중합 연산에 사용한다[11]. 이는 하위 계층의 복셀이 부모 복셀보다 공간적으로 더 가까운 위치에 존재하여, 더 높은 공간적 상관성을 가질 가능성이 높다는 가정에 기반한다. 한편, 화면 내 예측 기법은 예측 정확도를 보장하기 위해 예측에 활용되는 인접 이웃 복셀의 수가 사전에 정의된 임곗값보다 적을 경우, 예측을 수행하지 않고 원본 속성값을 그대로 엔트로피 부호화하도록 설계되어 있다.

Fig. 1.

Neighboring voxel types for RAHT intra prediction

3. Rank Order Filter

신호 처리 및 영상 처리 분야에서는 일반적으로 입력 데이터의 노이즈를 제거하기 위해, 특정 영역에서 가중합을 적용하는 가우시안 필터(Gaussian Filter)나 평균값 필터(Average Filter)를 일반적으로 사용한다. 그러나, 이러한 필터들은 저역 통과 특성으로 인해 이미지나 신호의 경계선이 평활화된다는 문제점을 가진다[12]. 한편, Rank Order Filter는 입력 데이터 집합에 대해 순위 매김(Rank)과 정렬(Order)을 적용한 뒤, 특정 순위의 값을 출력으로 사용하는 비선형 필터이다. Rank Order Filter는 저역 통과 특성을 가지면서도 경계 주변에서 평균을 취하는 방식이 아니라, 정렬된 데이터에서 특정 순위의 값을 선택하기 때문에 경계선의 형태를 비교적 잘 유지할 수 있다는 장점을 가지고 있다[13]. 특히, 2차원 이미지에서 소금과 후추 노이즈(Salt-and-Pepper Noise)라고 알려진 임펄스 노이즈(Impulse Noise)에 대해 효과적인 성능을 보이며, 이는 그림 2를 통해 확인할 수 있다[14]. 또한, Rank Order Filter는 정렬 과정 이후 특정 위치의 값만을 출력으로 선택하는 것이 아닌, 여러 위치의 값을 활용하여 출력값을 생성할 수 있다. 예를 들어, 정렬된 값에서 중위값을 기준으로 주변값을 포함하여 평균을 계산하는 방식이 존재하며, 이러한 방식은 가우시안 잡음 제거에 활용될 수 있는 것으로 알려져 있다[15].

Fig. 2.

Salt-and-Pepper noise removal of Rank Order Filter: (A) Ground truth image; (B) Salt-and-Pepper noise applied(10% area); (C) Rank Order Filter applied to noise image (3 × 3 kernel size, median is used)


Ⅲ. 제안 기법

본 장에서는 예측자 수의 제한으로 인해 화면 내 예측 기법을 적용하지 못하였던 속성 정보에 대해서도, 효율적인 예측 방안을 통한 압축 성능 향상을 달성하기 위해, 확장된 복셀 탐색 및 Rank Order Filter 기반 화면 내 예측 기법을 제안한다. 그림 3은 본 논문에서 제안된 기법의 구조도를 나타내며, 크게 확장된 복셀 탐색(Extended Voxel Search) 과정과 Rank Order Filter 기반 화면 내 예측(Rank Order Filter-based Intra Prediction) 과정으로 구성된다. 먼저, 확장된 복셀 탐색 과정은 탐색 거리를 확장하여 더 많은 이웃 복셀의 저주파 계수를 수집하는 과정으로서, 복셀 위치 가상화(Virtualize Target Voxel Position), 복셀 탐색(Search Voxel), DC값 수집(Collect DC Value) 및 반복 수집(Repetitive Collect) 단계로 구성된다. 다음으로, Rank Order Filter 기반 화면 내 예측 과정에서는 수집된 이웃 복셀의 저주파 계수들을 정렬한 후 예측값을 생성한다. 이 과정은 DC값 정렬(Order DC Value)과 중위값 주변 평균(Average around Median) 단계로 구성되며, 확장된 복셀 탐색 과정에서 발생할 수 있는 노이즈의 영향을 완화하고, 경계 영역에서의 예측 성능을 보장하는 데 기여한다. 아래 절에서는 각 단계에 대해 순차적으로 설명한다.

Fig. 3.

Proposed method framework

1. 복셀 위치 가상화 단계

기존 RAHT의 화면 내 예측 기법은 예측값 생성 과정에서 이웃 복셀들의 저주파 계수에 대해 가중합 연산을 수행한다. 이때 가중합 연산의 저역 통과 특성으로 인해 생성된 고주파 계수의 예측값이 원본값보다 작은 방향으로 편향될 가능성이 있다. 이러한 편향은 고주파 계수의 예측 정확도에 크게 의존하는 예측 모듈의 성능을 일정 수준 저하시킬 수 있다. 이를 해결하기 위해 본 논문에서는 압축 대상 복셀의 위치를 가상화하는 복셀 위치 가상화 단계를 제안한다. 그림 4의 (A)는 복셀 위치 가상화 단계의 구조도를 묘사하며, 가상점(Virtual Point)은 부모 복셀(Parent Voxel)의 중심(Center)에서 압축 대상 복셀(Target Voxel)의 중심 방향으로 가상화 거리(Virtualizing Distance)만큼 떨어진 지점에 위치한다. 이러한 가상점은 이후 복셀 탐색 단계에서 이웃 복셀을 수집하기 위한 거리 계산 시 압축 대상 복셀의 중심 위치 대신 사용된다. 복셀 위치 가상화 단계를 통해 가상점을 정의함으로써, 각 압축 대상 복셀에서 수집되는 이웃 복셀의 분포가 다양해지며, 이를 통해 각 압축 대상 복셀에 대해 서로 다른 예측값을 생성하여 고주파 계수의 예측값이 특정 방향으로 편향되는 문제점을 해결할 수 있다.

Fig. 4.

Extended voxel search architecture: (A) Virtualize target voxel position; (B) Search voxel

2. 복셀 탐색 단계

그림 4의 (B)는 복셀 탐색 단계의 구조도를 나타낸다. 이 단계에서는 앞선 복셀 위치 가상화 단계에서 지정된 압축 대상 복셀의 가상점과 이웃 복셀 간의 거리를 계산하여, 사전 정의된 탐색 최대 거리(Search Max Range) 이하에 위치한 이웃 복셀(In-ranged Voxel)만을 수집한다. 반면, 탐색 최대 거리를 초과하는 이웃 복셀(Out-ranged Voxel)은 수집 대상에서 제외된다.

3. DC값 수집 단계

DC값 수집 단계에서는 앞선 복셀 탐색 단계에서 탐색된 이웃 복셀들의 저주파 계수를 집계한다. 이 단계에서는 집계된 저주파 계수들에 대해 이상치를 판별하고 제거하는 절차가 포함된다. 해당 절차는 기존 RAHT의 화면 내 예측 기법에서 사용되는 이상치 제거 방식과 유사하며, 압축 대상 복셀의 부모 복셀의 저주파 계수를 기준으로 탐색된 이웃 복셀의 저주파 계수와의 비율이 사전 정의된 구간에 포함되지 않을 경우, 해당 이웃 복셀을 이상치로 간주하여 예측 과정에서 제외한다. 이는 예측된 고주파 계수가 편향되거나 노이즈의 영향을 받아 예측 성능이 저하되는 문제를 해소하기 위해 설계되었다. 이에 따라, DC값 수집 단계에서는 이상치로 판정되지 않은 이웃 복셀의 저주파 계수들만을 수집하며, 이를 통해 이후 정렬 과정에서 발생하는 높은 연산 복잡도를 간접적으로 완화할 수 있다[16].

4. 반복 수집 단계

반복 수집 단계는 앞선 DC값 수집 단계에서 수집된 저주파 계수에 가중효과를 부여하는 단계이다. 이 단계는 공간적인 거리가 가까울수록 상관성이 높을 것이라는 가정에 기반하여, 가까운 이웃 복셀의 저주파 계수에 더 큰 가중효과를 부여하도록 설계되었다. 이를 위해, 제안된 반복 수집 단계에서는 이웃 복셀의 저주파 계수를 반복적으로 수집하는 방식으로 가중효과를 적용한다. 구체적으로, 압축 대상 복셀과 면 또는 선을 공유하는 이웃 복셀의 경우 본 논문에서 사전 정의한 가중치에 따라 저주파 계수를 수집한다. 반면 이를 제외한 이웃 복셀의 경우에는 아래 수식 (2)를 통해 가중효과를 부여한다.

Wvoxel= Scale Distance Exponent(2) 

수식 (2)에서 Distance는 압축 대상 복셀의 가상점과 이웃 복셀 간의 거리를 의미하며, Exponent는 거리 항에 적용되는 지수이다. 또한, Scale은 이웃 복셀에 대한 가중효과를 수집 횟수의 형태로 부여하기 위한 규모 계수이다. 이후, 계산된 값을 내림 함수(Floor Function)에 적용하여 정수 형태의 가중치 Wvoxel을 유도한다. 결과적으로 이웃 복셀의 수집 횟수는 공간적 거리에 반비례하도록 정의되며, 이를 통해 가까운 이웃 복셀일수록 더 큰 가중효과를 부여할 수 있다.

5. DC값 정렬 단계 & 중위값 주변 평균 단계

앞선 단계들을 통해 수집되고 가중효과가 부여된 저주파 계수들은 DC값 정렬 단계를 통해 크기에 따라 정렬되며, 이후 중위값 주변 평균 단계를 통해 압축 대상 복셀에 대한 예측값을 생성한다. 이때, 중위값 주변 평균 단계의 수행 과정은 그림 5에 나타나 있으며, 두 가지 방식 중 하나로 수행될 수 있다. 먼저 그림 5의 (A)는 DC값 정렬 단계를 통해 정렬된 저주파 계수들 중 중위값을 예측값으로 선택하는 방식이다. 반면 그림 5의 (B)는 정렬된 저주파 계수들에서 중위값의 위치를 찾은 후, 사전 정의된 선택 범위(Selecting Area)에 해당하는 주변값을 포함하여 평균값을 계산하고 예측값으로 활용하는 방식이다. 이러한 방식은 수집된 저주파 계수가 양자화되어 있을 경우, 양자화 단계 사이의 값을 직접적으로 예측하기 어렵다는 점을 고려하여 설계되었다. 이에 따라, 주변값들의 평균 연산을 통해 양자화 단계 사이의 값을 보다 효과적으로 예측할 수 있다.

Fig. 5.

Rank Order Filter-based intra prediction architecture: (A) Average in ordered value not applied; (B) Average in ordered value applied


Ⅳ. 실험 결과

1. 실험 환경

본 논문에서 수행된 모든 실험은 G-PCC 참조 소프트웨어인 TMC13v30을 기반으로 진행되었으며, 테스트 데이터셋으로는 G-PCC CTC 내 Category 1의 Dense 분류에 해당하는 정적 밀집(Static Dense) 포인트 클라우드 콘텐츠와 Category 2에 해당하는 동적 밀집(Dynamic Dense) 포인트 클라우드 시퀀스를 활용하였다[9][17][18]. 이 중 Category 2의 경우 포인트 클라우드 콘텐츠를 부호화 복잡도를 기준으로 Category2-A, Category2-B, Category2-C로 분류하고 있어, 해당 시퀀스 내 모든 포인트 클라우드 콘텐츠들은 본 논문에서 제안하는 방법에 대해 유사한 반응을 보일 것으로 예상된다. 이에 따라, 본 논문에서 수행된 매개 변수 탐색 실험은 모든 포인트 클라우드 콘텐츠가 아닌 Category 2의 카테고리별 특정 콘텐츠를 대상으로 수행하였다. 이후 최적의 매개 변수에 대한 압축 성능 평가는 Category 1의 Dense 분류와 Category 2에 포함된 모든 포인트 클라우드 콘텐츠를 대상으로 검증하였다. 한편, 본 실험은 무손실 기하 압축 및 손실 속성 압축 환경인 C1 환경에서 수행되었다. 또한, 제안 기법의 효용성을 검증하기 위해, 압축 성능 평가 지표로 Bjontegaard Delta Rate(BD-Rate)[19]를 사용하였으며, 앵커(Anchor)는 TMC13v30을 활용하였다[20].

2. 매개 변수 탐색 실험 결과

본 절에서는 상기 Ⅲ장에서 소개된 여러 단계에서 사용되는 매개 변수들을 조절하며 압축 성능을 분석한다. 표 1은 본 절에서 탐색하는 매개 변수들과 그 의미를 설명한다.

Parameter types and descriptions

2.1 탐색 최대 거리

표 2는 탐색 최대 거리 실험에 사용된 매개 변수 값을 나타내며, 그림 6은 이를 기반으로 탐색 최대 거리 변수에 따른 압축 성능 결과를 보여준다. 그림 6의 가로축은 본 실험에 사용된 탐색 최대 거리 변수의 값을 의미하며, 세로축은 압축 성능 지표인 BD-Rate 수치를 나타낸다. 먼저, 그림 6의 (A)에서 확인할 수 있듯이 Y 채널의 경우, 평균적으로탐색 최대 거리가 3일 때 0.02%, 5일 때 0.01%, 7일 때 0.01%, 9일 때 -0.01%의 압축 성능 향상을 보여주며, 탐색 최대 거리가 증가할수록 압축 성능이 향상되었다. 특히, 8ivfbv2 redandblack vox10 콘텐츠에서는 탐색 최대 거리가 9일 때 -0.03%의 압축 성능 향상이 나타났다. 또한 Y 채널은 탐색 최대 거리에 따른 BD-Rate의 변화 폭이 그림 6의 (B), (C)에 해당하는 Cb, Cr 채널에 비해 상대적으로 작게 나타났다. Cb 채널에서는 모든 콘텐츠에서 유사한 변화 양상이 관측되었으며, 탐색 최대 거리가 5와 9일 때 압축 성능 향상이 나타났다. 특히, 탐색 최대 거리가 9일 때 평균적으로 -0.07%의 압축 이득이 확인되었다. Cr 채널에서는 8ivfbv2 loot vox10을 제외한 대부분의 콘텐츠에서 전반적으로 높은 탐색 최대 거리에서 압축 성능 향상이 관측되었다. 대표적으로, dancer player vox11의 탐색 최대 거리가 7일 때 -0.08%로 가장 큰 압축 이득이 나타났다.

Parameter values for the Search Max Range experiment

Fig. 6.

BD-Rate variation according to the Search Max Range: (A) Y Channel; (B) Cb Channel; (C) Cr Channel

앞선 관측 결과를 종합하면, 일반적으로 탐색 최대 거리가 증가할수록 압축 성능 향상이 관측되었으며, 탐색 최대 거리가 9일 때 가장 큰 압축 이득을 확인할 수 있었다. 이는 탐색 최대 거리 증가에 따라 탐색되는 이웃 복셀의 수가 증가하고, 이러한 이웃 복셀들이 보다 정확한 예측값 생성에 기여함으로써 압축 성능 향상이 나타난 것으로 판단된다.

2.2 지수부

앞선 2.1절의 탐색 최대 거리 실험 결과를 기반으로, 지수부 실험은 전반적인 압축 성능 향상이 나타났던 최대 탐색 거리 9인 환경에서 수행하였다. 표 3은 지수부 실험에 사용된 매개 변수 값을 나타내며, 그림 7은 이를 기반으로 지수부 변수에 따른 압축 성능 결과를 보여준다. 먼저, Y 채널의 경우, 평균적으로 지수부가 1일 때 가장 큰 압축 성능 향상이 확인되었다. 또한 전반적으로 지수부 변수에 따른 압축 성능의 변화는 최대 0.05%, 최소 -0.03%로 매우 미세한 수준을 보였다. 한편, Cb 채널과 Cr 채널에서는 유사한 경향이 나타났으며, 지수부가 0.5 또는 1일 때 평균 -0.04%로 가장 큰 압축 이득이 확인되었다. 해당 관측 결과를 통해, 일부 예외적인 경우를 제외하면 거리 지수부의 변화가 압축 성능에 미치는 영향은 매우 적은 것으로 나타났다. 이는 탐색된 이웃 복셀들에 대해 공간적 거리에 반비례하여 부여되는 가중효과의 정도 차이가 예측값 생성 과정에서 큰 영향을 미치지 못해, 압축 성능의 변화가 적은 것으로 예상된다. 또한, 8ivfbv2 loot vox10 콘텐츠에서 지수부가 1.5나 2일 때 관측된 큰 압축 성능 손실은, 압축 대상 복셀에 가까운 이웃 복셀의 가중치가 과도하게 증가하면서, 각 압축 대상 복셀이 유사한 예측값을 생성하게 되었기 때문으로 보인다. 이에 따라 증대된 저역 통과 특성으로 인해 고주파 계수에 대한 예측을 효과적으로 수행하지 못한 것으로 판단된다. 종합적으로, 평균적으로 지수부가 1일 때 가장 우수한 압축 성능 향상이 관측되었으며, 이에 따라 거리 항의 역수를 사용하는 방식이 가장 적합할 것으로 예측된다.

Parameter values for the Exponent experiment

Fig. 7.

BD-Rate variation according to the Exponent: (A) Y Channel; (B) Cb Channel; (C) Cr Channel

2.3 가상화 거리 및 선택 범위

앞선 탐색 최대 거리 및 지수부 실험 결과를 기반으로, 가상화 거리 및 선택 범위 실험은 가장 큰 압축 성능 향상을 보였던, 탐색 최대 거리와 지수부 변수가 각각 9와 1인 환경에서 수행하였다. 표 4는 가상화 거리 및 선택 범위 실험에 사용된 매개 변수 값을 나타내며, 표 5는 이를 기반으로 가상화 거리 및 선택 범위 변수에 따른 압축 성능 결과를 보여준다. 이때, 표 5에 제시된 수치는 압축 성능 지표인 BD-Rate를 의미하며, 배경색이 파란색일수록 압축 성능의 향상을, 빨간색일수록 압축 성능의 저하를 나타낸다.

Parameter values for the Virtualizing Distance and Selecting Area experiment

BD-Rate according to the Virtualizing Distance and Selecting Area

먼저, 동일한 선택 범위 변수에서 가상화 거리가 0.503, 0.753, 1.003일 때의 압축 성능은 서로 동일한 결과를 보였다. 이는, 가상화 거리에 따라 가상점의 위치가 변하더라도 탐색되는 이웃 복셀들이 유사하게 수집되어, 결과적으로 예측값의 차이가 발생하지 않았기 때문으로 추측된다. 반면, 가상화 거리가 1.253, 1.503일 경우에는 탐색된 이웃 복셀의 분포에 유의미한 차이가 발생하여, 압축 성능의 변화가 관측되었다. 다음으로, 표 5에서 알 수 있듯이, 가상화 거리와 선택 범위에 따른 압축 성능 변화의 경향은 전반적으로 매우 불규칙하게 나타났다. 다만, 특정 콘텐츠의 특정 채널 그룹에서는 가상화 거리와 선택 범위와 무관하게 압축 성능 향상 또는 저하가 비교적 일관된 경향을 보였다. 예를 들어, 8ivfbv2 loot vox10 콘텐츠의 Cb 채널에서는 선택 범위가 3, 5, 7, 9와 같이 넓은 경우 압축 이득이 나타나는 빈도가 높았으며, 평균적으로 -0.08%의 압축 성능 향상이 관측되었다. 반면, Cr 채널에서는 대부분의 가상화 거리와 선택 범위 조합에서 압축 성능 저하가 발생하였으며, 평균적으로 0.15%의 손실이 나타났다. 이와 같은 특정 콘텐츠 및 채널 그룹에서의 일관된 경향은 8ivfbv2 redandblack vox10과 dancer player vox11의 Cb 채널에서도 유사하게 관측되었다.

표 5의 실험 결과를 통해, 가상화 거리와 선택 범위에 따른 압축 성능 변화는 전반적으로 유의미한 차이를 보이지 않았다. 다만, 일부 콘텐츠의 Cr 채널에서 일관된 압축 성능 저하가 나타나는 경향을 고려할 때, 이를 방지하기 위해 선택 범위 변수는 1로 설정하고 가상화 거리 변수는 0.503, 0.753, 1.003 중 하나를 선택하는 것이 적절할 것으로 판단된다.

3. 최적 매개 변수 기반 압축 성능 검증

3.1 Category 2 콘텐츠 적용 결과

표 6은 앞선 매개 변수 탐색 실험을 통해 최적화된 설정값을 나타낸다. 이러한 최적 매개 변수를 기반으로 CTC 내 Category 2에 해당하는 모든 포인트 클라우드 콘텐츠에 대해 압축 성능을 평가하였으며, 그 결과는 표 7에 제시되어 있다. 표 8은 Category 2에 해당하는 포인트 클라우드 콘텐츠 중 앞선 매개 변수 탐색 실험에 활용하지 않은 포인트 클라우드 콘텐츠에 대해, 콘텐츠별 최적화된 매개 변수와 이를 통한 압축 성능을 나타낸다.

Optimized configuration for parameter values

Compression performance with optimal parameter configuration in Category 2

Compression performance with optimal parameter configuration for each content in Category 2

표 7에 나타난 압축 성능 변화 폭은 원본 RAHT 대비 매우 작게 나타났다. 이는 본 논문에서 제안한 기법이 기존 예측자 수 제한으로 인해 RAHT 기반 화면 내 예측이 적용되지 않는 일부 복셀에만 제한적으로 적용되었기 때문으로 분석된다. 구체적으로, Category 2에 해당하는 콘텐츠는 점들이 매우 밀집하게 분포하는 특성을 가지고 있어, 기존 예측자 수 적격 평가를 통과하지 못하는 부적격 복셀의 수가 매우 적다. 특히 queen 콘텐츠의 경우, 전체 복셀 중 제안 기법이 적용된 복셀의 비율은 0.82%에 불과하였다.

다음으로 매개 변수 탐색 실험에 사용되지 않은 데이터셋인 8ivfbv2 soldier vox10, queen, basketball player vox11 콘텐츠를 제외하면, 평균적으로 Y 채널 -0.008%, Cb 채널 -0.07%, Cr 채널 -0.02%의 압축 성능 향상이 관측되는 반면 본 실험에서 추가로 검증된 데이터셋의 경우, 압축 성능의 향상 및 저하가 반복적으로 나타났다. 즉, 앞선 매개 변수 탐색 실험을 통해 선정된 최적 매개 변수 조합은 충분한 일반화 성능을 확보하지 못한 것으로 판단된다. 특히 8ivfbv2 soldier vox10 콘텐츠는 다른 콘텐츠에 비해 공간 형상이 상대적으로 복잡하여, 본 논문에서 도출한 최적 매개 변수 조합이 해당 콘텐츠에 효과적으로 적용되지 못한 것으로 예측된다. 더불어, 표 8에서 콘텐츠별 개별 최적화를 통해 도출된 매개 변수 조합은 매개 변수 탐색 실험을 통해 선정된 최적 매개 변수 조합보다 더 우수한 압축 성능을 보였으며, 이는 표 6에서 제시한 최적 매개 변수 조합보다 더 나은 일반화 성능을 갖는 매개 변수 조합이 존재할 가능성을 뒷받침한다.

3.2 Category 1 콘텐츠 적용 결과

표 9표 6의 최적 매개 변수를 기반으로 Category 1의 Dense 분류에 속하는 포인트 클라우드 콘텐츠에 대해 제안 기법을 적용한 결과를 보여준다. 표 9에서 알 수 있듯이, Category 1 Dense 콘텐츠에서는 평균적으로 Y 채널 -0.34%, Cb 채널 -0.17%, Cr 채널 -0.22%의 압축 성능 향상이 관측되었으며, 이는 Category 2에서의 압축 이득 대비 더 큰 폭을 보여주었다. 특히, longdress viewdep vox12 콘텐츠에서는 Y 채널 -0.71%, Cb 채널 -0.56%, Cr 채널 -0.65%의 가장 큰 압축 이득이 나타났다. 이러한 압축 성능 향상의 원인은 두 가지로 분석된다. 첫째로, Category 1의 Dense 콘텐츠는 완전하게 연속적이지 않은 특성이 있어, 기존 예측자 수에 따른 적격 평가를 통과하지 못하는 복셀이 존재할 가능성이 높고 부호화 대상 복셀과 근접한 이웃 복셀의 색상 정보가 비교적 유사한 경향을 가지고 있다. 이에, 제안 기법의 확장된 복셀 탐색 과정이 예측에 적합한 이웃 복셀들을 효과적으로 탐색했던 것으로 판단된다. 둘째로, 정적 포인트 클라우드에서는 화면 간 예측을 수행하지 않아, 화면 간 예측의 간섭이 없어 제안 기법의 효과가 더욱 뚜렷하게 나타난 것으로 분석된다.

Compression performance with optimal parameter configuration in Category 1 Dense contents


Ⅴ. 결 론

본 논문에서는 인접 이웃 복셀 수의 제한으로 인해 화면 내 예측 기법을 적용하지 못하였던 복셀에 대해서도, 효율적인 예측 방안을 통한 압축 성능 향상을 달성하기 위해, 예측자 탐색 범위 확장 및 Rank Order Filter에 기반한 확장된 화면 내 예측 기법을 제안하였다. 제안 기법의 확장된 복셀 탐색 과정은 탐색 거리를 확장하여 더 많은 이웃 복셀의 저주파 계수를 수집하며, Rank Order Filter 기반 화면 내 예측 과정은 수집된 저주파 계수를 정렬하여 예측값을 생성한다. 이를 통해, 확장된 복셀 탐색 과정에서 발생할 수 있는 노이즈의 영향을 완화하고 경계 영역에서의 예측 성능을 보장하는 데 기여할 수 있다. 실험 결과, 최적화된 매개 변수 설정을 적용한 경우, 기존 RAHT 대비 압축 성능이 향상되는 것을 확인할 수 있었다. 결과적으로, 본 논문은 G-PCC RAHT 기반 화면 내 예측 기법에서 적격 평가로 인해 적용되지 않는 복셀에 대한 적용 범위를 확장함으로써, 추가적인 압축 성능 향상이 가능함을 보였다.

다만 본 논문에는 두 가지 한계점이 존재한다. 첫째로 제안 기법은 RAHT의 모든 계층에 동일한 매개 변수를 적용하여 계층별 특성을 충분히 반영하지 못하였다. 둘째로, 본 논문에서 사용된 매개 변수는 일부 포인트 클라우드 콘텐츠를 대상으로 수행된 사전 탐색 실험을 통해 최적화되었다. 이에, 향후 연구에서는 RAHT 부호화기 내에서 여러 매개 변수의 값을 적응적으로 결정하고 이를 계층별로 적용하는 설계를 통해, 제안 기법이 다양한 포인트 클라우드 콘텐츠에서도 일관된 압축 성능 향상을 달성하기 위한 연구가 진행될 예정이다.

Acknowledgments

이 논문의 연구 결과 중 일부는 한국방송·미디어공학회 2025년 동계학술대회에서 발표한 바 있음

본 연구는 과학기술정보통신부 및 정보통신기획평가원의 대학ICT연구센터육성지원사업의 연구 결과로 수행되었음 (IITP-2026-RS-2021-II212046)

References

  • M. Lee, B. Kim, S. Yoon, Y. Hwang, J. Kim, and K. Kim, “Point Cloud Video Codec using 3D DCT based Motion Estimation and Motion Compensation,” Journal of Broadcast Engineering, Vol.26, No.6, pp.680–691, November 2021. [https://doi.org/10.5909/JBE.2021.26.6.680]
  • J. Kwon, D. Kwon, and K. Kim, “A Study on the Performance Analysis of Deep Learning-based Point Cloud Compression using Feature Precision Enhancement,” Journal of Broadcast Engineering, Vol.30, No.6, pp.959–978, November 2025. [https://doi.org/10.5909/JBE.2025.30.6.959]
  • H. Oh, H. Hur, S. Sugimoto, and S. Lasserre, “Use Cases for Point Cloud Compression (PCC)”, ISO/IEC JTC1/SC29 WG2 MPEG m73848, July, 2025.
  • J. Byeon, H. Choe, and D. Sim, “MPEG G-PCC International Standard Technology,” Broadcasting and Media Magazine, Vol.26, No.2, pp.31-45, April 2021.
  • H. Hur, “MPEG Geometry-based Point Cloud Compression (G-PCC) Standardization Technology,” Broadcasting and Media Magazine, Vol.28, No.3, pp.12-22, July 2023.
  • D. Kwon, S. Rhee, and K. Kim, “RAHT Node Interpolation Method for Enabling G-PCC Inter-Frame Attribute Prediction and Improving Compression Performance,” Journal of Broadcast Engineering, Vol.29, No.6, pp.819–831, November 2024. [https://doi.org/10.5909/JBE.2024.29.6.819]
  • R. L. de Queiroz and P. A. Chou, “Compression of 3D Point Clouds Using a Region-Adaptive Hierarchical Transform,” IEEE Transactions on Image Processing, Vol.25, No.8, pp.3947-3956, August 2016. [https://doi.org/10.1109/TIP.2016.2575005]
  • S. Lasserre, and D. Flynn, “On an improvement of RAHT to exploit attribute correlation”, ISO/IEC JTC1/SC29 WG7 3DG m47378, March, 2019.
  • “Common test conditions for Solid G-PCC and E-G-PCC”, ISO/IEC JTC1/SC29 WG7 3DG N01236, July, 2025.
  • “Enhanced G-PCC test model TM13 v30”, ISO/IEC JTC1/SC29 WG7 3DG N01167, May, 2025.
  • W. Wang, Y. Xu, K. Zhang, and L. Zhang, “Sub-Node-based Prediction in Transform Domain for RAHT”, ISO/IEC JTC1/SC29 WG7 3DG m60203, July, 2022.
  • C. Lee, Digital Signal Processing 2nd edition, Hanbit Academy, Seoul, pp.464-465, 2022.
  • G. Heygster, “Rank filters in digital image processing,” Computer Graphics and Image Processing, Vol.19, No.2, pp.148-164, June 1982. [https://doi.org/10.1016/0146-664X(82)90105-8]
  • G. Rafael, Digital Image Processing 3rd edition, (H. Yu, Trans.), Pearson Education, London, pp.203-204, 2009.
  • D. Sim, Digital Image Processing Learning from Theory and Practice, Hanbit Academy, Seoul, pp.154-158, 2017.
  • K. Ali, “A Comparative Study of Well Known Sorting Algorithms,” International Journal of Advanced Research in Computer Science, Vol.8, No.1, pp.277-280, January 2017.
  • E. d’Eon, B. Harrison, T. Myers, and P. A. Chou, “8i Voxelized Full Bodies – A Voxelized Point Cloud Dataset”, ISO/IEC JTC1/SC29 WG11 MPEG m40059, January, 2017.
  • Y. Xu, Y. Lu, and Z. Wen, “Owlii Dynamic Human Textured Mesh Sequence Dataset”, ISO/IEC JTC1/SC29 WG11 MPEG m41658, October, 2017.
  • N. Barman, M. G. Martini, and Y. Reznik, “Bjøntegaard Delta (BD): A Tutorial Overview of the Metric, Evolution, Challenges, and Recommendations,” arXiv, 2024. (accessed Feb. 2, 2026) [https://doi.org/10.48550/arXiv.2401.04039]
  • “Enhanced G-PCC codec description”, ISO/IEC JTC1/SC29 WG7 3DG N01308, November, 2025.
원 성 현

- 2021년 3월 ~ 현재 : 경희대학교 전자공학과 학사과정

- ORCID : https://orcid.org/0009-0001-7263-6222

- 주관심분야 : 포인트 클라우드 압축, 영상 처리, 멀티미디어 시스템

홍 정 현

- 2020년 3월 ~ 현재 : 경희대학교 전자공학과 학사과정

- ORCID : https://orcid.org/0009-0002-1433-7408

- 주관심분야 : 포인트 클라우드 압축, 영상 처리, 멀티미디어 시스템

권 도 완

- 2024년 2월 : 경희대학교 전자공학과 공학사

- 2026년 2월 : 경희대학교 전자정보융합공학과 공학석사

- 2026년 ~ 현재 : LG전자

- ORCID : https://orcid.org/0009-0006-2150-4488

- 주관심분야 : 포인트 클라우드 압축, 영상 처리, 멀티미디어 시스템

권 준

- 2024년 2월 : 경희대학교 우주과학과 이학사, 전자공학과 공학사

- 2026년 2월 : 경희대학교 전자정보융합공학과 공학석사

- 2026년 3월 ~ 현재 : 경희대학교 전자정보융합공학과 석사후 연구원

- ORCID : https://orcid.org/0009-0003-8085-1170

- 주관심분야 : 포인트 클라우드 압축, 영상 처리, 멀티미디어 시스템

김 규 헌

- 1989년 2월 : 한양대학교 전자공학과 공학사

- 1996년 7월 : 영국 University of Newcastle upon Tyne 전기전자공학과 공학박사

- 1996년 ~ 1997년 : 영국 University of Sheffield, Research Fellow

- 1997년 ~ 2006년 : 한국전자통신연구원 대화형미디어연구팀장

- 2006년 ~ 현재 : 경희대학교 전자정보대학 교수

- ORCID : https://orcid.org/0000-0003-1553-936X

- 주관심분야 : 디지털 방송, 영상처리, 멀티미디어 통신, 디지털 대화형 방송

Fig. 1.

Fig. 1.
Neighboring voxel types for RAHT intra prediction

Fig. 2.

Fig. 2.
Salt-and-Pepper noise removal of Rank Order Filter: (A) Ground truth image; (B) Salt-and-Pepper noise applied(10% area); (C) Rank Order Filter applied to noise image (3 × 3 kernel size, median is used)

Fig. 3.

Fig. 3.
Proposed method framework

Fig. 4.

Fig. 4.
Extended voxel search architecture: (A) Virtualize target voxel position; (B) Search voxel

Fig. 5.

Fig. 5.
Rank Order Filter-based intra prediction architecture: (A) Average in ordered value not applied; (B) Average in ordered value applied

Fig. 6.

Fig. 6.
BD-Rate variation according to the Search Max Range: (A) Y Channel; (B) Cb Channel; (C) Cr Channel

Fig. 7.

Fig. 7.
BD-Rate variation according to the Exponent: (A) Y Channel; (B) Cb Channel; (C) Cr Channel

Table 1.

Parameter types and descriptions

Parameter Type Descriptions
Virtualizing Distance Distance between virtual point and center of parent voxel
Search Max Range Maximum distance of search range in Search Voxel stage
Exponent Exponent applied to the distance term in Repetitive Collect stage
Scale Scale factor used to assign the weighting effect to neighboring voxels in Repetitive Collect stage
Parent Weight Weight of coplane and coline voxels in Repetitive Collect stage
Child Weight Weight of replaced coplane and coline voxels in Repetitive Collect stage
Selecting Area The number of neighboring ranks around the median used for average in Average around Median stage

Table 2.

Parameter values for the Search Max Range experiment

Parameter Type Search Max Range Virtualizing Distance Exponent Scale Parent Weight Child Weight Selecting Area
Value 3, 5, 7, 9 0.753 1 9 8 7 1

Table 3.

Parameter values for the Exponent experiment

Parameter Type Search Max
Range
Virtualizing
Distance
Exponent Scale Parent
Weight
Child
Weight
Selecting
Area
Value 9 0.753 0.5, 1, 1.5, 2 9 8 7 1

Table 4.

Parameter values for the Virtualizing Distance and Selecting Area experiment

Parameter Type Search Max Range Virtualizing Distance Exponent Scale Parent Weight Child Weight Selecting Area
Value 9 0.503,
0.753,
1.003,
1.253,
1.503
1 9 8 7 1, 3, 5, 7, 9

Table 5.

BD-Rate according to the Virtualizing Distance and Selecting Area

BD-Rate [%] Y Cb Cr
Selecting Area Selecting Area Selecting Area
1 3 5 7 9 1 3 5 7 9 1 3 5 7 9
8ivfbv2 loot vox10 Distance
Virtualizing
0.503 0.00 0.01 0.02 0.03 0.02 -0.10 -0.03 -0.09 -0.17 -0.09 0.00 0.16 0.03 0.16 0.35
0.753 0.00 0.01 0.02 0.03 0.02 -0.10 -0.03 -0.09 -0.17 -0.09 0.00 0.16 0.03 0.16 0.35
1.003 0.00 0.01 0.02 0.03 0.02 -0.10 -0.03 -0.09 -0.17 -0.09 0.00 0.16 0.03 0.16 0.35
1.253 0.01 0.01 0.01 0.03 0.02 -0.01 0.09 -0.11 -0.02 -0.13 0.06 0.16 0.11 0.26 0.19
1.503 0.03 0.04 0.03 0.03 0.04 0.12 -0.16 -0.08 0.10 -0.06 0.01 0.08 0.12 0.06 0.12
8ivfbv2 redandblack vox10 0.503 -0.03 0.02 0.00 -0.02 0.01 -0.03 -0.01 -0.14 -0.07 -0.08 -0.01 -0.02 -0.01 0.02 0.00
0.753 -0.03 0.02 0.00 -0.02 0.01 -0.03 -0.01 -0.14 -0.07 -0.08 -0.01 -0.02 -0.01 0.02 0.00
1.003 -0.03 0.02 0.00 -0.02 0.01 -0.03 -0.01 -0.14 -0.07 -0.08 -0.01 -0.02 -0.01 0.02 0.00
1.253 0.03 0.01 0.00 0.02 0.00 -0.03 -0.02 -0.03 -0.01 -0.11 -0.01 -0.01 0.00 0.01 -0.02
1.503 0.00 -0.01 0.01 0.00 -0.01 0.00 0.03 0.03 0.00 -0.09 0.02 -0.01 -0.02 -0.02 0.01
8ivfbv2 longdress vox10 0.503 0.00 -0.01 0.00 0.00 0.00 -0.02 -0.01 0.00 -0.02 -0.01 -0.02 -0.02 -0.01 -0.03 -0.02
0.753 0.00 -0.01 0.00 0.00 0.00 -0.02 -0.01 0.00 -0.02 -0.01 -0.02 -0.02 -0.01 -0.03 -0.02
1.003 0.00 -0.01 0.00 0.00 0.00 -0.02 -0.01 0.00 -0.02 -0.01 -0.02 -0.02 -0.01 -0.03 -0.02
1.253 -0.01 -0.01 0.00 0.00 0.00 -0.01 0.01 0.00 -0.02 -0.01 0.00 0.01 -0.01 -0.02 -0.02
1.503 -0.01 -0.01 -0.01 0.00 0.00 -0.01 -0.01 -0.01 -0.01 0.01 -0.01 -0.02 -0.02 -0.01 0.00
dancer player vox11 0.503 0.00 -0.01 0.01 0.01 0.00 -0.12 -0.10 -0.16 -0.11 -0.18 -0.05 0.07 0.07 -0.05 0.08
0.753 0.00 -0.01 0.01 0.01 0.00 -0.12 -0.10 -0.16 -0.11 -0.18 -0.05 0.07 0.07 -0.05 0.08
1.003 0.00 -0.01 0.01 0.01 0.00 -0.12 -0.10 -0.16 -0.11 -0.18 -0.05 0.07 0.07 -0.05 0.08
1.253 0.01 0.02 0.01 0.00 0.00 0.02 -0.08 -0.13 -0.02 -0.03 -0.26 0.09 0.01 0.00 0.04
1.503 0.00 0.00 0.01 0.00 -0.01 0.00 -0.17 -0.20 -0.11 -0.13 -0.01 0.11 -0.03 0.03 -0.10

Table 6.

Optimized configuration for parameter values

Parameter Type Search Max Range Virtualizing Distance Exponent Scale Parent Weight Child Weight Selecting Area
Value 9 0.753 1 9 8 7 1

Table 7.

Compression performance with optimal parameter configuration in Category 2

Category 2 Dataset BD-Rate [%]
Y Cb Cr
Category2-A 8ivfbv2 loot vox10 0.004 -0.097 -0.004
8ivfbv2 redandblack vox10 -0.027 -0.028 -0.005
8ivfbv2 soldier vox10 0.044 0.285 -0.037
queen 0.020 0.003 -0.082
Category2-B 8ivfbv2 longdress vox10 -0.005 -0.023 -0.025
Category2-C basketball player vox11 0.018 -0.113 0.083
dancer player vox11 -0.002 -0.123 -0.049

Table 8.

Compression performance with optimal parameter configuration for each content in Category 2

Dataset Search Max
Range
Virtualizing
Distance
Exponent Scale Parent
Weight
Child
Weight
Selecting
Area
BD-Rate [%]
Y Cb Cr
8ivfbv2 soldier vox10 9 33 0.75 7 3 4 3 -0.017 0.159 -0.092
queen 9 23 0.625 7 3 4 3 0.000 -0.091 0.012
basketball player vox11 3 0.73 1 9 8 7 1 -0.016 -0.054 -0.230

Table 9.

Compression performance with optimal parameter configuration in Category 1 Dense contents

Category 1 Dataset BD-Rate [%]
Y Cb Cr
Category1-Dense boxer viewdep vox12 -0.388 -0.096 -0.097
facade 00009 vox12 -0.426 -0.237 -0.064
facade 00015 vox14 -0.134 -0.083 -0.129
facade 00064 vox14 -0.415 -0.241 -0.228
frog 00067 vox12 -0.067 -0.052 -0.045
head 00039 vox12 -0.165 -0.090 -0.098
house without roof 00057 vox12 -0.075 -0.071 -0.193
landscape 00014 vox14 -0.415 -0.303 -0.299
longdress viewdep vox12 -0.707 -0.557 -0.647
loot viewdep vox12 -0.366 -0.066 -0.043
redandblack viewdep vox12 -0.389 -0.181 -0.706
soldier viewdep vox12 -0.532 -0.119 -0.110