Real-Time Neural Light Field on Mobile Devices

AI Paper Review

최근에는 NeRF 에 대한 연구들이 인상적인 결과를 보여주며, 암묵적인 Neural 표현을 활용하여 3D 장면을 표현함으로써 새로운 시점 합성에서 탁월한 성과를 보이고 있습니다. 그러나 NeRF의 volume rendering 과정으로 인해 추론 속도가 매우 느려져 모바일 기기와 같은 자원이 제한돈 하드웨어에서 NeRF를 활용하는 응용 시나리오가 제한됩니다. NeRF 모델의 실행시간을 줄이기 위한 다양한 연구가... [Read More]

(R2L) Distilling Neural Radiance Field to Neural Light Field for Efficient Novel View Synthesis

AI Paper Review

최근 연구에서는 Neural Radiance Field (NeRF)에 대한 폭발적인 연구로 복잡한 장면을 신경망으로 효과적으로 표현할 수 있는 잠재력을 보여주고 있습니다. 그러나 NeRF의 주요 단점 중 하나는 그것의 신축적인 추론시간입니다. 단일 픽셀을 랜더링하기 위해서는 NeRF 네트워크를 수백번 쿼리해야합니다. 이를 해결하기 위해 기존의 노력들은 주로 필요한 샘플 포인트 수를 줄이는 방향으로 진행되고 있습니다.... [Read More]

(NeRF) Representing Scenes as Neural Radiance Fields for View Synthesis

AI Paper Review

이 논문은 복잡한 장면의 새로운 시점을 합성하기 위해 희소한 입력 시점 집합을 사용하여 기저 연속 volumetric sence 함수를 최적화하는 방법을 제시한다. 저자의 알고리즘은 시점 (x, y, z)와 시선의 방향 (theta, phi) 으로 구성된 연속적인 5차원 좌표 (공간 위치와 시점)를 입력으로 사용하고, 해당 공간 위치에서의 volume density와 시점에 의존하는 방출된 광도를... [Read More]

Voice Conversion With Just Nearest Neighbors

AI Paper Review

kNN-VC (k-nearest neighbors voice conversion)은 목표로 하는 음성 변환을 달성하기 위해 목표 화자의 몇 가지 예시만을 참고로 사용합니다. 최근의 방법들은 납득할 만한 변환 결과를 제공하지만, 그만큼 복잡성이 증가하여 결과물을 재현하고 확장하기 어렵게 만듭니다. 대조적으로, kNN-VC는 간단하면서도 효과적인 방법을 제안합니다. [Read More]

(NaturalSpeech) End-to-End Text to Speech Synthesis with Human-Level Quality

AI Paper Review

최근 몇년동안 TTS 기술은 학계와 산업에서 빠르게 발전해왔다, 자연스러운 인간 수준의 품질을 달성할 수 있는지, 어떻게 그 품질을 정의하고 판단할 수 있는지, 그리고 어떻게 품질을 달성할 수 있는지라는 질문들이 자연스럽게 제기된다. 이 논문에서는 주관적인 측정의 통계적 유의성을 기반으로 인간 수준의 품질을 정의하고 판단하기 위한 적절한 지침을 먼저 소개함으로써 이러한 질문에... [Read More]