デジタルコンテンツの品質が向上し続ける現代において、3Dモデルを様々な視点から高品質にレンダリングする「新規視点合成(Novel View Synthesis)」は非常に重要な技術となっています。特に近年、リアルタイムでの高品質レンダリングを可能にする「3D Gaussian Splatting (3DGS)」が登場し、大きな注目を集めています。
しかし、3DGSには課題がありました。カメラのズームイン・アウトや、カメラとオブジェクトの距離が変わるといった、学習時とは異なるサンプリングレートでレンダリングしようとすると、画像にノイズや不自然なぼやけといった「エイリアシング」が生じてしまうのです。
今回ご紹介する論文「Mip-Splatting: Alias-free 3D Gaussian Splatting」は、この問題を見事に解決する手法を提案しています。
著者:Zehao Yu, Anpei Chen, Binbin Huang, Torsten Sattler, Andreas Geiger
論文リンク (arXiv): https://arxiv.org/abs/2311.16493
3D Gaussian Splatting(以下、3DGS)は、3Dシーンを多数の3Dガウス分布(Gaussian)の集まりとして表現し、それを2D画像平面に投影してレンダリングする手法です。このガウス分布の位置、サイズ、向き、色、不透明度などを最適化することで、非常に高品質で高速な新規視点合成を実現します。
しかし、3DGSはレンダリングの際に「2D Dilation」という操作を行っています。これは、画像平面に投影された2Dガウス分布が小さくなりすぎる場合に、そのサイズを画面空間で膨張させることで、ピクセル単位での表現の欠落を防ぐためのものです。
この2D Dilationが、サンプリングレートの変化時にエイリアシングを引き起こす主な原因となります。
これらの問題は、特に数百万個ものガウス分布でシーンを表現する3DGSにおいて、見た目の品質を大きく損なう要因となっていました。
Mip-Splattingは、これらの課題を解決するために、大きく2つの新しいフィルターを導入しています。
このフィルターは、3DGSにおける「3Dガウス分布のスケールが適切に制約されていない」という根本的な問題を解決します。
論文では、Nyquist-Shannonサンプリング定理という、信号処理における基本的な法則に着目しています。これは、連続的な信号を離散的なサンプルから正確に復元するには、サンプリングレートが信号の最高周波数の少なくとも2倍でなければならない、というものです。
3DGSのガウス分布も3D信号の一部と捉え、学習時に使用された画像群から各ガウス分布が「どこまで細かい構造を表現できるか」という最大サンプリング周波数を計算します。そして、この最大周波数を超えるような高周波成分を、各3Dガウス分布に「3Dスムージングフィルター」を適用することで抑制します。
このフィルターは学習中に適用され、一度決定されると3Dシーン表現の不可欠な一部となります。そのため、レンダリング時にカメラの視点やズームレベルが変わっても、3D表現自体が高周波ノイズを含まないように設計されているため、ズームイン時の高周波ノイズや細部の侵食といったアーティファクトが解消されます。
3Dスムージングフィルターがズームイン時の問題を解決する一方で、ズームアウト時のエイリアシングを軽減するために、3DGSの「2D Dilation」操作を「2D Mipフィルター」に置き換えます。
この2D Mipフィルターは、物理的なカメラセンサーがピクセル領域全体で光を集積するプロセスを模倣するものです。理想的には2Dボックスフィルターが使われますが、ここでは効率のために2Dガウスフィルターで近似しています。このフィルターは、投影された2Dガウス分布が1ピクセル程度の適切なサイズになるように調整されるため、ズームアウト時の不自然な膨張や明るさの増加を防ぎ、エイリアシングを効果的に軽減します。
既存のEW Aフィルターと呼ばれる手法と似ていますが、Mipフィルターが「1ピクセルを正確に近似する」ことを目的としているのに対し、EW Aフィルターは周波数帯域を制限するために経験的にサイズが選択される点で異なります。Mip-Splattingの2D Mipフィルターは、より物理的なイメージングプロセスに基づいているため、ズームアウト時により自然なレンダリング結果をもたらします。
Mip-Splattingは、BlenderデータセットとMip-NeRF 360データセットという、標準的なベンチマークで評価されています。特に注目すべきは、「単一スケールで学習し、複数のスケールでテストする」という、より実用的なシナリオでの評価です。
これらの結果は、Mip-Splattingが幅広いサンプリングレートにおいて、頑健かつ高品質なレンダリングを可能にすることを示しています。
Mip-Splattingは、3D Gaussian Splattingの大きな課題であったサンプリングレート変化時のエイリアシング問題を、3Dスムージングフィルターと2D Mipフィルターという2つの革新的なアプローチで解決しました。
これらの変更は、3DGSのコードベースに最小限の変更で導入可能でありながら、既存手法を大幅に上回る汎化性能とレンダリング品質を実現しています。Mip-Splattingの登場は、3DGSがより実用的な新規視点合成技術として普及するための重要な一歩となるでしょう。