arXivリンク: arXiv:2503.18402v2
リアルタイム3Dレンダリングの新たな地平:3D Gaussian Splatting
近年、3Dシーンを高精細に再構築し、あらゆる視点からリアルタイムでレンダリングする「Novel View Synthesis」の技術が注目を集めています。その中でも「Neural Radiance Field (NeRF)」は画期的な品質を達成しましたが、1つのシーンを最適化するのに数日かかるという大きな課題がありました。
そこで登場したのが「3D Gaussian Splatting (3DGS)」です。これは、Gaussianプリミティブという小さな3Dの粒を使ってシーンを表現することで、NeRFに匹敵するレンダリング品質を保ちつつ、最適化時間を数十分へと大幅に短縮しました。しかし、モバイルデバイスでの利用や、広範囲にわたる大規模なシーンの再構築など、さらなる高速化へのニーズは依然として高いままでした。
DashGaussianの登場:最適化時間を劇的に短縮
この度、Harbin Institute of TechnologyとHuawei Noah’s Ark Labの研究者たちが発表した論文「DashGaussian: Optimizing 3D Gaussian Splatting in 200 Seconds」は、3DGSの最適化時間をこれまでの常識を覆す速さへと押し上げました。なんと、わずか200秒(約3分20秒)で、数百万個のGaussianプリミティブを持つ3DGSモデルを、一般的なGPUで生成できるというのです。
DashGaussianは、既存の3DGSバックボーンに簡単に組み込むことができる「プラグイン」型の手法であり、平均で45.7%もの高速化を達成しながら、レンダリング品質を犠牲にしないという驚くべき成果を出しています。
なぜ高速化できるのか?最適化の「複雑さ」を賢く管理
従来の3DGS高速化手法には、主に2つのアプローチがありました。一つはレンダリングパイプライン自体を効率化するエンジニアリング的な方法、もう一つは不要なGaussianプリミティブを削除するアルゴリズム的な方法です。しかし、後者の方法では、プリミティブを減らしすぎるとレンダリング品質が低下するという問題がありました。
DashGaussianは、これらとは異なる「計算リソースの賢い割り当て」という新しい戦略を提案します。彼らは、3DGS最適化の計算コストが「レンダリング解像度」と「Gaussianプリミティブの数」という2つの要因、すなわち「最適化の複雑さ」に大きく依存することに着目しました。
論文の主なアイデアは以下の3点です。
- 最適化の初期段階で高解像度画像をレンダリングすることは、プリミティブがまだまばらなため非効率である。
- 最適化の後期段階では、プリミティブ数が多くなるため膨大な時間がかかるが、得られる画質改善は限定的である。
- 3DGSの最適化を「トレーニングビューのより高周波成分への段階的なフィッティング」として再定式化する。
これらの洞察に基づき、DashGaussianは最適化の進行に合わせて、この「最適化の複雑さ」を動的にスケジューリングすることで、冗長な計算を削減し、高速化を実現しています。
DashGaussianの心臓部:二つのスケジューラ
DashGaussianの核心には、「周波数誘導型解像度スケジューラ」と「解像度誘導型プリミティブスケジューラ」という2つの革新的なメカニズムがあります。

1. 周波数誘導型解像度スケジューラ
このスケジューラは、訓練画像の「周波数成分」に基づいて、レンダリング解像度を最適化の進行に合わせて段階的に引き上げていきます。最適化の初期段階では低解像度で大まかな形状を学習し、次第に高解像度へと移行することで、シーンの細かいディテール(高周波成分)をフィットさせていくのです。これは、まるで絵を描くときに、まず全体的な構図を低解像度で描き、徐々に高解像度で細部を仕上げていくようなイメージです。これにより、初期段階での無駄な高解像度計算を省くことができます。
2. 解像度誘導型プリミティブスケジューラ
レンダリング解像度が段階的に上がっていくのと同期して、Gaussianプリミティブの数も適切に増加させる仕組みです。過剰なプリミティブの生成は計算コストを増大させるだけでなく、画質のわずかな向上しかもたらしません。このスケジューラは、プリミティブの成長を抑えつつ、レンダリング解像度とのバランスを取りながら、効率的にシーンを表現できる最小限のプリミティブ数を維持しようとします。
さらに、最終的なプリミティブ数(Pfin)をデータセットに依存せず、最適化の過程で適応的に推定する「Momentum-based Primitive Budgeting」も導入されています。これにより、あらゆるシーンに対して最適なプリミティブ数を自動で見積もることが可能になります。
画質を維持しながら、大幅な高速化を実現
DashGaussianは、これらのスケジューリング戦略を組み合わせることで、従来の3DGSを上回る画質を維持しつつ、劇的な高速化を実現しています。以下の画像は、Mip-NeRF 360データセットの「stump」シーンでのレンダリング結果を示しています。

グラフを見ると、DashGaussianを適用した手法(Taming-3DGS+Oursなど)は、他の手法と比較して圧倒的に短い時間で高いPSNR値(画質指標)に到達していることが分かります。特に、Taming-3DGSにDashGaussianを組み合わせることで、最適化時間を41.3%削減し、かつ少ないGaussianプリミティブで、バックボーン単独よりも優れたレンダリング品質を達成しています。
また、DashGaussianは様々な3DGSバックボーン(3DGS、Mip-Splatting、Taming-3DGSなど)に対して汎用的に適用できることも強みです。異なる最適化手法やプリミティブ表現を持つバックボーンに組み込んでも、平均で45.7%の高速化を実現し、そのポテンシャルの高さを証明しています。

上記の定性比較画像からも、DashGaussianが元の3DGSモデルに匹敵、あるいはそれ以上のレンダリング品質を、はるかに短い時間で達成していることが見て取れます。特に、詳細な部分の表現において、オリジナルと同等以上の品質が確認できます。
まとめ:3DGSの新たな標準となるか?
「DashGaussian: Optimizing 3D Gaussian Splatting in 200 Seconds」は、3DGSの最適化プロセスにおける計算リソースの配分方法を根本から見直し、レンダリング品質を損なうことなく、かつてない高速化を実現した画期的な論文です。
この手法は、さまざまな3DGSバックボーンに簡単に適用できる「プラグアンドプレイ」な性質を持っているため、今後の3DGS研究における新たな最適化パラダイムとなる可能性を秘めています。また、大規模なシーン再構築や、計算資源が限られたデバイス上での3DGSの活用において、その実現可能性を大きく広げることでしょう。
今後の研究では、Gaussianプリミティブ数とレンダリング解像度の関係性をさらに深く分析し、より直感的な制御方法を探求していくとのことです。3DGSの進化から目が離せませんね!
