見出し画像

Metaの新しい3D生成モデル「SAM 3D」シリーズを試す

2025年11月20日 07:11

Metaから新しい3D生成のモデルが公開されました。コードもモデルも商用利用可能です。

今回は概要の確認と、公式のデモを使って感触を試してみました。

2つのモデル

公開されたのは汎用的なセグメンテーション用のSegment Anywhere Model 3（SAM3）をベースにした「SAM 3D Objects」と「SAM 3D Body」の2モデル。

SAM 3D Objectsは物体の形状とテクスチャ、レイアウトまで含めて、単眼画像から複数推定できる。子供部屋のような入り組んだシーンが得意とされてます。

リポジトリ：https://github.com/facebookresearch/sam-3d-objects

デモ：https://www.aidemos.meta.com/segment-anything/editor/convert-image-to-3d

SAM 3D Bodyは人体の形状とポーズ推定に特化。テクスチャは無いけど、ボーン付きのメッシュとポーズが精度高く単眼画像から推定できる。
リポジトリ：https://github.com/facebookresearch/sam-3d-body

デモ：https://www.aidemos.meta.com/segment-anything/editor/convert-body-to-3d/

SAM 3D Objects

子供部屋のような込み入った室内が得意ということで、かなり意地悪な画像でテストしました。画像はGoogle Geminiの画像生成機能で生成したものです。

SAM 3D Objectsのデモでは、この画像に対し3D化したい範囲をSAM3を使ってセグメンテーションし、個別のオブジェクトとして認識させていきます。

ひとつのオブジェクトに複数のポイントを指定しながら範囲を追加し、決定したら「Add Object」で次の範囲指定。ポイントはかなり雑に指定しても、非常に賢く自動でセグメンテーションされていきます。

オブジェクトを追加すると、その場で並行して3D化の推論が動きます。非常に高速で、ローカルでも軽量に扱えるかもしれません。

3D化の結果です。3Dシーンの推定を謳っているように、個々のオブジェクトの位置関係や方向、サイズも、画像から見た妥当なものになっています。テクスチャは恐らく影も焼きこまれたカラーのみ。

隠れた部分まできれいに立体化され、極端に欠けた部分も目立ちません。これまで色々な3D生成モデルを試していますが、ここまで欠けた入力を積極的に補うものは初めてかもしれません。

たとえば机。画像ではたくさんの物でかなりの部分が隠れた状態です。セグメンテーション結果のマスクもこんなひどい状態。

しかし3D化された姿はこのように、欠けていた部分をかなり机らしく補っています。明らかにマスク範囲が机であるという、ある程度の関連付けが無ければここまでの復元はできないでしょう。

欠けた部分をここまで推定できるということは、画像に無い部分を積極的に学習データによって正規化する可能性が高いです。最近の3D生成モデルはかなり大胆に形状を補正してしまうことで品質の向上を行っており、SAM 3D Objectsでは更にその傾向が大きいかもしれません。忠実性が重要な用途では結果のよりしっかりした確認が必要です。

SAM 3D Body

こちらもかなり推定の難しそうな、こんな意地悪な画像をGeminiで生成してテスト。そもそも人体として破綻したポーズまで含めて複数人、しかも解像度も低めです。

まずはセグメンテーション結果。小さなピクセルしかない指先まで、きちんと取れています。

そして推定された形状とポーズ。

やはり非現実的な人物の推定には失敗しています。手前中央の人物とその奥右側の人物はそもそも構造上矛盾があるためか、全く違うポーズに。一方他の人物は、それなりに正確な体勢が取れています。

研究ページにあったように手の推定にはまだ難があり、どの人物も不自然です。とはいえここまで条件の悪いデータだけでは酷いので、もう少し妥当なものでも試します。

こちらもGeminiで生成。セグメンテーションはこうなりました。

中央の戦うふたりはもちろんですが、顔の隠れたレフェリーだけでなく、小さな観客まである程度認識しています。体形とポーズの推定はこうなりました。

こちらのテストではかなり正確に、手まで推定できています。隠れたレフェリーも含め位置関係も概ね正しいです。

研究の課題として、人物を個別に推論していることで関係性に問題があると挙げられていましたが、蹴った足先の位置がずれているのはそうした原因かもしれません。

何に使えるか

残念ながらどちらのデモも、生成した3Dモデルのダウンロード機能はありません。そのためデータの品質や使い勝手はローカルで検証が必要です。

それでも、かなり手軽に強力な単眼からの3D推定が可能なのは間違いありません。モデルの性格上高精度な本番用の生成より、素早いイメージの具現化やユーティリティ向きですが、色んな用途が考えられます。

たとえばBodyの方は、ダミーの人形や生成画像を使って、3Dモデルのポージングに適用できます。連続してキーフレームを打つ代わりにも使えますし、もちろんシーンのダミーキャラクター配置にも有効でしょう。

Objectsの方は特に手早いシーン構築に有効です。入力が単眼、しかもある程度非写実的な表現の画像でも大丈夫なので、イメージ画像から3Dシーンをざっと構築して検証する段階などで便利です。

ローカルに環境が出来たら、Objectsのそうした利用を想定したテストも行ってみる予定です。

ライセンス

最後に、重要なライセンス確認。

コードもモデルウェイトも独自の「SAM License」。このライセンスは原則商用利用が可能で、たとえばゲームアセットの事前生成や、映像制作のワークフローでSAM3 3Dを使うなら、追加の表記も不要です。
制限は以下の3点。

軍事等一部の目的での利用禁止
SAMの派生物にはSAM Licenseの適用が必要
SAM使った研究には謝辞が必要

かなり自由に商用利用も可能で、特にゲーム開発には嬉しいので、次はローカルでの環境を作ってみる予定です。

いいなと思ったら応援しよう！

CV

170本

コメント

コメントするには、ログインまたは会員登録をお願いします。

こちらもおすすめ

Metaの…3Dモデル生成AI「SAM 3D」のデモを触ってみたよ

MetaのSAM 3D

SAM3DをComfyUIで試す

画像1枚で3Dモデルが作れる！？Copilot 3Dを試してみた

Gemini 3 Pro に間取り図の3Dビューアアプリを作成してもらう（Geminiアプリ）

【学習】老後の学びと日常｜AIで写真から3D？

Meshy, StableDiffusion:画像→3Dモデル生成→画像で遊ぶ #2

World LabsのMarble試してみた

AIで簡単に３Dに出来てしまう！あらゆる職業のイメージでお仕事時短化Luma AI（GENIE）

【新時代】Meta「SAM 3」公開。動画の「切り抜き」作業がテキスト指示だけで終わる時代が来た

モデリング生成ツール「SAM3D」で絶望した私

やばいぞGemini 3

SAM 3D Body をローカル環境で動かす

SAM3セットアップ（WSL2）＆sam-3d-objects用の画像処理スクリプト

Meshy AI:テキストと画像から3Dモデル生成/アニメーション作成まで： 3Dモデル生成編

Instant Skinned Gaussian Avatars 入門 (1) - クイックスタート

【生成AIニュース+】『Hunyuan3D-Part』『Qwen Image Edit 2511』『AI Sheets』『Parallel Extract』『Grok Imagine』『Agent 365』『Fac…

MicrosoftのMAI-Image-1で画像生成をnano-bananaと比較する

Gemini 3 がついに登場！軽く使ってみた。

生成AIで3Dデータを作る【Tripo】

【生成AI活用】Nano Banana Pro ＋ Veo3.1 でイベント紹介動画作成

GensparkのスーパーAIエージェントで3Dプリンタ用のSTLファイル作った

Canva「マジック生成」に3Dタブが登場！キャンバス上で立体モデルを自由に動かせる時代へ

【AI+３Dプリント】2025年11.04最新版｜3Dモデル生成AIツール徹底比較！３Dプリントに一番使えるツールは？？

Blenderで作りました。#日記

ゼロからはじめたBlender 番外編 / スマホでのモデリング

Googleの新型AI「Gemini 3」がついに正式リリース! ｲﾔｯﾎｳな性能をｻﾞｯｸﾘ解説

【革命】MeshyAIでプログラミング知識ゼロでも3Dモデルが作れる時代が到来！

「ミニマル・モデリング」の衝撃： Depth Anything 3が3Dの世界を書き換える仕組み

Gemini 3 の使用感

20251105BICに新しい選択肢

療法士向け生成AI研修イベントレポート｜重工大須病院・木村病院様での実践事例

Metaの…3Dモデル生成AI「SAM 3D」のデモを触ってみたよ

🐌𝐂𝐮𝐫𝐫𝐲𝐒𝐚𝐦𝐮𝐫𝐚𝐢🐌 ツムの飼い主

4日前

9

MetaのSAM 3D

5日前

3

SAM3DをComfyUIで試す

seisei_surumono

16時間前

1

画像1枚で3Dモデルが作れる！？Copilot 3Dを試してみた

1か月前

4

Gemini 3 Pro に間取り図の3Dビューアアプリを作成してもらう（Geminiアプリ）

SeaGate（繁戸和幸）

4日前

4

【学習】老後の学びと日常｜AIで写真から3D？

チャレン爺さん

4日前

3

【衝撃のAI進化】Figma MakeにGoogle「Gemini 3 Pro」が登場、デザイン作業の未来を変える

Figma拾い物ニュース

19時間前

2

Meshy, StableDiffusion:画像→3Dモデル生成→画像で遊ぶ #2

Nanashi-nil-null

3週間前

2

World LabsのMarble試してみた

11日前

14

AIで簡単に３Dに出来てしまう！あらゆる職業のイメージでお仕事時短化Luma AI（GENIE）

【アダルト研究】かなこの秘密のラボ

6日前

3

【新時代】Meta「SAM 3」公開。動画の「切り抜き」作業がテキスト指示だけで終わる時代が来た

あまんちゅ

2日前

1

モデリング生成ツール「SAM3D」で絶望した私

4日前

やばいぞGemini 3

ぷれっさん

3日前

2

SAM 3D Body をローカル環境で動かす

1日前

1

SAM3セットアップ（WSL2）＆sam-3d-objects用の画像処理スクリプト

3日前

14

Meshy AI:テキストと画像から3Dモデル生成/アニメーション作成まで： 3Dモデル生成編

クリエイティブボーイ

4日前

1

Instant Skinned Gaussian Avatars 入門 (1) - クイックスタート

1か月前

44

【生成AIニュース+】『Hunyuan3D-Part』『Qwen Image Edit 2511』『AI Sheets』『Parallel Extract』『Grok Imagine』『Agent 365』『FaceFusion ComfyUI』『Comet Android版』『In-N-On』『SAM 3D Body』『Nano Banana Pro+ComfyUI』『Nano Banana PRO+LTX』『GeoVista』『Co-Me』他

14時間前

8

MicrosoftのMAI-Image-1で画像生成をnano-bananaと比較する

1か月前

1

Gemini 3 がついに登場！軽く使ってみた。

えひめAIラボ

6日前

32

生成AIで3Dデータを作る【Tripo】

モールドテック

1か月前

【生成AI活用】Nano Banana Pro ＋ Veo3.1 でイベント紹介動画作成

Tomoko Nakasaki（中崎倫子）

3日前

11

GensparkのスーパーAIエージェントで3Dプリンタ用のSTLファイル作った

3週間前

14

【AI・5行要約】World LabsによるMarbleの紹介：空間知能の未来の基盤

6日前

1

Canva「マジック生成」に3Dタブが登場！キャンバス上で立体モデルを自由に動かせる時代へ

12日前

3

【AI+３Dプリント】2025年11.04最新版｜3Dモデル生成AIツール徹底比較！３Dプリントに一番使えるツールは？？

キクリエ(kicrea)

2週間前

4

figma.makeのブランドプロモーションが渋谷大型ビジョンに

GOOD MORNING DESIGN #おはようデザイン

2週間前

4

Blenderで作りました。#日記

2日前

3

ゼロからはじめたBlender 番外編 / スマホでのモデリング

しゅすい@毎日投稿中

1か月前

1

Googleの新型AI「Gemini 3」がついに正式リリース! ｲﾔｯﾎｳな性能をｻﾞｯｸﾘ解説

6日前

6

【革命】MeshyAIでプログラミング知識ゼロでも3Dモデルが作れる時代が到来！

2週間前

6

「ミニマル・モデリング」の衝撃： Depth Anything 3が3Dの世界を書き換える仕組み

7日前

3

Gemini 3 の使用感

靜（しずか）

1日前

1

20251105BICに新しい選択肢

2週間前

1

療法士向け生成AI研修イベントレポート｜重工大須病院・木村病院様での実践事例

バックテックCEO福谷直人

1か月前

8

無料でチケット予約フォームを作る方法

ちゃんはま

1年前

57

Metaの新しい3D生成モデル「SAM 3D」シリーズを試す｜kogu

word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1