【生成AIニュース+】『Multi-Color Printing』『HY 3D Studio 1.2』『FLUX.2 [klein]』『LTX-2更新』『LightingRemap_Alpha』『Gmail in the Gemini era』『Learn Your Way』『V-DPM』『Cowork』『Camera Controls』『HeartMuLa』『OpenVoxel』『Alterbute』『RigMo』『TMD』『Step3-VL-10B』『VibeCode』他

2026年1月17日 22:58

『Fast-ThinkAct』
『Tiny』
『ギター演奏練習ソフト』
『Cobot Magic』
『DEEP Roboticsの四足ロボット』

まいどです。
本日の生成AIニュース+テクノロジー情報です

■Multi-Color Printing

Multi-Color PrintingはMeshyの新機能で、Meshyはテキストや画像から3DモデルをAIで生成するツールですが、この機能は生成したテクスチャをFDMプリンター（フィラメント式3Dプリンター）でマルチカラー印刷可能にするものです。
画面で見たテクスチャがそのままプリントされる「What you see is what you get」を実現します。
この機能は、複雑なテクスチャをプリント可能な色に簡略化・最適化するもので、3Dプリント愛好家やクリエイター向けのものです。

■HY 3D Studio 1.2

HY 3D Studio 1.2は下記記事でご紹介したv1.1のメジャーアップグレードで、3D作成パイプライン全体の精度とクリエイティブコントロールを大幅に強化したバージョンです。
PartGen 1.5で、解像度が1024³ → 1536³ に引き上げされており、モデル分割時の細部保持が大幅に向上し、クリスタルクリアな分割が可能になりました。
また、細かいインタラクティブコントロール追加や形状適合性の劇的改善などが行われています。
Tencent HY 3D 3.1では、ジオメトリの細かさ強化、テクスチャ忠実度・色精度の大幅向上、入力ビューの拡張（4から8へ）がなされています。

■FLUX.2 [klein]

FLUX.2 [klein]は、Black Forest Labsから発表された、爆速の生成スピードと、高い編集能力を両立させた次世代の画像生成AIモデルです。
プロ級の画像をわずか0.5秒で生成・加工でき、一般家庭のPCでもサクサク動く『リアルタイム視覚インテリジェンス』です。
これまでの高性能AIは、画像を作るのに数秒〜数十秒かかり、さらに編集には別のモデルや複雑な設定が必要でしたが、FLUX.2 [klein]では、生成と編集をひとつのコンパクトな設計（4B/9Bパラメータ）に統合しており、0.5秒以下という速さで、テキストからの画像生成だけでなく、元画像の一部を変える「編集」もこなします。
ちなみにComfyUIでも対応しました。

■LTX-2更新

Lightricksは、正しいVAEでLTX-2の蒸留されたfp8/bf16チェックポイントを更新しました。
以前のバージョンには「悪い」VAEが埋め込まれていたようです。

■LightingRemap_Alpha

LightingRemap_AlphaはQwen-Edit-2511用のLoRAです。
画像の上に『色付きの四角（色塊）』を置くだけで、その色と場所を『照明』として認識し、映画のようなライティングを自動で作り出すライトアップツールです。
このモデルには「セット機能」が備わっており、例えば、右上にオレンジの四角を置けば、AIは「右上に夕日がある」と解釈し、被写体の右側に暖かい光を当て、左側に柔らかな影を作ります。
出力結果からは、指示に使った「色ブロック」自体は綺麗に消え去ります。残るのは、そのブロックがもたらした自然な光と影だけです。

■Gmail in the Gemini era

Gmail in the Gemini eraは、Gemini AIを統合したGmailの新機能で、Gemini AIを活用した新機能で、メールの要約、質問回答、ドラフト作成、返信提案、優先順位付けを実現したものです。
長いメールスレッドをAIが要約したり、受信箱全体に自然言語で質問したり、メールドラフトをAIが生成・洗練できたりします。

■Learn Your Way

Learn Your Wayは、Googleの教育特化AIモデルである「LearnLM」を活用して、任意のPDF（教科書など）をユーザーの興味や学年に合わせてパーソナライズされた学習コンテンツに変換するもので、「教科書キラー」と呼ばれています。
テストでは、従来のPDF学習より保持率が78%対67%と向上した結果が出ています。教育革命として注目されています。
現在、Google Labsで試用可能ですが、PDFアップロードはウェイトリスト制です。

■V-DPM

V-DPMは動画から、動いている物体も含めたシーン全体の4次元（3D空間＋時間軸）構造を、一瞬で復元する技術です。
普通のビデオ映像を読み込ませるだけで、カメラの動きだけでなく、映っている人や物が『いつ、どこへ、どう動いたか』という全データの3D軌跡を、AIが高速に計算して立体化するシステムです。
V-DPMは、Dynamic Point Maps (DPM) という概念を動画に拡張しました。
これにより、各ピクセルに対して「3D位置」だけでなく「時間の経過による移動（モーション）」を同時に予測させ、動的なシーンの完全な4D復元を可能にしました。

■Cowork

AnthropicのClaude AIの新機能「Cowork」がアップデートされ、Proユーザーにも解放されました。
Coworkは、Claudeの新機能で、チャットUIをベースに高度なタスク自動化を実現しており、ChatGPTやGeminiより優位と評価され、文章生成や実装力が桁違いです。
指示を出せばAIが自走し、複数タスクを並行処理可能。Claude Codeと異なり、初期設定不要で使いやすいです。
Cowork自体は下記記事でもご紹介しております。

■Camera Controls

Invideo AI（テキストからビデオを生成するAIツール）の新機能「Camera Controls」は、カメラの動きを細かく制御して、よりクリエイティブなフィルムメイキングを実現します。
カメラコントロールにより、ビデオ内の視点や動きをプロレベルで調整可能で、例えば、パン（横移動）、ドリー（前後移動）、ティルト（上下傾き）、トラック（横移動追尾）、ジブ（クレーン風の上下移動）などを指定できます。
これにより、単なる静的なビデオではなく、ダイナミックで映画のような表現がワークフローに取り入れられます。

■HeartMuLa

HeartMuLa音楽の理解・認識・生成のすべてを統合した、オープンソースの音楽基盤モデル・ファミリーです。
歌詞の書き出しから、曲のスタイル指定、そして高品質な歌唱付き楽曲の生成まで、音楽に関するあらゆるタスクを1つのエコシステムで完結させる、音楽制作AIの決定版です。
HeartMuLaは、「理解（検索）」「変換（圧縮）」「認識（書き出し）」「生成」の4つの専門モデルを組み合わせることで、プロが使うDAW（音楽制作ソフト）のような細かい制御をAIで実現しました。

■OpenVoxel

OpenVoxelは、追加の学習を一切行わずに、3D空間内の物体を自動でグループ化し、それぞれの名前や特徴を言語で説明できるシステムです。
3D空間の『点（ボクセル）』の集まりを見て、AIが『これは緑のリンゴ』『これは木製の椅子』と自ら判断し、ラベルを貼り付けていくインテリジェントな地図作成技術です。
「トレーニング・フリー」で既存の強力なAIモデル（SAMやQwen3-VLなど）を賢く組み合わせることで、一度も学習させることなく、どんな言葉でも物体を特定できるようにしました。

■Alterbute

Alterbuteは、画像の質感を保ったまま、色・テクスチャ・素材、さらには形状までも自由自在に書き換えるAI技術です。
写真の中の物体の『アイデンティティ（らしさ）』を壊さずに、中身の属性だけをピンポイントで改造できる、超高精度な画像編集AIです。
Alterbuteは、Visual Named Entity (VNE)」という新しい概念を導入しました。
VNEとは、単なる「車」という大まかな分類ではなく、「ポルシェ 911 カレラ」や「iPhone 16 Pro」といった、人間が特定の製品やモデルとして認識する詳細なアイデンティティのことです。

■RigMo

RigMoは、3Dモデルの『骨組み（リグ）』と『動き（モーション）』を同時に学習・生成するAIフレームワークです。
バラバラに動く3Dメッシュのデータを見せるだけで、AIが勝手に『どこに骨があって、どう動くべきか』を理解し、自由にアニメーション可能な3Dモデルに変えてくれる魔法のツールです。
ただの3Dの塊を放り込めば、AIがその構造を見抜き、自在にポーズを変えたり踊らせたりできる『生きた3Dアセット』へと一瞬で変換してくれる、3D制作の常識を覆す技術です。

■TMD

TMD (Transition Matching Distillation)は、高品質なAI動画生成を、従来の数十倍のスピード（超低ステップ数）で実行可能にする高速化技術です。
これまで100回近く計算して作っていたAI動画を、わずか1〜3回の計算で同等以上のクオリティで作り出す『究極の効率化プログラム』です。
現在の高性能な動画生成AI（Wan2.1やSoraなど）は、美しい動画を作るために「拡散モデル」や「フローモデル」という仕組みを使っていますが、1つの動画を作るのに、ノイズを少しずつ取り除く計算を50回〜100回も繰り返す必要がありました。
これではリアルタイムな対話や、サクサクとした試行錯誤ができません。
TMDでは、蒸留を進化させ、たった1〜3ステップで動画を完成させます。

■Step3-VL-10B

Step3-VL-10Bは、小型ながら超大型AIに匹敵する知能を持つ、100億パラメータ級のマルチモーダルAIモデルです。
スマホやPCでも動くサイズなのに、Gemini 2.5 ProやQwen3-VLといった10倍〜20倍以上巨大なトップクラスAIに勝負を挑める、究極のコスパ・モンスターです。

■VibeCode

VibeCodeは、ユーザーが「どんなアプリを作りたいか」をテキストで説明するだけで、AIが完全なプロ級アプリを生成します。
モバイルアプリに加え、新たにウェブアプリ対応を追加（フロントエンド/バックエンド両方を自動構築）しました。
API統合をワンクリックで追加可能で、APIキーの管理不要で、TestFlightでテストしたり、インターネットに即デプロイしたりできます。

■Fast-ThinkAct

Fast-ThinkActは、ロボットの思考プロセスを高速化し、キビキビとした動作を実現する次世代のVLA（視覚・言語・行動）モデルです。
ロボットが『次はこう動こう』と考える際の『心の声（推論）』をギュッと圧縮することで、頭の回転を最大9.3倍速くし、スムーズな作業を可能にする技術です。
Fast-ThinkActは長い文章による思考を、AIにしか分からない「コンパクトな潜在空間」での思考に置き換えました。
ロボットに『深く考える賢さ』を保たせたまま、『瞬時に判断する素早さ』を与え、家庭や工場でより実用的なパートナーにするための画期的なフレームワークです。

■Tiny

Tinyは、植物の擬人化プロジェクトで、実際の植物にセンサーを取り付け、環境データをリアルタイムでモニターし、可愛いアニメーションキャラクターとしてチャットできるインタラクティブなシステムです。
Riveのデータバインディング、GPTモデル、ハードウェア（ESP32マイコンとセンサー: タッチ、土壌水分、湿度、光、温度）を組み合わせたDIYプロジェクトです。

■ギター演奏練習ソフト

これは、ギター演奏の練習をゲーム化して上達を助ける個人開発のソフトウェアです。
作成者さんが、自分がギターが下手なので改善するために作ったもので、Dance Dance Revolution (DDR) や Guitar Hero のようなスタイルです。
実際にギターを弾いている音をリアルタイムで分析し、演奏中のコード（例: Em, D, G など）を検出します。
次に弾くべきコードを表示し、指のポジション（コードダイアグラム）も示します。
タイミングと正確さを評価し、スコアを加算。ハーモニック・スペクトル（音の周波数分布）やオーディオ波形を表示して視覚的にフィードバックします。
ギターの弦を弾くエリアをハイライトし、ストラミングのタイミングを助けます。

■Cobot Magic

Cobot Magicは、ロボットコミュニティで人気の研究用協働ロボットで、マスター-フォロワーアームセットアップを採用しており、人間のデモンストレーションをキャプチャし、エンドツーエンドのデータ（人間の動作からロボットの実行まで）を収集・実行します。
これにより、具現化AI（Embodied AI）の学習やタスク実行を可能にします。

■DEEP Roboticsの四足ロボット

DEEP Roboticsの四足ロボットは、本体は白と黒のボディにカメラやセンサー（LiDAR、カメラ、熱検知センサーなど）を搭載しており、脚部は柔軟で、不整地や障害物を克服可能。IP67防水・防塵規格で、水中や悪天候下でも動作します。
緊急救助に特化しており、人間の代わりに危険地帯に入り、偵察・検知・ナビゲーションを行います。

本日は以上となります。

過去の生成AIニュースは買い切りマガジンの「【生成AIニュース】アーカイブ」で全て見ることができます。

SDなどで使えるプロンプト集です。マガジンご購入者にももれなく付いてきます。

マガジンご購入者専用の特典「生成AIツール辞典」です。

それでは、また。

いいなと思ったら応援しよう！