週刊 エレクトロニクスニュース 3/7/2022

Graphcoreがウエハ・オン・ウエハでIPUを超高速化
Graphcoreは、3Dウエハ・オン・ウエハ(WoW)技術を使用して製造された初のプロセッサである第3世代知能演算処理装置(IPU)を発表した。
コードネーム「Bow IPU」と呼ばれるGraphcoreの新しいAIプロセッサは、2020年に発売された従来製品(WoW非対応、それ以外は同一)と比較して、最大40%の性能向上と16%の電力効率改善を実現している。
Graphcoreは、新しいパーツを旧パーツと同価格で提供することで、価格性能指標を大幅に向上させる計画である。顧客は、ソフトウェアを変更することなく、Bow IPUに交換することができるという。
また、顧客の要望に応え、将来世代のWoW IPUを使用して、10エクサフロップスを実現する超知能AIスーパーコンピュータ製品「Good Computer」と呼ぶ製品を構築すると発表している。

性能向上:Graphcoreは、新しいBow IPUを “現在、世界で最も高性能な量産型AIプロセッサ “と謳っており、各Bow IPUチップは、350 TeraFLOPSの混合精度AIコンピュートを提供ししている。このプロセッサは、前世代のColossus Mk2 IPUチップと同じ1472個の独立したプロセッサコアと同じ900MBのインプロセッサSRAMを備えているが、前世代よりも約40%高速に動作し、1.325GHzから1.85GHzとなり、それゆえ最大40%の性能向上が実現されている。
Graphcoreによると、同社の顧客は、様々なモデルの学習時間を最大40%短縮しているという。Graphcoreが発表した数値は、画像分類(ビジョン変換を含む)、物体検出、テキストから画像、グラフネットワーク、自然言語処理、音声認識などのさまざまなワークロードで、1.29倍から1.39倍のスピードアップを実現している。
また、電力効率(ワットあたりの性能)も、Graphcoreの数値によると、より少ない範囲のワークロードで9~16%向上している。
GraphcoreのBow IPUは、AIトレーニングや推論を大規模に行うことを想定しており、非常に大規模なマルチチップシステムに組み合わせることが可能である。256チップのBowPod-256システムで89ペタフロップス、1024チップのBowPod-1024で350ペタフロップスを実現する。

WoWファクター:Graphcoreは、TSMCのWoW(Wafer-on-Wafer)技術の主要顧客である。
WoWチップは、プロセッサダイのウェハとパワーデリバリダイのウェハの2枚のウェハを貼り合わせたものである。パワーデリバリ・ウエハには、DRAMの情報保存に使われるようなディープトレンチ・キャパシタを搭載し、電荷リザーバとして、プロセッサ・ダイ上のトランジスタに超低インピーダンスで接続されている。
GraphcoreのCTOであるSimon Knowles氏は、同じプロセッサ設計および技術(TSMC 7nm)のプロセッサダイを使用しているにもかかわらず、「これにより、トランジスタは電力効率よく、より速く動作することができ、Bow IPUプロセッサのクロック速度向上という正味の効果が得られる」と述べている。

Micron SSDのレイテンシーQoSへの対応について
ハイパースケーラやデータセンタは、サービスレベル契約を実現するために、SSDに安定したレイテンシを期待している。
新しいソリッドステートドライブ(SSD)では、性能の向上、低レイテンシー、および大容量が重要な課題であるが、Micron Technologyの最新のエンタープライズ製品では、性能の一貫性も重視されている。
NVMeとPCIe Gen4を搭載したMicronの7450 SSDは、垂直統合型176層NANDを採用した初のエンタープライズSSDで、2ミリ秒(ms)以下のサービス品質(QoS)レイテンシを実現することを目指していると、Micronのデータセンター・ストレージ担当副社長兼ゼネラル・マネージャー Alvaro Toledo氏は述べている。これは、幅広い容量範囲とフォームファクタの選択肢を提供することに加えて、実現されるものである。また、このSSDは、PCIe Gen4がサーバーで最も広く採用されているSSDインタフェースになりつつある時期に発売されることになる。
Toledo氏は、一貫した信頼性の高いレイテンシは、データセンターのワークロード用にSSDを選択する顧客にとって重要な指標であり、スケールアウト環境におけるサービス品質(QoS)は、ハイパースケーラだけでなく、データベースを実行する従来のエンタープライズデータセンターでも特に重要であると述べている。どちらも、顧客と交わしたSLA(サービス・レベル・アグリーメント)を実現する必要がある。
Micronは、7450 SSDが、一般的な、混合、ランダムなワークロードにおいて、99.9999%のQoSで2ms以下のレイテンシを達成し、Oracle、MySQL、RocksDB、Microsoft SQL Serverなどの一般的なデータベースの性能を向上させるとしている。Toledo氏は、「すべてのデータベースはマルチスレッドであり、複数のキューが出て、結果を配信する前に最も遅い処理を待っていることになる」と述べている。
Micronの7450 SSDは、低レイテンシーでさまざまなワークロードに対応するだけでなく、U.3、M.2、E1.Sなど、進化するスペース、電力、熱のニーズに対応できる最も幅広いフォームファクターのセットによって柔軟性を実現している。また、400 GBから15.36 TBまでの幅広い容量の組み合わせがあり、コンパクトなE1.Sフォームファクターの8 TBを含めて、Toledoは、超大規模企業による大規模展開のニーズも反映している、と語っている。
一方、PCIe Gen4市場はこれからが本番で、「7450はそのタイミングに非常に適していると考えている」と述べている。
Micronは、15mmと7mmの両方の厚さのPCIe Gen4 U.3 SSDを提供している唯一の企業であり、2.5インチのNVMeドライブを必要とするプラットフォームに対して柔軟性を提供しているという。7450は、主にサーバーブート用途に設計されたPCIe Gen4 M.2 22×80mmSSDとしても提供されており、電力損失保護に対応している。
その他の特徴として、Micronの7450 SSDは、自己暗号化ドライブ機能を搭載し、さらに物理的に分離された専用のセキュリティ処理ハードウェアを提供することにより、データ保護を強化する同社のSEE(Micron Secure Execution Environment)も搭載している。また、この新しいSSDラインは、認定環境向けのOpen Compute Project(OCP)展開もサポートしている。
Micronは2020年末に、初の176層NANDの量産出荷を発表し、RG(Replacement Gate)技術を採用していることをアピールしている。フローティングゲートを排除してチャージトラップ方式を採用し、CMOSアンダーアレイアーキテクチャと組み合わせることで、性能と密度を大幅に向上させることができたのだという。また、リードレイテンシ、ライトレイテンシともに、同社の前世代の量産用3D NANDと比較して35%以上改善されている。

McLaren Appliedの急速充電器用800V SiCインバータ
McLaren Appliedは、高速充電、高効率、長距離走行を実現する800Vシリコンカーバイドインバータ、Inverter Platform Generation 5(IPG5)のフル生産に向けて前進している。このインバータは、高性能であると同時に繊細な部品であり、数百キロワットの電力を管理しながら、ドライバーの意向に合わせて細かく制御する。そのため、インバーターに不具合が生じると、電動化されたクルマにさまざまな問題が生じる。

McLaren Appliedは、F1マシンのインバーター技術を開発した。その技術を商用電気自動車向けに最適化しているところである。同社は現在、IPG5のサンプリングを行っているが、商業生産量に引き上げるのは2024年以降になる見込みである。
電動化担当責任者であるStephen Lambert氏は、「800Vは超高速充電への道を開くため、電気自動車用の事実上の標準バス電圧になる可能性がある」と述べている。

McLaren Appliedは、自動車、商用車、航空宇宙、船舶の各分野で高効率な電動化を支援している。電気自動車が従来の内燃機関と競合するためには充電時間の短縮が必要である。そのため、電気自動車の充電システムは、充電時間を20分未満に短縮するために最大350kW出力のパワーソリューションへと急速に移行している。このようなパワーに伴い、電圧と電流のレベルは、設計者を新たなエンジニアリングの課題へと導いている。
同社によると、OEMはIPG5によって、コストと持続可能性を維持しながら、より短い充電時間を期待することができるという。継続的な開発とテストのために、McLaren AppliedはOEMの顧客と密接に連携している。
IPG5は、2022年3月2日に英国のNational Motorcycle Museumで開催されたFuture Propulsion Conferenceで発表された。McLaren Appliedは、2024年に予定されている量産に先立ち、現在プロトタイプユニットを顧客に納入している。

SiCベースインバータ:
SiCはシリコンよりもバンドギャップが広い(3.2eV、シリコンの約3倍、1.1eVに等しい)のが特徴である。実用的には、半導体の伝導帯で価電子を励起するのに必要なエネルギーが大きいため、より高い耐圧、高効率、高温での熱安定性が実現できることを意味する。SiC MOSFETのドレイン-ソース間オン抵抗(RDS(on))は、同じ耐圧でシリコンデバイスの300倍から400倍まで低くなっている。
SiCは、従来のシリコン製パワーデバイスの限界を超えることができる。より高い動作電圧、電流、スイッチング周波数に耐えることができ、熱管理にも優れているため、車載用を含むさまざまなパワーアプリケーションにおいて、シリコンに代わる理想的な半導体といえる。電気自動車のトラクションインバータに使用されるSiCは、より長い航続距離とより効率的なドライブサイクル性能をサポートすることが確認されている。
IPG5」は、急速充電に対応した800VのSiCインバータで、パワートレイン効率97%(代表値)を実現する。IPG5は、最大350kW(ピーク時)、250kW(連続時)の電気モーターを駆動でき、重量は5.5kg、容積は3.79L。ダイレクトドライブを含む自動車用途に設計されており、モーターを高速で効率的に動作させ、ISO 26262 ASIL-D規格に準拠している。

eFPGA LUTは10年後にFPGA LUTを上回る
FPGAは戦略的な技術になった。かつては「ASIC」として、少量生産のアプリケーション向けにカスタマイズされたICを提供していた。今でも多くのシステムでこのように使用されているが、2つの非常に大きな高成長アプリケーションにとって戦略的に重要な存在となっている。

・ クラウドデータセンター:ネットワーキング、ストレージ、セキュリティ
・ 通信システム:基地局や5Gなど

実際、FPGAはデータセンターにとって戦略的であるため、IntelがAlteraを買収し、最近ではAMDがXilinxを買収する原因となった。これは、多くの場合、プロセッサーのワークロードがFPGAにシフトしているためである。
データセンターでは、プロセッサでは実現できない並列プログラマビリティ(ある顧客はこれを「ハードウェアの速度でプログラマビリティ」と呼んでいる)を提供するために、FPGAを大量に使用している。これらのFPGAは、NIC(ネットワークインターフェースチップ)やネットワークスイッチチップなどの専用機能ICと組み合わされる。データセンターはそれぞれワークロードやニーズが異なるため、すべてに対応する標準的な製品ではうまくいかず、それぞれのデータセンターがボリュームと資金を持って、ニーズに合わせて最適化することができるのである。
通信システムは長い間、何百もの国の周波数帯とプロトコルを処理するためにFPGAを使用してきた。現在5Gでは、O-RANのような複雑で進化する規格を管理するためにFPGAが使用されている。
FPGA のプログラマビリティは上記のように非常に価値があるが、FPGA の消費電力とサイズはまた別の話である。 そのため、今日、データセンターおよび通信会社は、FPGA を SoC に統合してサイズと電力を削減したいと考えている。

FPGAの統合はすでに始まっている:
Achronix、Flex Logix、Mentaなどの企業は、ほぼ10年にわたって組み込みFPGA(eFPGA)の機能を提供してきた。eFPGAは現在、180nmから7nmまでのプロセスノードで、1K LUTから>>100K LUTまでの容量で利用でき、今後1M LUTが加わる予定だ。また、DSPやBlock-RAMのオプションも用意されている。 以下は、業界全体で行われた採用の歴史の一部である。

・ 最初にeFPGAの採用を発表したのは、ニューメキシコ州にあるサンディア国立研究所の180nmファブであった。それ以来、eFPGAを使ったASICを数多く作っている。

・ その後、Boeing、AFRL(空軍研究所)、Microsoft、BAEなど多くの政府機関や下請け企業も、米国製の防衛システムでeFPGAを多用するようになった。その結果、eFPGAは現在、DODやDOEの技術として定着している。

・ 大同電信の子会社であるMorning Coreは、車間通信用のFinFet ASICにeFPGAを使用していることを発表した。

・ Dialogは、1K LUTから始まるeFPGAのForgeFPGAファミリーを、50セント以下のボリュームで、ミリワットだけ消費するように発表した。

・ Flex Logixは自社の16nm AI InferenceチップにeFPGAを使用しており、その性能は500MHzを超え、ソフトウェアの拡張により667MHz、800MHzへと向上している。

・ Socionextは、大手システム会社と共同で、10万個のLUTを持つプログラマブル・ロジックで、ワーストケースで500MHz以上動作するeFPGAを使用した7nm SoCを開発中である。これは5Gアプリケーションであり、大量のLUTを集積した初の量産通信チップとなる。

ハイパースケーラーと5G
5G対ハイパースケーラーという話もあるが、5Gネットワークとハイパースケーラーは相性が良い。
5Gの大規模マシン型通信(mMTC)機能セットにより、プライベートおよびパブリックネットワークは、1平方キロメートルあたり最大100万台のデバイスをサポートすることができる。これは、IoTやその他の接続デバイスが2025年までに年間約73ゼタバイトを生成するとIDCが予測する理由のほんの一例である。これらのデータはすべて、分析とアクションのためにどこかに移動する必要があり、そこでハイパースケーラの出番となる。IDCの定義によれば、10,000平方フィート以上の建物内に少なくとも5,000台のサーバーが設置されている。後者には、ハードウェアや面積の追加による水平方向の拡張と、既存のハードウェアを使用して帯域幅や効率を向上させる垂直方向の拡張が含まれる。IoT は電子工学のほぼすべての側面を変革しているが、5G はギガビット速度、超低遅延、mMTC 接続、ビームフォーミングによる超高密度化、およびその他の高度な機能によってこの傾向を加速させることになる。6Gでは、テラヘルツ帯の周波数、宇宙モノのインターネット、バイオ・ナノモノのインターネットなど、さらに高度な機能が提供され、そのすべてが世界最先端の人工知能(AI)エンジンによって制御されることになる。 しかし、これらの変革はすべて、ハイパースケール・コンピューティングなしには、その可能性を完全に発揮することはできない。5G の mMTC、拡張モバイルブロードバンド(eMBB)、超信頼低遅延通信(URLLC)機能セットと同様に、ハイパースケーラーには IoT の前例のないトラフィック負荷に対応するための独自の次世代技術がある。例えば、800Gレンジの光トランシーバは、データセンター間だけでなく、インテリジェントエッジコンピューティングセンター間のデータセンター相互接続(DCI)容量を2倍から4倍に拡大する。分散型エッジコンピューティングは、ユーザープレーンアプリケーションとネットワーク機能をIoTデバイスに近づけることでシステムのレイテンシーを削減するため、重要な鍵となる。また、高度なAIアナリティクスと自動化(アクションプレーンに近い)を実装するのに最適な場所でもある。

5Gとハイパースケーラによる新しいアプリケーションとユースケースの実現:
5Gネットワーク以降とハイパースケーラを組み合わせることで、旧来の技術では現実的でない、あるいは不可能なさまざまな次世代アプリケーションを実現できる。その例として、先進運転支援システム(ADAS)、Industry 4.0、無人データセンター、メタバース・アプリケーションなどが挙げられる。

・ ADAS:自動ブレーキ、死角検出、衝突回避システムなどの既存のアプリケーションを超え、他のソースとデータを交換することによって実現する。たとえば、車車間通信や車車間インフラ通信は、車道のがれきやブラックアイスをドライバーが見るよりもずっと前に警告し、安全性と交通の流れを向上させる。ハイパースケールインフラは、AIを使用して車両センサーから来るデータを分析し、近くにいるすべてのドライバー(人間または自律走行)に警告を発することができる。

・ Industry 4.0:mMTCなどの5G機能を活用して、産業用ロボット、自律型マテリアルハンドラー、過度の振動や熱などの状態を検知するセンサーなど、工場周辺の数万台のIoTノードをサポートし、予測保守を可能にする。5GのeMBBとURLLC機能は、それぞれ高帯域幅と低遅延を提供し、膨大な量のデータを分析およびアクションのためにプライベートエッジクラウドに迅速に取り込むことを支援する。

・  無人データセンター: 消灯型工場と同様に、次世代データセンター(特にエッジ部)は圧倒的に無人化が進むだろう。この新しいモデルは、独自の専用ネットワークスライスを持つデータセンターIoTバーティカルの開発を加速させるのに役立っている。これらのデータセンターでは、製造工場、港、小売センター、都市を再定義しているのと同じリアルタイムの5G IoTセンシングとリモートオートメーションが使用されることになる。

・ メタバースアプリケーション:Emergen Researchによると、世界のメタバース市場規模は2020年に476億9,000万ドルで、2028年には8,289億5,000万ドルに達すると同時に、2021年から2028年までの売上CAGRは43.3%を記録すると予測されている。このミニインターネットとAR/VRアプリケーションの意欲的な新時代は、超低遅延、超高密度化、デバイスあたりの数十ギガバイトの帯域幅、高速エッジコンピューティングとストレージに大きく依存することになる。エッジ・ハイパースケールの新たなフロンティアとなることだろう。

広がるチップの選択肢
2年近く経った今でも、パンデミックは多くの産業に影響を及ぼしている。新型コロナウィルスの最初の「自宅待機」の影響は、航空旅行、ホテル、娯楽、小売、そして製造業などの労働集約的な部門に及んだ。半導体製造は特に大きな打撃を受け、自動車業界を中心に半導体チップの不足がよく知られるようになった。2021年の調査では、チップ不足による自動車業界の逸失利益を2100億ドルと見積もっている。
半導体不足に対処し、成長を計画するために、米国の民間および将来の公的資本1,500億ドル以上が、半導体拡張に向けられ、コミットされ、そして計画されている。高価値のM&A取引やオファー、大企業や中小企業による縮小命令セットコンピューティング(RISC)アーキテクチャの採用、そして最も影響を受ける当事者による地政学的リスクやサプライチェーンのリスクを軽減するための推進により、半導体業界はかつてないほどダイナミックになっている。
デジタル化やモビリティといったマクロレベルのトレンドが業界のダイナミズムの多くを占める一方で、RISC の存在感と影響力が高まっていることも、業界の成長の可能性を高めている。ライセンス供与された命令セット(Arm やオープンソースの RISC-V など)により、バリューチェーン内のリソースと委託製造へのアクセスがあれば、誰でも Intel や Nvidia といった既存の大手企業と競争できるようになる。

RISCの出現: RISCベースのアーキテクチャは、重要な役割を担っている。RISCプラットフォームは、携帯電話や小型デバイスの家電ベンダーが、IntelやAMDのようなCISCベースのソリューションと比較して、価格、性能、エネルギー消費の面で魅力的な製品を提供することを長い間可能にしてきた。RISCベースのソリューションは、小型デバイスの起源を越えて、ますますサーバーに搭載され始めている。
RISCは、IntelがRISC-V企業を支援するために10億ドルの基金を立ち上げたことで、より明るいスポットライトを浴びるようになった。IntelはRISC-Vの足場を固め、製造委託先でRISCベースのソリューションをサポートすることでビジネス獲得のチャンスを広げるという、いささか必要な競争上の動きをしている。
世界の主要なハイテク企業は、すでにこの方向に動いている。Facebookは10年近く前からデータセンターにArmを採用している。2018年末には、AmazonはArmのサーバー・プロセッサー・ライセンスをベースに構築したAWSクラウド・サービス「Graviton」の提供を開始した。Microsoftは、サーバーで使用するためのArmベースの設計に取り組んでいると伝えられている。RISC-Vは、IntelによるSiFiveへの出資など、大企業からの出資も増えつつある。また、民間のベンチャー投資家も参加している。
また、RISCで設計しているのはPCやソフトウェア、クラウドプラットフォームの顧客だけではない。Intel、AMD、Nvidiaのような既存のファブおよびファブレス企業はすべて、RISC設計を活用して自社の製品を強化している。これらのベンダーは、ブランドや経済的な理由から自社独自のソリューションを好むかもしれない、RISCは様々な用途で利用されていることから、多くのベンダーがこのアーキテクチャを製品に組み込んでいることが分かる。ファブレス成長戦略と結びついたRISCベースのアーキテクチャの性能向上と採用は、既存のパートナーや顧客によるプロセッサベースの競争のハードルを下げつつある。
RISC採用の増加で恩恵を受けるのは、TSMCやSamsungなどの受託製造企業で、彼らは長い間、ファブとファブレスの両方の顧客に必要な数量を提供し、成功を収めてきた企業である。今日、これらの企業は、供給可能な数量を超える需要で滞留しています。Intelが2021年初めに発表したファウンドリ・サービスの意向は、シリコンバレーの巨大ハイテク企業が受託製造に好機を見出していることを示唆している。
マルチチップアーキテクチャと特殊用途ASICの開発により、業界はより専門的なワークロードに移行している。 既存企業と新興企業の両方が、ますますソリューション重視のマルチチップアーキテクチャを設計するに伴い、顧客はより多くの選択肢と価値を得ることになり、既存企業と新興企業は構築と成長期から恩恵を受けることになる。