Neuchipsが世界最高精度のレコメンデーションアクセラレータをテープアウト
台湾のスタートアップ企業Neuchipsは、データセンターのレコメンデーションモデル用に特別に設計されたAIアクセラレータをテープアウトした。このチップのエミュレーションによると、エネルギー1ジュールあたり100万件のDLRM推論(または20ワットのチップあたり1秒あたり2000万件の推論)を達成する市場で唯一のソリューションとなることが示唆されている。同社はすでに、同社のソフトウェアがFP32の99.97%の精度で世界最高水準のINT8 DLRM精度を達成できることを実証している。
Neuchipsは、2019年にFacebook(現Meta)がレコメンデーション推論のハードウェアアクセラレーションに取り組むよう業界に呼びかけたことに応えて設立された。台湾のスタートアップはまさにこれを目指しており、同社はレコメンデーションに特化して参入したわずか2社のスタートアップのうちの1社だ(もう1社は1000コアのRISC-V設計を持つエスペラント)。
NeuchipsのCEOであるYoun-Long Lin氏はEE Timesに対し、「多くの報告によると、データセンターにおけるAI推論サイクルのほとんどは、実際にはビジョンや言語ではなく、推薦モデル用である…だから我々は推薦が重要な市場だと考えている」と述べ、必要とされる推薦推論の数が着実に増えていることを付け加えた。また、「消費電力は決まっているので、予測精度を上げるためには、エネルギー予算内でできる限りのことをしなければならないというのが本質的な問題だ」と述べた。
予測精度は、オンラインショッピングなどの推薦アプリケーションにとって非常に重要であり、精度が落ちれば、オンラインショッピングプラットフォームにとっては、それに応じて収益が減少することを意味する。
Metaのオープンソース推薦モデルであるDLRM(深層学習推薦モデル)は、コンピュータビジョンに広く使われているCNNとはかなり異なる特徴を持っている。顧客の年齢や収入など連続的な値を持つ特徴は、多層パーセプトロン(MLP:ニューラルネットワークの一種)で抽出し、疎な特徴(はい・いいえの質問)は埋込みテーブルを使う。特徴量は数百個以上あり、埋め込みテーブルのサイズもギガバイトになることもある。これらの素性間の相互作用は、オンラインショッピングのプラットフォームでは、商品とユーザーの関係を示すことになる。これらの相互作用は明示的に計算される。DLRMはドット積を使う。そして、これらの相互作用は別のニューラルネットワークを経由する。
ニューラルネットワークの計算は計算量に縛られるかもしれないが、DLRMに必要な他の操作は、メモリ容量、メモリ帯域幅、または通信量に縛られるかもしれない。このため、DLRMは、画像処理などのアプリケーション向けに開発されたものを含め、汎用のAIアクセラレータで加速することが非常に難しいモデルとなっている。
NeuchipsのASICソリューションであるRecAccelには、埋め込み、行列の乗算、特徴の相互作用を加速するために特別に設計されたエンジンが搭載されている。
Neuchipsの組み込みエンジンは、斬新なキャッシュ設計とDRAMトラフィック最適化技術により、オフチップメモリへのアクセスを50%削減し、帯域幅の利用率を30%向上させたという。
推薦モデルによって、特徴量の相互作用に使う演算は異なる。DLRMはドット積を使うが、他にもあり、Neuchipsの特徴量相互作用エンジンは、このような柔軟性をサポートしているとのこと。
このチップには10個の演算エンジンがあり、エンジンごとに16KのMACを搭載している。
「ここで重要なのは、この演算エンジンをいかに低消費電力で実装し、疎な行列を効率的に扱えるようにするかということだ」とLin氏は言う。演算エンジンは、SoCレベルで1回の推論に1マイクロジュールを消費する。 また、ハードウェアの機能として、ある一定の精度に達した時点で計算を終了させ、電力を節約することも可能だと林氏は付け加えた。
自動車産業を超えたSiCの可能性
炭化ケイ素(SiC)は、スイッチング周波数が高く、接合部温度が高いため、自動車産業において従来のSi IGBTデバイスの後継として知られるようになった。さらに、この5年間は、自動車産業がSiCベースのインバータの公開実験場として観察されている。SiC コンバータによる DC から AC への基本的な変換は、シリコン(Si)コンバータよりも小型、軽量、高効率であることが証明されており、ワイドバンドギャップデバイスの可能性は自動車産業で大幅に拡大すると思われる。
しかし、電動化の課題は、自動車に始まり、自動車に終わるものではない。トラックやバス、船舶や海運、鉄道のさらなる電化、さらには航空機など、より広範な輸送機関への応用が間もなく視野に入ってくるだろう。供給側では、グリッド接続された太陽光発電システムと高電圧直流(HVDC)リンクによるエネルギー輸送が、低炭素エネルギーの生成と分配に不可欠となる。
これらのアプリケーションに共通するテーマは、より高いシステム電圧、ひいてはより高電圧のパワーデバイスの潜在的な役割である。電気自動車(EV)では、400Vから800Vへの電圧シフトの利点は、主に充電速度が速くなることであり、太陽光発電用インバーターでは、1000Vから1500Vへの移行が進み、PVストリング、インバーター、ケーブル、DCジャンクションボックスの数が減少し、効率とコスト削減が実現されている。公称電圧が数百キロボルトのギガワット HVDC 設備では、個々のデバイスの定格が高いほど、マルチレベルスタックに必要なデバイスの数が減り、メンテナンスと全体のシステムサイズを削減することができるのである。
SiCパワーデバイスは、これらの各分野で重要な役割を果たす可能性がある。しかし、現在市販されているSiCデバイスは、650Vから1,200Vまでと非常に範囲が狭く、1,700Vのデバイスも散見される程度である。技術的には3,300Vにも手が届きそうだが、この電圧レベルのデバイスを供給しているのはGeneSiCとMicrochipだけとなっている。
このように、車載機器向けの賞品に特化していることは、もちろん理解できる。この業界の市場シェアを獲得するために、各社は生産能力の増強、200mmウェハーの採用、歩留まりの向上などにしのぎを削っている。これでは、相対的に小さい高電圧市場を開拓するために必要な、多大な研究開発の余地がなくなってしまう。
ありがたいことに、研究部門は熱心に取り組んでおり、高電圧でのSiC技術の数多くのデモ機が設計、製造、試用され、SiCスーパージャンクション(SJ)MOSFET、IGBT、サイリスタがこれらの高電圧アプリケーションに与える影響についてよく理解できるようになった。
TSMCが新しい3nmノードの設計オプションを作成
Taiwan Semiconductor Manufacturing Co. (TSMC) は、今年後半に立ち上がる予定の 3nm FinFET ノードのバージョンを作成し、チップ設計者が性能、電力効率、およびトランジスタ密度の強化、あるいはこれらのオプションのバランスを選択できるようにした。
2022 年後半に生産を開始する TSMC の 3nm 技術は、性能を重視した 3-2 フィン構成のスタンダード セル、電力効率とトランジスタ密度を重視した 2-1 フィン構成、または効率的な性能を重視した 2-2 フィン構成から選択できる同社の FinFlex アーキテクチャを特徴としている。
この新しいアーキテクチャにより、顧客は、性能、消費電力、ダイサイズの目標を達成するために、さまざまなフィン配置を実装した機能ブロックからSoCデザインを作成することができる。
SamsungやIntelなどのライバルがプロセス技術のリーダーシップを目指している中で、同社は、新しい3nmノードの立ち上げ時にさまざまな選択肢を提供することで、このギャップを埋めようとしている。
市場調査会社Gartnerによると、TSMCは先進の7nmと5nmノードで90%のビジネスを獲得している。 TSMCは、同社の3nmプロセス技術は、フィン構成の組み合わせを可能にするために設計されたと述べている。
TSMCのグローバルマーケティング責任者であるGodfrey Cheng氏は、「EDAパートナーと密接に協力することで、顧客が同じツールセットを使用して、TSMC FinFlexを製品に最大限に活用できるようにする」と述べている。
Cheng氏によれば、チップ設計者の最近のトレンドの1つはハイブリッドCPUであり、新しいCPUは、高性能なコアと電力効率に優れたコア、そしてGPUコアと固定機能ブロックを備えている。電力効率の高いCPUコアは、日常的なワークロードのほとんどを処理する。作業負荷が増加すると、高性能コアが作動する。これらのCPUコアを補完するのは、超高効率・超高密度のGPUと固定機能ブロックである。
TSMC FinFlexを使えば、製品設計者は、これらの機能ブロックごとに、他のブロックに影響を与えることなく、すべて同じダイ上でフィン構成を最適化することができる、とCheng氏は言う。
先週の技術シンポジウムでTSMCは、エッジAIやIoTデバイス向けに演算能力とエネルギー効率の向上を図るプロセス技術、N6eを開発中であることも発表した。N6eは、TSMCの7nmプロセスをベースに開発される予定だという。
大手ファウンドリが先端ノードで異種混載を採用するのに伴い、パッケージング技術の重要性が高まっている。
今回のシンポジウムでは、SRAMをレベル3キャッシュとして積層するCoW(Chip On Wafer)技術を採用した世界初のSoIC搭載CPUなど、SoICチップスタック技術を紹介した。
また、WoW(Wafer-on-Wafer)技術により、ディープトレンチキャパシタダイの上にインテリジェンスプロセッシングユニットをスタックする詳細も発表された。
CoWとWoWの両方で7nmチップを生産しているTSMCは、2023年から5nm用のパッケージング技術を提供すると述べている。SoICやその他のTSMC 3DFabricシステム統合サービスの需要に対応するため、2022年後半に世界初の完全自動化3DFabric工場からの生産を開始するとしている。
MicronがLPDDR5 DRAMで自動運転レベル5を目指す
Micronは、同社のLPDDR5メモリが、自動車の安全性に関する最も厳しい安全度水準とされるISO 26262に基づくASIL(Automotive Safety Integrity Level)Dの認定を受けたことを発表した。
MicronのAutomotive Systems Architecture and Segment MarketingのシニアディレクターであるRobert Bielby氏は、インタビューで、ISO 26262規格は現在、メモリにASIL準拠を明確に求めてはいないが、自動車の安全アプリケーションにとってメモリの重要性が増すにつれ、この認定を取得することは意味があると述べている。
この業界初の認証とMicron独自のオンチップ安全機能アーキテクチャを組み合わせることで、自動車メーカーがリスクを軽減するための新たな仕組みを組み込む必要性を大幅に減らすとともに、システム設計の簡素化と市場への迅速な投入を可能にする、と述べている。自動車用電子機器にとって、機能安全性と過酷な環境下での信頼性は重要な要件である。
また、ISO 26262は、現代の自動車におけるメモリとストレージの役割の変化を認識したもので、完全な自律走行型でない自動車にも適用できるとBielby氏は説明する。
Micronは、オートメーションシステムの安全性を専門とする製品認証・ナレッジ企業であるExidaと、車載用メモリの認証で協業している。Bielby氏によると、クラス3デバイスであるDRAMは、機能安全管理に関して複雑であることが判明しており、これにはメーカーに一定の仕様に対応した設計を要求するシステム障害補償が含まれている。
Micronは、最も厳しいASIL Dに準拠するようにDDR5 DRAMを設計した。
同社はメモリが故障する可能性のあるモードについて理解しており、エラー訂正コード(ECC)に伴うオーバーヘッドの必要性を減らすことができるとBielbyは述べている。
設計者がすべてをECCでカプセル化する必要がないため、オーバーヘッドを排除することでパフォーマンスを向上させることもできる。これにより、大量のコンピューティングパフォーマンスを回復でき、SoCを解放してより多くのAI演算を実行できるようになる。
現状では、ほとんどの車両がレベル3の自律性にしか達しておらず、現在のアンチロックブレーキシステムでさえ、電子部品と信頼性の高いデータに依存しているため、メモリに依存するようになっているとBielbyは述べている。
グラフェン太陽電池の実用化について
グラフェンは、いくつかのハイテク分野への応用が期待されているが、今のところ商業的に進出したのはいくつかの分野のみである。そのひとつが、太陽電池である。
太陽電池は、グラフェンが持つさまざまな特性を有効に活用できる分野であり、その可能性は大きい。ここ数年、いくつかの商用製品が市場に投入されており、今年は海洋分野をターゲットにした最新のものが登場した。
グラフェン太陽電池の商業的魅力 :
グラフェンは、高い柔軟性と引張強度、高い電気伝導度と電荷キャリア移動度、高い熱安定性、ほぼ100%の光学透過性、ドーピング能力など、さまざまな有益な特性を有している。
また、通常ゼロバンドギャップ材料(完全に導電性)であるが、半導電性の誘導体も存在する。純粋なグラフェンシートは、さまざまな原子をドープして半導体材料とすることも可能で、太陽光発電接合での使用に適している。
しかし、グラフェンの利用は、接合部だけにとどまらない。グラフェンが最も広く利用され、かつ最も商業的な可能性を秘めているのは、グラフェンの導電性を利用して、酸化インジウムスズに代わる太陽電池用透明電極として利用することである。また、グラフェンを無反射コーティングとして使用することで、他の種類の太陽電池の光吸収性を向上させることも可能である。
グラフェンが示す電気的特性だけでなく、構造的特性も商業的な観点から興味深いものであり、これを利用して製品化された太陽電池もある。グラフェンを用いた太陽電池は、製造時の熱応力が小さくなるため、通常の太陽電池に比べてマイクロクラックの発生が少なくなる傾向がある。
また、グラフェンの機械的特性や安定性は、従来の材料と比較して、使用後の太陽電池の劣化や寿命が短く、長期的なコストパフォーマンスに優れていることを意味している。
グラフェンは、そのさまざまな特性とともに、調整・カスタマイズが可能であるため、学術・産業の両レベルで、さまざまな用途に適した太陽電池を作り出すことができる。また、グラフェン固有の薄さと柔軟性は、より柔軟で印刷可能な透明太陽電池への道を開いている。
このような太陽電池は、まだ学術レベルで見られることが多いが、グラフェンを利用した太陽電池はすでに市場に投入されているものもあり、現在大規模な試験運用が行われているものもある。
グラフェン太陽電池の実用化に向けて:
グラフェン太陽電池の商業的な開発は、まだ学術的な研究室にとどまっているか、あるいはまだ試験的な段階には至っていない。しかし、ここ数年の間に、グラフェン太陽電池が実際の用途に使用されるに至った注目すべき商業的な進展がいくつかあった。
最初の注目すべき商業的発展は、2018年に中国の老舗企業ZNShineが、インド最大の発電設備メーカーBharat Heavy Electricals Limitedと直接協力して、インドの太陽電池ファームに蓄積される埃の問題に取り組んだことであった。
ZNShineの太陽電池の場合、グラフェンは太陽に面したパネルの上のコーティングに使用され、光性能の向上と、表面をセルフクリーニングにすることで、埃の多い環境でも定期的かつ大規模なメンテナンスが必要ないようにするためのものです。ZNShineはその後、さまざまな太陽電池デバイスを市場に送り出しましたが、いずれもグラフェン・コーティングを使用して太陽電池技術の電力変換効率を向上させています。
ここ数年で2番目に大きな進展は、Freevoltがグラフェン太陽電池を住宅用として市場に投入したことで、この太陽電池技術の権利は、S2Aモジュラーが自立型住宅に使用するために買い取ったものでもある。
この太陽電池は、グラフェンを電池の上に透明電極として利用することで、グラフェンの持つ優れた導電性(効率の向上)だけでなく、構造的な特性も生かすことができる。また、表面近傍に集積することで、太陽電池の表面劣化を最小限に抑え、熱などの外部環境による影響を低減し、太陽電池の寿命を向上させることができる。
InfineonがFRAMを宇宙へ
宇宙では電力が貴重であるため、強誘電体RAM(FRAM)は惑星外のアプリケーションにとって理想的なメモリとなる。動作中のエネルギー消費だけでなく、デバイスがプログラムされるときにも重要であり、これは、Infineon Technologiesの極限環境用最新シリアルインターフェース(FRAM)の主要機能となっている。
電力の考慮事項とは別に、放射線被曝も宇宙へ行くメモリ・デバイスの重要な課題の1つである。Infineonは、同社のQML-V認定FRAMが宇宙業界初の耐放射線性FRAMであると主張している。
Infineon Technologiesの航空宇宙・防衛担当副社長Helmut Puchner氏はEE Timesとのインタビューで、同社の最新の耐放射線FRAMデバイスは、不揮発性EEPROMやシリアルNORフラッシュデバイスなどの宇宙アプリケーション用の代替品よりも低い電力要件で優れた書き込み能力を備えていると述べている。また、この新しいFRAMは、部品点数が少なく、性能が向上し、信頼性に妥協のないシステム設計をサポートするという。
シリアル・ペリフェラル・インターフェース(SPI)を備えた2メガバイト密度のデバイスは、ウェアレベリングがなくほぼ無限の耐久性を持ち、宇宙用アプリケーションで100年以上のデータ保持が可能である。また、動作電圧範囲は2.0V~3.6Vで、85℃において10兆回の読み出し/書き込みサイクルと120年のデータ保持を誇るという。最低動作電流は最大10mAで、プログラミング電圧は2Vと極めて低い。
FRAMのデータ保持特性は、宇宙ベースのアプリケーションにとっても魅力的で、ミッションクリティカルなデータのデータロギング、テレメトリーストレージ、コマンド&コントロール校正データのストレージなどが含まれる。
衛星の寿命は25年に及ぶ可能性があるため、メモリ・デバイスは大幅な摩耗や電力消費なしに頻繁に更新される必要がる。新しいInfineon FRAMのその他の用途としては、マイクロコントローラ、FPGA、およびASICのブートコードストレージソリューションがある。
商業フライトの打ち上げが増え、宇宙向けメモリの市場が拡大しているとはいえ、メモリ全体の売り上げに占める割合はまだ比較的小さいとPuchner氏は指摘する。しかし、地上波用メモリには、-55℃から125℃までの軍用規格の温度グレードを必要とする航空電子機器などの用途がある。
実は、この新しいFRAMデバイスは、もともと商業用産業用車載アプリケーションを想定して設計されたものだという。
FRAMは数十年前から存在する新興メモリの一つで、不揮発性、低消費電力、低スイッチングエネルギー(プログラム時に必要なエネルギーが非常に小さい)などから、今もなお関心を集めている。また、その固有の信頼性は、空気がなく、予測不可能な過酷な環境下でメモリが予測可能な動作をすることを重視する宇宙用アプリケーションにとって重要である。