FTCがNvidiaとArmの取引を阻止
米国連邦取引委員会(FTC)は、NvidiaによるArmの買収を競争上の理由で阻止するために訴訟を起こす意向であると発表した。FTCは、この買収によってNvidiaがライバル企業が自社の競合チップを開発する際に頼りにしている技術や設計に対する支配力が強くなりすぎると指摘している。欧州委員会は、この組み合わせは、市場のイノベーションを阻害する手段と動機の両方を持つことになると考えているという。
Nvidiaが提案しているArmの買収は、2020年夏に買収が保留されているという噂が流れ始めたときから懸念されていた。反対運動はずっと続いていたが、最近になってまとまってきたようだ。2週間前、英国は、競争と国家安全保障の両方に対する懸念から、この取引に対する調査を拡大した。また、米国連邦取引委員会(FTC)がこの取引について懸念を表明し始めたのも2週間前のことである。
Nvidiaは、このような状況下でも戦い続け、Armの買収を継続する意向を示した。FTCに対して、同社は、「FTCのプロセスの次のステップに進むにあたり、我々は、この取引が業界に利益をもたらし、競争を促進するものであることを示す努力を続ける。― Armの研究開発に投資し、ロードマップを加速させ、競争を促進し、すべてのArmライセンシーに多くの機会を与え、エコシステムを拡大する方法で、Armの提供製品を拡大していく。NVIDIAは、Armのオープンなライセンスモデルを維持し、現在および将来のすべてのライセンシーがそのIPを利用できるようにすることを約束する」との声明を発表している。
一方、この取引は、中国の承認を待っている。中国がNXPとQualcommの合併を、承認プロセスへの参加を拒否するだけで見殺しにしたことを思い出す。NvidiaによるArmの買収に関する中国の判断は、国際的な貿易紛争、国際的な政治的緊張、そしてArmの中国における合弁会社での奇妙な武勇伝によって、さらに複雑なものとなっている。Armは、合弁会社のCEOであるAllen Wu氏を解任しようとしたが、Wu氏は事業を物理的にコントロールし、Armからの指示に今も抵抗している。
Tirias Researchの主席アナリストであるJim McGregor氏は、FTCがNvidiaとArmとの間で係争中の取引を検討している最中であるという点で、FTCのタイミングに驚いていると述べている。手続き上、FTCは審査が完了するまで訴訟を起こすことができないかもしれない。
Nvidiaが買収の完了に二の足を踏むことについて、McGregor氏は、「(NvidiaのCEOである)Huang氏は引き下がることを考えていない。彼は非常に強い意志を持っており、それがNvidiaの現状を支えている」と述べている。
Nvidiaは、2020年9月にSoftbankからArmを買収する意向を発表した。当時、このオファーは400億ドルの価値があった。ある試算では、その後の株式価値の変化を考慮すると、この買収は現在540億ドルもの価値があると考えられている。いずれにしても、この買収はビジネス史上最大の買収となるだろう。
この買収のニュースは、すぐに一部のArmライセンシーの間で、NvidiaがArmの運営をコントロールしすぎるのではないかという懸念を引き起こした。Nvidiaは、FTCが主張するように、Nvidiaの競合他社にとって重要な技術的手段を重視しなくなったり、あるいは閉鎖したりする可能性があり、イノベーションを阻害することになる。また、競争力のある情報がArmを経由してNvidiaに流れてしまうことも懸念されている。
SiFiveが64ビットRISC-Vサーバーコアを発表
SiFiveが発表したRISC-Vプロセッサコア「Performance P650」は、複数のプロセッサコアの大規模なアレイを必要とするハイエンドサーバなどのアプリケーションを対象としている。
P650プロセッサコアは、64ビットのRISC-Vアーキテクチャを実装しており、アウトオブオーダー・パイプラインと高度な分岐予測機能を備えている。この新しいRISC-Vプロセッサコアは、SiFiveが発表したPerformance P550プロセッサコアの数ヶ月後に登場する。
P650は、ハイエンド・サーバー・プロセッサーの領域に位置する2つの特性を備えている。まず、SiFive社はプロセッサ・アーキテクチャの性能を向上させており、3つの実行ユニットに4ワイドの命令ディスパッチ(P550コアの3ワイドディスパッチから増加)を採用している。性能面では、P650コアが13段のロード/ストアパイプラインと、10段の独立した整数実行パイプラインを備えている。
SiFiveは公式発表でこのコアの浮動小数点機能については口を閉ざしていたが、10月に開催された「Linley Processor Forum」でPerformance P550コアの説明を行った際、次の次世代プロセッサコアを予告する2枚のスライドを提示した。そのうちの1枚は、次世代プロセッサコアが64ビットの倍精度FPUとビット操作の拡張機能を搭載することを明かしている。
P650は、サーバープロセッサーとしての用途を考慮して、RISC-Vの “H “ハイパーバイザー命令拡張を実装し、仮想ソフトウェア環境をサポートしている。また、P650コアは、P550コアよりも高度なプロセス技術で実装されるように設計されている。SiFiveでは、対象となるプロセスノードと、アーキテクチャやその他の設計上の改善を組み合わせることで、P650コアはP550コアに比べて50%の性能向上を実現しているとしている。
SiFiveがP650プロセッサ・コアに採用した、高性能サーバーに求められる2つ目の特性は、クラスタあたり4〜16個のプロセッサ・コアを持つ、スケーラブルでコヒーレントなマルチコア・プロセッサ・クラスタを実装する能力である。P650プロセッサコアは、最大128KバイトのL1命令キャッシュとデータキャッシュ、および2つのバンクに分割されたL2キャッシュをそれぞれ備えている。
SiFiveは、Performance P 650コアのL2キャッシュの最大サイズを公表していないが、初期のP550コアのL2キャッシュは256Kバイトにもなる。これは、P650コアのL1キャッシュに比べてそれほど大きくないため、新コアのL2キャッシュの最大サイズは多少大きくなると予想するのが妥当だろう。
実際、SiFiveの次世代コアのプレビュースライドでは、L2キャッシュが最大2Mバイトになる可能性があることが示されている。また、P650プロセッサのコア群は、コアごとに最大1MバイトのL3キャッシュを共有することができる。おそらく、16個のプロセッサーコアがあれば、16MBのL3キャッシュを共有できることになるだろう。
以前のP550コアの設計では、L3キャッシュへのマルチポート・アクセスを共有することで、マルチコア・クラスターを実現していた。4つのPerformance P550コアが1つのL3キャッシュを共有する。パフォーマンスP650コアでは、クラスタリングを実現するために、まだ公表されていないコヒーレント・インターコネクトを使用するが、SiFiveの発表では、その詳細として “クリーンでコヒーレントなNoCインターフェイス “が挙げられている。
SiFiveのプレビューでは、4つのP650コアのクラスタに同様のマルチポートキャッシュの構成が示されており、2つ目の次世代プレビューでは、4つの4コアのクラスタがネットワークオンチップで接続されている。
SiFiveでは、コヒーレント・クラスタリングの仕組みに加えて、プラットフォームレベルのメモリ管理や割り込み制御ユニットなど、マルチコアのP650プロセッサ・クラスタのためのシステム・ハードウェア機能を設計しており、十分な機能を備えたサーバー・プロセッサ・クラスタの実装に必要となる。また、SiFiveは、「高度なセキュリティと暗号機能」についても言及しているが、詳細は明らかにしていない。
MLPerfのトレーニングスコア:Microsoftが最速のクラウドAIを実証
MLPerf AIトレーニングベンチマークの最新ラウンドにおいて、Microsoft Azureは、Nvidia搭載の大規模インスタンスを使用して、世界最速のAI用クラウドを実証した。AzureのNDm A110 v4シリーズの仮想マシンは、最大2,048台のNvidia A100-80GB GPUでベンチマークを実行し、各ベンチマークを18分以内に完了した。Nvidiaは、最大4,320個のA100アクセラレータを搭載したシステムで、クローズド部門の8つのベンチマークワークロードのうち7つのワークロードでリードした。Microsoft Azureは、Nvidiaを搭載したクラウド・インスタンスにより、8つのカテゴリー(医療用画像処理)でトップとなった。また、GraphcoreとHabana Labsは、ResNet-50とBERTベンチマークで改善された結果を提出した。
Microsoft Azure:MicrosoftのAzureが提出したMLPerfは、世界のトップ100スパコンの中で10位に、またNvidiaの自社製AIスパコン「Selene」は約2倍の規模で、現在6位にランクインしている。
Azureの仮想マシン「NDm A110 v4」シリーズは、必要に応じて1台から256台以上の仮想マシン、または8個から2,048個のGPUへの拡張性を備えている。Azureクラウドで使用された2,048個のGPUは、BERT自然言語処理モデル全体をわずか25秒強で学習できることを実証した。最も困難なベンチマークであるMiniGoは、1,792個のGPUを使用して17.5分未満で学習された。Azureは、3次元の医療画像に使用される3D Unetベンチマークにおいて、768個のGPUを使用して1.262分で学習を完了した(Nvidia社の768個のGPUを使用した3D Unetの結果は1.373分)。
Nvidia:Nvidiaは、大規模なAIトレーニングに対する同社の能力を示すために提出した。
Nvidiaのアクセラレーテッド・コンピューティング製品管理担当シニア・ディレクターのParesh Kharya氏は、「大規模なクラスターへのスケーリングは、AIをトレーニングする上で本当に難しい部分であり、NvidiaのAIプラットフォームが非常に大きな強みを持っている部分でもある」とし、「すべてがボトルネックになってしまうので、スケーリングは本当に重要で、これは非常に難しい問題である。作業の分散、作業の調整、データの移動など、すべてがボトルネックになる」と述べている。
巨大で最先端のモデルのトレーニングは、Selene上でも数ヶ月かかるとKharya氏は言い、最先端のAIモデルを進化させるにはスケールが必要であると付け加えた。
また、AIプロジェクトを迅速に反復する能力が不可欠であるため、スケールも重要であるという。さらに、「よくある誤解のひとつに、モデルのトレーニングのための “投資収益率 “にインフラのコストだけを使うというものがある」と付け加えた。ユーザーは、「インフラのコストだけでなく、高価なデータサイエンスチームの生産性や、最終的には自社製品や製品のアップデートを競合他社よりも早く市場に投入するための時間も気にしている」とのこと。
Seleneで実行されたベンチマークは、今回のラウンドで最大のシステムである4,320個のGPUにまでスケールアップした。Nvidiaによると、この結果は、Graphcoreの最速システム(256アクセラレータ)と比較して30倍、Habana Labsの最大システム(同じく256アクセラレータ)の結果と比較して53倍の速度を示している。
また、アクセラレータ1基あたりの性能では、GraphcoreおよびHabana Labsのアクセラレータに勝利したが、Google TPU v4のResNet-50スコア(前回のトレーニングベンチマーク)には及ばなかったとしている。また、Nvidiaは着実にスコアを伸ばしていることにも注目している。A100が導入された2020年7月のMLPerfトレーニングのスコアと比較すると、Nvidia A100ベースのシステムは、スケールでは5倍、チップレベルでは2倍の性能を発揮している。
ソフトウェアの変更が性能向上の要因となっており、一連のカーネルをシリアルではなく同時に起動することでCPUのボトルネックを軽減するCUDAグラフなどが挙げられる。CUDAグラフは、一連のカーネルを直列ではなく同時に起動することで、CPUのボトルネックを軽減し、GPU上でトレーニングの繰り返しを行うことができる。CUDAストリームは、計算と通信を細かくオーバーラップさせることで、並列性を向上させた。
NvidiaのNCCLおよびSHARP技術は、マルチGPUおよびマルチノード処理を改善するために使用され、NCCLは、利用可能な帯域幅とネットワークのレイテンシーに基づいてデータの集約を最適化し、SHARPは、CPUの処理をスイッチにオフロードすることで、異なるエンドポイントやサーバー間でデータを何度も送信する必要がなくなり、パフォーマンスが向上する。また、MXネットワークの実装を刷新し、連結や分割などの操作におけるメモリコピーの効率を向上させている。
ウエハー生産量の増加がグローバルファウンドリーズの収益を牽引
GlobalFoundriesは、9月30日に発表した第3四半期の決算において、売上高が5%増の17億ドル、年間売上高が56%増となった。
世界的なチップ不足にもかかわらず、GlobalFoundriesは9月30日までの第3四半期に500万ドルの純利益を計上し、前年同期には2億9,300万ドルの純損失を計上していたが、再び黒字に転換した。また、アナリスト予想の1株当たり利益も0.00ドルを上回り、調整後のEPSは0.07ドルとなった。
CEOのThomas Caulfield氏は、「当社の売上高の増加は、主にウエハー生産量の増加と、当社の差別化されたソリューションが事業全体の中で大きな割合を占めるようになったことによる継続的なミックスの改善によるもで、同社の総売上高の約92%は、ウェハ出力に由来するものである」と述べた。
しかし、GlobalFoundriesは、半導体のサプライチェーンの問題と無縁ではない。10月に行われた上場後初の決算説明会で、Caulfield氏は需要と供給の問題が続いていることを認めている。また、アナリストとの決算説明会で、「2022年に当社の主要顧客に供給できる製品がまだ不足している」と述べた。
それでも、GlobalFoundriesは、第4四半期の売上高を18億ドルから18億3,000万ドル、EPSを0.02ドルから0.06ドルと予測している。
GlobalFoundriesは10月28日に上場し、当初47ドルで5500万株の普通株を発行した。この株式(NASDAQ: GFS)は、1株あたり73.25ドルの最高値をつけた後、11月30日に69.24ドルで終了した。
生産能力の拡大:GlobalFoundriesは、今後も生産能力の拡大を継続する予定であると述べている。同社は今期、世界の設備容量が約4%増加すると予想しており、これは前年同期比で12%の増加となった。また、ドイツ・ドレスデンにある同社のFab 1では、今期の生産量を16%増加させる予定だ(前年同期比15%増)。これは、22FDX、20nm ISP、およびBiCMOS技術に対する顧客の需要の高まりに対応するための拡張である。
GlobalFoundriesは、需要の急増や供給のボトルネックに対応するため、今年60億ドルを投じてチップ生産を拡大する予定で、打撃を受けた自動車分野をターゲットにしている。
11月18日には 11月18日、GlobalFoundriesとFordは、カーエレクトロニクスを進化させながら、半導体製造を促進するための協力関係を発表した。このパートナーシップは、Fordをはじめとする米国の自動車メーカーへのチップ供給を強化するものである。
GlobalFoundriesは、半導体製造に関する研究を開始し、当初は現在のチップ危機に対応し、最終的にはFordの車両ラインナップのADASやバッテリー管理などの分野でチップ製造を強化することを目指す。これにより、ADASやバッテリーマネジメントシステムの改良とチップ供給の増加が期待できる。
しかし、今回の提携とチップの在庫構築への注力は、将来的にチップメーカーのキャパシティ問題を引き起こす可能性があると指摘されている。
アナリストのRich Smith氏は、「The Motley Fool」に掲載された記事の中で、「一方で、Fordとの提携は今日のチップ不足に対するGlobalFoundriesの解決策が、2年後にはチップの供給過剰を引き起こすというリスクを生み出しているように思える」と指摘している。
米国国防総省がマルチクラウド化へ移行
ベンダーロックインを回避するために、「マルチクラウド」戦略を採用する大企業が増えている。米国防総省も、長年にわたる法律上の駆け引きや調達上のトラブルを経て、ようやく同様のアプローチに落ち着き、広大な企業を21世紀に引きずり出そうとしている。
国防総省は、7月に不運なクラウドの調達を終了し、その代わりにJWCC(Joint Warfighting Cloud Capability)という新しいブランドを導入した。今月初めには、数十億ドル規模のクラウド競争を繰り広げてきたAmazon Web Services(AWS)とMicrosoftにクラウド契約を発注する計画を発表した。
調達担当者は、AWSとMicrosoftがあらゆるレベルの国家安全保障分類でクラウドサービスを提供することを含め、現時点で国防総省のすべての要件を満たす能力があると思われる、と結論づけている。これには、機密からトップシークレットまでのクラウドベースのデータを保護する能力が含まれている。
国防総省は、マルチクラウド戦略を推進するために、JWCCの連絡先として、競合他社であるGoogleとOracleにも入札を依頼すると発表した。廃止されたJEDI(Joint Enterprise Defense Infrastructure)プログラムに早くから参加していたIBMは、今回の国防総省のクラウド競争には目立って参加していない。
今のところ、調達担当者はクラウドサービスの予備契約をAWSとMicrosoftに授与すると述べているが、Microsoftは諜報活動などの区分けされたデータを扱うことができると認定されたAzureクラウドサービスを提供している。クラウドの大手であるAWSは、すでに米国の情報機関にITサービスを提供しており、政府のクラウドサービスを提供する上で有利な立場にある。
今回、AWSとMicrosoftが獲得した初期契約は、3年間の契約に加えて、12ヶ月のオプションが2回付いている。この期間があれば、IT管理者は、避けられない法的問題に備えながら、マルチクラウド戦略を立ち上げるのに十分な時間を確保することができる。
最終的には、4社のクラウドサービスプロバイダーすべてが、国防総省の数十億ドル規模のクラウド契約の一部を手に入れることができるだろう。しかし、国防総省の関係者は、ウェブサイト「Nextgov.com」に対し、国防総省が入札を募集したからといって、各企業が受注できるとは限らないと語っている。
いずれにしても、11月19日に発表されたクラウド契約の募集要項の改訂は、100億ドル規模のJEDIの受注競争が長引き、政治的にも大きな問題となった後の、調達担当者による根本的な転換を意味している。
国防総省のクラウド契約は当初、2022年春に締結される予定でした。今回の調達方針の変更により、契約の締結は来年後半にずれ込むことになる。米国に拠点を置くハイパースケールクラウドサービスプロバイダー5社の能力を評価したと強調する国防総省の担当者は、今回はデューデリジェンスを行ったと主張している。
ストリーミングオーディオ
車は、オーディオメーカーにとって新たなフロンティアのようだ。もちろん、カーオーディオは今に始まったことではない。私も昔、CD用にアフターマーケットで素晴らしいサウンドシステムを購入したことがある。しかし、ストリーミングオーディオは、道路で聴く音楽に2020年代的な変化をもたらしており、多くの企業が参入を希望している。
Audiは5月、今年の新型電気自動車「Q4 e-tron」にSonosを搭載すると発表した。EVでは、「自然でありのままの音に忠実でありながら、新しいHi-Fiパートナーシップを活用する」としてる。Audiは、ミッドサイズとフルサイズのモデルには音のパターンが鮮やかなBang & Olufsenを残しつつ、若い人向けには、低音が効いたサウンドの新しいオーディオパートナーSonosを導入した。しかし、Audiによれば、Sonosブランドは「新型コンパクトSUVにぴったり」であり、自動車メーカーの「電気の未来」への参入でもあるという。
一方、Amazonは昨年春、Amazon Musicの新しい車用機能として、ドライバーが車のBluetoothシステムに接続すると同時に自動的に起動する、簡素化されたカーモード・インターフェースを発表した。ドライバーが道路から目を離さずに音楽を聴いていてはいけない。俳優のAlbert Brooks氏アは、『ディフェンディング・ユア・ライフ』で、CDを交換している最中にバスに激突し、このことを痛感している。
AmazonはDigital Trendsに対し、この機能は運転中の広範囲にわたる閲覧を制限するために設計されたものだと説明しているが、Webページには「車の運転中にこのアプリを操作しないでください」という警告が表示されている。そのため、Digital Trendsは、「なぜアプリにカーモードをつけたのか?」という疑問を投げかけている。
Spotifyは先週、2019年に発売した「Car View」という簡易カーコントロールアプリのバージョンを廃止し、加入者を怒らせた。この無料アプリは、ドライバーの注意力が散漫にならないように制御機能を最小限にするように設計された、スマートフォンベースのユーザーインターフェースのストリップダウン版だった。Spotifyはこの機能を終了し、「今後登場する新たなイノベーションに対応するため」だと述べている。
そのような技術革新のひとつが、無料アプリではなく、79ドルの入手困難なガジェットである。私は昨年の春にこの話を聞いて以来、ずっとこの製品を欲しいと思っていた。この4.6×2.5×0.7インチのデバイスは、「Car Thing」と名付けられた想像を絶するものであるが、チップ・ショートゲージをベースにした数カ月間の遅れを経て、先週ようやく姿を現した。
Car Thingには、車内のさまざまな場所に取り付けるためのパーツが付属しており、通気口に取り付けたり、CDプレーヤーのスロットに巧妙なマウントで取り付けたりすることができる。ボイスコントロール用のマイクはデバイスの上部にあるので、通気口からの空気の流れで操作が妨げられないようにする必要があるが、これはAlexa時代のよくある問題である。
ただ、この音声エンジンは、AmazonのAlexaでもなく、Google Assistantでもなく、AppleのSiriでもない。Sonosの年次報告書には、同社のスマートスピーカーが音声コントロールに関して競合他社に依存していることについてのリスク要因が満載されている。Spotifyは、競合他社の言いなりになることなく、代わりにスウェーデンの仲間であるReadSpeakerをデジタル音声のパートナーとして起用した。この音声エンジンは、GoogleアシスタントやSiriのように動作し、プレイリストやアルバムをリクエストする前に「Hey Spotify」と言う必要がある。
低消費電力DDRの普及
Micron Technologyがスマートフォン向けに開発した最新のメモリ技術は、消費電力の削減という点では三拍子そろった可能性を秘めており、エッジでのDRAM普及の可能性が高まっている。
Micron は先日、同社の低消費電力DDR5X(LPDDR5X)DRAMが、MediaTekの新しいスマートフォン向けチップセット「Dimensity X1 5G」向けに検証されたことを発表した。このチップセットは、MediaTekのDimensity 5G SoCポートフォリオのフラッグシップモデルとなる。Micron は、ハイエンドスマートフォン向けの1α(1-alpha)ノードで製造したLPDDR5Xのサンプルをすでに出荷している。
LPDDR5は、その名の通り、すでにパワーコンシャスな製品である。JEDECが7月に発表したLPDDR5Xエクステンションは、さらなる省電力化を実現するとともに、5G通信の強化に向けてより高い帯域幅とメモリ速度を提供する。
Micron が検証したサンプルは、最大7.5Gb/sのデータレートをサポートしており、今後のサンプルは最大8.533Gb/sのデータレートをサポートすると予想している。これは、前世代のLPDDR5と比較して33%高速である。
Micron のモバイルビジネスユニットのマーケティング担当副社長であるChris Moore氏は、インタビューの中で、1αノードでは消費電力がさらに削減されるとし、「1αに移行することで、自然な電力削減が可能になるだろう」と述べた。アプリケーションプロセッサ間のデータ転送が高速化されたことで、メモリからのデータ転送が高速化され、プロセッサはより早く低消費電力モードに移行することができる。これはバッテリー駆動時間にも影響する。「私たちは皆、携帯電話が1週間、2週間と、実際に電源を入れなくても持つようになって欲しいと思っている。しかし、携帯電話に搭載されているすべての機能を強化し続けているため、そこまで到達できるかどうかはわからない」と述べている。
LPDDR5がスマートフォンにもたらす重要な機能は、PCのようなマルチタスクを可能にすることである。この機能には、携帯電話のディスプレイ上で複数のアプリを同時に開いたり、アプリ間でのドラッグ&ドロップやカット&ペーストなどが含まれる。これらの機能は、折りたたみ式の新型携帯電話でも利用できる。
Moore氏は、LPDDR5Xの電力プロファイルとパフォーマンス性能はマルチタスクを可能にし、AIの普及に伴い、このDRAMバージョンはスマートフォン以外にもユビキタスになると述べている。すでに一部のノートPCでは、ユーザーがより長いバッテリー駆動時間を求めてLPDDRへの移行が進んでいる。
「現在、多くのノートPCが低消費電力で動作しているが、今後はLPやLP5Xへと移行していくだろう。これは自然な流れである。短期的には、携帯電話よりもスピードとパワーの必要性が高いかもしれない」と述べた。
自動車用アプリケーション:Moore氏は、LPDDR5Xが最終的には自動車用アプリケーションにも採用され、5Gでの通信に必要な応答性を向上させ、迅速な推論を可能にするだろうとし、「今後、自動車に搭載されるストレージやメモリーはますます増えていくだろう」と予測している。
また、自動車のアプリケーションでは、バッテリーへの負担が大きくなるため、消費電力も重要である。今年初め、Micronは、厳しいASIL(Automotive Safety Integrity Level)仕様を満たすようにハードウェア評価されたLPDDR5メモリのサンプリングを開始した。これは、自動緊急ブレーキシステム、車線逸脱警報、アダプティブ・クルーズ・コントロール、死角検知システムなど、安全性が評価されたDRAMを使用する可能性のあるさまざまなADAS技術に展開するために設計された、メモリおよびストレージ製品の新しいポートフォリオの一部である。
また、DRAMの拡張性を利用して、LPDRR5をエッジデバイスに搭載することも可能である。Moore氏は、「DRAM自体の将来性は非常に高いと思う。エッジデバイスのニーズに合わせてカスタマイズされた、高度に特化したコンピュートと高度に特化したメモリが登場するだろう」と述べている。
また、数十億台のデバイスの導入が予想されるエッジは、コスト面でも非常に厳しいものになると考えられる。
Micronがスマートフォンのエコシステムに注力するLPDDR5Xは、LPDDR5、1αベースのLPDDR4X、176層NANDベースのUFS 3.1、uMCP5デバイスの導入に続くもので、DRAMやNANDフラッシュの進化で後れを取っていたMicronに先発者としての優位性をもたらしている。
昨年、Micronは176層NAND用の最新3D NANDフラッシュメモリにリプレースメントゲート技術を採用し、他社がまだ128層NANDに注力している中、大量に出荷したことをアピールした。2021年初頭、Micronは1αノードDRAMを発表し、1zノードDRAMと比較してメモリ密度を40%向上させ、モバイル機器の省電力性を15%向上させたとしている。
LPDDR5の最初のバージョンでは、LPDDR4の初期バージョンに比べてI/Oレートが大幅に向上しており、アーキテクチャの変化を示していた。LPDDR5の再設計では、16バンクのプログラマブルなマルチクロッキングアーキテクチャへの移行が行われた。LPDDR5では、16バンクのプログラマブル・マルチクロック・アーキテクチャーへの移行や、データ転送量を減らしてシステムの消費電力を改善するための2つのコマンドベースのオペレーションが導入された。
MicronとUMCが特許侵害訴訟で和解
United Microelectronics Corp. (UMC)とMicron Technology Inc.は、11月25日、両社の長年にわたる特許侵害訴訟に終止符を打つグローバルな和解合意を発表した。
UMCはMicron に対して一時的な支払いを行うことに合意し、両社は互いの訴訟を事実上取り下げることになった。和解金の金額は非公開となっている。
今回の和解は、2018年1月にUMCがMicron に対して提起した特許侵害訴訟を含む、両社の過去の貿易紛争の解決を目的としている。この訴訟では、Micron が中国でDRAMやNANDフラッシュメモリーチップなどの特定の種類のチップを製造、加工、輸入、販売することを事実上阻止していた。
この反訴は、Micron が数カ月前にUMCに対して行った、台湾のチップメーカーと福建金華集積回路有限公司(JHICC)による知的財産権の盗用疑惑に対応したものである。2018年10月に商務省産業安全保障局が下した裁定により、JHICCはEntity Listに掲載され、米国企業がJHICCとの間で事業活動を開始することができなくなった。
反訴の際に提示された事実により、UMCはMicron の台湾子会社から3名の従業員を雇用し、そのうちの1名は、UMCがこれまで資本参加していなかった開発分野であるJHICC向けのDRAMメモリチップを開発するために、UMCとJHICC間の協議をリードする役割を担っていたことが判明した。
その後、UMCに雇われた2人の従業員が、Micron の台湾子会社のDRAMチップ製造設計に関する機密情報をUMCに伝えていたことが判明した。
UMCは2020年10月に疑惑を認め、同社はJHICCの調査・訴追に協力する代わりに、6,000万ドルの罰金に合意した。
UMCとMicronは、11月25日に発表した共同声明の中で、「UMCとMicronは、相互のビジネス協力の機会に従事することを楽しみにしている」と述べている。
しかし、半導体の覇権をめぐる米中の争いを考えると、Micron とUMCの今後の協力関係には問題がある。今年初め、Semiconductor Manufacturing International Corp.に加えられた制裁措置は、ワシントンと北京の間の緊張感を高めた。
一方、米国政府は最近、世界的なチップ不足の問題を解決するために、国内外のサプライヤーにチップの供給データを要求しており、さらなる懸念が生じている。例えば、日産自動車の社長は11月29日(月)、BBCの取材に対し、IC不足がすぐに解消されることはないと述べている。
SC21:量子的な性能に迫る中国のスーパーコンピュータ
今回のSC21では、中国のチームが名誉あるゴードン・ベル賞(スーパーコンピュータのノーベル賞に相当)を受賞した。このチームが発表した論文「Closing the Quantum Supremacy Gap: Achieving Real-Time Simulation of a Random Circuit Using a New Sunway Supercomputer」には、新しいスーパーコンピュータを使ってランダムな量子回路をシミュレートしたことが書かれている。
実はこのベンチマークは、2019年にGoogleが同社の量子コンピュータ「Sycamore」の「量子至上主義」を主張して物議を醸したものと同じものだ。Sycamoreはこのベンチマークを200秒で管理し、Summitのような古典的なスーパーコンピュータは1万年を必要とするとした(これには当時、IBMが反論し、実際の数値は2.5日に近いとした)。今回の中国のスーパーコンピュータは、中国チームのアルゴリズム作業と相まって、304秒でそれを実現している。古典的なスパコンよりも量子の方がまだリードしているようだが、その差は縮まっている。
論文では、Sunwayベースのスパコンの単精度性能を1.2エクサフロップスとしている。1.2エクサフロップスは単精度で、これは、中国で噂されているエクサスケールの能力を公式に確認するものではないが、この新しいスーパーコンピュータが世界で最も強力なものの1つであることは間違いないようだ。このスーパーコンピュータの名前は公表されていないが、研究には4190万個のサンウェイRISCプロセッサコアが使用されていることがわかっている。
Top500の結果:世界初のエクサスケール・システムの登場が期待されたTop500 HPCベンチマークの結果では、トップ10にはほとんど変化がなかった。中国は「Sunway」ベースのシステムをエントリーしておらず、米国の1.5エクサフロップスシステム「Frontier」は2021年後半に稼働する予定だが、まだ準備ができていないようだ。
中国とFrontierが不在のため、Top500のトップは、2020年6月以来のチャンピオンであるFugakuとなった。日本のスパコンのHPL(High Performance Linpack)ベンチマークスコアは442Pflopsで、世界2位のSummitの性能を3倍も上回っている。
実際、トップ10にはほとんど変化がなく、唯一の新エントリであるMicrosoft Azureの「Voyager-EUS2」が10位にランクインした。このシステムは、CPUに「AMD Epyc Rome」、GPUに「Nvidia A100」を採用している。
今回の注目すべき新規エントリーとしては、19位から43位の間に4台のロシア製システムが入っている。
今回のスコアでは、中国がトップ500の186システムから173システムに減少したのに対し、米国のシステムは123システムから150システムに増加した。
MLPerf HPCスコア:AIベンチマークスイート「MLPerf HPC」の結果も発表された。MLPerf HPCは、AIの性能を測定するためのベンチマークで、科学的作業負荷の中でAIの占める割合がますます大きくなっている。前回の応募時と比較して、最も優れたベンチマークの結果は4~7倍に向上し、ハードウェア、ソフトウェア、システム規模の大幅な改善が見られた。
また、P100、V100、A100といったNvidia社製GPUアクセラレータを搭載したものが、1件を除いてすべて採用された。
CosmoFlowとDeepCAMのベンチマークでは、Nvidiaが勝利した。CosmoFlowは、宇宙画像データからの物理量推定に用いられる。CosmoFlowのスコアは、1024個のNvidia A100-SXM4-80GB GPUを使ったトレーニング時間は8.04分であった。(FugakuのCPU512個では114.35分)。
DeepCAMは、気候シミュレーションデータに含まれるハリケーンや大気中の河川を識別するために使用されている。優勝したのは、今回もNvidiaで、同じGPUを2倍搭載し、1.67分であった。
新しいOpenCatalystベンチマークでは、ローレンス・バークレー国立研究所が勝利した。同じNvidia製GPUの40GBバージョンを512個使用し、そのトレーニング時間は111.86分であった。OpenCatalystは、グラフの連結性に基づいて分子配置のエネルギーを予測するために使用される。グラフネットワークが含まれているのは、材料科学や化学のワークロードの現状を反映しているため、重要であると提出者は述べている。グラフネットワークの計算特性は、他の種類のニューラルネットワークとは異なり、疎である傾向がある。データセットが異なれば、ネットワークの構造や接続性も異なり、負荷の不均衡(負荷を効率的に並列化することが困難な場合)が発生する可能性がある。
また、新しいパフォーマンス指標も導入された。弱いスケーリングモードとは、システムが同じモデルの複数のインスタンスを同時に学習できることを意味する。これは、ストレージシステムやインターコネクトなどの共有リソースへの影響を把握するためのものである。
終わりの見えないGPU供給の混乱
第3四半期のグラフィックス・プロセッサの供給ネットワークは、ジェットコースターのような状態が続いた。業界アナリストは、ジャストインタイムの在庫管理に頼りすぎた結果、持続的な供給障害が発生したと結論づけている。
Jon Peddie Researchが今週発表したレポートによると、PC向けGPUの出荷台数は、年間ベースでは12%増加したものの、前四半期比では18.2%減少した。市場をリードするNvidiaのGPU出荷量は8%増と好調で、ライバルのAMD(11.4%減)とIntel(25.6%減)を引き離した。
Jon Peddie氏は、「パンデミックは、ジャストインタイム戦略に過度に依存した脆弱なサプライチェーンのバランスを崩し続けているため、安定したサプライチェーンが見られるのは2022年末頃だと予想している。その間には、いくつかの予期せぬこともあるだろう」と述べている。
Peddie氏は、ホリデーショッピングシーズンを控えたグラフィックスベンダーにとっては、第3四半期が最も好調であると述べている。少なくとも今のところ、市場の季節性は過去のものとなっており、チップベンダーは次の四半期のガイダンスを平均2.7%上方修正している。
最近のほとんどの製品と同様、チップの供給が逼迫しているため、平均販売価格は高くなっている。Peddie Researchによると、タブレット端末のローエンド市場は現在、Google Chromebookで飽和状態にあり、予期せぬ在庫の増加が生じているとのことだ。
グラフィックス分野はテクノロジー市場の試金石であるため、ほとんどのチップベンダーが四半期ごとのガイダンスを平均3%ポイント上方修正しており、これは通常の季節性とパンデミックによるサプライチェーンの混乱を反映したものである。
ノートブック、デスクトップPC、ワークステーションに加え、統合型およびディスクリート型デバイスを含む全体のGPU搭載率は、125%上昇した。これは、PCの需要が供給を上回る状況が続いているためで、前四半期比で7.6%の増加となる。しかし、PCのCPU部門は、好調であったはずの第3四半期に23.1%減少した。タブレット端末の出荷台数は、四半期ベースで6.9%減少している。
Peddie氏は、AMDがNvidiaから市場シェアを奪おうと協調して努力しているにもかかわらず、過去3四半期のGPU市場シェアは一桁の増加にとどまっていると報告した。