前編「機械学習の代表的アルゴリズム『線形回帰』『決定木』とは?」は、主要な機械学習アルゴリズム5種類のうち「線形回帰」「決定木」について説明した。後編は残る3種類の機械学習アルゴリズムを紹介する。
サポートベクターマシン(SVM)はデータセットを分析して複数のクラスに分類する機械学習アルゴリズムだ。トレーニングデータを基にクラスを分ける「線」を見つけ、各クラスのマージン(線とクラス間の距離)を最大化するように、新たに入力したデータをクラスに分類する。
特性上、SVMは線で明確に分離できるトレーニングデータに向いている。非常に複雑なトレーニングデータ(顔や性格特性、ゲノム、遺伝物質など)ではクラスが細分化され、特定が難しくなるため人による分類が必要になる。SVMは現在と将来のデータセットで比較的高精度の分類を実現できるため、財務分野で多く使われている。
テクノロジーサービス企業Clairvoyantの最高技術責任者(CTO)を務めるシェカール・ベムリ氏によると、非線形データや多様なデータセットを扱う企業の間では、SVMによる画像分類が注目されている。例えば製造会社では、生産する製品の高解像度画像を撮影し、欠陥があれば品質管理担当者が画像に注釈を付ける。このようにして蓄積した大規模な画像データセットがあれば、SVMによって「生産品の欠陥を自動で識別することが可能になる」とベムリ氏は説明する。
データ量が爆発的に増大する中、そこから有意なインサイトを得ることはより困難になっている。こうした状況を改善し、セルフサービスアナリティクスを実現するには、体系的なデータ管理アプローチと、データレイクの構築が不可欠だ。
デジタル変革によりデータ活用の手法が変化する中、IT部門と業務部門のコラボレーションを前提とした「セルフサービスアナリティクス」の実現が不可欠となっている。こうした中で組織に求められるガバナンス戦略とは?
今やビジネスにおける浮沈の鍵を握るのは、紛れもなくデータだ。ただ、新ビジネスを創出すべくビッグデータ活用のPoCに取り組む企業は多いが、その失敗率も高い。失敗原因を把握し、その教訓を成功のための道しるべとしたい。
多くの企業がBI/アナリティクスへの投資を続ける一方、成果を上げている企業は多くない。その原因となっているのが、データ活用の前段階である、データ管理基盤の未整備だ。この状況を脱するために必要な「3本柱」の構築方法を解説する。
ビッグデータプロジェクトが世界的に進められる一方で、データ品質に関する懸念が浮上している。解決策とされるデータレイクも、問題を自動的に解決してくれるわけではない。データの信頼性を高めるためには、何が必要だろうか。
サイロを乗り越え「使えるデータ」を生み出すために何をすればいいのか (2019/12/17)
「ビジネスの課題は量子コンピューティング技術で解ける」は本当か (2019/12/16)
“明日のインターネット業界”に求められる「洞察力」を高めるには何が必要か (2019/12/6)
DX時代に必要な「新たなDBの役割」とその実現方法 (2019/12/4)
増え続ける非構造化データに対応する超高速データ分析プラットフォームとは? (2019/11/22)
「IaaS」調査を実施中! 回答者には「生データ」を先行提供
「IaaS」に関するアンケートを実施中です。ご回答いただいた方には、調査結果の「生データ」をいち早くお届けいたします。ぜひご回答ください!
企業における固定電話の活用実態――シンカ調査
固定電話はまだまだ使われており、重要な会話が交わされています。一方で、電話に出るス...
「Uber」1強だがダウンロード数で「Lyft」が猛追――米国ライドシェアアプリ市場(2019年11月度)
UberとLyftの2社は、ともに株価低迷と黒字化に悩むといわれてきましたが今後、どんな市場...
CMO? CIO? CDO? デジタルトランスフォーメーション(DX)の担い手は誰か――電通デジタル調査
日本企業の7割がデジタルトランスフォーメーション(DX)に着手。社内で旗を振るのは誰で...