カスタム検索
表示順:
Relevance
Relevance
Date
ウェブ
 
 
 

Slack、全ユーザーが接続できなくなった大規模障害の原因はバッチ処理にバグがあったためと報告

2018年7月2日


チャットサービスを提供するSlackは、太平洋夏時間の6月27日午前6時30分(日本時間6月27日午後10時30分)頃から約3時間、全てのユーザーでSlackが利用できなくなる深刻な障害に見舞われました。

同社はその後、障害についての報告をステータスページに掲載。障害の原因が、データのバッチ処理に含まれていたバグであったことを明らかにしました

同社の報告の一部を引用します。

On June 27th (yesterday) between 6:33 a.m. and 9:49 a.m. PDT Slack experienced an outage where people could not connect to their workspaces. The network problems were caused by a bug included in an offline batch process of data, which resulted in unexpected network spikes and led all of our customers to become disconnected and unable to reconnect.

6月27日(昨日)の太平洋夏時間午前6時33分から午前9時49分のあいだ、Slackにおいてユーザーがワークスペースに接続できなくなる障害が発生しました。このネットワーク障害は、オフラインバッチによるデータ処理に含まれるバグによるものでした。これが予期せぬネットワークのスパイクを引き起こし、全ユーザーへの接続断と再接続障害の原因となりました。

Slackの大規模障害

オフラインバッチ処理がどのようなものかは説明されていません。定期的なバックアップあるいはデータ分析に伴う前処理かなにかだったのでしょうか。

半年前にも数時間にわたる大規模障害

Slackは、約半年前の2017年11月にも全ユーザーが2時間以上Slackに接続できなくなる大規模障害が発生しています。

このときは定期デプロイによってサーバにデプロイされたソフトウェアに含まれていたバグが原因で障害が発生し、復旧のために急きょハードウェアの増強を行ったことが報告されています。

前回も今回も共通しているのは、何らかのソフトウェアのバグが原因であることと、その影響が全ユーザーに影響する深刻な障害に結びついていることです。

Slackはちょうど先週、日本への本格展開を宣言したばかりのタイミング。障害の発生を完全に防ぐことはできないにしても、できるだけ局所的に押さえ込むような仕組みにしてほしいところです(と書くのは簡単でも、実現するのは容易ではないと思いますが)。

follow us in feedly


≪前の記事
「MongoDB 4.0」正式リリース。マルチドキュメントに対するACIDトランザクションをサポート


カテゴリ



Blogger in Chief

photo of jniino Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

人気記事ランキング

  1. Javaの新しい商用ライセンス、米オラクルが発表。月額料金でデスクトップは2.5ドル、サーバは25ドル。LTS版を利用可能
  2. 「Amazon Linux WorkSpaces」リリース。マネージドなLinuxの仮想デスクトップをクラウドから提供
  3. Flutter、ベータを卒業してリリースプレビューへ。Dart言語によるiOS/Android対応アプリフレームワーク
  4. 「MongoDB 4.0」正式リリース。マルチドキュメントに対するACIDトランザクションをサポート
  5. 来月にはJava 10が登場し、9月にはJava 11が登場予定。新しいリリースモデルを採用した今後のJava、入手方法やサポート期間はこう変わる(OpenJDKに関する追記あり)
  6. Slackが日本でローンチイベント開催、本格展開スタート。日本法人の増員、国内サービスとの連携拡充、コミュニティの支援を約束
  7. デザイナーが作ったUIモックから、デベロッパー向けにAngularのコードを生成。「Indigo.Design」日本語版をインフラジスティックスが提供開始
  8. VMwareもKubernetesのマネージドサービス「VMware Kubernetes Engine」提供へ。VMware Cloud on AWSを皮切りにAzure版も予定
  9. Linuxバイナリを最適化して性能を向上させる「BOLT」、Facebookがオープンソースで公開。言語やコンパイラに依存せず高速化
  10. 「WebDriver」がW3Cの勧告に到達。Webブラウザのテスト自動化などを実現


新着記事 10本


PR - Books


fig

fig

fig