Jump to content 日本-日本語
日本HPホーム 製品 & サービス サポート & ドライバー ソリューション ご購入方法
≫ お問い合わせ

お客様導入事例

ソフトバンクモバイルが推進する
モバイルインターネットサービス基盤の運用革新

ソフトバンクモバイル株式会社

お客様導入事例

ソフトバンクモバイル
株式会社
日本HPサイトマップ
コンテンツに進む

障害検知の迅速化と精度向上、可視化、そして自動復旧までを、サービス監視とトポロジーベースのイベント抑制を加え充実させたHPソフトウェアのHP IT Performance Suite BSMソリューションにより実現



お客様背景
ソリューション
効果と今後の展望
会社概要
PDF(623KB)

目的

アプローチ

スマートフォン普及に伴うモバイルインターネットサービスの爆発的なトラフィック拡大に対応するとともに、サービス品質を維持・向上させること。重大事故発生によるリスクを低減させ、すべての事故におけるサービス停止時間を短縮すること。
モバイルインターネットサービスを支えるインフラ群およびサービスの監視・障害対応機能を強化し、障害検知から復旧までの一連のプロセスを自動化。(HP CLIPソリューション)運用の高度化とコスト最適化のバランスを図る。

ITの効果

ビジネスの効果

HP APM End User Management softwareのサービス監視機能の付加により、従来のシステム機器監視だけでは捉えきれなかった問題を顧客目線で確実に検知
HP Operations Manager i softwareのRTSM(ランタイム・サービスモデル)により、複数の監視情報を照合し障害の根本原因を迅速に特定
HP Service ManagerとHP Universal CMDBによりインシデントと運用ナレッジ、機器群の構成情報を集中管理

HP Operations Orchestration softwareにより障害の診断と復旧、イベントクローズまでを自動化

大規模化・複雑化するインフラ環境における障害リスクの低減

サービス品質の維持・向上により顧客満足度を向上

スピーディなサービス展開を支える運用体制を実現

運用監視にかかる作業を効率化しコストを削減



お客様背景

スマートフォン普及とともにトラフィックが急増

日本を代表する携帯電話事業会社であるソフトバンクモバイルが、モバイルインターネットサービスを支えるサービス基盤の運用革新に取り組んでいる。背景にあるのは、障害リスクの高まりだ。プラチナバンドによるサービスエリア拡大、高速通信サービス「Softbank 4G/4G LTE」の開始、続々と投入されるスマートフォンや新サービスがデータトラフィックを急増させ、サービス基盤の大規模化・複雑化をますます加速させている。

ソフトバンクモバイル株式会社
プラットフォーム運用本部
サービスプラットフォーム運用1部
部長
荒川雄司氏
ソフトバンクモバイル
株式会社
プラットフォーム運用本部
サービスプラットフォーム
運用1部
部長
荒川雄司氏

「ソフトバンクモバイルの2012年9月時点の契約数は3,000万を突破しました。2007年からほぼ倍増という伸びです。2010年には、通話サービスによる収入をデータ通信サービスによる収入が上回りました。これに大きく貢献したのがスマートフォンです」と、プラットフォーム運用本部の荒川雄司部長は語る。

荒川氏が指揮を執るサービスプラットフォーム運用1部は、24時間365日体制でモバイルインターネットサービス基盤の監視・運用を担う。高品質かつ顧客満足度の高いサービスを支え続けることがそのミッションだ。

日本市場では、フィーチャーフォン(従来型携帯電話)によるモバイルインターネットサービスが2000年代前半から広く普及していた。そのため、「2009年に本格化したスマートフォンの市場投入は非常にスムーズだった」(荒川氏)という。しかし、フィーチャーフォンとスマートフォンの両方にサービスを提供するために、関連設備は大きくしかも複雑になっていった。

「サービス基盤の大規模化と複雑化は、私たちの監視業務をさらに高度化させていきました。さらに、スマートフォンには特有の急激なトラフィック変動があります。ユーザーへのサービスに何らかの問題が生じたとき、原因となる機器の特定から問題の解決までに長時間を要してしまうリスクも高まっていました」とプラットフォーム運用本部山上昌昭課長は振り返る。

サービスの悪化や停止をいち早く検知すること。問題の根本原因を迅速に特定し最短時間での復旧を行うこと。さらに、サービスへ影響を及ぼす機器障害を未然に防ぐことが求められた。

「私たちは、ITサービスマネジメントのあるべき姿を見据えた監視運用業務の抜本的な見直しを開始しました。2008年のことです。そして、新しい監視運用フレームワークを策定し、それに基づいてシステム運用基盤を整備していく方針を定めました」(荒川氏)



ソリューション

ユーザーが体感するサービスを可視化

荒川氏のチームは、大規模化・複雑化したサービス基盤における障害リスクをどのように抑制しようと考えたのか。そして、問題検知から復旧までのプロセスをどのように刷新したのだろうか。

「新たに“サービス監視”を導入したことが最大のポイントです。エンドユーザーが実際に体験しているサービスを可視化することで、問題の把握をより確実かつ迅速に行うことが可能になりました」と荒川氏は語る。

一般的な監視アプローチでは、システム機器の稼働状況を監視し、機器の障害がサービスに及ぼす影響を把握する方法が採られる。しかし、近年“サイレント障害”と呼ばれる現象が多発し問題になっている。監視ツール上で機器が正常に稼働しているように見えていても、ユーザー側ではサービスの劣化や遅延が起こっているような状況だ。

ソフトバンクモバイル株式会社
プラットフォーム運用本部
サービスプラットフォーム運用1部兼2部
運用技術課 課長
山上昌昭氏
ソフトバンクモバイル
株式会社
プラットフォーム運用本部
サービスプラットフォーム
運用1部兼2部
運用技術課 課長
山上昌昭氏

「大規模かつ複雑なシステムでは、システム機器という一側面からの監視だけでは問題を把握することが難しくなっています。そこで私たちは、エンドユーザーの視点から問題の発生をいち早くキャッチする方法を採用しました。さらに、このサービス監視の情報を機器監視情報とつけ合せて問題の切り分けを行い、障害原因の可能性のある機器を特定して可視化することに成功しています」と山上氏は自信を見せる。

これにより、たとえば「SNSのタイムラインが見えない」という問題が発生したとき、原因がSNS側にあるのかソフトバンクモバイルの設備にあるのか、即座に切り分けることが可能になったという。

「実際には、サービス監視、機器監視、トラフィックの傾向監視、自動巡回によるシステムの正常性確認という4つの監視情報を照合しています。これにより問題発見から原因究明までのプロセスが大幅に迅速化されました。また、サービスとトラフィックの傾向情報を分析することで、障害の“予兆”を捉えて問題発生を未然に防ぐことも可能になりました」(山上氏)

すでに大きな効果が得られている。荒川氏は「イベントに対するアラームメッセージの数を約1/10に削減しました。また、システム機器の障害が発生してから、サービスへの影響を確認するまで時間を1/10に短縮しています。まさに、劇的な改善と言えるでしょう」と語る。



緊密な連携により効果を高めるHPソフトウェア群

「障害検知から復旧までのプロセスは大きく変わりました。エンドユーザーが体感するサービス状況、システム機器の稼働状況は監視コンソール上で可視化されています。インシデントをサービスデスクで一元的に管理し、定型化された復旧手順をシステムが自動処理する仕組みも実装しました」(荒川氏)

荒川氏のチームに成果をもたらしたのは、広範に採用された、HPソフトウェアのポートフォリオHP IT Performance Suiteを構成するBSM(Business Service Management)製品群である。サービス監視、機器監視、イベントフィルタリング、インシデント管理など最先端のマネージメントテクノロジーがHP CLIP(クローズド・ループ・インシデント・プロセス:イベント発生からインシデント対応、クローズまでのプロセス自動化)ソリューションとして統合され、緊密に連携している。今回、ソフトバンクモバイルが採用したのは次のHPソフトウェア製品だ。

「HP APM End User Management(HP APM)」がエンドユーザーの視点からサービス品質を監視し、サービス遅延や劣化が発生した際に原因を特定するための情報を提供する。そして、統合的な機器監視を担うのは「HP Operations Manager(HP OM)」である。システムの稼働状況やパフォーマンスボトルネック、キャパシティ等を常時監視するとともに、除外条件を定義することでイベントフィルタリングを行う。これら2つの監視システムが検知したイベントの相関関係をほぼリアルタイムの構成情報(RTSM: ランタイム・サービスモデル)をもとに把握し、根本原因となっている機器を迅速に特定して直感的なイメージで可視化するのが「HP Operations Manager i(HP OMi)」である。ここでは第2段階のイベントフィルタリング(TBEC: トポロジーベースのイベント抑制)も行われる。

収集された重要なイベントはインシデント情報として管理されるが、これを担うのがITIL v3に準拠したサービスデスク製品「HP Service Manager(HP SM)」である。複数のツール群が収集した情報は「HP SM」上で一元的に管理され、経過のトラッキングからクローズまで復旧プロセスの迅速化に貢献する。また、数千に及ぶ機器群の構成情報は「HP Universal CMDB」により一元管理される。

HP Universal CMDB

もうひとつのキーワード“自動化”についてはどうか。
障害原因となった機器が特定されると、次はサービス復旧の手順を実行することになる。荒川氏のチームでは、長年にわたり様々な障害に対する復旧手順やノウハウを蓄積してきたが、この豊富な“資産”が自動化の効果を高めることになった。

「監視者は、HP Service Managerの運用ナレッジデータベースを検索し、即座に最適な復旧手段を見つけ出します。既知の障害の多くはツールによる復旧の自動実行が可能です。復旧処理に加え、監視ツールにおける当該イベントのクローズ、レポーティング情報の収集も人手を介することなく自動的に行われます」(山上氏)

この“自動化”を実現したのがランブックオートメーション製品「HP Operations Orchestration(HP OO)」である。
「標準化・定型化を進めてきた復旧手順をHP OO上で定義しました。これにより、誰が対応しても迅速かつ正確な障害復旧が可能になりました。個人のスキルに依存しない運用監視体制は、ひとつの理想形です」と荒川氏は評価する。




効果と今後の展望

運用におけるサービス品質とコストのベストバランス

2011年3月11日、大地震と津波によって東日本地域は甚大な被害を受けた。ソフトバンクモバイルも被災エリアの基地局などが壊滅的な状況に陥ったものの、幸いにしてモバイルインターネットサービス系設備への被害は軽微で済んだという。

「震災直後、メールや通話のトラフィックが爆発的に増大しました。イベントも大幅に増大し、もし機器に障害が発生すると問題の切り分けが非常に困難な状況でした。私たちは、サービス監視ツール『HP APM』を利用してサービス状況を即座に把握し、機器の安定稼動を確保するなどその時点で可能な最善の対処を行いました」
サービスを監視することで、過負荷による重大な機器障害が発生する前に手を打つことができたのである。

◇◇◇
モバイル通信業界の競争は一段と激しさを増している。ユーザーの純増数などで優位にあるソフトバンクモバイルが、さらなる高みを目指すには、より魅力的で高品質なサービスを提供し続ける必要がある。荒川氏は次のように語って締めくくった。

「サービスを支えるインフラストラクチャとその運用は、スピーディな新サービスの投入や急速なユーザー数の拡大に応えていく必要があります。日本HPとともに取り組んだ運用基盤の革新は、あらゆるビジネス要求に応えるものとなりました。
HPソフトウェアの機能を使いこなすことで、運用におけるサービス品質とコストのベストバランスをいっそう追求していきたいと考えています」



会社概要

ソフトバンクモバイル株式会社
所在地: 〒105-7317 東京都港区東新橋1-9-1
従業員数: 約6,800人(2012年3月31日現在)
設立(創業): 1986年12月
事業内容: ・移動体通信サービスの提供
・携帯端末の販売など、移動体通信サービスに関連する事業
URL: http://www.softbankmobile.co.jp/ja/このリンクをクリックすると、HP社外へリンクします。

事例キーワード

業種: 通信, メディア, HP Software


  本ページに記載されている情報は取材時におけるものであり、閲覧される時点で変更されている可能性があります。予めご了承下さい。  
印刷用画面へ印刷用画面へ
プライバシー ご利用条件・免責事項 ウェブマスターに連絡