Overview

オンプレミスのHadoopベースのエコシステムは、企業における異なるデータセットの処理や実行可能なアナリティクスの構築に役立ちます。ただし、こうしたプラットフォームの導入は大規模になるため、クラスターのプロビジョニング、コストの増加、ガバナンスや性能に関する課題を避けて通ることができません。分析用のサンドボックスタイプの環境では、必要なオンデマンドのコンピュートをプロビジョニングすることが要求されます。オンプレミスのHadoopアーキテクチャではコンピュートとストレージの分離に対応しないため、こうしたプロビジョニングは困難です。

Logo

安定したセキュアな、統制されたクラウドプラットフォームに移行することで、企業はこれらの課題に対処できる可能性があります。クラウドプラットフォームにより、オンデマンドのスケーリング、効果的なコスト管理、従量課金機能の利用とコンプライアンス要件への適合を実現できます。また、分析ユーザーはインフラストラクチャのオンデマンドなプロビジョニングを利用して、事前構築済みのライブラリコンポーネントの大規模な基盤を活用できます。Hadoopのクラウドへの移行は、データランドスケープのモダナイゼーションにおける重要な役割を担い、またデータエコノミーにより創出される機会の収益化を促進します。

当社のHadoop移行戦略とアクセラレーターを利用することで、クラウドへ移行する企業のプロセスを効率的に高速化できます。

インフォシスのデータおよびアナリティクス・チームは、Hadoop からクラウドプラットフォームへの移行プロセスを高速化するための、綿密に定義された戦略とツールのスイートによるソリューションを構築してきました。

当社では、クラウドへの効率的な移行のために、以下の異なるアプローチを特定しています。

  • リフト&シフト : オンプレミスのプロセスを変更せずにクラウドへ移行
  • レトロフィット: 新しい環境に互換性のあるストレージコンポーネントや機能など、オブジェクトに最小限の変更を加えて移行
  • リ・アーキテクト: モダナイズ後のプラットフォームのメリットを実現するために、アプリケーションを再設計
  • ハイブリッド: 異なるパターンを組み合わせてアプリケーションを移行
Data Operations Service Offerings

Fig 1: Hadoop Migration to AWS- Patterns

当社が設計したアクセラレーターとプロセスは、上記のいずれのパターンでもオンプレミスのデータレイクオブジェクトやアプリケーションの移行を促進します。その後の導入戦略では、お客様がスケールアップと予測可能な成果を獲得するお手伝いをします。

Data Operations Service Offerings

Fig 2: Implementation Strategy

Infosys Data WizardとAWSを活用したクラウド移行の高速化

TALK TO OUR EXPERTS

以下の能力でクラウド移行プロセスを50%高速化します。

  • インベントリメタデータの収集
  • スキーマ変換
  • 履歴データの移行と負荷上昇
  • データ認証

Infosys Data Wizardは移行プロセスの高速化を促進します。ソリューションは以下のコンポーネントで構成されます。

  • アセスメント: 移行元データストアの使用パターンを特定して最も適切な移行先データストアを推奨できる、包括的なアセスメントフレームワーク
  • モダナイゼーション推奨: データストアの各タイプへのアプローチを特定するために役立つ、意思決定マトリクス
  • データベースオブジェクト移行: 異なるタイプのDBオブジェクトのインベントリクラスを効率的に移行するソリューションアクセラレーター
  • コード/パイプライン移行: 異なるタイプのデータ処理オブジェクトのインベントリクラスを効率的に移行するソリューションアクセラレーター
  • 消費移行: 異なるタイプの消費オブジェクトのインベントリクラスを効率的に移行するソリューションアクセラレーター
  • 履歴データ移行: 履歴データを移行先データプラットフォームに効率的に移行するソリューションアクセラレーター
  • テストと検証: 移行後のアセットの検証を高速化する、包括的なテスティングソリューション
  • パートナーエコシステム: 移行フレームワークとソリューションを補完するベンダーパートナーシップ

当社では、各種プラットフォームのツールと互換性のあるワークフロー/コードの移行にあたり、お客様に固有のニーズに対応した各種アプローチをご用意しています。

Hadoop から AWS への移行は、以下の方法で実現できます。

  • クラウド上のHadoopプラットフォーム
  • HadoopからAWS EMRへの移行
  • Hadoopから 次世代サービス (ネイティブ+サードパーティ) への移行

課題とソリューション

  • まず初めに価値実現フレームワークを確立し、全体を把握・監視します。
  • 移行後プラットフォームが提供する機能を活用します。たとえば、
    • マネージドサービスによる簡略化と運用コストの削減
    • 永続的ではない、一時的なオンデマンドのストレージと処理クラスター (短期的モデル) の使用
    • ストレージ/コンピュートの設計を定期的なタスクにして、コストを削減

以下の能力でクラウド移行プロセスを50%高速化します。

  • 移行先プラットフォームの利点を考慮した、適切な移行アプローチを確実に実行 (リフト/シフト、レトロフィット、リ・アーキテクトなど) します。また、これらのすべてのアプローチを、ワークロードに応じて1種類に限定せずに実行できます。
  • スモールスタート: 小規模/非クリティカルデータと、関連付けられたジョブでテストサンドボックスの構築とPOCを実行し、移行後の製品構成を調整
  • 移行先ツールのデータインジェスト、データエンジニアリング、共通データライブラリ、データガバナンス (品質、メタデータ、データリネージ) のための、データフローパターンの特定 (パターン、ツール、業務領域) と基礎コンポーネントの構築
  • 移行先製品ベンダーまたはパートナーが提供する移行ツールの活用
  • 商用テスティングツールの活用 (移行先製品ベンダーが推奨するもの)

RACI (実行責任者、説明責任者、協業先、報告先) を明確にした適切な移行チームを編成します。

  • プログラムのリスクを適切に軽減
  • ガバナンス、ハードウェア、Hadoopソフトウェア、アーキテクチャ、アプリケーション (データオブジェクト、コード、ワークフロー、消費)、テスティングとデプロイにおよぶ、包括的なプログラム計画を作成

データドメインをタイムスタンプ、業務明細、ワークロードで分割し、適切なMVP (最小限のプロダクト) へと変換

  • 計画のスプリント
  • 人材の流動は不可避であるため、ナレッジ管理、課題管理を重要な活動として検討