はじめに
DX(デジタルトランスフォーメーション)を推進するためには、技術やツールといったハードウェアだけでなく、組織内で考え方や将来像をしっかりと共有することも重要です。しかし、考え方というものはどうしても抽象的であり、製品名を挙げるといったように具体的な話をしやすいハードウェアに関する内容よりも共有が難しいものです。そこで本記事では、DX推進に不可欠なデータ活用の指針となる「DataOps」という考え方の基礎についてご紹介します。
DataOpsとは
DataOps(Data Operations)とは、「データを円滑に活用するために、データ管理の効率改善やデータ管理者とデータ利用者の連携強化に取り組む」という考え方や取り組みを指す用語です。担当業務ごとに異なる目的を目指してバラバラに努力していた従来の体制ではなく、活発なコミュニケーションを基に互いに理解を深め、担当業務だけでなく全体的な成功を目指します。
「効率改善」や「連携強化」に取り組む方がよいというのは万人が賛成する考えですが、なぜそこに注力するべきだという考えが登場したのか、その必然性を理解しないと重要性は分かりにくいままです。そこで、歴史的な背景を通じて、DataOpsの価値をあらためて整理しましょう。
DataOps登場までのデータ分析
データ分析が、テクノロジーの進歩によってどのように変化してきたのか。また、データ分析に対するニーズはどのように変化してきたのか、コンピュータとネットワークに注目して整理します。
黎明期:統計学の時代
かつて、データ分析は統計学という学問でした。情報をアナログ管理していた時代、事象を数値化して因果関係や相関関係といった規則性を探すことは、ビジネスシーンでも有用だという認識はありましたが、手間や時間が必要なため実践は簡単ではなかったためです。
コンピュータの普及や進歩とともに、数値データはデジタル化され、統計理論はプログラムにより自動化され、データ分析はビジネスシーンで使いやすいように徐々に変化します。
コンピュータが登場した当初、データ分析に関するテクノロジーへのニーズは、人力で行っていた作業工程を代替することであり、業務プロセスや組織の変革には関わりませんでした。
2000年代以前:専門家の時代
1980年代にビジネスシーンにパソコンが普及し、1990年代にかけてマシンスペックが向上したことにより、データ分析は急速に発展します。例を挙げるならば、「データマイニング」は大規模データを分析する手法として1970年代に考案されましたが、一般的に普及したのは1990年代に入ってからでした。
単純なマシンスペックだけでなく、その演算処理能力が不可欠な統計学や計算機科学の専門知識がなくても利用しやすいデータ分析専門ツールやデータベースの普及も、大きな原動力になりました。
データ分析に関するテクノロジーへのニーズは、演算能力を生かして人力では時間のかかる大規模データを高速で処理する、といった方向へ変化していきます。あくまでも何を分析するのかといった思考や判断は専門家が担当し、処理を機械が高速化するという分業です。
2000年代:インターネット普及によるパラダイムシフト
2000年代に入ると、インターネットの急速な普及が契機となりパラダイムシフトが起こります。Web上にさまざまなデータが蓄積されるようになり、分析の対象となるデータは以前の社内データと比べものにならない規模に拡大しました。
2010年代には、「ビッグデータ」と呼ばれる大規模データ解析が登場します。また、機械学習やディープラーニングといった人工知能技術の発展により解析精度が向上し、ビジネス分野だけでなく医療や自然災害予測など、データ分析の利用される分野は広がります。こうして、データ分析は扱うデータの種類や量、用途が多様化しました。
多様化に伴って、分析業務に統計学をはじめとした学術的な知識と専用のソフトウェア操作だけでなく、マーケティングやITといった関連する分野への知識が求められるようになりました。また、顧客とのコミュニケーション能力も求められるようになり、ビジネスシーンにおけるデータ分析は「データアナリスト」や「データサイエンティスト」といった専門職の領域になっていきます。
現代:DataOpsへ
現代では、データ分析業務は複雑化する一方で、データ分析を利用したいというニーズは増え、需要と供給の天秤は傾きました。また、市場の変化スピードは以前とは比べ物にならないほど速く、データ分析には以前よりも速度が求められるようになっていました。そこで、DataOpsが登場することになります。
データ分析自体が幅広く利用されるようになり、ツールだけで分析に求められるスピードを担保するのが難しくなったため、分析だけでなくデータ管理(オペレーション)自体をより効率化することは有用となっています。
DataOpsとDevOpsの違い
DataOpsは、データ分析やデータ活用の分野で突然生まれた訳ではありません。DevOpsという開発と運用の連携を強化することで開発を高速化する考え方を基にしています。
そもそもDevOpsとは、開発(Development)と運用(Operations)を組み合わせた造語であり、スピーディーなシステム開発と運用を実現するため、開発チームと運用チームの連携を強化するという考え方です。
ソフトウェア開発の分野で生まれたDevOpsの、「全体的な最適化を図るために、複数の部署や担当者が連携する」という汎用性が高かったため、この概念をデータ分析の分野にも応用しようと考え出されたのがDataOpsです。
DataOpsとDevOpsで同じ点
DataOpsとDevOpsはどちらも、小さな目的は異なるものの、同じ企業としての大きな視座から見れば、利益を共有できる部署や担当の連携を強化するという考え方は一緒です。また、連携を強化して業務の効率化や高速化を図るという点でも違いはありません。
DataOpsとDevOpsで異なる点
DevOpsは開発(Development)と運用(Operations)という、一見対立関係にある要素を組み合わせた名称です。しかしDataOpsはData Operationsの略であり、何が何と対立するのか、直感的に分かりにくい名称になっています。
DataOpsにおいて対立するのは、「データ管理者とデータ利用者」です。経営層から現場の担当者まで「データ利用者」と一口で言ってもさまざまな場合があること、データ管理者といっても、データ管理を担当する部署も企業ごとにさまざまである点には注意が必要です。DataOps実践には、企業ごとにデータの入力から管理、活用がどのように行われているのか、さまざまなケースを把握してその業務フロー自体を見直していくことになります。多くの部署や担当者が関わり、場合によってはトップダウンでデータを活用する場合もあるため、全社規模の取り組みが必要になる場合が多くあります。
DataOpsの基礎的なポイント
DataOpsの実践には関係者の連携や業務の自動化、業務フローの見直しなど多岐に渡る取り組みが必要なため、 1つでDataOps全体をサポートするようなツールは存在しません。
そのため、DataOpsを進める際に課題になりやすい、基礎的な3つのポイントをご紹介します。
データの品質管理
効率的にデータ活用を進めるためには、利用するデータフォーマットと管理場所の統一が有効であり、一般的には部署ごとや目的別ではなく、CRMのように全社的にデータを管理できるツール導入がオススメです。しかし取り扱うデータの秘匿性は業種や業態、取引先といったさまざまな要素で代わるため、各社がそれぞれ管理するデータにとって、最適なセキュリティを満たせるような検討が必要なことには留意が必要です。
西暦と和暦、数値の単位などが異なるデータが存在すると活用の際の手間が嵩むため、一元管理が難しい場合でも、データ活用の際の手間を可能な限り削減できるようにフォーマット統一に取り組みましょう。
データ管理者と利用者のコミュニケーション強化
データ利用者は社内で管理されているデータの品質や量について、データ管理者は社内でデータがどのように活用されているのかについて、互いに完璧に把握するのが理想ですが、現実的ではありません。そのため、密なコミュニケーションが必要になりますが、データ管理者と利用者は部署が異なる、勤務地が異なるなどのケースも多く、コミュニケーションが不足しがちになってしまいます。
そこで、経営層から現場の担当者まで、さまざまな立場の方がデータ利用者になる可能性があるため、全社で共通のコミュニケーションツールの導入が効果的です。依頼や連絡だけではなく、「○○のために」といったように目的や用途を共有する、「△△のデータの方が信頼性が高いかも」といったようにデータ管理の立場から提案することも大事です。コミュニケーションの質を向上させることは、データ管理と活用の質を向上させることにつながります。
自動化の推進
定期的に同じ項目に関して繰り返すデータ分析の際には、管理しているデータベースからデータを抽出する、分析ツールに取り込む、分析前にデータクリーニングするといった決まった作業を繰り返します。この作業をツール導入で自動化することはデータ分析の高速化につながります。また近年では、世界的に利用できるデータの量が増えたことにより、定期的な分析ではなく、不定期にデータ同士の関連性があるか探るといったような分析の機会も増えました。そのため、どのようなグラフを使ってデータを表現するか、価値あるインサイトは何か、といったこれまで人力で判断していた部分についてAIでサポートするといった試みが進められています。
技術の進歩によって、今後はAIや機械学習を活用して、より自動化できる範囲が広がると考えられます。AIを備えたデータ分析ツールといった製品も登場しているため、どういった形で導入していくのがベターか、現在利用しているツールや業務フローを勘案して検討を進めておくのも重要です。
DataOpsとDXの関係
DataOpsとDXはどちらも抽象的であり、具体的なアクションではないため直感的に分かりにくい部分があります。
2つの関係に注目すると、デジタル技術でビジネスを変革するDXにとって、DataOpsは欠かせない要素だといえます。DXを推進するためには、既存の業務をデジタル技術で効率化することだけでなく、主観や経験から客観的なデータへと判断基準を代えることが必要です。そのため、判断の際に必要なデータに素早くアクセスできるような環境作りは欠かせません。DataOpsはその環境作りのための取り組みだといえます。
現在、思うようにデータ活用を進められていないという方だけでなく、これからDX推進に取り組もうという方にとってもDataOpsへの取り組みが必要です。
まとめ
DataOps という考え方をうまく実践することは、DXの成功につながります。そのため簡単ではありませんが、ぜひデータの管理や活用に関わる多くの従業員にDataOpsに関する理解を深めて欲しい考え方です。社内スタッフだけでメイン業務と並行して教育を進めるのが大変だという場合は、DataOpsやDX、データ分析に関するサポートを外部の専門家に依頼するのも効果的です。
セラクはクラウドサービスの導入支援や情報システムに関するマネージドサービス、セルフサービスBIツールの活用支援といった幅広いサービスを提供しています。DX推進の取り組みを効率化させるため、プロフェッショナルの手を借りたい場合はセラクへご相談ください。