COLUMN
Cloud Operator Days Tokyoで社会人2年目が登壇してみた|運用を効率化したシステム開発のご紹介
クラウド活用に関するさまざま情報をお届けするメルマガを毎週配信しておりますので、ぜひこの機会にご登録ください。
こんにちは、坂齊です。 |
技術者のための年次カンファレンスイベント「Cloud Operator Days Tokyo 2024(CODT2024)」が開催されます。今年のテーマはAI!NTT東日本では、過去2名のヤングオペレーター賞を受賞しています。本コラムでは、過去の受賞案件のご紹介と発表者がイベントを通して感じたこと、発表した案件のその後をご紹介します。
はじめに
本コラムでご紹介するのは、Cloud Operator Days Tokyo 2021で発表した『新入社員が9ヶ月でクラウド運用の自動化システムを作ってみた』と『自動化システムのその後』です。
皆さんの業務の中にも繰り返し発生する業務はありませんか?弊社ではそんな業務をAWSを活用して自動化しました。
まずCloud Operator Days Tokyo 2021で発表した内容から紹介させていただきます。
発表内容@Cloud Operator Days Tokyo 2021
システム化に至った背景
弊社ではアラートを確認し、該当の宛先に通知するという業務を手動で実施していました。アラートが発生するたびに発生するこの業務は、弊社の運用組織の稼働逼迫の要因となっていました。
実業務を洗い出すと、アラート確認後ExcelやPowerpointを開きフローや通知判断を行う『通知判断』やアラートの種類により通知文面が変わるなど当初の想定より複雑でしたが、一貫して事前に定められた内容に従い定型化された業務となっていました。
設計の方針
自動化するにあたって目指したことは『開発するシステムの運用は最小限に』ということです。そこでAWSにて提供されているサーバーのプロビジョニングや管理が不要でコードを実行できるコンピューティングサービスである『AWS Lambda』を利用しました。また、コードの複雑化とランタイムエラーを防止する為、実施する機能ごとにLambdaを分け、疎結合な設計を意識しました。
Lambda同士の連結は『AWS Step Functions』を利用しました。Step FunctionsではJsonやGUIで処理(ワークフロー)を設計できます。複雑な処理が発生する場合は特に有用です。
また、ワークフローの実行履歴を視覚的に確認できるため、運用後のエラー対処も迅速に行うことが可能です。
構成図
最終的に下記のような自動化システムを構築しました。
発表セッションはITmediaにて取り上げていただきました。開発時の苦労点なども記載いただいてますので、よろしければご参照ください。
AWS初心者でもサーバレスでここまでできる――クラウド運用の定型業務を9カ月で自動化した新入社員の挑戦(ITmedia)
3年の運用を経て
運用を通して、エラー発生の処理がわかりやすいことが解決の迅速化につながり運用者の負担を少なくすることを強く実感しました。本コラムでご紹介した自動化システムでは下記2か所を確認することでほとんどのエラーを解決することができます。
- Step Functionsの実行履歴
- Lambdaのログ ※Lambda内でエラーが発生した場合
特にStep Functionsの実行履歴では、それぞれのステップの入出力結果が確認できるため、エラー発生しているステップのLambdaではなく別のステップのLambdaの出力が誤っていたケース等も比較的短時間で原因を特定し方針を決めることができました。
また大きな転機として、メール通知に加え『コミュニケーションツール(SaaS)に通知』をする機能拡張がありました。『疎結合』な設計により、既存システムに影響を与えない形で機能拡張をすることができ、SaaSの仕様変更の影響で改修が必要となった際も、最小限の影響で改修を実施することができました。
システム設計ではたくさんポイントがありますが、私はこの自動化システムの案件を通して学んだ『エラー発生時の原因がわかりやすいこと』『疎結合な設計』、そして上記の選択につながった『複数案を出してよく比較検討すること』は今後もシステム設計において大事にしていこうと思います。
Cloud Operator Days Tokyoでの発表を通して
入社2年目だった私は、初めての公式の場での発表ということもあり、漠然と不安を感じていました。この内容で大丈夫だろうか、本当に見てもらえるのだろうか、そもそもクラウドを始めてから2年もたっていない自分が発表側に回っていいのか等。。。周りの方に背中を押していただけなければ、挑戦できなかったと思います。実際に配信が始まると、視聴していただけていることが実感でき、大変うれしく感じていました。振り返ってみると、事前録画の為、準備もしやすく比較的挑戦しやすかったと感じます(※2021年度は事前収録のみ)。
また運用という業務はわかりやすい形で成果が見えない、または評価につながっているのか実感しにくいと感じていた時期に、入社3年目までの発表者を対象とした「ヤングオペレーター賞」を受賞できたことは自分の取り組みを認めていただけたように感じることができました。モチベーションが向上し、自分がやってきたことを社内外に積極的に発表していこうという気持ちにつながりました。
光栄なことに、「Cloud Operator Days Tokyo 2022」のプレイベントにてヤングオペレーターパネルとして、「ヤングオペレーター賞」3名でパネルディスカッションすることができ、他社の同世代の考えを知ることができ、とても有意義な時間となりました。
さいごに
本システムを最初に発表した場であるCloud Operator Days Tokyoはとても思い入れのあるイベントです。セッション応募はどなたでも可能です、近年トレンドとなっているAIOpsやこんなしくじりをしてしまった等の運用苦労話、本コラムのような自動化や、チームづくり・人材育成等、テーマは様々です。運用業務でご苦労されている方、こんな改善したんだとうずうずされている方、力試しをされたい方、ぜひご応募ください!
■Cloud Operator Days Tokyo 2024に関して
最後に、定型業務を自動化したい、特定の作業を自動化したい等のお悩みをお持ちの方はぜひ弊社までご相談ください。
RECOMMEND
その他のコラム
相談無料!プロが中立的にアドバイスいたします
クラウド・AWS・Azureでお困りの方はお気軽にご相談ください。