非公開ユーザー
ソフトウェア・SI|ITアーキテクト|300-1000人未満|ユーザー(利用者)|契約タイプ 有償利用
企業所属 確認済
監視対応に便利
統合運用管理ツール ,ログ管理システム ,サーバー監視ツール で利用
良いポイント
AWSからログを飛ばして、Datadogでエラー検知等を行っています。
AWSとDatadogをどう連携させたらいいのかについては、公式サイトでCloudFormationを公開しており、それを実行するだけで簡単に連携できます。
オンコール機能も搭載され、現在、監視ベンダーとの契約もなくていいのでは(大きなコスト削減)という話もしています。
改善してほしいポイント
オンコール機能は比較的新しい機能であるためちょこちょこと不便なところがあり、以下が改善できれば、オンコール機能の正式利用にむけて検討しやすくなるのですが。
・カスタム応答メッセージの作成かつ日本語対応
・オンコールの発信元の特定(不明な発信者と出る)
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
複数プロダクトの監視に利用していますが、ログが一元管理できるため、エラーやログの確認が大変便利です。また、個人的にUIが使いやすいと思っています。
これでオンコール機能が改善されたらコスト削減も進むので、期待しています。
続きを開く
非公開ユーザー
情報通信・インターネット|ITアーキテクト|1000人以上|ユーザー(利用者)|契約タイプ 有償利用
企業所属 確認済
利用画像確認
クラウドサーバーの監視モニタリングへの取り組み方が変わった
APMツール ,統合運用管理ツール ,ログ管理システム ,サーバー監視ツール で利用
良いポイント
このサービスを活用する前の姿は、アプリケーションとサーバーの正常性、そしてエンドユーザーの利用状況やセキュリティのモニタリングはそれぞれ別々のツール(製品)を導入していた。担当する技術者もそれぞれの専門領域がありサイロ化された組織で伝言によるコミュニケーションをしている。
Datadogを採用してからはこれら全てをひとつのツールで管理できるようになった。まだ実践しているプロジェクトは数件と少なくこれから展開していくが、ツールがひとつに集約できるのでアプリ保守運用チームとITインフラ運用チームが同じツール・同じ用語でコミュニケーションできるようになって、ITインフラ運用の専門家がアプリ保守運用の領域にも監視モニタリングを使ってパフォーマンス最適化と障害原因の分析を支援できるようになった。これまでの分業ではなく一緒に運用できるようになることを検証できたので運用のスピードとコスト削減を期待できる。
改善してほしいポイント
Datadogサービスは、データベースモニタリングやセキュリティスキャンなど次々と新機能が登場して、現在では情報システム全体のあらゆる状態を監視モニタリングできるようになってきた。異なる領域であっても、ほぼ同じUI画面インターフェースなので、分析や観測は直感的に操作できるので学習コストは少ない。一方で、モニタリング対象のアプリやITインフラは今でも専門家が求められる領域であり、監視モニタリングのセットアップは苦労することがある。できるだけ共通化されたツールの実装方法、もしくは自動化を期待しています。
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
AWSやAzureなど複数のメガクラウドそしてサーバー仮想化環境も含め様々なITインフラをひとつのツールで運用できるようになり監視モニタリングの学習コストと実装スピードは数分の一に圧縮できている。結果としてクラウド専門家の人手不足も解消、コスト抑制できている。そのうえITインフラ専門家がフルスタックエンジニアへスキルアップする一歩も踏み出せていると考えている。
検討者へお勧めするポイント
ITインフラ運用もアプリ保守運用も同じツールで運用できることで、組織の一体化や専門家の人材不足を解決できると考える。
続きを開く
非公開ユーザー
情報通信・インターネット|プロジェクトマネージャ|300-1000人未満|導入決定者|契約タイプ 有償利用
企業所属 確認済
利用画像確認
各種メトリクスが同時並行でどんな状態だったかが確認できて便利
APMツール ,インシデントレスポンスツール ,サーバー監視ツール で利用
良いポイント
優れている点・好きな機能
・基本的なCPUやメモリ等のリソースモニタリングに加え、Agentによるログ転送やAPMも同時にデータ可視化できる点
・Syntheticsを利用した外形監視とそのアラート時のSlack通知
その理由
・リソースの状態とそのときのアプリのログや各種モジュールのパフォーマンスが一括で確認できる点が便利だから
・外形監視にてダウンしたサイトやシステムのアラート通知が届き、そのまま障害対応のコミュニケーションが開始できるため
改善してほしいポイント
日本語で画面を利用したりできない点から各画面への理解が直感的に進みづらいため、日本語のUIにもできるようにしてもらえると理解がもっと捗りそうかなと思います。
スマホアプリも作られてるので、ぜひアラートのプッシュ通知ができるようにしてほしい。
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
監視においては、外形監視からのアラート後に原因を調査することが基本だと思いますが、
その際にアラートが発生した時間帯とそのときのリソース状況やアプリの状況を同時に確認できる状態がなく、
調査に時間がかかってしまうことと、複数の画面を行ったりきたりして調査のしづらさを感じていました。
Datadogはこれを同じ画面で確認できるダッシュボードが作成できるなど、今後のモニタリングやパフォーマンス改善にも活用できそうなメリットのあるサービスだと思いました。
続きを開く