非公開ユーザー
ソフトウェア・SI|ITアーキテクト|300-1000人未満|ユーザー(利用者)|契約タイプ 有償利用
企業所属 確認済
監視対応に便利
統合運用管理ツール,ログ管理システム,サーバー監視ツールで利用
良いポイント
AWSからログを飛ばして、Datadogでエラー検知等を行っています。
AWSとDatadogをどう連携させたらいいのかについては、公式サイトでCloudFormationを公開しており、それを実行するだけで簡単に連携できます。
オンコール機能も搭載され、現在、監視ベンダーとの契約もなくていいのでは(大きなコスト削減)という話もしています。
改善してほしいポイント
オンコール機能は比較的新しい機能であるためちょこちょこと不便なところがあり、以下が改善できれば、オンコール機能の正式利用にむけて検討しやすくなるのですが。
・カスタム応答メッセージの作成かつ日本語対応
・オンコールの発信元の特定(不明な発信者と出る)
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
複数プロダクトの監視に利用していますが、ログが一元管理できるため、エラーやログの確認が大変便利です。また、個人的にUIが使いやすいと思っています。
これでオンコール機能が改善されたらコスト削減も進むので、期待しています。
閉じる
非公開ユーザー
情報通信・インターネット|ITアーキテクト|1000人以上|ユーザー(利用者)|契約タイプ 有償利用
企業所属 確認済
利用画像確認
クラウドサーバーの監視モニタリングへの取り組み方が変わった
APMツール,統合運用管理ツール,ログ管理システム,サーバー監視ツールで利用
良いポイント
このサービスを活用する前の姿は、アプリケーションとサーバーの正常性、そしてエンドユーザーの利用状況やセキュリティのモニタリングはそれぞれ別々のツール(製品)を導入していた。担当する技術者もそれぞれの専門領域がありサイロ化された組織で伝言によるコミュニケーションをしている。
Datadogを採用してからはこれら全てをひとつのツールで管理できるようになった。まだ実践しているプロジェクトは数件と少なくこれから展開していくが、ツールがひとつに集約できるのでアプリ保守運用チームとITインフラ運用チームが同じツール・同じ用語でコミュニケーションできるようになって、ITインフラ運用の専門家がアプリ保守運用の領域にも監視モニタリングを使ってパフォーマンス最適化と障害原因の分析を支援できるようになった。これまでの分業ではなく一緒に運用できるようになることを検証できたので運用のスピードとコスト削減を期待できる。
改善してほしいポイント
Datadogサービスは、データベースモニタリングやセキュリティスキャンなど次々と新機能が登場して、現在では情報システム全体のあらゆる状態を監視モニタリングできるようになってきた。異なる領域であっても、ほぼ同じUI画面インターフェースなので、分析や観測は直感的に操作できるので学習コストは少ない。一方で、モニタリング対象のアプリやITインフラは今でも専門家が求められる領域であり、監視モニタリングのセットアップは苦労することがある。できるだけ共通化されたツールの実装方法、もしくは自動化を期待しています。
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
AWSやAzureなど複数のメガクラウドそしてサーバー仮想化環境も含め様々なITインフラをひとつのツールで運用できるようになり監視モニタリングの学習コストと実装スピードは数分の一に圧縮できている。結果としてクラウド専門家の人手不足も解消、コスト抑制できている。そのうえITインフラ専門家がフルスタックエンジニアへスキルアップする一歩も踏み出せていると考えている。
検討者へお勧めするポイント
ITインフラ運用もアプリ保守運用も同じツールで運用できることで、組織の一体化や専門家の人材不足を解決できると考える。
続きを開く
非公開ユーザー
ソフトウェア・SI|社内情報システム(その他)|50-100人未満|導入決定者|契約タイプ 有償利用
企業所属 確認済
(ブラウザ)テスト自動化用途の目的ならやめておいたほうが良い
APMツールで利用
良いポイント
外形監視周りがメインではなくブラウザテストの自動化を目的に導入しましたが、特におすすめポイントはありません。
改善してほしいポイント
ブラウザテストの自動化を目的に1年弱、導入運用してみましたが、
(1)使い勝手はお世辞にも良くない
(2)非エンジニア(テスター、QAエンジニア)にはなにかと敷居が高い
(3)シナリオのスケジュール実行周りにバグがある(スケジュール実行をOFFにしているにも関わらず動いてしまう)
(4)サポート窓口、およびエンジニアの対応にスピード感がなく不具合の解決に数週間、普通にかかる。
(5)テストケース(ステップ)の制約が以外と多くレコーディングしたステップに対する編集(スクリプトの追加等)コストがかかかる
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
ブラウザテストの自動化を主な目的に導入を図りましたが改善ポイントで挙げたとおり問題が多く、課題解決への貢献も特になくメリットもありませんでした。
検討者へお勧めするポイント
テスト自動化に関してはなし。
続きを開く
非公開ユーザー
情報通信・インターネット|プロジェクトマネージャ|300-1000人未満|導入決定者|契約タイプ 有償利用
企業所属 確認済
利用画像確認
各種メトリクスが同時並行でどんな状態だったかが確認できて便利
APMツール,インシデントレスポンスツール,サーバー監視ツールで利用
良いポイント
優れている点・好きな機能
・基本的なCPUやメモリ等のリソースモニタリングに加え、Agentによるログ転送やAPMも同時にデータ可視化できる点
・Syntheticsを利用した外形監視とそのアラート時のSlack通知
その理由
・リソースの状態とそのときのアプリのログや各種モジュールのパフォーマンスが一括で確認できる点が便利だから
・外形監視にてダウンしたサイトやシステムのアラート通知が届き、そのまま障害対応のコミュニケーションが開始できるため
改善してほしいポイント
日本語で画面を利用したりできない点から各画面への理解が直感的に進みづらいため、日本語のUIにもできるようにしてもらえると理解がもっと捗りそうかなと思います。
スマホアプリも作られてるので、ぜひアラートのプッシュ通知ができるようにしてほしい。
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
監視においては、外形監視からのアラート後に原因を調査することが基本だと思いますが、
その際にアラートが発生した時間帯とそのときのリソース状況やアプリの状況を同時に確認できる状態がなく、
調査に時間がかかってしまうことと、複数の画面を行ったりきたりして調査のしづらさを感じていました。
Datadogはこれを同じ画面で確認できるダッシュボードが作成できるなど、今後のモニタリングやパフォーマンス改善にも活用できそうなメリットのあるサービスだと思いました。
続きを開く
非公開ユーザー
ソフトウェア・SI|プログラミング・テスト|300-1000人未満|ユーザー(利用者)|契約タイプ 有償利用
企業所属 確認済
性能向上に欠かせないツール
APMツール,インシデントレスポンスツール,サーバー監視ツールで利用
良いポイント
・レイテンシのボトルネックが目ですぐわかる
APIがどこで遅延しているのかの原因が画面で表示されるようになるので、解析しやすい。
また、コミュニケーションツールとしても様々な部門の人たちと可視化された画面をみて会話ができる点が良い。
・機能がすぐに使える
service実行時にライブラリを呼ぶようにすることですぐに使えるようになるのがよい。
改善してほしいポイント
Reference Tablesで登録するデータとAPMトレースのタグとを紐付を行えるようにしてほしい。
logとの紐付はできるが、主にAPM側で情報を見ることが多いので、紐付できサービス側が付与するAPMトレースタグでは十分でないグルーピングなどができるとなおよいと感じている。
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
一目でAPIのボトルネックがわかるため、原因調査から修正、改善結果確認がスムーズに行える。
上記により、各サービス開発者が自発的に問題発見し、改善する流れが生まれつつある。
結果、レイテンシが20%以上向上するなどの改善効果がみられる活動が活発化するようになった。
続きを開く
非公開ユーザー
情報通信・インターネット|社内情報システム(CIO・マネージャ)|20-50人未満|導入決定者|契約タイプ 有償利用
企業所属 確認済
利用画像確認
システムに関する全てを可視化しビジネス側へも共有できるツール
APMツール,統合運用管理ツール,ログ管理システム,インシデントレスポンスツール,サーバー監視ツールで利用
良いポイント
・とにかくUIが良い。ほしい情報に最短距離で辿り着ける
・設定が楽。クラウドをモニターする場合、インテグレーションの設定をするだけである程度の設定ができる
・Logsは全環境を横断的にログ出力、確認できるのでなくてはならないツール
・Serverlessアーキテクチャの場合はコストがだいぶ安い
・無料で技術的なサポートをしてもらえる
改善してほしいポイント
・InfrastructureやSyntheticsなどは意外と料金が高いので安くなると嬉しい
・Incidentなど一部のサービスはまだ発展途中なものもあり、もう少し完成度を上げてほしい。Pagerdutyなど使わなくてもDatadogだけで一元管理できるようにしてほしい。
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
システムまつわるあらゆる情報の可視化と社内への共有が可能になりました。ログや負荷情報はもちろんですが、SLOを定めてそれにひもづく監視を行うなど、ビジネス側への共有しやすい仕組みを構築することができました。技術部門だけでシステム監視を完結するのではなく、全社的にシステム情報が生かされる仕組みを構築することができました。
検討者へお勧めするポイント
営業の方に相談すれば十分なトライアル計画を一緒に考えてもらえるのでまずは相談してみると良いと思う
続きを開く
非公開ユーザー
情報通信・インターネット|社内情報システム(開発・運用管理)|1000人以上|IT管理者
企業所属 確認済
Observabilityを実現できる監視サービス
APMツール,サーバー監視ツールで利用
良いポイント
優れている点・好きな機能
・様々な情報(監視データ)を容易に取得できる。クラウドやインフラストラクチャなど。
・様々なデータを組み合わせた見せ方、ダッシュボードを容易に作ることができる。
・規模や用途、重要度に応じて必要なものを必要な形で取得できる。
・新機能のリリースが早い。
改善してほしいポイント
欲しい機能・分かりづらい点
・サポートへ機能解放を依頼しないといけない利用できない機能がある為、ユーザで設定できるようにして欲しい。
・エラーになった際などにエラーに紐づけたサポートへの問い合わせが容易できるようにして欲しい。
・予測・予兆についてのパラメータ調整が難しい。
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
解決できた課題・具体的な効果
・ダッシュボードを活用した見える化・可視化が容易にできるようになった。
・障害が発生した際にはまずはDatadogを使って状況の確認をするのが容易になった。
続きを開く
非公開ユーザー
ソフトウェア・SI|プロジェクトマネージャ|1000人以上|ビジネスパートナー|契約タイプ 有償利用
企業所属 確認済
販売関係者
Datadog
ログ管理システム,サーバー監視ツールで利用
良いポイント
優れている点・好きな機能
・様々なクラウドサービスに対応
・様々なメトリクスが取得可能
・監視の設定をコード化してコマンドベースで適用可能
その理由
・各種マネージドサービスやコンテナの監視ができるため、今後のシステム基盤を監視することができる
・APMやRUMが備わっているため、Webアプリケーションの監視が可能
・監視設定の自動化ができるため、オペレーション負担を減らせる
改善してほしいポイント
欲しい機能・分かりづらい点
・dogshellの充実
・メトリクスの長期保存オプションの提供
(他社製品だとデータレイクにメトリクスを保存するオプションがあったりします)
・セキュリティ関連機能がどの程度使えるか分かりづらい
その理由
・Monitorの設定等は現状コマンドベースで対応できるが、メトリクス情報取得等が現状SaaS画面上でする必要があるため
・メトリクスなら15ヶ月等、SaaSに貯めておけるデータの量が仕様で決まっており、長期的な傾向を確認したい場合は
自分達で仕組みを作る必要があるため
・近年CSPM機能やSIEM機能が搭載されたが、どの程度の事ができて先行しているツールとの差別化要因を説明している
資料がほとんどないため。(また、新しすぎるためGartner等が提供している資料にも記載がない)
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
解決できた課題・具体的な効果
・AWSマネージドサービスの監視に対応
・監視基盤の統一、一元管理
・PagerDutyやServiceNOWと連携する事によるインシデント管理の一元化
・システムの見える化
課題に貢献した機能・ポイント
・Integration
・メール通知、Webhook
続きを開く
非公開ユーザー
自動車・輸送機器|ITアーキテクト|1000人以上|ユーザー(利用者)
企業所属 確認済
Datadogを利用してAWSのリソース稼働状況を監視
統合運用管理ツール,インシデントレスポンスツール,サーバー監視ツールで利用
良いポイント
優れている点・好きな機能
・AWSとのインテグレーション機能
・自動通知機能
その理由
・AWSのリソース稼働状況をリアルタイムで可視化できる為、運用監視ツールとして非常に良い
・予め設定していた閾値を超えれば、メールや、Slackなどに自動通知を発砲する設定ができるので、監視の自動化に役に立つ。
改善してほしいポイント
欲しい機能・分かりづらい点
・Dashboardの編集方法がわかりづらい
・自動通知のタグ機能が欲しい
その理由
・見たいリソースの状況をどのように設定、あるいはどのようなクエリを書けば、見れるようになるかノウハウが必要で、見たいように設定するにはなかなか時間がかかり、場合によって諦めることがある。
・AWSリソースの稼働状況が一定値を超えたら、Slackやメールに自動通知を発砲する機能を使っているが、ランクごとに自動通知を分けたいので、自動通知のタグ機能が欲しい。
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
Datadogを使ってAWSリソースの稼働状況を可視化にして、
自動通知機能を導入することによってシステムの稼働状況を監視する工数が大幅に削減できた。
また、他社に自動通知を送ることでインシデント時の初期連絡時間を大幅短縮して、サービスレベルが向上になった。
続きを開く
非公開ユーザー
ソフトウェア・SI|ITアーキテクト|20-50人未満|導入決定者|契約タイプ 有償利用
企業所属 確認済
オールインワンの監視ツール
APMツール,ログ管理システム,インシデントレスポンスツール,サーバー監視ツールで利用
良いポイント
・ログ調査が楽
検索結果が素早く返ってくるため、障害調査のストレスが軽減されました。
また、元々CloudWatch Logsを使っていたため、50を超えるAWSアカウントそれぞれに入ってログ調査をする必要がありましたが、集約して調査できるようになったことで時系列に紐づく調査が容易になりました。
・Synthetics Test からインフラ監視まで、全てが入っている
複数の監視ツールを個別に導入する必要がなく、毎度ツール選定に迷わずに済みました。
また、Datadogの機能ベースで監視項目の検討ができ、監視設計の見直しにつながりました。
・RUMが強力
エンドユーザが何に困っているのか、文字通り手に取るように分かり、問い合わせ対応やプロダクト改善が捗っています。
改善してほしいポイント
・公式ドキュメントが少しわかりづらい
例えばAWSであれば、EC2・ECS・Lambdaで本来設定が異なるところを一部混同しかねない記載になっています。
また階層構成も少し分かりづらく、やりたいことを調べる際に探しまわることになります。
・料金を月次でコミットしなければならない
素直に従量課金にしていただけると非常に楽です。
・料金が少々高い
特にログ保管は高めと感じています。
どのような課題解決に貢献しましたか?どのようなメリットが得られましたか?
・未知の障害検知
APMにより、これまで監視を仕掛けられていなかった障害ケースに気づくことができました。
・問い合わせ対応の精度・速度向上
RUM機能とトレース機能を導入したことで、ユーザ体験の確認からログ調査までをシームレスに行えるため、ユーザからの問い合わせへの対応が迅速かつ正確に行えるようになりました。
・外部SaaSの異常検知
Synthetics Testにより、外部SaaSの異常を手軽に検知できるようになり、SaaS側の発表やユーザ問い合わせより前に対応に動き出せるようになりました。
・端末監視ダッシュボード
RUMとダッシュボードを利用し、数十台のiPad端末を使った自社サービス提供時に、端末の温度・バッテリ残量・通信状況等をモニタリングし、立ち会い負荷低減・人件費の削減・安定したサービスの提供を実現できました。
検討者へお勧めするポイント
これから監視ツールを一から検討する場合は、Datadog一つでOKなのでお勧めです。
続きを開く