ビッグデータを管理するための信頼性が高くスケーラブルなストレージ
どのようなビジネス課題を解決できましたか?あるいは、どのようなメリットが得られましたか?
Azure Data Lake Store は、大量の構造化データと非構造化データを一元的かつ費用対効果の高い方法で管理および保存するのに役立ちます。データソースが分散しているという問題を解決し、分析とレポート用の統合データプラットフォームを簡単に構築できます。Azure Data Factory、Synapse、Databricks などのビッグデータツールをサポートしているため、大規模なデータセットをより効率的に処理できるようになりました。また、きめ細かなアクセス制御が可能になり、データガバナンスも向上しました。これは、チームごとに必要なアクセスレベルが異なる場合に特に便利です。
改善してほしいポイントは何でしょうか?
最初は設定に時間がかかりました。特に権限構造の把握と価格内訳の理解には時間がかかりました。これは最も直感的なプロセスではありませんでした。カスタマーサポートは迅速に対応してくれますが、より技術的な問題の根源にたどり着くまでに何度かやり直さなければならないこともあります。また、使用頻度が高いときには、特に大きなファイルを直接クエリするときに、まれにレイテンシーが発生していました。
この製品・サービスの良いポイントは何でしょうか?
Azure Data Lake Store は、パイプライン内の大量のデータを確実に処理してくれました。さまざまなプロジェクトにまたがる未加工データや処理済みデータの保存に頻繁に使用しており、データの増加に合わせて拡張できます。Azure Data Factory と Databricks との統合により、ゼロからセットアップする場合に比べて実装がスムーズかつ簡単になります。また、RBAC と ACL によるアクセス制御の柔軟性にも感謝しています。
続きを開く
Reliable and Scalable storage for Managing Bigdata
What problems is the product solving and how is that benefiting you?
Azure Data Lake Store helps us manage and store massive volumes of structured and unstructured data in a centralized, cost-effective way. It solves the problem of scattered data sources and makes it easier to build a unified data platform for analytics and reporting. With its support for big data tools like Azure Data Factory, Synapse, and Databricks, we're able to process large datasets more efficiently. It has also improved our data governance by allowing granular access controls, which is especially useful when different teams need different levels of access.
What do you dislike about the product?
Setting it up initially took some time, especially figuring out the permission structure and understanding the pricing breakdown. It wasn’t the most intuitive process. Customer support is responsive, but sometimes it takes a few back-and-forths to get to the root of a more technical issue. Also, during high-frequency usage, there have been rare moments of latency, especially when querying large files directly.
What do you like best about the product?
Azure Data Lake Store has been solid for handling high-volume data in our pipeline. We use it frequently for storing raw and processed data across different projects, and it scales well as our data grows. Integration with Azure Data Factory and Databricks makes implementation smoother and ease compared to setting things up from scratch. I also appreciate the access control flexibility through RBAC and ACLs.
続きを開く