前回はDatabricksの「DatabricksのMLflow」から「Databricksのワークフロー」までの内容について簡単に説明しました。 今回はデータの取り込みと処理について説明します。 14. データの取り込み Databricksでのデータ処理の第一歩は、データの取り込みです。データの ...
End-to-Endの自動化実務:Auto Loaderとカタログの連携 自動化は「取込」だけでは完結しない Auto Loaderの便利さに最初に触れたとき、多くの人がまず感動するのは、「新着ファイルを自動で拾ってくれる」という点だと思います。 実際、それだけでも十分に価値 ...
Databricksは、カルフォルニア州立大学バークレー校において、CEO兼共同設立者のアリ・ゴディシ(Ali Ghodsi)氏をはじめ、データとAIなどを研究するOSSの分散処理フレームワーク「Apache Spark」のクリエイター20人により、2013年にサンフランシスコで創業した。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する