使用案例¶
本節將 Presto 放入背景,以便潛在的管理員和最終使用者了解對 Presto 的期望。
Presto 不是什麼¶
由於 Presto 被社群的許多成員稱為資料庫,因此從定義 Presto 不是什麼開始是有意義的。
不要將 Presto 理解 SQL 的事實與它提供標準資料庫的功能混淆。Presto 不是通用的關聯式資料庫。它不是 MySQL、PostgreSQL 或 Oracle 等資料庫的替代品。Presto 並非設計用於處理線上交易處理 (OLTP)。這也適用於許多其他設計和最佳化用於資料倉儲或分析的資料庫。
Presto 是什麼¶
Presto 是一個工具,旨在有效率地使用分散式查詢來查詢大量資料。如果您使用 TB 或 PB 級別的資料,您可能正在使用與 Hadoop 和 HDFS 互動的工具。Presto 被設計為使用 MapReduce 工作管線(如 Hive 或 Pig)查詢 HDFS 的工具的替代方案,但 Presto 不僅限於存取 HDFS。Presto 可以擴充並已擴充到可在不同類型的資料來源上運作,包括傳統關聯式資料庫和其他資料來源(如 Cassandra)。
Presto 被設計為處理資料倉儲和分析:資料分析、彙總大量資料和產生報告。這些工作負載通常被歸類為線上分析處理 (OLAP)。
誰在使用 Presto?¶
Presto 是一個開源專案,在 Presto 基金會的管理下運作,該基金會是 Linux 基金會 的一部分。Presto 是在 Meta 發明的,並由 Meta、Bytedance、IBM、Uber、Twitter 和其他地方的社群成員繼續開發。