Redshift 連接器

Redshift 連接器允許在外部 Amazon Redshift 叢集中查詢和建立資料表。這可以用於在不同系統(如 Redshift 和 Hive)之間或在兩個不同的 Redshift 叢集之間聯接資料。

設定

若要設定 Redshift 連接器,請在 etc/catalog 中建立一個目錄屬性檔案,例如命名為 redshift.properties,以將 Redshift 連接器掛載為 redshift 目錄。使用以下內容建立檔案,並根據您的設定適當取代連線屬性

connector.name=redshift
connection-url=jdbc:postgresql://example.net:5439/database
connection-user=root
connection-password=secret

多個 Redshift 資料庫或叢集

Redshift 連接器只能存取 Redshift 叢集中的單一資料庫。因此,如果您有多個 Redshift 資料庫,或想要連線到多個 Redshift 叢集,您必須設定多個 Redshift 連接器執行個體。

若要新增另一個目錄,只需將另一個屬性檔案新增到 etc/catalog,並使用不同的名稱(確保它以 .properties 結尾)。例如,如果您將屬性檔案命名為 sales.properties,Presto 將使用已設定的連接器建立名為 sales 的目錄。

一般設定屬性

屬性名稱

說明

預設值

user-credential-name

其值為 JDBC 驅動程式使用者名稱的 extraCredentials 屬性名稱。請參閱 參數參考中的 extraCredentials

password-credential-name

其值為 JDBC 驅動程式使用者密碼的 extraCredentials 屬性名稱。請參閱 參數參考中的 extraCredentials

case-insensitive-name-matching

不區分大小寫地比對資料集和資料表名稱。

false

case-insensitive-name-matching.cache-ttl

將快取遠端資料集和資料表名稱的時間長度。設定為 0ms 以停用快取。

1m

查詢 Redshift

Redshift 連接器為每個 Redshift 綱要提供一個綱要。您可以執行 SHOW SCHEMAS 來查看可用的 Redshift 綱要

SHOW SCHEMAS FROM redshift;

如果您有名為 web 的 Redshift 綱要,您可以執行 SHOW TABLES 來查看此綱要中的資料表

SHOW TABLES FROM redshift.web;

您可以使用以下任一方法,查看 web 資料庫中 clicks 資料表的資料行清單

DESCRIBE redshift.web.clicks;
SHOW COLUMNS FROM redshift.web.clicks;

最後,您可以存取 web 綱要中的 clicks 資料表

SELECT * FROM redshift.web.clicks;

如果您為目錄屬性檔案使用了不同的名稱,請在以上範例中使用該目錄名稱而不是 redshift

Redshift 連接器限制

尚不支援以下 SQL 陳述式