資料連線是任何資料分析的常見要求。可能需要在單個源中連線來自不同表的資料,或者從多個源連線資料。
Tableau提供了使用「Data」選單中提供的資料窗格來連線表的功能。
連線意味著組合關聯式資料庫中一個或多個表的列。它還建立一個可以儲存為表的集合,或者可以按原樣使用它。
連線指定有五種型別:
連線部分用於組合來自兩個或多個表的行,基於它們之間的相關列。
1.交叉連線:交叉連線生成的行將第一個表中的每一行與第二個表中的每一行組合在一起。
2.內部聯接:內部聯接返回正在連線的表中的匹配行。
3.自然連線: 自然連線不使用任何比較運算子。它沒有連線方式。
如果兩個關係之間至少存在一個共同屬性,則只能執行自然連線。此外,屬性必須具有相同的名稱和域。自然連線適用於那些匹配屬性,其中兩個關係中的屬性值相同。
4.外連線:外連線是內連線的擴充套件形式。它返回正在連線的表的匹配行和非匹配行。
外連線的型別如下:
4.1.左外連線:左外連線返回正在連線的表中的匹配行,以及結果中左表的不匹配行,並將NULL值放在來自右表的屬性中。
4.2.右外連線:右外連線操作返回正在連線的表中的匹配行,以及結果中右表中的不匹配行,並將NULL值放在來自左表的屬性中。
4.3.全外聯接:完整外部聯接用於組合表。因此,它包含兩個表中的所有值。當表中的值與另一個表不匹配時,它將在資料網格中返回NULL值。
5.1.自聯接: 自聯接用於將表連線到自身。這意味著表的每一行都與自身以及表的每一行組合在一起。
我們假設一個資料源Sample-superstore 來建立兩個表(如Orders和Returns)之間的連線。
下面的螢幕截圖顯示了使用Order id
欄位在Orders和Returns表之間建立內部連線。
Tableau會自動在兩個表之間建立一種連線型別,但可以根據需要進行更改。
inner join
, left outer join
, right outer join
和 full outer join
。可以通過單擊「資料源」選項來更改欄位,以新增連線彈出視窗中可用的新連線子句。
選擇欄位時,可以使用搜尋文字框搜尋欄位。