對視點執行去除重複作業

對節點執行去除重複可讓您比對視點中類似的現有節點,並將它們組合成單一節點。

注意事項

  • 您必須具有視點的資料管理員或更高層級的權限,才能對該視點執行去除重複。

  • 您無法對時間標籤視點或已封存的視點執行去除重複。
  • 您一次只能在一個作用中要求中對視點執行去除重複。如果正在另一個作用中要求中對某視點執行去除重複,則無法在新的去除重複作業中選取該視點。
  • 每個要求僅支援一種去除重複模式。您無法在相同要求中執行叢集鍵和時間型去除重複。
  • 在視點中執行去除重複時:
    • 視點中的節點會與該節點類型中的所有節點進行比對,即使其中有些節點不在現有視點中。
    • 如果視點包含共用節點,則只會針對該節點的一個例項執行比對規則。
    • 每個相符節點最多會顯示 20 個比對結果。
  • 要求項目上限為 10,000 個。由於每次合併作業都會產生兩個要求項目 (刪除來源節點以及目標節點的特性更新),當相符節點數達到 5000 時,該要求的去除重複程序將會停止,系統會提示您建立新的要求以繼續對節點執行去除重複。如果您的要求已包含其他要求項目,則可能會更早達到要求上限。
  • 由於您是對視點中的節點集,而非對傳入的要求項目執行去除重複,因此兩個不同的節點經常可能互為比對候選項目。例如,對包含 "Oracle" 和 "Oracle Inc" 節點的視點執行去除重複時,這兩個節點彼此都可以作為比對候選項目。您接受的重複節點將控制哪個節點會被刪除,以及哪個節點會成為存留節點。請記住,相符節點是將被刪除的節點,而比對候選節點則是存留節點。請參閱瞭解去除重複中的相符節點和比對候選項目

    Tip:

    當您接受比對結果為重複項時,該重複節點會在「去除重複結果」畫面中被標示為重複 (請參閱瞭解去除重複結果)。標示的節點就是要刪除的節點。
  • 如果在去除重複過程中比對三個或更多的節點,則無法將第一個合併至第二個,再將第二個合併至第三個。不過,您可以將第一個和第二個同時合併至第三個。

    例如,假設您有節點 "Oracle"、"Oracle Inc" 和 "Oracle Incorporated",並希望保留 "Oracle Incorporated",同時將其他兩個節點的資訊合併至該節點。您不能將 "Oracle" 合併至 "Oracle Inc",再將 "Oracle Inc" 合併至 "Oracle Incorporated"。請改為尋找相符節點 "Oracle",並將其標示為 "Oracle Incorporated" 的重複項,然後尋找 "Oracle Inc",並將其標示為 "Oracle Incorporated" 的重複項。

若要對視點執行去除重複,請執行下列動作:

  1. 為您要執行去除重複的視點建立要求。
  2. 在視點視窗左側,按一下比對並去除重複 比對圖示 頁籤。
  3. 在比對窗格中,按一下新增 建立比對圖示,然後選取去除重複視點
  4. 去除重複視點對話方塊中,執行下列動作:
    1. 選取您要執行去除重複的視點
    2. 在該視點中選取節點類型。該節點類型必須已設定為可執行去除重複 (請參閱瞭解去除重複)。
    3. 選取去除重複模式
      • 叢集鍵:使用叢集化特性對視點執行去除重複。請從下拉功能表中選取叢集化特性值。下拉功能表中的叢集化特性值是以您定義為叢集鍵之特性的允許值為根據。請參閱使用叢集鍵執行去除重複

        Note:

        如果已對該叢集化特性執行去除重複作業,則系統會顯示最後處理之節點的建立日期。
      • 時間型:根據節點的建立日期對視點執行去除重複。輸入節點建立日期。請參閱時間型去除重複
  5. 選擇性:輸入批次大小以指定要檢查重複項的節點數。

    Tip:

    例如,如果您對要測試的比對規則做出變更,這會有所幫助。您可以先執行較小批次並評估結果,再對整個視點執行去除重複。
  6. 按一下執行去除重複

使用節點類型的已定義比對規則和視點的已登錄資料來源,在視點上執行去除重複。

去除重複作業

由於視點可能包含數千個節點,通常會以批次方式執行去除重複。批次可透過下列方式定義:

批次也可以根據上述某些條件的組合來定義,例如叢集鍵加上指定批次大小。

您可以選擇多種方式來處理這些批次中的節點。下列術語可協助您瞭解以下選項:

Table 11-1 批次處理選項

選項 定義 如何執行
執行 針對指定叢集或節點建立開始日期,執行第一批節點的初始去除重複。 去除重複視點對話方塊中,按一下執行去除重複
繼續 針對指定叢集或節點建立開始日期,執行下一批節點的後續複製。系統會追蹤已處理的節點,以便您可以從上次停下來的地方繼續。 執行初始「執行」作業之後,在去除重複視點對話方塊中,按一下執行去除重複
重新執行 重新處理要求中的現有結果集。這可能包含一或多個批次。

備註:重新執行只會重新處理未接受的比對結果。

去除重複結果集面板中,按一下您要重新執行之結果集旁的動作 「動作」圖示,然後選取重新執行
重新啟動 從頭開始重新處理已處理過的叢集。

備註:重新啟動僅適用於叢集鍵去除重複。

提示重新執行重新啟動之間的差異在於,重新執行會重新處理一或多個批次,而重新啟動則會重新處理一個叢集

去除重複視點對話方塊中,按一下叢集鍵旁的重新啟動 「重新啟動」圖示
捨棄 刪除指定要求的現有結果集。系統會保留最後處理的節點,以便您下次執行去除重複時可以繼續。

備註:刪除要求也會捨棄結果集。

去除重複結果集面板中,按一下您要重新執行之結果集旁的動作 「動作」圖示,然後選取捨棄
捨棄並重新執行 刪除指定要求的現有結果集,並重新處理該結果集中的相同節點。這可能包含一或多個批次。 去除重複結果集面板中,按一下您要重新執行之結果集旁的動作 「動作」圖示,然後選取捨棄並重新執行