Tasks
Vor Version 1.14 wird im Workspace definiert, ob Extraction- oder Analytic-Tasks darin erstellt werden können.
Ab Version 1.14 gibt es keine Einschränkung im Workspace mehr. Stattdessen können verschiedene Task-Typen in einem Workspace erstellt werden.
Ab Version 1.16 gibt es zusätzlich den Task-Type Replication Task.
Du kannst in einem Workspace mehrere Tasks erstellen, um verschiedene Analysen durchführen zu können. Diese Tasks kannst Du zeitlich einplanen, sodass sie einmalig, stündlich, täglich, wöchentlich oder monatlich automatisiert ausgeführt werden.
Beim Hinzufügen eines neuen Tasks hast Du nun mehrere Möglichkeiten:
- Vor Version 1.14: Klicke oben auf Workspaces und anschließend direkt in einem Workspace auf den Button + Task in Workspace oder klicke oben auf Workspaces, anschließend auf den Namen des Workspace, in der nachfolgenden Task-Auflistung kannst Du oben rechts auf + Task klicken
- Ab Version 1.14: klicke oben auf Workspaces und dann oben rechts auf den Button + Task
Task-Erstellung
Wenn Du einen Task anlegen möchtest, musst Du wählen, welche Art von Task erstellt werden soll.
Analytic Task
Es wird ein Extraktionspaket auf Grundlage der gewählten Schritte erzeugt, die Daten werden aus dem SAP-System extrahiert und in die SQL-Datenbank geschrieben. Anschließend wird die Analyse durchgeführt.
Extraction Task
Hier wird für die Daten-Extraktion aus SAP ein benutzerdefiniertes Paket verwendet, welches über das Package Studio erstellt wurde. Diese Daten werden in die SQL-Datenbank gespeichert. Es findet keine Analyse der Daten statt.
Replication Task - ab Version 1.16
Die aus SAP extrahierten Daten werden in die unter Punkt Connection gewählte Umgebung weitergegeben. Eine direkte Speicherung auf dem SQL-Server, wie beim Analytic- oder Extraction-Task, findet nicht statt.
In den nächsten Schritten siehst Du nun, welche Einstellungen in den Tasks getroffen werden müssen.
Alle Einstellungen, die neben ihrem Namen einen Asterisk * haben, sind Pflichtangaben und müssen daher definiert werden.
Workspace & SAP-System
- Workspace: trage den Workspace ein bzw. ändere ihn
- SAP-System & Slots: bestimme, aus welchem SAP-System die Daten extrahiert werden sollen und wie viele Tabellen gleichzeitig extrahiert werden können (Standard: 2 Slots)
- Privacy Protection: hier kannst Du definieren, ob sensible Daten (bspw. Usernamen, Personennamen, etc.) verschlüsselt werden sollen (Du kannst die Verschlüsselung bezogen auf ein SAP-System auch erzwingen. Aktiviere hierzu die Option Force Privacy Protection bei der Erstellung der Verbindung des SAP-Systems in dab Nexus über Settings > SAP Systems)
- None: keine Verschlüsselung
- Pseudonymize: sensible Daten werden mit einem eingetragenen Salt verschlüsselt
- Anonymize: sensible Daten werden mit dem Wert XXXXXXXXXXXX ersetzt
- Pseudonymize Salt: definiere hier den Salt, mit dem die sensiblen Daten verschlüsselt werden sollen
Klicke anschließend auf Continue.
Data Strategy
Wähle hier eine Data Strategy aus, die Du im Vorfeld über Settings > Data Strategies erstellt hast.
Data Transformation - ab Version 1.16
- String Trimming: hier kannst Du angeben, ob bei den einzelnen Feldwerten Leerzeichen abgeschnitten werden sollen. Du kannst sie entweder vor dem Feldwert (Start), hinter dem Feldwert (End), vor und hinter dem Feldwert (Both) oder garnicht (None) abschneiden.
- Use Field Prefix: aktivierst Du diese Option, wird bei den Ergebnistabellen vor dem Feldnamen auch der Tabellenname angezeigt. Das bedeutet, statt EBELN steht dann EKKO_EBELN in der Tabelle.
- Use Primary Key Override: ist diese Option nicht sichtbar, muss sie zuerst in den Settings aktiviert werden (folge den Schritten in diesem Artikel). Die Aktivierung der Einstellung im Task führt dazu, dass bei jeder extrahierten Tabelle eine neue Spalte mit dem Namen NEXUS_ID hinzugefügt wird, die als Primärschlüssel dient und die systemeigenen Primärschlüsselfelder umgeht.
Connection (bei Replication Task) - ab Version 1.16
Du hast hier die Möglichkeit, eine von drei Connection-Typen auszuwählen:
- Fabric Mirrored Database: unter der Auswahl musst Du die Fabric Mirrored Database hinterlegen.
- Snowflake: trage hier die Snowflake und das Database Schema ein.
- Fabric Lakehouse: hinterlege das Fabric Lakehouse.
- Data Strategy: wähle hier aus Merge (vorhandene Daten mit den neuen zusammenfassen) oder Overwrite (alte Daten löschen und neue einfügen).
Scheduling
In diesem Abschnitt hast Du die Möglichkeit, Tasks einmalig auszuführen oder sie wiederholt einzuplanen. Die folgenden Schritte erklären Dir alle möglichen Einstellungen:
Regler | Intervall | Mögliche Einstellungen | Beschreibung |
Once | keine Wiederholung | Start Time mit Datum und Uhrzeit (incl. Zeitzone) oder Run immediately | Run wird entweder zum eingetragenen Zeitpunkt oder sofort nach Fertigstellung des Tasks einmalig durchgeführt |
Hourly | stündlich | Start Time mit Datum und Uhrzeit (incl. Zeitzone) 1 bis 23 Stunden | Lege fest, in welchem Stunden-Intervall der Task wiederholt ausgeführt werden soll |
Daily | täglich | Start Time mit Datum und Uhrzeit (incl. Zeitzone) 1 bis 6 Tage | Lege fest, in welchem Tages-Intervall der Task wiederholt ausgeführt werden soll |
Weekly | wöchentlich | Wochentag-Auswahl Start Time mit Datum und Uhrzeit (incl. Zeitzone) 1 bis 7 Tage | Lege fest, an welchen Wochentagen der Task wiederholt ausgeführt werden soll |
Monthly | monatlich | 1 bis 28 Tage oder last day 1 bis 12 Monate Start Time mit Datum und Uhrzeit (incl. Zeitzone) | Lege fest, an welchen Tagen im Monat der Task wiederholt ausgeführt werden soll (alternativ auch immer am letzten Tag im Monat) |
Klicke nach dem Festlegen des Intervalls auf Continue.
Parameter
Je nach Typ des Tasks kannst Du ganz oben in der Mitte entweder ein Extraction Package mit Variante oder eine Analytic Group angeben.
Die darunter aufgelisteten Parameter ändern sich je nach Auswahl des Task-Typs und des Extraction Packages bzw. der Analytic Group.
Auch hier müssen alle mit * (Asterisk) versehenen Parameter befüllt werden, da es sich um Pflichtangaben handelt.
Klicke anschließend auf Continue.
Third-Party Services (nur für Analytic- & Extraction-Task)
Du musst hier keinen Third-Party Service einbinden. Wenn Du ohne fortfahren möchtest, klicke hier einfach unten auf Continue.
- Third-Party Services: mit einem Klick auf das große + kannst Du einen Third-Party Service einbinden, wenn Du die extrahierten und analysierten Daten bspw. in Excel oder eine CSV-Datei exportieren möchtest.
Excel
Markiere im Popup die Option Excel und wähle Choose & Configure.
Folgende Einstellungen können bzw. müssen angegeben werden:
- Export Path (ggf. mit Subfolder): gebe einen Pfad an, wo die Excel-Datei gespeichert werden soll
- Test Path: mit diesem Button kannst Du testen, ob der von Dir angegebene Pfad richtig ist und erreicht werden kann
- Copy Full Path: mit einem Klick kannst Du Dir den Datei-Pfad in die Zwischenablage kopieren, sodass Du ihn anschließend im Datei-Browser einfach einfügen und suchen kannst
- Export Mode:
- File per Result Table: pro Ergebnistabelle (Result Table) wird eine eigene Excel-Datei angelegt und gespeichert
- Sheet per Result Table in one File: pro Ergebnistabelle (Result Table) wird ein eigenes Arbeitsblatt (Sheet) in einer Excel-Datei angelegt. So landen alle Result Tables in einer einzigen Excel-Datei
- Data Limit: lege fest, wie viele Einträge maximal in einer Datei gespeichert werden sollen. Wird diese Anzahl überschritten, wird automatisch eine weitere Excel-Datei angelegt
- Add Header: mit Aktivierung der Option wird der Spaltenname in die erste Zeile der Excel-Tabellen geschrieben
- Create Subfolder per Run: ist diese Option aktiviert und wird der Task wiederholt ausgeführt, werden die Excel-Dateien eines jeden Runs separat in eigene Unterordner gespeichert
- Result Table & Alias: für jede Ergebnistabelle kannst Du hier eine alternative Bezeichnung eintragen, bspw. um den Tabellen in den Export-Dateien sprechendere Namen zu geben
Klicke unten rechts auf Add Excel Service, um die Einstellungen für den Third-Party Service abzuschließen.
Dir wird nun in der Übersicht angezeigt, dass Du einen Excel-Export als Third-Party Service für diesen Task erstellt hast. Du hast hier des Weiteren auch die Möglichkeit, mehrere Third-Party Services anzulegen um die Ergebnistabellen bspw. parallel in CSV-Dateien zu exportieren.
CSV-Export
Beim CSV-Export verhält es sich bei der Einbindung genauso wie der Excel-Export. Klicke auf das große +, wähle CSV aus und klicke auf Choose & Configure. Du kannst hier ebenfalls, falls gewünscht, den Export-Pfad (mit Unterordner), das Data Limit, den Spaltennamen in der ersten Zeile, die Speicherarten und die Aliase für die Ergebnistabellen anpassen.
Zusätzlich musst Du beim CSV-Export noch den Delimiter angeben. Die Voreinstellung wird ebenfalls aus den Settings > Third-Party Services > CSV-Export gelesen.
Hier hast Du folgende Einstellungsmöglichkeiten:
- Komma ,
- Semikolon ;
- Hashtag #
- Pipe |
- Tab (wie die Tab-Taste Deiner Tastatur)
Klicke unten auf Continue, um fortzufahren.
Abschluss
- Name: vergebe einen Namen für den Task
- Description (optional): du kannst für den Task eine Beschreibung erstellen
Klicke anschließend unten auf Finish, um die Task-Erstellung abzuschließen.