Poziom Kroków Analitycznych
DEAN
Czym jest DEAN?
Nasz zestandaryzowany sposób analizy oparty na regułach pozwala zidentyfikować pozycje w określonej bazowej tabeli, które odpowiadają danemu kryterium. Przykładowo, AP_ManPayments zestawia wszystkie faktury z tabeli AP, które nie zostały jeszcze rozliczone przez automatyczny przebieg płatności. Zdarzają się jednak pozycje, które mogą zainteresować klienta, a nie są wykrywane przez nasze kroki analityczne.
Właśnie z tego powodu wdrożyliśmy DEAN. DEAN wykorzystuje statystyczne (nie oparte na regułach) metody w celu identyfikacji wartości odstających w wybranej bazowej tabeli. Wartość odstająca to wiersz istotnie różniący się od innych, np. z powodu nietypowych danych. DEAN wynika z detekcji anomalii. Terminy "anomalia" oraz "wartość odstająca" są synonimiczne. DEAN można zastosować do następujących tabel bazowych: SD, PU, MM, MD, GL, DL, BL, AR, AP.
Logika
Dla każdej tabeli bazowej uruchamiany jest osobny krok analityczny, wywołujący ten sam skrypt R, w którym zaimplementowano DEAN. W zależności od modułu do R przekazywane jest od 50 do 100 predefiniowanych i stałych kolumn z tabeli bazowej. Po przesłaniu danych do R/DEAN wykonywane są następujące etapy:
- Wstępne przetwarzanie
- Usuwane są kolumny zawierające tylko jedną unikalną wartość
- Wyszukiwanie wartości odstających
- Podział tabeli bazowej na części w celu uniknięcia problemów z pamięcią RAM przy obliczaniu wartości odstających
- Wyszukiwanie wartości odstających w każdym fragmencie
- Zidentyfikowanych zostaje maksymalnie 100 pozycji odstających z wybranej tabeli bazowej
- Wyjaśnienie wartości odstających
- Dla każdej znalezionej wartości odstającej system analizuje, które kolumny i wartości odpowiadają za jej nietypowość
Ważne kolumny
DEAN udostępnia listę odnalezionych wartości odstających. Do wyników dodawane są następujące kolumny:
| Nazwa techniczna kolumny | Nazwa opisowa kolumny | Opis |
|---|---|---|
| Outlier_Score | Outlier_Score | - zawiera wartość z zakresu od 0 do 1 - im wyższa, tym dana pozycja jest bardziej odstająca |
| Detected_by_DEAN_because | Detected_by_DEAN_because | - krótki opis oraz nazwy kolumn, których wartości powodują, że dana pozycja jest uznana za odstającą |
Market Basket Analiza (dla kont G/L)
Czym jest Market Basket Analiza?
Market Basket Analiza dotyczy dokumentów oraz odpowiadających im kont G/L zawartych w wybranej tabeli GL.
Logika
Do R przekazywane są następujące kolumny z tabeli GL:
- BKPF_BUKRS
- BKPF_GJAHR
- BKPF_BELNR
- BSEG_BUZEI
- c_GL02_HKONT_SKAT_TXT20
- BSEG_SHKZG
Tworzone są następnie Market Baskets. Market Basket oznacza strukturę (tablicę lub listę), zawierającą wszystkie konta G/L użyte w konkretnym dokumencie. Każdy market basket (i każdy dokument) jest unikalnie identyfikowany przez kolumny: BKPF_BUKRS, BKPF_GJAHR i BKPF_BELNR.
Przykład: Market Basket może zawierać następujące konta G/L:
- 0000156000 - A/R ICO_S
- 0000874010 - Rozliczenie aktywów przeznaczonych do sprzedaży_H
- 0000261100 - VAT należny_H
Jak widać w przykładzie, do każdego konta G/L dołączana jest informacja o debet/kredyt. Jeśli dane konto G/L pojawia się w jednym dokumencie wielokrotnie, w obrębie danego market basketu występuje tylko raz.
Następnie wyszukiwane są często występujące reguły w market basketach.
Przykładowa reguła: Jeżeli dokument zawiera 0000193800 – konto rozliczeniowe ELKO_S oraz 000261100 – VAT należny_S, to w 99,95% przypadków zawiera także 0000372100 – rabat 3_S.
Dla każdej znalezionej reguły wskazane zostaną dokładnie te dokumenty, które jej nie spełniają. Oznacza to, że w wynikach znajdą się dokumenty, które zawierają lewą stronę reguły, ale nie prawą.
Ważne kolumny
Poniższe kolumny generowane są przez Market Basket Analysis:
| Nazwa techniczna kolumny | Nazwa opisowa kolumny | Opis |
|---|---|---|
| Unique_ID | Unique_ID | jednoznacznie identyfikuje dokument, który nie spełnia danej reguły |
| Rule_Number | Rule_Number | numer reguły wykrytej podczas analizy |
| Exception_Number | Exception_Number | numer dokumentu lub dowodu, który nie jest zgodny z określoną regułą |
| Rule | Rule | treść reguły w formie tekstowej |
| Number_of_Receipts_following_given_Rule | Number_of_Receipts_following_given_Rule | liczba dokumentów spełniających określoną regułę |
| If_a_Receipt_contains_A_Probability_that_it_contains_B | If_a_Receipt_contains_A_Probability_that_it_contains_B | prawdopodobieństwo, że dokument zawiera prawą stronę reguły, jeśli występuje w nim jej strona lewa |
Do poniższych analiz wymagana jest instalacja R
- GL_AI_MBA_Accounts (Market Basket Analiza dla kont G/L)
- AI_MarketBasket (Market Basket Analiza dla dowolnej tabeli)
- AI_Outliers (DEAN dla dowolnej tabeli)
- **_AI_Outliers (DEAN dla Data Products/Bazowych tabel)
- AP_Dupl_Payments_AI (Analiza duplikatów płatności z użyciem AI)
- AR_Dupl_CreditNotes_AI (Analiza duplikatów not kredytowych z użyciem AI)
- CU_AI_Duplicates i VE_AI_ Duplicates (duplikaty w danych podstawowych)
- CU_AI_Outliers i VE_AI_Outliers (wartości odstające w danych podstawowych)
- Root-Cause-Analysis
Poniżej omówienie wybranych kolumn w analizie Root-Cause-Analysis:
| Nazwa kolumny | Opis |
|---|---|
| Root_Cause_Count | Opisuje zidentyfikowaną przyczynę (uwzględnia liczbę wystąpień) |
| Root_Cause_Volume | Opisuje zidentyfikowaną przyczynę (dla uwzględnienia wartości kwotowych) |
| Trend_Count | Przechowuje wartość trendu dla danego miesiąca (analiza liczby wystąpień) |
| Trend_Volume | Przechowuje wartość trendu dla danego miesiąca (przegląd wartości kwotowych wykryć) |
| Benchmark_Count_Mean | Przechowuje wartość Benchmark dla danego miesiąca (analiza liczby wystąpień) |
| Benchmark_Volume_Mean | Przechowuje wartość Benchmark dla danego miesiąca (uwzględnienie wartości kwotowych wykryć) |