Przejdź do głównej treści

Poziom Kroków Analitycznych

DEAN

Czym jest DEAN?

Nasz zestandaryzowany sposób analizy oparty na regułach pozwala zidentyfikować pozycje w określonej bazowej tabeli, które odpowiadają danemu kryterium. Przykładowo, AP_ManPayments zestawia wszystkie faktury z tabeli AP, które nie zostały jeszcze rozliczone przez automatyczny przebieg płatności. Zdarzają się jednak pozycje, które mogą zainteresować klienta, a nie są wykrywane przez nasze kroki analityczne.

Właśnie z tego powodu wdrożyliśmy DEAN. DEAN wykorzystuje statystyczne (nie oparte na regułach) metody w celu identyfikacji wartości odstających w wybranej bazowej tabeli. Wartość odstająca to wiersz istotnie różniący się od innych, np. z powodu nietypowych danych. DEAN wynika z detekcji anomalii. Terminy "anomalia" oraz "wartość odstająca" są synonimiczne. DEAN można zastosować do następujących tabel bazowych: SD, PU, MM, MD, GL, DL, BL, AR, AP.

Logika

Dla każdej tabeli bazowej uruchamiany jest osobny krok analityczny, wywołujący ten sam skrypt R, w którym zaimplementowano DEAN. W zależności od modułu do R przekazywane jest od 50 do 100 predefiniowanych i stałych kolumn z tabeli bazowej. Po przesłaniu danych do R/DEAN wykonywane są następujące etapy:

  1. Wstępne przetwarzanie
    • Usuwane są kolumny zawierające tylko jedną unikalną wartość
  2. Wyszukiwanie wartości odstających
    • Podział tabeli bazowej na części w celu uniknięcia problemów z pamięcią RAM przy obliczaniu wartości odstających
    • Wyszukiwanie wartości odstających w każdym fragmencie
    • Zidentyfikowanych zostaje maksymalnie 100 pozycji odstających z wybranej tabeli bazowej
  3. Wyjaśnienie wartości odstających
    • Dla każdej znalezionej wartości odstającej system analizuje, które kolumny i wartości odpowiadają za jej nietypowość

Ważne kolumny

DEAN udostępnia listę odnalezionych wartości odstających. Do wyników dodawane są następujące kolumny:

Nazwa techniczna kolumnyNazwa opisowa kolumnyOpis
Outlier_ScoreOutlier_Score- zawiera wartość z zakresu od 0 do 1
- im wyższa, tym dana pozycja jest bardziej odstająca
Detected_by_DEAN_becauseDetected_by_DEAN_because- krótki opis oraz nazwy kolumn, których wartości powodują, że dana pozycja jest uznana za odstającą

Market Basket Analiza (dla kont G/L)

Czym jest Market Basket Analiza?

Market Basket Analiza dotyczy dokumentów oraz odpowiadających im kont G/L zawartych w wybranej tabeli GL.

Logika

Do R przekazywane są następujące kolumny z tabeli GL:

  • BKPF_BUKRS
  • BKPF_GJAHR
  • BKPF_BELNR
  • BSEG_BUZEI
  • c_GL02_HKONT_SKAT_TXT20
  • BSEG_SHKZG

Tworzone są następnie Market Baskets. Market Basket oznacza strukturę (tablicę lub listę), zawierającą wszystkie konta G/L użyte w konkretnym dokumencie. Każdy market basket (i każdy dokument) jest unikalnie identyfikowany przez kolumny: BKPF_BUKRS, BKPF_GJAHR i BKPF_BELNR.

Przykład: Market Basket może zawierać następujące konta G/L:

  • 0000156000 - A/R ICO_S
  • 0000874010 - Rozliczenie aktywów przeznaczonych do sprzedaży_H
  • 0000261100 - VAT należny_H

Jak widać w przykładzie, do każdego konta G/L dołączana jest informacja o debet/kredyt. Jeśli dane konto G/L pojawia się w jednym dokumencie wielokrotnie, w obrębie danego market basketu występuje tylko raz.

Następnie wyszukiwane są często występujące reguły w market basketach.

Przykładowa reguła: Jeżeli dokument zawiera 0000193800 – konto rozliczeniowe ELKO_S oraz 000261100 – VAT należny_S, to w 99,95% przypadków zawiera także 0000372100 – rabat 3_S.

Dla każdej znalezionej reguły wskazane zostaną dokładnie te dokumenty, które jej nie spełniają. Oznacza to, że w wynikach znajdą się dokumenty, które zawierają lewą stronę reguły, ale nie prawą.

Ważne kolumny

Poniższe kolumny generowane są przez Market Basket Analysis:

Nazwa techniczna kolumnyNazwa opisowa kolumnyOpis
Unique_IDUnique_IDjednoznacznie identyfikuje dokument, który nie spełnia danej reguły
Rule_NumberRule_Numbernumer reguły wykrytej podczas analizy
Exception_NumberException_Numbernumer dokumentu lub dowodu, który nie jest zgodny z określoną regułą
RuleRuletreść reguły w formie tekstowej
Number_of_Receipts_following_given_RuleNumber_of_Receipts_following_given_Ruleliczba dokumentów spełniających określoną regułę
If_a_Receipt_contains_A_Probability_that_it_contains_BIf_a_Receipt_contains_A_Probability_that_it_contains_Bprawdopodobieństwo, że dokument zawiera prawą stronę reguły, jeśli występuje w nim jej strona lewa

Do poniższych analiz wymagana jest instalacja R

  • GL_AI_MBA_Accounts (Market Basket Analiza dla kont G/L)
  • AI_MarketBasket (Market Basket Analiza dla dowolnej tabeli)
  • AI_Outliers (DEAN dla dowolnej tabeli)
  • **_AI_Outliers (DEAN dla Data Products/Bazowych tabel)
  • AP_Dupl_Payments_AI (Analiza duplikatów płatności z użyciem AI)
  • AR_Dupl_CreditNotes_AI (Analiza duplikatów not kredytowych z użyciem AI)
  • CU_AI_Duplicates i VE_AI_ Duplicates (duplikaty w danych podstawowych)
  • CU_AI_Outliers i VE_AI_Outliers (wartości odstające w danych podstawowych)
  • Root-Cause-Analysis

Poniżej omówienie wybranych kolumn w analizie Root-Cause-Analysis:

Nazwa kolumnyOpis
Root_Cause_CountOpisuje zidentyfikowaną przyczynę (uwzględnia liczbę wystąpień)
Root_Cause_VolumeOpisuje zidentyfikowaną przyczynę (dla uwzględnienia wartości kwotowych)
Trend_CountPrzechowuje wartość trendu dla danego miesiąca (analiza liczby wystąpień)
Trend_VolumePrzechowuje wartość trendu dla danego miesiąca (przegląd wartości kwotowych wykryć)
Benchmark_Count_MeanPrzechowuje wartość Benchmark dla danego miesiąca (analiza liczby wystąpień)
Benchmark_Volume_MeanPrzechowuje wartość Benchmark dla danego miesiąca (uwzględnienie wartości kwotowych wykryć)