Jakie korzyści daje uczenie maszynowe w analizie ryzyka transakcji biznesowych?

Posted on

Prowadzenie biznesu w oczywisty sposób wiąże się z zawieraniem transakcji. Wszyscy chcielibyśmy, aby te transakcje przebiegały sprawnie i bez zakłóceń. Jednym słowem chcielibyśmy, aby usługa lub towar został dostarczony na czas i w odpowiedniej jakości, a z drugiej strony aby spłynęła należność za wystawioną fakturę. Niestety, nie zawsze tak jest. Często kontrahent okazuje się nieuczciwy lub zdarzają się inne losowe okoliczności, które nie pozwalają wywiązać się mu z zawartej umowy.

Każda nieopłacona faktura generuje straty dla przedsiębiorstwa. Zbytnia przezorność też jest dla przedsiębiorstwa niebezpieczna. Jeżeli nie będziemy zawierali umów, bojąc się że nie otrzymamy zapłaty, nasz biznes szybko upadnie.

Ważne jest zatem to, aby w możliwie optymalny i racjonalny sposób ocenić ryzyko związane z zawarciem lub odrzuceniem umowy pomiędzy firmami.

Często odnosimy się tutaj do własnego doświadczenia i wiedzy – znamy naszych kontrahentów, staramy się oszacować ich wiarygodność i wypłacalność na podstawie wiedzy branżowej czy naszego rozpoznania. Zapewne jest to metoda dość skuteczna, ale czy najskuteczniejsza? Czy da się dzięki niej określić w sposób ilościowy zysk lub straty przedsiębiorstwa wynikające z konkretnej polityki zawierania umów?

Współczesną odpowiedzią na powyższe pytanie jest „Nie!”. Wynika to z dużej ilości danych oplatających cały nasz świat. Te dane można wykorzystać, stosując uczenie maszynowe – nauczyć nasz komputer rozpoznawania ryzyka związanego z zawarciem umowy, a co najważniejsze, ustalenia progu tego ryzyka, tak aby było to dla nas najbardziej opłacalne. Wytłumaczymy to na przykładzie.

Konkretny przykład

Prowadzimy Firmę, która dostarcza, dla ułatwienia niniejszych rachunków, bardzo powtarzalne usługi. Koszt świadczenia pojedyńczej usługi (materiały, koszty pracy) to ok 30 dukatów. Nasza firma wystawia faktury za niniejsza usługę, które opiewają na 100 dukatów.

Rocznie zawieramy około 200 umów – każda z innym odbiorcą. Gdyby świat był całkowicie uczciwy zarabialiśmy: 200 umów x 70 dukatów = 14 000 dukatów rocznie. Ale nasz świat, niestety, nie jest w pełni uczciwy. Około 10 procent z naszych odbiorców nie płaci nam za faktury. Liczymy dochód naszego przedsiębiorstwa, i umieszczamy go w TABELI A kolumnie “Podejście swobodne”.

Załóżmy teraz, że zmienia się dyrektor finansowy naszej firmy. Przychodzi osoba o zszarganych nerwach, która lubi żyć spokojnie. Podejmuje decyzje: zawierajmy umowy tylko z pewniakami. Niestety pewniaków, czyli tych firm, wobec których nasz sztab rozpoznania ustalił, że na pewno zapłacą, jest jedynie 60% ze wszystkich 200, które się do nas zgłaszają. Roczny bilans, przy takiej strategii zamieszczony jest w TABELI A, w kolumnie “Podejście asekuracyjne. No cóż, spokojne życie oraz brak nerwów kosztuje nas 3 600 dukatów rocznie!

 

TABELA A

Podejście
swobodne asekuracyjne riskM
Koszty 6 000 dukatów 3 600 dukatów 5340 dukatów
Jak liczymy? 200 trans x 20 duk. 60% z 200 trans.  x 30 duk. 89% z 200 trans. x 30 duk.
Przychód 18 000 dukatów 12 000 dukatów 17400 dukatów
Jak liczymy? 90% z 200 trans.  x100 duk. 60% z 200 trans. x 100 duk. 87% z 200 trans. x 100 duk.
Zysk 12 000 dukatów 8 400 dukatów 12 060 dukatów

Uczenie Maszynowe

A gdyby zatrudnić uczenie maszynowe, czyli klasyfikator – algorytm wyuczony maszynowo na naszych historycznych klientach tak, aby skuteczniej oceniać który z kontrahentów zapłaci a który nie? Użyjemy do tego danych zebranych w naszej firmie z okresu przed przyjściem nowego nerwowego dyrektora finansowego. Uwzględnimy też informacje, które są dostępne o naszym kontrahencie: wpisy z KRS, z BIG, stron internetowych, profili serwisów społecznościowych oraz dowolne inne dane pozyskane w przemyślny sposób.

Musimy jeszcze zatrudnić zespół Data Science, który opracuje nam model klasyfikacyjny, czyli klasyfikator. Nazwijmy go riskM. Obecne technologie uczenia maszynowego pozwalają na utworzenie bardzo skutecznych klasyfikatorów. Wciąż jednak klasyfikatory uczenia maszynowego popełniają błędy. Z tym że możemy ilość tych błędów oszacować. Klasyfikator może popełniać błędy dwojakiego rodzaju. Zanim jednak omówimy szczegółowo błędy, to ucieszmy się tym, że nasz riskM potrafi klasyfikować dobrze! To znaczy, jeśli nauczonemu klasyfikatorowi przedstawiamy nowego kontrahenta (czyli dane opisujące firmę z którą chcemy podpisać umowę), to nasz klasyfikator z reguły oceni prawidłowo: “ta firma zapłaci za fakturę” lub “ta firma nie zapłaci za fakturę” Nasz klasyfikator może także popełnić błędy – po pierwsze może ocenić, że firma, która w rzeczywistości zapłaciłaby za fakturę, nie zapłaci za nią, zatem zarekomendować niezawieranie umowy, lub odwrotnie – ocenić, że firma, która w rzeczywistości nie zapłaci za fakturę, jest rzetelnym odbiorcą i zarekomendować zawarcie umowy.

Weźmy nasz klasyfikator riskM. Jego skuteczność opisujemy czterema parametrami: TP,FP,TN,FN, których wyjaśnienie znajduje się na Rysunku 1.

Rysunek 1: Jak interpretować wynik klasyfikacji? Każde zagadnienie klasyfikacji zasadniczo polega na odróżnieniu dwóch grup obserwacji. Z jednej strony, mamy rzeczywistość: przypadki Positives (niebieskie romby) i Negatives (czerwone romby). Idealnym klasyfikatorem, takim który nie popełnia żadnych błędów, byłaby pionowa brązowa linia. Z reguły jednak, klasyfikator popełnia błędy: niektóre przypadki Positives oznaczane są jako Negatives, i ponieważ klasyfikator się tu myli, nazywamy je False Negatives; z drugiej strony niektóre przypadki Negatives oznaczane są jako Positives, i te nazywamy False Positives.

Analiza opłacalności

Wróćmy do naszego przykładu i przypomnijmy: na każdych 100 kontrahentów 10 jest nieuczciwych. Mamy zatem 90 uczciwych (w uczeniu maszynowym nazywanych Positives) oraz 10 nieuczciwych (Negatives). Nasz klasyfikator, po zaprezentowaniu mu wszystkich 100 kontrahentów, dzieli je następująco: 89 uznaje za uczciwych a 11 za nieuczciwych. To jednak nie wystarcza, abyśmy mogli oszacować nasz zysk po wdrożeniu naszego klasyfikatora. Musimy wiedzieć więcej. I wiemy: z 89 ocenionych jako uczciwych, 87 jest rzeczywiście uczciwych (True Positives, dalej TP = 87%) a dwóch mylnie ocenionych jako uczciwych (False Positives, dalej FP = 2%). Natomiast z pozostałych 11 ocenionych jako nieuczciwych ośmiu jest rzeczywiście nieuczciwych (True Negatives, TN = 8%), a trzech mylnie zostało ocenionych jako nieuczciwi (False Negatives, FN = 3%). Można zatem wyliczyć, jaki zysk odniesie nasza firma stosując klasyfikator riskM w porównaniu do asekuranckiego podejścia nowego nerwowego dyrektora finasowego oraz swobodnego podejścia jego poprzedników. Wyniki tych obliczeń zamieszczamy w kolumnie riskM Tabeli A. Jak widać zarabiamy rocznie o 60 dukatów więcej, niż w przypadku podejścia „swobodnego”. Czy to dużo, czy mało – to oczywiście zależy od skali przedsiębiorstwa.

Dokładność tak ustawionego klasyfikatora, czyli jego ACCURACY wynosi 95%. Natomiast, jeśli będziemy stopniowo zwiększali ilość nieuczciwych kontrahentów przyjmująć że jest ich  10, 20, 30, 40 procent to zestawienie, wyników finansowych uzyskanych przy dwóch strategiach: “swobodnej” oraz strategii opartej o klasyfikator riskM  staje się jeszcze ciekawsze, co ilustruje Wykres 1. Widać na nim co prawda stały spadek zysku przedsiębiorstwa wraz ze wzrostem ułamka nieuczciwych kontrahentów (co jest oczywiste), ale widać również że zastosowanie klasyfikatora riskM, znacznie zmniejsza tempo spadku zysku także przy sporej liczbie nieuczciwych kontrahentów, np. 40%, różnica pomiędzy zyskiem w modelu swobodnym i modelu z klasyfikatorem wynosi 1860 dukatów!

 

 

Wykres 1. Zależność osiąganego zysku od ogólnej uczciwości kontrahentów.

 Co dalej?

To oczywiście nie koniec analiz, jakie można wykonać, aby ocenić przydatność uczenia maszynowego do oszacowania ryzyka związanego z zawieraniem transakcji.

Klasyfikator o danej skuteczności można dalej dostrajać do konkretnego stosunku koszt-zysk w danej grupie transakcji. W zależności od kosztu usługi i jej ceny, w ramach klasyfikatora o danej skuteczności(mierzonego parametrem AUC) można regulować wielkość błędów typu FN oraz FP tak, aby przy pewnej, zależnej w końcu od danych, skuteczności klasyfikatora odnieść jak największy zysk finansowy.

Powyższy przykład ilustruje ogólną zasadę funkcjonowania klasyfikatorów uczenia maszynowego w praktyce przedsiębiorstwa. Od konkretnych uwarunkowań będzie zależało, jaki zysk można wypracować wdrażając dane rozwiązanie.

 

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *