Reakcja Avenga na wojnę w Ukrainie: ciągłość działania i pomoc humanitarna
Wprowadzenie
Naszym klientem jest wiodąca globalna firma z branży doradztwa finansowego, która wspiera doradców finansowych, konsultantów oraz inwestorów instytucjonalnych.
NDA
Klient, działający w sektorze finansowym, pracuje z dużymi zbiorami notatek ze spotkań ze swoimi klientami w celu wyszukiwania określonych informacji, organizowania i konsolidowania ich w łatwe do odczytania interaktywne zestawy danych do różnych celów biznesowych. W związku z tym potrzebował opcji szybkiego wyszukiwania, znajdowania i przetwarzania tekstów. Chciał także uzyskać rzeczywisty wgląd w dane zawarte w notatkach, aby zrozumieć swoich (potencjalnych) klientów, zidentyfikować trendy rynkowe i określić istniejące ryzyko w celu podejmowania dalszych świadomych decyzji biznesowych poprzez etykietowanie dokumentów.
Aby umożliwić szybkie przeszukiwanie tekstu pod kątem cennych informacji, porównaliśmy podejście out of the box ze spersonalizowanym rozwiązaniem:
Zaproponowaliśmy zastosowanie Modelowania Tematycznego, które pomaga określić listę tematów omawianych we wszystkich notatkach zebranych podczas spotkań i wskazać obecność jednego lub więcej tematów w każdym dokumencie. Ponadto nasz zespół wykorzystał rozpoznawanie nazwanych encji (NER) do wykrywania słów lub fraz w tekście, które mają albo wstępnie ustawiony typ generyczny (lokalizacja, osoba, podmiot geograficzny i geopolityczny) albo typ niestandardowy (produkt, organizacja, podmiot finansowy).
Oba podejścia pozwalają na wyszukiwanie informacji w nieustrukturyzowanym tekście, nakładając kontekst na treść poprzez oznaczenie jej metadanymi, które można odczytać maszynowo. Jednak podejście niestandardowe umożliwia etykietowanie nowych i niewidzianych dokumentów w locie, z jednym lub wieloma tematami znalezionymi za pomocą algorytmu modelowania tematycznego.
Jest to najlepsze rozwiązanie w przypadkach, gdy wymagana jest większa kontrola nad treningiem, optymalizacją i hostingiem modelu tematycznego (np. gdy mamy do czynienia z konkretną domeną tekstów, tak jak w naszym przypadku). Co więcej spersonalizowany model jest udoskonalany w trakcie tworzenia, więc nie wymaga dodatkowego wysiłku. Używając niestandardowych rozwiązań NER, opartych na modelu głębokiego uczenia, możemy wykrywać zarówno domyślne, jak i niestandardowe podmioty w czasie rzeczywistym.
Nasze rozwiązanie pomaga automatycznie przeszukiwać surowy, nieustrukturyzowany tekst, szybko go przetwarzać i wydobywać rzeczywiste dane w celu podejmowania świadomych decyzji biznesowych. Korzyści dla klienta:
Wykorzystane technologie
Python
NLP
LDA
AWS Comprehend
AWS SageMaker
Docker
Salesforce