sql >> Database teknologi >  >> RDS >> Database

Ustruktureret indhold:En uudnyttet brændstofkilde til kunstig intelligens og maskinlæring

Af Alex Welsh , Vice President, Analytics Practice, Ephesoft

Ville du vælge, hvor du vil tage på ferie, hvis du kun kunne få adgang til 10 til 20 procent af anmeldelserne og oplysningerne på et rejsewebsted? Hvis du gør det, vil du sandsynligvis få en uforglemmelig tur, men af ​​grunde, du måske ikke kan lide. Alligevel træffer statslige organisationer og virksomheder – fra fremstilling til forsikringsselskaber og sundhedspleje til bankvæsen – beslutninger på samme måde. Og det har de gjort i årevis. De ser på den nemme information, de kan få fra strukturerede data, mens de ignorerer deres ustrukturerede data, som Deloitte mener kan tegne sig for 80 til 90 procent af indholdet, der genereres globalt, hvilket gør ustrukturerede data til en enorm kilde til uudnyttet værdi.

Heldigvis gør fremskridt inden for AI (kunstig intelligens) og maskinlæring det nu muligt og overkommeligt at gennemskue og finde mening i enorme mængder ustrukturerede data opnået fra video- og lydfiler, e-mails, logfiler, opslag på sociale medier og endda meddelelser fra Internet of Things (IoT) enheder. Alle disse data kan medføre enorme fordele, såsom når de bruges til at automatisere opgaver, der er manuelt intensive og ofte meget gentagne. En opgave er for eksempel at passe på røde flag:specifikke kriterier eller adfærd, der kan indikere, at noget er galt, og der skal hurtigt træffes korrigerende handlinger. Lad os se på nogle få sager fra forskellige brancher.

Hvad med et forsikringskrav, der på overfladen ser fint ud, men fortjener at blive undersøgt, eller en jobansøger, der måske skjuler oplysninger? Hvad med en forsendelse af meget letfordærvelige farmaceutiske produkter, som måske ikke har været nedkølet på en del af deres rejse, eller en kontrakt, der kan være i strid med et lands love eller bryder en eksisterende aftale med en anden virksomhed? Det vigtige er, at et rødt flag indikerer problemer, der, hvis de ikke er markeret, kan forårsage stor skade.

Kunstig intelligens er enormt datasulten

Hvordan muliggør AI og machine learning mere effektiv dataanalyse? Gennem at fodre det med data. Ved at give en maskinlæringsmodel eksempler på gode og dårlige transaktioner, lærer den sig selv at skelne mellem de to typer. Og jo flere data maskinlæringsmodellen behandler, jo mere styrker den disse lektioner, hvilket øger nøjagtigheden.

Så selvom AI og maskinlæring gør store fremskridt, skal virksomheder og andre organisationer indhente det. Tænk på det på denne måde:data er som brændstof. Vi har brug for det for at styrke vores tankegang til at træffe kloge beslutninger. Men vi har udvundet alle de nemme ting, de strukturerede data, der kommer i pæne og pæne pakker. Men her er, hvor brændstofanalogien går i stykker:Selvom endnu en gallon gas lader os køre yderligere 20 til 30 miles, gør jo flere data, vi indsætter, os i stand til at træffe væsentligt bedre og mere præcise beslutninger - ikke bare yderligere 20 til 30 -ulige miles værd - og for at gøre dem endnu hurtigere.

Alligevel har en enorm del af vores data, vores ustrukturerede data, så længe forblevet uudnyttet, fordi det havde været for dyrt og for svært at få adgang til og behandle. Og selvom det ikke længere er tilfældet, da ny teknologi til at indsamle og analysere ustrukturerede data bliver tilgængelig, har mange mennesker i erhvervslivet og andre organisationer overset disse fremskridt.

Hvor de smarte penge er

International Data Corporation (IDC) forudsiger, at i 2020 vil organisationer, der analyserer både strukturerede og ustrukturerede data – det vil sige alle relevante data – og leverer brugbar information, opnå en ekstra $430 milliarder i produktivitetsgevinster i forhold til deres konkurrenter, der ikke udfører en sådan dataanalyse. Og virksomheder, der forstår dette, venter ikke til 2020. En leder i et multinationalt forsikringsselskab baseret i Tyskland omtaler ustrukturerede data som deres største risiko. De forstår de involverede tal og arbejder på at sikre, at de ikke bliver overrumplet ved at skrive forsikringer, der udsætter dem for forpligtelser, de kunne have undgået.

Den kombinerede kraft af big data, AI og machine learning kan gøre det nemmere at behandle information relateret til endnu mere komplekse udfordringer. For eksempel kan banker og andre organisationer mere præcist og hurtigere opdage svindel, skatteunddragelse, hvidvaskning af penge og andre ordninger ved at udvinde, hvad der tidligere havde været ubehandlede, ustrukturerede data. Dette gør dem i stand til at fange og lukke sager om svindel og misbrug, samt undgå de mange falske positiver, der kan opstå, når de kun stoler på strukturerede data. Handelsfinansieringsaftaler, herunder kontrakter og flere datakilder, mellem lande eller virksomheder kan også gennemsøges for at afgøre, om der findes svig eller uligheder, uanset om de er forsætlige eller ej.

Ydermere kan kunstig intelligens og maskinlæring hjælpe banker og andre former for virksomheder med bedre at identificere og verificere identiteten af ​​deres kunder gennem automatiserede Know Your Customer (KYC) procedurer. Sådanne procedurer kan hjælpe med at forhindre dem i at blive brugt, bevidst eller utilsigtet, til hvidvaskaktiviteter samt hjælpe med at forhindre bestikkelse og andre former for korruption i at forekomme. KYC-procedurer kan også sætte virksomheder i stand til bedre at forstå deres kunders finansielle transaktioner og behov, samt hjælpe dem med en mere forsigtig styring af risici. Andre fordele omfatter at fremskynde tiden til indtjening, når du tager nye kunder ind, hvilket gør KYC ikke til endnu en omkostning, men i stedet en kilde til overskud.

AI og maskinlæring kan øge din konkurrenceevne

Med alle fordelene opnået gennem AI og maskinlæring – og de fremskridt inden for teknologi, der bruges til at behandle strukturerede og ustrukturerede data – er det tid til, at flere virksomheder og organisationer drager fordel af den største tilgængelige informationskilde:deres egne ustrukturerede data.

Om forfatteren

Alex Welsh leder Ephesofts globale analysepraksis. Han er en erfaren salgsdirektør, projektleder og iværksætter med en passion for at løse kunders missionskritiske problemer med innovative omkostningseffektive teknologiløsninger.


  1. Docker venter på, at postgresql kører

  2. PostgreSQL belastningsbalancering ved hjælp af HAProxy &Keepalved

  3. Sikre dine Mongo Clusters med SSL

  4. Oracle-lagret procedure med parametre for IN-klausul