7 trin til maskinlæring: Hvordan man forbereder sig på en automatiseret fremtid

Billede: Sdecoret / Shutterstock

Den stigende digitale økonomi kræver, at bestyrelser og ledere har en solid forståelse af det hurtigt skiftende digitale landskab. Kunstig intelligens (AI) er naturligvis en vigtig interessent. De organisationer, der ønsker at forberede sig på en automatiseret fremtid, skal have en grundig forståelse af AI. AI er imidlertid et paraplybegrep, der dækker flere discipliner, der hver især påvirker virksomheden på en lidt anden måde.

Når vi ser på kunstig intelligens, kan det opdeles i tre forskellige domæner:

  1. Robotik, der beskæftiger sig med den fysiske verden, og den kan direkte interagere med mennesker. Robotik kan bruges til at forbedre vores arbejde på forskellige måder. Inkluderet Fords eksoskelet eller Boston Dynamics 'hjælpe robotter.
  2. Kognitive systemer, der beskæftiger sig med den menneskelige verden. Et godt eksempel på et kognitivt system som en del af AI er chatbots. Chatbots er et meget håndgribeligt eksempel, hvor mennesker og maskiner arbejder sammen for at nå et mål. En chatbot er en kommunikationsgrænseflade, der hjælper enkeltpersoner og organisationer med at have samtaler.
  3. Maskinindlæring, der beskæftiger sig med informationsverdenen. Maskiner bruger data til at lære, og maskinindlæring har til formål at få mening fra disse data. Maskinindlæring bruger statistiske metoder til at gøre det muligt for maskiner at forbedre med maskiner. En delmængde af maskinlæring er dyb læring, der muliggør multilags neurale netværk.

Kunstig intelligens består af den problemfri integration af robotik, kognitive systemer og maskinlæring.

Figur 1: Kunstig intelligens - tilpasset fra Goel & Davies, 2019

7 trin til maskinlæring

Lad os dykke lidt dybere ind i et af disse domæner: maskinlæring. Målet med maskinlæring er at få mening fra data. Derfor er data nøglen til at låse op for maskinlæring. Der er syv trin til maskinlæring, og hvert trin drejer sig om data:

Figur 2: 7 trin til maskinlæring

1. Dataindsamling

Maskinindlæring kræver træningsdata, meget af det (enten mærket, hvilket betyder overvåget læring eller ikke mærket, hvilket betyder uovervåget læring). Dataindsamling eller datafikation er også det første trin i min nye D2 + A2-model.

2. Forberedelse af data

Rå data alene er ikke særlig nyttige. Dataene skal udarbejdes, normaliseres, de duplikeres, og fejl og bias skal fjernes. Visualisering af dataene kan bruges til at se efter mønstre og outliers for at se, om de rigtige data er indsamlet, eller om data mangler.

3. Valg af model

Det tredje trin består i at vælge den rigtige model. Der er mange modeller, der kan bruges til mange forskellige formål. Når du vælger modellen, skal du sørge for, at modellen opfylder forretningsmålet. Derudover skal du vide, hvor meget forberedelse modellen kræver, hvor nøjagtig den er, og hvor skalerbar modellen er. En mere kompleks model udgør ikke altid en bedre model. Almindeligt anvendte maskinlæringsalgoritmer inkluderer lineær regression, logistisk regression, beslutningstræer, K-midler, analyse af hovedkomponent (PCA), Support Vector Machines (SVM), Naïve Bayes, Random Forest og Neural Networks.

4. Uddannelse

Træning af din model er hovedparten af ​​maskinlæring. Målet er at bruge dine træningsdata og trinvis forbedre modelens forudsigelser. Hver cyklus med opdatering af vægte og forspændinger er et træningstrin. Ved overvåget maskinlæring er modellen bygget ved hjælp af mærkede eksempeldata, mens uovervåget maskinlæring forsøger at trække slutninger fra ikke-mærkede data (uden henvisninger til kendte eller mærkede resultater).

5. Evaluering

Efter træning kommer modellen til evaluering af modellen. Dette indebærer at teste maskinlæringen mod et ubrugt kontroldatasæt for at se, hvordan det fungerer. Dette kan være repræsentativt for, hvordan modellen fungerer i den virkelige verden, men dette behøver ikke være tilfældet. Jo større antallet af variabler i den virkelige verden er, jo større skal trænings- og testdata være.

6. Parameterstilling

Efter evaluering af din model skal du teste de oprindeligt indstillede parametre for at forbedre AI. At øge antallet af træningscyklusser kan føre til mere præcise resultater. Du skal dog definere, hvornår en model er god nok, da ellers fortsætter du med at finjustere modellen. Dette er en eksperimentel proces.

7. Forudsigelse

Når du først har gennemgået processen med at indsamle data, forberede dataene, vælge modellen, træne og evaluere modellen og indstille parametrene, er det tid til at besvare spørgsmål ved hjælp af forudsigelser. Dette kan være alle slags forudsigelser, lige fra billedgenkendelse til semantik til forudsigelig analyse.

Endelige tanker

Maskinindlæring tillader, at software bliver nøjagtige til at forudsige resultater. Det vil øge mange, hvis ikke alle, forretningsprocesser i de kommende år. Som sådan vil maskinlæring blive en integreret del af morgendagens automatiske organisation. Takket være stadig hurtigere hardware vil vi se mere kraftfulde modeller, der tilbyder bedre forudsigelser.

Desværre er udfordringen med partiske modeller takket være partiske data og partiske dataforskere aldrig langt væk. Derfor, for at organisationer virkelig kan drage fordel af AI, skal de sikre, at deres modeller og data er bias-fri, veluddannede og evalueret og korrekt afstemt. Først da vil organisationer virkelig drage fordel af maskinlæring.

Hvis det lykkedes mig at bevare din opmærksomhed på dette punkt, skal du efterlade en kommentar, der beskriver, hvordan denne historie gjorde en forskel for dig eller abonnere på mit ugentlige nyhedsbrev for at modtage mere af dette indhold:

Dr. Mark van Rijmenam er grundlæggeren af ​​Datafloq, han er en globalt anerkendt taler om big data, blockchain og AI, strateg og forfatter af 3 managementbøger: Think Bigger, Blockchain og The Organization of Tomorrow. Du kan læse en gratis forhåndsvisning af min seneste bog her. Opret forbindelse med mig på LinkedIn, eller sig hej på Twitter, hvor du nævner denne historie.

Hvis du gerne vil tale med mig om rådgivning eller tale engagementer, kan du kontakte mig på https://vanrijmenam.nl