Foto af Mpho Mojapelo på Unsplash

AI API'er: Hvad er de, og hvordan man bruger dem

Et sæt bedre praksis for API'er til kunstig intelligens

Er du nysgerrig efter tale-til-tekst, sprogoversættelse eller billedgenkendelses-API'er? Du er heldig! Der er masser af tjenester, der giver dig mulighed for at gøre dette, og også mange grunde til at bruge AI (API) i dine applikationer. I denne artikel vil vi beskrive nogle af brugssagerne til AI API'er og derefter tale om den bedre praksis, der skal bruges, når du bruger dem.

Hvis du har travlt, skal du skynde dig til TL; DR i bunden.

Det første spørgsmål, før du implementerer en ekstern service, som du har brug for at stille dig selv, er "har jeg brug for dette"? Når det kommer til kunstige intelligens-baserede API'er, kan svaret blive kompliceret! For at hjælpe dig med at beslutte, lad os se på to af de mest anvendte tjenester, og hvornår du skal (eller ikke skulle) bruge dem.

Brug sag 1: Tal til tekst

Mange applikationer i dag udnytter mulighederne for tale-til-tekst - og du har sandsynligvis allerede brugt en, der gør det. Siri, Google Assistant, Bixby eller Alexa bruger alle det, men det er ikke alt. Det bruges også af messaging-apps (f.eks. WhatsApp) og søgemaskiner (f.eks. Googles søgefelt).

Du kan undre dig over, hvor er AI derinde. Er det ikke kun tale transkription?

Grundlaget for ethvert tale-til-tekst API er faktisk at tage talelyd som input og transkribere den til tekst, skønt den ikke stopper her, og det er her, magien med kunstig intelligens sker. For de fleste af de tilgængelige API'er derude, vil det også:

  • ændre den forrige transkription baseret på kontekst
  • identificere forskellige højttalere
  • være i stand til at lede efter specifikke nøgleord
  • giver mulighed for modeltilpasning (nyttig til regionale accenter)

Brug dette: til specifikke brugssager, f.eks. Under talesyntese under en prøve, hvor konteksten, de anvendte ord og den aktuelle taler betyder meget.

Brug ikke dette: hvis du kun forventer en enkelt højttaler eller til simpel tekstbeskeder. I dette tilfælde inkluderer de fleste smartphone-tastaturer allerede en talegenkendelsesfunktion, der kan bruges, og til webapplikation kan du bruge SpeechSynthesis API.

Brug sag 2: Billedgenkendelse

Sammenlignet med tale-til-tekst er der kun et par programmer, der bruger billedgenkendelse i dag, og de fleste af dem er ganske specifikke (f.eks. PlantNet, der identificerer de planter, du tager et billede af). Vi begynder dog at se en generel brug af den, specifikt med:

  • Google Lens: analyserer, hvad der er på din skærm (billede eller ej) og vil prøve at identificere adresser, steder, ting og anbefale resultater baseret på det
  • Se AI: applikation til synshandicappede, der beskriver, hvad der er omkring dem (baseret på, hvor telefonens kamera peger)
Brug af Google Lens til at genkende et sted

Som du har forstået nu, er magien her at tage et billede som input og forsøge at identificere, hvad der er på det nævnte billede. For de fleste udbydere er der to måder at gøre det på:

  • Brug af foruddannede modeller: Disse inkluderer almindelige klasser (mad, steder, mennesker, farve ...)
  • Brug af brugerdefinerede klassifikatorer: disse giver brugerne mulighed for at træne deres egne klasser (som det ses med PlantNet ovenfor)

Selvom nogle Android- og iOS-enheder har indbygget billedgenkendelsesfunktioner, kan du som udvikler ikke altid forespørge dem fra din app. Derfor, så længe din brugskasse passer, skal du bruge den.

Brug sag nr. 3, # 4 ...

Der er masser af andre AI API'er derude. Vi vil ikke gennemgå dem alle i dette indlæg, men hvis du overvejer at bruge en af ​​dem, og ikke er sikker på, om din brugssag passer til behovet eller ej, skal du skrive en kommentar eller kontakte mig direkte. Jeg hjælper gerne!

Du har nu besluttet at bruge en, to eller endda mere (i dette tilfælde er her en artikel til dig) AI API'er i din applikation. I dette afsnit ser vi et par bedre fremgangsmåder, der skal bruges, før vi tænker på at bruge dem i produktionen.

Prøv, før du køber

Som med alle tredjeparts API'er er der parametre, der skal tages i betragtning - pris, brugervenlighed, tilgængelighed ... men når det kommer til kunstig intelligens er der også en pålidelighedsfaktor, der kommer i spil. Pålidelighed er ikke et binært hensyn, og vandt ' t rate 0 eller 1. Faktisk vil det være alt imellem 0 og 1, som vi kan se i det næste afsnit!

Alle større cloud-udbydere leverer deres eget sæt AI API'er, og de har alle enten en demonstrationsside eller en gratis prøveversion. Udnyt det, prøv selv, og vælg den, der får de bedste resultater!

  • IBM Watson
  • Google Cloud AI
  • Microsoft Cognitive Services
  • AWS AI Services

Der er også platforme til specifikke tjenester som Clarifai (Vision API), SAP Conversational AI (Chatbots) eller en enkel indsæt-din-favorit-søgemaskine-her søgning.

Eksempel på opkald til Watson Assistant-tjenesten ved hjælp af Postman

Kunstig intelligens rimer med selvtillid

Som omtalt i det foregående afsnit, vil hver gang du får et svar fra en AI API, det også indeholde et konfidensniveau, der spænder fra 0 til 1, hvilket svarer til den procentvise sikkerhed, det har anerkendt noget.

Lad os tage et eksempel med et Visual Recognition API, når vi sender følgende billede:

Kreditter: Getty.com

Her er JSON-svaret. Jeg har fjernet nogle klasser for læsbarhed.

[{"classifier_id": "default", "name": "default", "Classes": [{"class": "bus", "score": 0.797}, {"class": "mekanisk enhed", " score ": 0.506}, {" class ":" Indisk rød farve "," score ": 0.799}]," display ":" General Model "," description ":" Forstå hurtigt objekter, handlinger, scener og farver inden for et billede. " }]

I dette tilfælde har vi en klasse, der identificeres sammen med et tillidsresultat. At tage denne score i betragtning er nøglen. Jeg anbefaler normalt et minimumsfortro score på 95%. Denne score skal stige over tid, når du eller din API-udbyder tilføjer (e) flere træningsdata til modellerne.

Når vi taler om træningsdata, er en anden ting, du vil overveje, om du vil tillade, at de data, der sendes fra din ansøgning, bruges til at forbedre din udbyders generelle modeller. Hvis du ønsker at tillade det, skal du informere dine brugere eksplicit.

TL; DR:

  • Før du bruger en AI API, skal du beslutte, om du virkelig har brug for det
  • Hvis du gør det, kan du prøve forskellige udbydere og vælge den, der passer bedst til din brugssag
  • Sørg for at have en tærskel, der er høj nok på tillidsresultatet for at undgå falske positiver

Hav det sjovt at tildele AI i dine apps!