Primul contact cu Microsoft Azure Cognitive Services l-am avut atunci când echipa de developeri a XAPT finaliza taskuri legate de noua versiune a soluției ERP Dynamics 365 for Operations (numită până în toamna trecută Microsoft Dynamics AX). Am folosit unul din API-urile (Application Programming Interface) din suita Cognitive Services pentru a optimiza un proces care consumă destul de mult timp. Folosirea lor în acest context nu a eliminat factorul uman, dar a automatizat aproximativ 80% din acest proces.
de Mugur Mirea, IT Business Partner și Cătălin Ionescu, Developer la XAPT SOLUTIONS
Ce am descoperit împreună cu această ocazie a fost o întreagă suită de servicii de inteligență artificială (AI), legată de factori cognitivi (imagini, vorbire, limbaj scris, cunoștințe). Partea care ne-a atras cel mai mult atenția a fost cea grupată sub numele de Vision: algoritmi de procesare a imaginilor cu care poți realiza lucruri imposibil de realizat până acum: de la aproximarea vârstei persoanei dintr-o fotografie sau film, până la „ghicirea” stării emoționale în care se află aceasta (fericire, frică, mânie, tristețe, surpriză, etc.) sau chiar identificarea acesteia prin compararea cu altă imagine a aceleiași persoane. Mai mult decât atât, o imagine poate fi analizată, iar rezultatul trimis sub forma unor cuvinte cheie care descriu imaginea respectivă cu o precizie extraordinară, identificând toate obiectele din peisaj și chiar construind o frază în care este descrisă pe scurt imaginea („o pajiște largă în fața unei case” sau „un bărbat stând pe o plajă și pozând pentru cameră”).
Timpul nu ne-a permis să abordăm în detaliu și celelalte servicii cognitive, dar iată pe scurt, o descriere a acestora: Speech – prelucrarea/recunoașterea limbajului vorbit, Language – prelucrarea limbajului natural, evaluarea sentimentelor și subiectelor, recunoașterea comenzilor, Knowledge – maparea informațiilor complexe, Search – API-uri de căutare bazate pe Bing și Labs – proiecte încă în dezvoltare (de la încorporarea de comenzi bazate pe gesturi, până la calcul de rute optime pentru transportatori). Fiecare categorie are însă 5-7 alte subcategorii, fiecare cu denumiri sugestive („Computer Vision API”, „Emotion API”, „Custom Decision Service”, etc.).
Îi lasăm pe cititorii interesați de subiect să le descopere în link-ul de mai jos: http://azure.microsoft.com/en-us/services/cognitive-services/
Ce este demn de remarcat în această goană după inteligența artificială, este „democratizarea” acestor servicii. Ele sunt disponibile efectiv pentru oricine, fie gratuit, pentru testare, fie la niște prețuri accesibile.
În contextul în care GPU-urile profesionale (Graphics Processing Unit – plăcile video pentru PC-uri si nu numai) au ajuns a fi folosite și pentru AI (prin instrucțiuni de tip FP16 sau INT16), iar Google lansează chiar hardware dedicat (TPU – Tensor Processing Unit) pentru acest tip de activități, este clar că dezvoltarea acestui domeniu va fi exponențială. De la automobilele autonome până la recunoașterea clientului într-un magazin și oferirea automată a unei cravate care să se asorteze cu cămașa și costumul său, nu mai este decât un pas.