Een besturingssysteem dat met mensen kan communiceren lijkt misschien iets uit de verre toekomst, maar dankzij de vooruitgang op het gebied van machinaal leren wordt het steeds meer een realiteit. Naarmate machines slimmer worden door gegevens te analyseren en te leren via leermethoden onder toezicht en zonder toezicht, dragen ze bij aan het oplossen van verschillende problemen in ons dagelijks leven.
In de film 'Her' is er een besturingssysteem (OS) ingesproken door Amanda Seyfried. Het besturingssysteem gedraagt zich alsof het emoties heeft, slaat woord-voor-woord-gesprekken met een persoon op en analyseert deze om zijn/haar hobby's, smaak en kenmerken eruit te halen. Dit leidt tot interessante gespreksonderwerpen en empathie, en veel mensen, waaronder de hoofdpersoon, Theodore, worden verliefd op het computerbesturingssysteem. Je zou kunnen denken dat dit computerbesturingssysteem iets uit een sciencefictionfilm is. Dit komt omdat de machine leert als een mens door gesprekken en veel ervaring, en op basis daarvan nieuwe acties onderneemt. Maar deze leermachines zijn al overal om ons heen. De theorie achter deze machines staat gezamenlijk bekend als machine learning.
Wat is machine learning?
Machine learning is precies hoe het klinkt: machines leren zichzelf aan te leren, met name door verschillende soorten gegevens die ze op de een of andere manier hebben verzameld te analyseren en ervan te leren, en vervolgens een wiskundige basis te bieden die kan worden toegepast op nieuwe soorten gegevens. De sleutel hiervoor is dat je een computer niet expliciet hoeft te programmeren om te leren, je hoeft hem alleen maar input te geven. Als u een computer bijvoorbeeld leert een afbeelding van een appel te herkennen, zal hij herkennen dat het een appel is als u hem een afbeelding van een appel laat zien die anders is dan de vorige, zelfs als u de kenmerken niet specificeert. van een appel.
Machine learning kan worden onderverdeeld in twee hoofdcategorieën, afhankelijk van hoe het leert. Eén daarvan is begeleid leren, waarbij de uitkomst (of het label) van de gegevens die worden getraind bekend is. Wanneer u bijvoorbeeld een foto op Facebook plaatst, herkent deze automatisch uw gezicht en wordt deze weergegeven als een vierkant. Dit wordt gedaan door te leren welke afbeeldingen gezichten zijn en welke afbeeldingen geen gezichten zijn. Met andere woorden: als de gegevens een afbeeldingsbestand zijn dat bestaat uit RGB-waarden van pixels, is het resultaat of het een gezicht is of niet.
Aan de andere kant houdt een andere methode van machine learning, unsupervised learning, in dat een afbeelding in een machine wordt ingevoerd en deze wordt uitgevoerd zonder te specificeren hoe deze moet worden geclassificeerd. In het bovenstaande gezichtsherkenningsprogramma kan de machine kenmerken in de afbeelding vinden en op zichzelf onderscheiden of het een mens of een kat is, ondanks dat hem niet wordt verteld wat hij met de afbeelding moet doen, dat wil zeggen of het een gezicht is of iets anders. . Een ander voorbeeld is een nieuwscategorisatieprogramma op een portaalsite. Als u naar nieuwsartikelen op een portaalsite kijkt, merkt u wellicht dat deze zijn onderverdeeld in verschillende gebieden, zoals politiek, leven, entertainment, enzovoort, en dat soortgelijk nieuws wordt gegroepeerd en aanbevolen. Om dit te doen specificeert de portaalbeheerder niet aan de leermachine welke artikelen politiek zijn, welke entertainment zijn, welke sport zijn, enzovoort, maar wanneer een groot aantal artikelen van verschillende typen in de leermachine worden ingevoerd, analyseert hij de frequentie van woorden in de artikelen zelf en maakt een classificatie met hoge nauwkeurigheid voor nieuwe artikelen.
Begeleide leermethoden
De leermethode die momenteel voor het meeste machine learning wordt gebruikt, is begeleid leren. Het is goed voor ongeveer 95% van alle leermachines. Eén reden hiervoor is dat er minder trainingsgegevens nodig zijn om een bepaald prestatieniveau te bereiken dan bij een autonome leermethode, omdat een mens direct de resultaten voor de gegevens specificeert. Dit komt omdat autonome leermethoden meer gegevens nodig hebben om binnen deze gegevens de kenmerken te vinden die onderscheid kunnen maken tussen objecten op zichzelf – bijvoorbeeld tussen een mens en een kat, tussen een politiek artikel en een amusementsartikel. Aan de andere kant kunnen begeleide leermethoden goed presteren met relatief kleine hoeveelheden gegevens, omdat ze door mensen worden geleid, waardoor de tijd die nodig is om gegevens te verzamelen en de tijd die nodig is om de training zelf uit te voeren, wordt verkort.
Leren onder toezicht heeft echter een groot nadeel: het kan niet leren over dingen die het niet door mensen is geleerd, en de prestaties kunnen dramatisch afnemen in omgevingen die enigszins verschillen van de omgevingen die het door mensen wordt aangeleerd. Een machine die is getraind op basis van een afbeelding van een persoon in een heldere omgeving, herkent de persoon mogelijk niet bij weinig of weinig licht, of herkent de zijkant van een persoon mogelijk niet als alleen de voorkant van het gezicht wordt ingevoerd.
Autonome leermethoden
Zelfleermethoden kunnen de tekortkomingen en beperkingen van begeleid leren aanpakken. Deze leermethode bereikte echter decennia geleden zijn grenzen. De benodigde gegevens waren te groot, de rekencomplexiteit was te hoog, de hardware kon deze niet verwerken en het was te tijdrovend om praktisch te zijn. De afgelopen jaren hebben autonome leermethoden echter hernieuwde aandacht gekregen omdat de algehele prestaties van hardware zijn verbeterd, inclusief verbeterde geheugen- en CPU-prestaties, en het heel gemakkelijk is geworden om overal gegevens te verzamelen, op te slaan en te delen via mobiele connectiviteit, inclusief de cloud. computers.
Te midden van deze veranderingen loopt een tak van zelfleren, genaamd 'deep learning', voorop. Deep learning is een leermethode die een vergelijkbare structuur heeft als het menselijk brein. Het menselijk brein heeft neuronen die elk deel van de hersenen verbinden, en het is bekend dat naarmate de hersenen leren, de verbindingen tussen de delen die vaker worden gebruikt en aan elkaar gerelateerd worden sterker worden. Dit is de inspiratie voor deep learning, dat, net als neuronen, een verbindingsstructuur heeft tussen elk leerstuk, en deze structuur verandert voortdurend naarmate er aanvullende trainingsgegevens binnenkomen, waardoor feedback tussen de leerstukken ontstaat. Daarom is het mogelijk om eerder geleerde kennis te hergebruiken en zich daarop aan te passen aan nieuwe omgevingen.
Het heden en de toekomst van machinaal leren
Zowel autonome als begeleide leermethoden worden momenteel in verschillende contexten gebruikt. Begeleid leren wordt gebruikt voor snelle ontwikkeling die alleen in een specifieke omgeving hoeft te worden toegepast, terwijl autonoom leren wordt gebruikt op gebieden waar machines nodig zijn die in verschillende omgevingen kunnen worden toegepast. Eén ding is echter duidelijk: er wordt veel onderzoek gedaan in beide richtingen.
De laatste tijd hebben veel mondiale bedrijven, waaronder Facebook en Google, veel energie gestoken in de ontwikkeling van machinaal leren. Facebook werkt er hard aan om zijn gezichtsherkenningsmachine te verbeteren met behulp van begeleid leren, en Google heeft onlangs een onderneming onder leiding van deep learning-experts genaamd DeepMind overgenomen voor ongeveer 440 miljard won. Het feit dat het bedrijf nog maar drie jaar bestaat en nog geen enkel product heeft verkocht, laat zien hoeveel Google investeert in machine learning. Momenteel is machinaal leren alleen in staat objecten te herkennen, dus het is nog lang niet mogelijk om gesprekken met mensen met emoties te voeren, zoals het besturingssysteem in de film Her. Het snelle tempo van de recente ontwikkelingen suggereert echter dat de dag waarop we met Haar kunnen praten niet ver weg is.
De mogelijkheden voor machinaal leren zijn eindeloos. In de gezondheidszorg worden AI-systemen ontwikkeld om patiënten te helpen diagnosticeren en behandelen, en in de financiële sector worden systemen geïntroduceerd om marktschommelingen te voorspellen en investeringsbeslissingen te nemen. De technologieën die ons leven gemakkelijker maken, zoals zelfrijdende auto's, slimme huizen en stemassistenten, worden ook steeds geavanceerder en intelligenter naarmate machinaal leren vordert. We leven in een tijdperk waarin machine learning voortdurend evolueert en de toekomstige vooruitgang ervan onvoorstelbaar is.
Daarom is machinaal leren niet alleen een technologie die gegevens verwerkt en analyseert, maar wordt verwacht dat het het menselijk leven zal verrijken en zal bijdragen aan het oplossen van verschillende problemen. Machines die emotioneel contact kunnen maken met mensen, zoals in de film ‘Her’, lijken misschien iets uit de verre toekomst, maar de mogelijkheid wordt steeds reëler. Machine learning is al diep verankerd in ons dagelijks leven, en toekomstige ontwikkelingen zullen ons nog meer verrassingen en innovaties brengen.