Digitale afbeeldingen zijn samengesteld uit pixels en er worden verliesloze en verliesgevende compressietechnieken gebruikt om de hoeveelheid gegevens te verminderen. Compressie in het JPEG-formaat omvat voorverwerking, DCT, kwantisering en codering. Digitale beelden worden op allerlei gebieden gebruikt, waaronder fotografie, medische beeldvorming, kunstmatige intelligentie en meer, met vooruitgang op het gebied van kwaliteitsverbetering en auteursrechtbescherming.
Een digitaal beeld is een digitale weergave van een foto of tekening. Deze digitale afbeeldingen zijn opgebouwd uit pixels, de kleinste eenheid van punten, die aan elk een waarde toegewezen krijgen die helderheid, kleur, enz. vertegenwoordigt. Over het algemeen geldt: hoe hoger het aantal pixels, hoe hoger de resolutie, maar dit gaat ten koste van de hoeveelheid opgeslagen gegevens. Om deze digitale beelden efficiënt op te slaan en te verzenden, zijn digitale beeldcompressietechnieken nodig om de hoeveelheid gegevens te verminderen.
Er zijn twee soorten digitale beeldcompressietechnieken: verliesvrije compressie en verliesgevende compressie. Bij verliesloze compressie wordt er tijdens het compressieproces geen gegevens verloren gegaan, dus het is minder efficiënt, maar kan wel worden hersteld naar dezelfde afbeelding als het origineel. Compressie met verlies verwijdert daarentegen overtollige of onnodige gegevens, waardoor het moeilijk wordt om hetzelfde beeld als het origineel te herstellen, maar het kan een hoge compressie-efficiëntie bereiken die vele malen tot duizenden keren hoger is dan compressie zonder verlies, waardoor het een populaire compressie is. compressie techniek.
JPEG, dat we vaak gebruiken, is een representatief bestandsformaat voor digitale afbeeldingen met compressie met verlies. De compressie van het JPEG-formaat bestaat voornamelijk uit voorverwerking, DCT, kwantisering en codering.
Ten eerste omvat de voorbewerking het wijzigen van het kleurmodel en het “bemonsteren”. Eerst wordt het kleurmodel van het digitale beeld gewijzigd van RGB naar YCbCr. Het RGB-model combineert de drie primaire lichtkleuren om samen de kleur en helderheid van een pixel weer te geven, terwijl het YCbCr-model de informatie van een pixel scheidt in Y, wat helderheidsinformatie vertegenwoordigt, en Cb en Cr, die kleurinformatie vertegenwoordigen. Wanneer het kleurmodel wordt gewijzigd van het RGB-model naar het YCbCr-model, wordt er bemonstering uitgevoerd om slechts enkele waarden uit de pixels te extraheren.
Het menselijk oog is gevoelig voor veranderingen in helderheid en relatief minder gevoelig voor kleurveranderingen. Daarom extraheert de bemonstering alle Y, die helderheidsinformatie vertegenwoordigt, en slechts een deel van de Cb en Cr, die kleurinformatie vertegenwoordigen, in de mate dat het menselijk oog kan geen kleurveranderingen waarnemen. Deze bemonstering extraheert informatie uit een blok pixels in de verhouding J:a
uit een blok pixels in een bepaalde verhouding van J:a. Waar J het aantal horizontale pixels in het pixelblok is, is a het aantal pixels met informatie uit de eerste rij van het pixelblok, en b het aantal pixels met informatie uit de tweede rij. Als u bijvoorbeeld kleurinformatie bemonstert in een verhouding van 4:2:0, extraheert de eerste rij van een pixelblok met 4 horizontale pixels twee stukjes kleurinformatie, en haalt de tweede rij geen kleurinformatie op. Uiteindelijk worden slechts twee van de acht kleuren in het 2×4-blok geëxtraheerd, waardoor de hoeveelheid gegevens wordt verminderd.
Na de voorbewerking wordt een transformatie genaamd DCT uitgevoerd. DCT is een proces dat de informatie in de bemonsterde pixels omzet in frequenties en de gegevens representeert als regelmatig gescheiden gegevens in het frequentiedomein. Omwille van de efficiëntie wordt DCT uitgevoerd op een matrix die als basiseenheid is opgedeeld in 8 pixels horizontaal en 8 pixels verticaal. Wanneer DCT wordt uitgevoerd, worden laagfrequente componenten, die kleine verschillen in informatie tussen aangrenzende pixels vertegenwoordigen, linksboven in de matrix verzameld, en hoogfrequente componenten, die grote verschillen vertegenwoordigen, rechtsonder in de matrix. en worden weergegeven als matrixwaarden gescheiden langs het frequentiedomein. De grenswaarde van de laagfrequente component is groter dan de grenswaarde van de hoogfrequente component.
De volgende stap is kwantisering. Bij het kwantiseringsproces wordt de door DCT verkregen matrixwaarde gedeeld door een bepaalde vooraf ingestelde constante en afgerond. In dit geval wordt de matrixwaarde van de laagfrequente component gedeeld door een kleine constante en naar boven afgerond, maar wordt de matrixwaarde van de hoogfrequente component gedeeld door een grote constante en naar boven afgerond om er een waarde van nul van te maken. Dit is bedoeld om de omvang van de gegevens te verkleinen door de absolute waarde van de laagfrequente componenten te verkleinen en de hoogfrequente componenten te verwijderen, aangezien het menselijk oog gevoelig is voor laagfrequente componenten, maar minder gevoelig voor hoogfrequente componenten.
Ten slotte worden de gegevens gecodeerd. Codering is de binaire representatie van de gekwantiseerde matrixwaarden. Voor dit proces wordt doorgaans Huffman-codering gebruikt. Huffman-codering werkt door minder bits toe te wijzen om gegevens weer te geven die vaak voorkomen en meer bits om gegevens weer te geven die niet vaak voorkomen. Als gevolg hiervan kan het Huffman-coderingsproces de hoeveelheid gegevens in een digitaal beeld verminderen zonder gegevens te verliezen.
Digitale beelden worden op veel gebieden van ons dagelijks leven gebruikt. Ze worden bijvoorbeeld gebruikt in fotografie, medische beeldvorming, satellietbeelden, grafisch ontwerp, productafbeeldingen in online winkels en vele andere toepassingen. Met het toenemende gebruik van digitale beelden evolueren ook de technologieën die betrokken zijn bij beeldverwerking snel. Vooral de vooruitgang op het gebied van beeldherkenning met behulp van kunstmatige intelligentie (AI) en machinaal leren (ML) heeft innovatieve technologieën mogelijk gemaakt, zoals gezichtsherkenning, zelfrijdende auto's en slimme camera's.
Naast het gebruik van digitale beelden is de kwestie van het auteursrecht een belangrijke kwestie. Naarmate digitale beelden gemakkelijker te kopiëren en te verspreiden zijn, zijn juridische en technologische maatregelen nodig om het auteursrecht te beschermen en inbreuk te voorkomen. Digitale watermerktechnologie wordt bijvoorbeeld gebruikt om copyrightinformatie in een onzichtbare vorm in afbeeldingen in te sluiten om illegaal kopiëren van afbeeldingen te voorkomen.
Er wordt ook onderzoek gedaan om de kwaliteit van digitale beelden te verbeteren. Er wordt een verscheidenheid aan beeldverwerkingstechnieken ontwikkeld, waaronder technieken om afbeeldingen met een hoge resolutie te maken, ruisverwijdering en kleurcorrectie. Deze technieken helpen digitale beelden scherper en nauwkeuriger te maken.
Digitale beelden spelen een belangrijke rol in veel aspecten van ons leven, en hun belang zal in de toekomst blijven toenemen. Het is dus belangrijk om de technologieën die verband houden met digitale beelden te begrijpen en op de juiste manier te kunnen gebruiken. Digitale afbeeldingen zijn meer dan alleen foto's of tekeningen; ze hebben een diepgaande impact op ons dagelijks leven en de technologische vooruitgang.