Bild-zu-Text

Bild-zu-Text (Image-to-Text) bezeich­net die auto­ma­ti­sche Umwand­lung von visu­el­len Infor­ma­tio­nen in schrift­li­che Beschrei­bun­gen oder struk­tu­rier­te Text­da­ten. Dabei kom­men Tech­no­lo­gien wie Opti­cal Cha­rac­ter Reco­gni­ti­on (OCR) zur Tex­terken­nung in Bil­dern oder Com­pu­ter Visi­on zur Objekt­er­ken­nung und Bild­be­schrei­bung zum Ein­satz. Anwen­dun­gen fin­den sich in der auto­ma­ti­sier­ten Doku­men­ten­er­fas­sung, bar­rie­re­frei­en Bild­be­schrei­bun­gen für Seh­be­hin­der­te und der Ana­ly­se von Bil­dern in sozia­len Medi­en oder Sicher­heits­über­wa­chung. KI-gestütz­te Model­le wie OCR-Sys­te­me oder mul­ti­mo­da­le neu­ro­na­le Net­ze ermög­li­chen dabei eine immer prä­zi­se­re und kon­text­be­zo­ge­ne Tex­terstel­lung aus Bil­dern.