Kunstig intelligens2

Kunstig intelligens er ikke en kommende teknologi; den er her allerede, og der kommer meget mere i løbet af de næste par år.

Af JOS Svendsen, 17. maj 2019

Kunstig intelligens – morgendagens revolution, der skete i går

Skulle nogen mene at kunstig intelligens er en teknologi, som er på vej, kan de godt tro om igen. Den har været i gang de sidste par år. Brancheorganisationen IABM kan melde, at 13% af virksomhederne i mediebranchen allerede har investeret i AI-teknologi i den ene eller anden form. Men mere end 60% af medie-virksomhederne forventer at ville investere i teknologien under en eller anden form i løbet af de næste to til tre år. Både IBC og NAB har udnævnt AI til den vigtigste teknologi i branchen.

Glem alt om HAL 9000 og science fiction-film, når der tales om kunstig intelligens. Det foregår på et helt andet og enklere plan.

Faktisk er det lidt forkert, at kalde teknologien for kunstig intelligens eller AI (Artificial Intelligence). En bedre betegnelse ville være lærende system. Det, som teknologien kan, er at genkende mønstre med en grad af sandsynlighed. Et eksempel på det er objektgenkendelse på billeder. Når et AI-system er blevet fodret med f.eks. billeder af biler, vil systemet med en vis sikkerhed kunne sige, om et objekt på et billede er en bil. 

Men AI kan også være en skabende teknologi. Databasen over billignende objekter kan nemlig bruges til at danne billeder af billignende objekter. Disse billeder kan man så sende til et AI-system, som kan genkende biler. Det system lærer så det bil-billede dannende system at danne stadigt bedre billeder af biler. Da systemer er helt uden konventioner om bildesign, vil det kunne komme med design, som menneskers traditionsbundne fantasi ikke ville kunne forestille sig. 

Det virker jo meget enkelt. Men hvad kan man så bruge det til? En hel del viser det sig.

De tre områder, som IABM har identificeret som de mest populære, er:

  • Indeksering og styring af indhold
  • Automatisering af medieproduktion
  • Automatisering af indholdsdistribution 

Indholdsstyring

Siden 2015 har YouTube anvendt AI til at scanne indhold. Det er både indhold, som forbryder sig mod YouTubes regler for indhold, men også indhold der forbryder sig mod copyrightindehaveres rettigheder. Det er også noget, som Facebook anvender i stor stil. Dertil bruger YouTube også indholdsscanning til at kunne bygge kanaler specielt efter brugernes interesser.  

Det samme gør mange TV-stationer. Al Jazeera er for eksempel i fuld gang med at indeksere hele deres arkiv ved hjælp af AI. Det gør søgninger efter bestemt indhold op til 54% hurtigere ifølge virksomheden GreyMeta. At have styr på indholdet i ens arkiv er naturligvis smart til produktionsformål, men det kan også betyde, at man kan kommercialisere ens videoarkiv på en helt ny måde. Idet kunder kan fritekst-søge og få præcis de sekvenser, der indeholder det ønskede. Da systemerne indekserer på alle egenskaber i et billede, vil man kunne lave forespørgsler som ”Vis alle sekvenser med fortrinsvis nyere biler med åbne vinduer på grøn baggrund”. Det er noget, der er svært dag.

Automatisering af produktion

IBM har her taget frontpositionen; Traileren til filmen Morgan fra 2016 var klippet med hjælp fra IBM’s AI-system, som kaldes Watson. Siden har Watson været med til automatisk produktion af highlights fra sportsbegivenheder som Wimbledon, FIFA, NFL og U.S. Open. Her anvender systemet data som publikums reaktioner, data fra dommeren og telemetridata fra kampen til at finde højdepunkter. Disse højdepunkter klipper systemet sammen og publicerer umiddelbart efter kampen. Det giver nye indtjeningsmuligheder for sportsorganisationerne, der kan sælge online abonnementer til fans. Men AI kan også hjælpe broadcasterne.

Der er mange formulariske tv-udsendelser, som også er modne til automatisering med AI. Nyhedsudsendelser, talkshows, debatter, sport, klassiske koncerter, reality-tv er bare nogle af de programtyper, der er er AI-parate. 

På IBC 2018 viste hollandske MobileViewpoint et AI-drevet nyhedsstudie med remote kameraer, der blev styret af AI-systemet, der brugte lyd og billeder suppleret med data fra 3D sensorer til at styre kameraer og lyd. Studiet havde endda en robotarm med et remote kamera, der kunne efterligne de kranture og bevægelser, der er standard i dagens nyhedsudsendelser. MobileViewpoint tilbyder det samme for sportstransmissioner. Her er det et 180 graders kamera, som dækker hele banen. Softwaren sporer spillerne og laver virtuelle kamerabevægelser, som ligner dem, vi kender fra sportstransmissioner.

Sony har samme idé, men bruger flere kameraer, hvor billederne føjes sammen via softwaret. Senest har Sony udviklet en AI-baseret videoprocessor, som er beregnet til automatisk produktion af foredragsbaseret undervisning. Processoren er så avanceret, at den kan fjerne baggrunden bag foredragsholderen og erstatte den med en anden – blue screen uden farvet baggrund. 

Der er flere broadcastere, som har set mulighederne i AI til automatisering. Disney har f.eks. annonceret, at de overvejer at automatisere basketball-transmissioner. Endemol kigger på automatisering af Big Brother realityshows. 

I øvrigt er der allerede en flok automatiske videoredigerings-services eller redigeringsprogrammer til brugere uden redigeringslyst på markedet. 

Styring af distribution

Her er Netflix og YouTube mestre. Netflix indsamler konstant informationer om seernes præferencer. Det er både oplysninger om, hvad der ses, hvornår der bliver stoppet med at se, spolet tilbage eller spolet frem og meget mere. Det giver et solidt datagrundlang for at bruge AI til at spotte seerinteresse. Det kan naturligvis bruges til at målrette nye produktioner til seernes interesser, som Netflix gør det. I broadcast sammenhæng kan disse data også bruges til at målrette reklamer til brugeren. Der er forskellige initiativer til at frakoble broadcast og reklamer på smart-tv. Det nyeste er OAR (Open Addressable Ready), hvor man sender personliggjorte reklamer direkte til smart-tv’et, som så vises i stedet for standardreklameblokken. Disse personlige reklamer er baseret på data fra Smart-tv’ets streaming. En af de fremtidige muligheder kunne være personliggjorte programmer, hvor indholdet styres af brugerens seervaner. Der kunne være nyhedsudsendelser, hvor der automatisk udelades sektioner eller adderes sektioner afhængigt af, hvad seeren tidligere har set. Det kunne også være lærende optimering af en streamcasters infrastruktur, så der tilkobles ekstra systemressourcer til visning af specielt populært indhold. 

Dannelse af indhold med AI

Undertekster er oplagt til AI. YouTube har i noget tid haft automatisk generering af undertekster på udvalgte hovedsprog. Microsoft har annonceret, at der kommer automatiske undertekster til Powerpoint. Det betyder, at præsentatørens tale automatisk kommer på skærmen som undertekster, når præsentationen afvikles. Der er endda indbygget mulighed for oversættelse til over 60 sprog fra de 12 sprog, som kan fortolkes. Samme teknologi er allerede kommet til Microsofts Skype-telefonisystem. På IBC kunne IBM vise automatisk dannelse af transskriptioner fra video. Den dannede tekst er søgbar og koblet til tidslinjen i Premiere Pro, så man direkte kan gå til et bestemt sted på tidslinjen, hvor der bliver sagt noget bestemt.

Men der er flere anvendelser for AI. Ecrett Music er en online service, der generer musik til brug i videoproduktioner med AI. Siden der ikke er en komponist eller musikere, er der heller ikke nogen rettigheder at betale. Det koster beskedne 5 USD om måneden. 

Teknologien er ikke begrænset til audio. Spilfabrikanter som Unity kan allerede danne video af landskaber og statiske objekter, hvor det er tæt på umuligt at se, at videoen er computergenereret.

Her kommer internettets skyggeside ind. 

Begrebet Deepfakes dækker over, at AI bruges til at danne billedelementer, der ikke findes i den originale video. Det er allerede brugt til både fake news og porno, hvor kendissers ansigter er lagt oven på en pornostjernes ansigt. Denne teknologi krævede oprindeligt massiv computerkraft og var derfor kun brugt i effekttunge spillefilm som Fast and Furious og Star Wars. Sådan er det ikke længere. 

Dagens mere avancerede grafikkort gør, at en kraftig spilcomputer har nok kapacitet til at køre et AI-system, der kan håndtere videotransformationer som Deepfakes. 

Teknologien har også positive sider. Det kan være super effektiv fjernelse af billedstøj fra video, avanceret farvestyring, GDPR-maskning af personer, videoeffekter, animationer af virtuelle skuespillere og meget andet.

Vær med eller bliv væk

I dag er det ikke et spørgsmål, om man er med på AI eller ikke. Teknologien er her, og der er så store fordele ved at bruge AI til alle former for mediebrug, at det ikke stopper. Vi kan kun råde alle, der kommer på udstillinger som IBC til at lægge vejen forbi Facebook, Amazon, Netflix, Google, Microsoft og IBM. Det er nemlig der, det sker. 

 

Artiklen er fra ProAV Magasinet - Maj 2019

ProAV Digital

ProAV 5Forside www

Nyt nummer ude nu!

Læs bl.a. om:

  • Intercom på revyen
  • Mr GoPro
  • Rokoko
  • Trådløs video
  • God lyd på mobilen

Læs alt lige her

Annoncering

Få kontakt til en købestærk målgruppe i Danmarks eneste PRO AV magasin

Se mere her

Typisk ProAV læser

74,5% er meget tilfreds med det redaktionelle indhold

Se mere her