Natural Language Generation
Om du tror att något kan och kommer att automatiseras med artificiell intelligens (AI), kanske du inte blir förvånad över att veta hur många stora internationella mediehus inklusive The New York Times, Associated Press, Reuters, Washington Post, and Yahoo redan använder AI för att generera innehåll. The Press Association kan idag generera upp till 30 000 lokala nyheter per månad med hjälp av AI.
Processen som automatiskt skapar innehåll från data kallas Natural Language Generation (NLG). Det är en mjukvaruprocess som omvandlar strukturerad data till naturligt språk. Innehållet genereras av ett NLG verktyg. De NLG verktyg som idag finns tillgängliga på marknaden är till exempel Amazon’s Polly, Googles Text-to-Speech och svenska företaget Monok.
I Sverige har vi nu den unika chansen att ta del av den nya NLG AI-tekniken för att skapa naturligt och unikt innehåll med hjälp av verktyget Monok. Jag har fått en intervju med Adam Sam som är medgrundare till Monok – det revolutionerande NLG AI-verktyget i Sverige. Monok är AI-verktyget som automatiserar journalistiska omskrivningar och genererar unik text, bild och video som är SEO-vänligt.
1. Vilka typer av texter skriver Monok? Kan verktyget skriva kategoritexter, produkt-texter, sms, mejl eller annonstexter?
Nyhetsartiklar genereras främst. Den kan även skriva och generera annonstexter, mejl, sms och video. Fokus ligger främst i nyhetsartiklar. Monok passar bäst för de företag som behöver längre unika och seo-vänliga nyhetstexter.
Tekniken är kapabel att sammanfatta flera dokument. Om du matar in fem eller tio dokument så kan verktyget sammanfatta fram en ny unik text. På det sättet kan man även applicera denna teknik för produkt och kategori-texter hos stora e-handelsföretag. Har du fem kategoritexter som pratar om samma kategori som exempelvis ekologisk hudvård kan en sjätte unik SEO text genereras om just ekologisk hudvård på 1000 ord som inte är plagiat.
2. Kan man ta texterna ett steg längre och personifiera dem baserat på målgrupp?
Planer att personifiera texterna finns längre fram. Möjligheten att personifiera allt från enheterna i texten till SE-enheter eller imperial kommer att finnas tillgängligt framöver. Det kan vara km eller miles per hour. Om kunderna finns i england eller i USA så är det andra enheter i jämförelse med till exempel Sverige och detta kan anpassas. Landsspecifika enheter översätts med hjälp av verktyget Monok.
Tider ska även kunna personifieras. Har du till exempel äldre texter kan de nya texterna uttrycka sig som att händelsen inträffade för väldigt länge sen eller så kan den uttrycka sig som att det hände idag. Verktyget kan även skriva texter som uttrycker sig på ett positivt eller negativt sätt.
Det finns planer på att implementera dessa speciella och unika funktioner inom den närmsta framtiden för att generera kvalitativa personifierade texter. Tekniken och planerna finns för att implementera detta men det har inte kommersialiserats än.
3. Kan Monok översätta texter?
Vi kan producera unika texter på engelska, tyska, franska och ryska med bra kvalité. Dessutom kan vi producera texter på svenska och japanska med ok kvalité. Dessa texter är därefter översättningsbara från det ena språket till det andra. Texter som skrivs på engelska kan därefter översättas till tyska och franska.
4. Har verktyget begränsningar? Inriktar ni er på specifika branscher?
Just nu inriktas sig Monok till företag och branscher som är i behov av unikt innehåll för att synas på sökmotorer som Google eller Bing för att få organiska trafik. Detta för att automatisera existerande processer och att spara tid och pengar på journalistiska omskrivningar.
Omskrivningar gör de flesta mediehus idag. Ungefär 16 av 20 artiklar som skrivs av en mediebyrå är en sammanfattning av en nyhet som har inträffat. Med Monok kan man nu automatisera bort de omskrivningar som skrivs manuellt av anställda och spara upp till 70 % av kostnaderna kopplat till den tid det tar att skriva om texter.
Vi har dessutom kunder som befinner sig i affiliate branschen. Dessa affiliate kunder är inte jätteintresserad av att göra omskrivningar utan de är mer intresserade av att ha ny och unikt innehåll. De vill gärna ha innehåll som de kanske inte besitter kunskap om. Då kan Monok hjälpa till med det, att ta fram innehåll som ökar kunskapen, relevansen och medvetenheten kring ett ämne.
Ibland får vi förfrågningar från jurister som vill synas på Google och Bing. I Los Angeles har vi sådana typer av kunder. Alternativt mediehus i Japan som är intresserade av automatisering av nöjesnyheter och att spara pengar på manuella omskrivningar. Verktyget har idag oändliga möjligheter både nationellt och internationellt.
5. Tror du att Monok funkar för alla typer av produkter och marknader?
Det finns en del små begränsningar som att svenska artiklar inte är lika bra som engelska artiklar. Dessa begränsningar uppstår när det inte finns lika mycket innehåll att sammanfatta för mindre språk.
Vi hade en kund som ville ha artiklar om olyckor som sker i USA. I USA sker det mycket trafikolyckor. Det skrivs inte om alla olyckor i media så den mängd data som fanns för att sammanfatta ämnet om just olyckor var det brist på. Det finns material i ämnet att producera men inte lika stora volymer. Det finns därför en begränsning i specifika ämnen för att generera stora mängder texter. Utöver det är det väldigt fritt. Man gör bara en ordsökning när man skapar ett nytt innehålls flöde av artiklar.
6. Vilka ämnen finns det störst potential att skapa unikt innehåll för?
Världsnyheter är det bredaste och enklaste. Inom kategorin världsnyheter finns alla ämnen egentligen. Där finns ämnen som ekonomi, sport, nöjen, innovationer och teknologi. Inom kategorin världsnyheter finns det en stor potential för den som vill ha fräscht och nytt innehåll. Vi har en svensk kund som är intresserad av klimatförändringar och hon ville ha autogenererade artiklar om klimatförändring och det lyckades vi generera med väldigt bra resultat. Vi har givetvis bättre potential för en snyggare artikel om vi kan hitta fler kvalitativa foton till artikeln, alternativt en video eller tweet.
Fråga 7
Hur många företag använder verktyget idag?
Just nu är det runt 10 bolag som betalar för Monok. Vi började få kunder för cirka ett år sedan efter lanseringen av det färdigutvecklade verktyget Monok. Efter lanseringen har efterfrågan på verktyget ökat stadigt både nationellt och internationellt. Med det ökade antalet kunder utvecklas även funktionerna för AI produkten baserat på kundernas behov. Utvecklingen av produkten sker kontinuerligt i samarbete med kunderna. Vi kollar efter kundernas behov och kan därefter anpassa verktyget enligt kundernas behov.
Data från Google Analytics som visar ökningen av antal besökare efter lansering av Monok.
8. Har ni räknat ut hur mycket ett företag kan spara på att använda Monok?
Vi räknar med att en omskrivning tar cirka 15 minuter att skriva. Kör du 16 omskrivningar av 20 texter totalt så blir det cirka 70 % av kostnaderna som du sparar pengar på. Hur mycket man faktiskt sparar beror på från bolag till bolag. För vissa spelar det jättestor roll. Vissa företag kan spara upp till 100 % av deras tid och kostnader om de inte har några journalister alls. I Sverige har vi en kund som inte har någon som skriver manuellt alls utan där kör de bara vår teknik. Så då sparar de 100 % av kostnaderna. Det beror på bemanningen i företagen med andra ord.
9. Hur funkar AI-tekniken?
I grund och botten är vi ett AI bolag som fokuserar på den senaste tekniken. Några av våra neurala nätverk är veckor gamla. Det är alltså på den nivån. Vi implementerar den senaste forskningen i produkterna för att hålla tekniken på framkanten. Det gör att när vi försöker konkurrera i den digitala marknaden så möts vi av jättemånga människor som håller på med AI fast det inte riktigt är AI. De har en AI-produkt men de kör med en tredje part produkt eller en API som de betalar för eller kallar de det AI men det är inte det.
Vi skiljer oss jättemycket från våra konkurrenter för vi har inga tredje part verktyg, utan allt är egenutvecklat. Vi implementerar den senaste forskning inom AI i vår produkt. I den aspekten är vi i framkant med den senaste tekniken. Vi märker av att vår teknik är unik eftersom vi kontaktas av stora fonder över hela världen.
Vi kör också ett forskningsprojekt med University of Brighton i England där vi evaluerar de generade texterna. Vi evaluerar om en dator kan upptäcka om texterna är mänskligt skrivna eller om det är en dator som skrivit texterna för en kontinuerlig kvalitetsförbättring.
Vi använder oss av samma teknik som fake news för att autogenerera artiklar och det positiva med vår teknik är att fake news kan bekämpas. Har du en artikel som är skriven från 20 källor så kommer 2 eller 3 av dessa källor vara fake news. Deras vikt kommer att försvinna i mängden av sammanfattningen. Resultet blir då mer generella texter som har en större sannolikhetshalt just för att de tar av den största sannolikhetshalten från alla källor.
10. Hur kommer jag igång med Monok?
I dagsläget måste man kontakta Monok för texterna. Andra steget är att Monok behöver en input från kunden i form av en lista av sökord. Så vill man till exempel ha ett flöde om sport så skickar man en lista som innehåller sökord som tennis, fotboll, sport eller UEFA Champions League och så vidare. Därefter kan man med några knapptryckningar skapa texter på flera olika språk inom just det området av sökbegreppen. Kostnaden för Monok grundar sig i hur många artiklar du producerar. Du behöver därför aldrig betala för något som du inte använder.
Skillnaden på Monok och de resterande AI-text producerande-bolag är att konkurrenterna använder sig av specifika mallar. Detta är en fem eller sexårig gammal teknik och inte ens i närheten av det vi gör. Vi har fått frågor tidigare, om det är mallar som vi använder oss för att autogenerera nya texter.
Vi kör neurala nätverk som genererar text på ett mycket mer abstrakt sätt. Så vi har inga mallar utan verktyget förstår kontexten av nyhetshändelser och skriver en ny, unik och naturlig text. Denna unika text är då mycket mer värdefull än en text som är genererad av en specifik mall, just för att Google känner inte igen mönstret. Det är ett nytt mönster. Vi har verifierat det. Vi analyserar med Google Analytics och ser en relation mellan antal flöden vi har igång och antal besökare på sajterna som Monok är aktiv på. Med hjälp av analysverktyg som Google Analytics kan man se att den organiska trafiken ökar markant efter implementering av Monok.
Vår produkt presenterades på den internationella årliga NLG konferensen i Tokyo i år. Det var enbart forskare inom NLG som närvarade på den konferensen. Det var vår samarbetspartner från University of Brighton som presenterade vår produkt i Tokyo.