Cepic 9:e juni. Årets konferens om metadata var bara en halvdag och gock parallelt med konferensen om nya medier som också hade ett pass om metadata. Detta var den fjärde internationella konferensen om metadata och jämfört med den första som var i Florens 2007 så var det en liten tillställning. Däremot var det hög nivå på det som avahandlades. En utomstående hade nog kallat den för nördig då de som var här till stor del är samma personer som arbetar aktivt med att utveckla IPTC:s standarder. Många utomstådne tycker nog att detta är lite som med en mobiltelefon – den ska bara fungera men jag vill inte veta hur den fungerar. Standarder kring metadata gör det möjligt att hitta bilder och handla med dem. Konferensen avslutades med en gemensam presentation av Getty och Corbis – vilket måste ses som ett statement. De delade med sig av kunskap om hur folk söker bilder på deras sajter och hur dessa båda giganter hanterar översättningar, ordlistor och rättstavning.
Paul Brown och Michael Stiedl – Metadata Survey
Undersökningen visar att det finns en stor spridning både bland leverantörer och kunder i hur man använder metadata. Många tidningar läser bara caption-fältet. Det är till och med i många nyhetssystem är det det enda fältet som redaktörerna kan se. Pauls slutsats är att det gäller att kunna anpassa metadata beroende på vem som är kund. Han förslag är att bildbyråer bör använda system som lägger in relevant metadata i de fält som kunden faktiskt använder i samband med att kunden laddar ner bilden. Om det är en dagspresskund bör man i princip kopiera nästan all relevant information till captionfältet.
Paul pratade också om utmaningen för byråer när IPTC utvidgar med fler fält. Bildbyråerna kan inte gå tillbaks och fylla i dem på de bilder som redan finns i arkivet. Man måste kunna hantera både gamla och nya bilder.
Michael pratade om att standarder får inte förändras för ofta. De ska vara stabila så det blir enkelt att flyta data mellan system. När man nu lägger till nya fält så har man varit noga att bara lägga till fält som verkligen efterfrågats. En av de viktigaste arbetena nu är att förbättra informationen om hur metadata ska användas korrekt. Det behövs bra guider. Ett annat viktigt område är flerspråkig metadata. Det finns redan stöd i standarden, men får program stödjer det.
Metadata Howto med Michael Stiedl och Sarah Saunders
Michael Stiedl berättade om hur fotometadata fungerar och vad som krävs för att vara en standard. Det är egentligen flera överlappande standards som ska fungera ihop där IPTC utgör en delmängd. Följande är huvudkomponenterna i nuvarande metadata för stillbilder.
- IIM
- IPTC Core
- IPTC Extended
- EXIF
- XMP
- Dublin Core
- Photoshops egna fält
- Plus
- Prism/DIM
Det finns två motsägesfulla krav på en standard
- Att vara stabil över tid
- Att kunna utökas med fler fält efterhand som behov uppstår
Sarah pratade om arbetsflödet kring att lägga till och importera metadata. Här är en checklista för vad som hon tyckte var viktigt
- Lägga till metdata en gång
- Kolla kompatibilitet
- Städa metadata (ta bort konstiga tecken som kan störa systemet)
- Mappa mellan fält
- Automatisera med programvara
- Behåll all data även om du inte behöver den nu
Sarah påpekade att alla fält inte är relevanta för alla bilder. Det beror på typ av bild och bransch. Mycket av informationen är samma för många bilder så det går att spara tid genom att använda mallar. Sara gick också igenom de nya fält som finns i IPTC Extension och varför de har kommit till.
Michael berättade om de nya metadatapanelerna till Bridge som gör att det går att använda de nya fälten även i CS3 och CS4. De kommer att göra tillgängliga för nedladdning om några månader. De gör det möjligt att använda de nya fälten även i dessa äldre versioner.
Sarah Saunders & Abbie Enock – CV Controlled Vocabulary
Sarah gav en introduktion till vad en kontrollerad ordlista (CV) är och hur de används. Syftet är att se till så termer är entydiga. I grunden är det en strukturerad kontrollerad ordlista av av utvalda termer. Ofta är de hierakiskt uppbyggda (en trädstruktur).
Om man söker på ”orange” så kan det vara många olika saker. Det kan vara en frukt, en färg, en religiös orden eller ett telekomföretag. Men om man lägger till att det är en frukt så blir det entydigt.
CV är också ett bra verktyg för att hantera synonymer. Genom att lägga in ett ord kan systemet automatiskt veta vilka andra nyckelord som är synonymer. Även om den som märker bilden använder ett ord så kan folk fortfarande söka på synonymerna. Hur dessa används varierar mellan bildarkiv.
Getty har kommit lång inom detta område, de har lagt ner massor med energi på sina CV. Men problemet är att andra inte kan använda dem. Getty är av förklarliga skäl inte så intresserade av att dela med sig, den ger dem ju konkurrensfördelar. Om IPTC tar fram en så kan den användas av alla och det gör det lättar att flytta bilder mellan arkiv. Det underlättar också översättning av metadata.
Bibliotek har använt CV länge och därifrån finns det mycket att lära. Men IPTC har också redan några CV som används. En av dem är Newscodes, men den är inte anpassad för stockbilder.
Abbie fortsatte med att visa hur CV skulle kunna implementeras i deras program (Capture). Hon pratade om hur viktigt det är att göra det på ett sätt som guidar användaren och som är väldigt flexibelt.
Andrew Labonte & Mary Foster – Seaching for images – finding by metadata
Mary berättade om hur folk söker bilder. Ungefär en tredjedel av alla sökningar är på ”av människan skapade föremål”. Därefter kommer sökningar på kända personer eller platser.
Vad får folk att ge upp och gå till en annan sajt för att hitta bilder? Om folk för allt för många irrelevant resultat så ger de upp. Den vanligaste orsaken är ”keyword spamming”. Det andra orsaken är om de får för få resultat. Om det inte får några träffar gör de ofta ett nytt försök. Det farliga är om de bara får en handfull, då är det risk för att de går till en annan sajt för att de får för sig att arkivet är för litet inom området. En annan risk är att de stavat fel men inte inser det och därför inte får rätt bilder, så automatisk stavningsrättning är en bra funktion.
Andrew pratade om flerspråkig sökning. Här har de stor nytta av CV som gör det lätt att spara översättningar på ett kompakt och sökbart sätt. Problemet är fritexten eftersom den inte går att återanvända.
Mary pratade om vad som är de stora fällorna vid keywording. Ett stort problem är kulturell kunskap. Det är inte säkert att den som märker bilden kan tillräckligt om innehållet. Den som märker bilder måste ha bra språkkunskaper för att få rätt ord och inte använda ”false friends”. För att få konsekvent märkning måste du träna de personalen. Det gäller också för att få en bra balans av antal nyckelord och att prioritera det som är relevant.
Försök att lära dig utifrån statistik från vad dina kunder söker på. En bra balans är ca 15 till 20 nyckelord på en bild. Både Corbis och Getty har sina huvudkontor i Seatle. Det gör att personal naturligtvis har hoppat mellan företagen och ”smittat av sig kunskap”. De berättade även att de ibland går tillbaks och lägger till fler nyckelord på bilder eftersom deras betydelse ändras med tiden.