20. elokuuta 2010

Metatietojen tarkoitus (osa 2)

Kun tavalliselle työntekijälle sanoo sanan "metatiedot", oletettavasti yksi ensimmäisistä mielleyhtymistä hänellä on jonkinlainen metatieto-välilehti. Tiedättehän niitä lukuisia pakollisia kenttiä, joihin pitää laittaa jotain ennen kuin asiakirjan saa kirjattua järjestelmään. Niiden tarkoituksesta ei välttämättä ole ihan tarkkaa tietoa, mutta tehdään niin kuin käsketään ja aina niihin jotain keksitään.

Mielestäni varsin suuri osa metatiedoista on sellaisia, jotka lisätään varmuuden vuoksi sen kummemmin miettimättä. Periaatteena on usein: "mitä enemmän sen parempi". Enkä kiistä sitä etteikö niistä voisi olla joskus hyötyä tai sitä ei pitäisi tehdä, mutta mielestäni joskus olisi syytä pysähtyä miettimään metatietoja myös niiden hyödyntämisen näkökulmasta.

Suosikkiesimerkkini tästä aiheesta on asiasanojen käyttö. Asiakirjahallinnossa asiasanoitus on käytännössä sosiaalisen median suosimaa "taggaamista". Virkamiehet eivät paljon asiasanastoista ymmärrä, vaan sanoja käytetään varsin vapaasti eli epäyhdenmukaisesti. En tiedä kuinka monissa organisaatioissa edes huomataan opettaa niiden käyttöä tai nähdään sitä edes tarpeelliseksi. Virkamiehet nyt ainakin ovat vastaan. Hidastaahan se aika tavalla, jos välillä pitää Vesalla (tai organisaation mahdollisella omalla asiasanastolla) vierailla tarkistelemassa.

Ja kuinka suuri asiasanoituksesta saatava hyöty edes on? Jos luokittelukin tuntuu olevan liian vaikeaa, niin eikö asiasanoitus ole jo vähän liikaa vaadittu? Silti kyseinen kenttä löytyy jokaisesta itseään kunnioittavasta asiakirjajärjestelmästä. Sieltä se katsoo syyttävästi käyttäjää, sanoja sisällökseen vaatien.

Viime vuonna kesätyönäni oli yhdenlaisen asiasanaston ja luokituksen laatiminen. Sitä työtä tehdessäni huomasin, kuinka samanalaisia asioita sekä luokitus että asiasanoitus pohjimmiltaan ovat. Luokitus on kaiken pohjana ja määrää niteelle tai asiakirjalle yksiselitteisen paikan hierarkiassa, jonka lisäksi se sijoitetaan kuvailun tarkentamiseksi asiasanojen avulla useisiin muihin luokkiin. Asiasanasto luo siis yhdenlaisen luokitusjärjestelmän, josta voi hakea/selailla asiasanojen luomien luokkien perusteella.

Monissa blogeissa käytetään myös asiasanoituksen kaltaista taggaamista (labels). Ensimmäisessä blogissani sitä tuli kokeilluksi, mutta jo muutaman kirjoituksen jälkeen se alkoi tuntua turhalta. Eivät ne muodostaneet mitään järkeviä kokonaisuuksia tai auttaneet minua millään tavalla. Ja kun niiden tarkoitus ei ole minulle vieläkään selvinnyt, olen jättänyt ne täyttämättä, ihan hyvällä omalla tunnolla.

On harmillista, että metatietoja täytetään turhaan tai huolimattomasti vain koska ei ymmärretä niiden merkitystä. Jos niitä osattaisiin käyttää monipuolisemmin, myös itse kuvaileminen sujuisi sujuvammin. Nykyään tietysti päästään varsin hyviin tuloksiin pelkillä koneen keräämillä ja taitavasti hyödyntämillä (hakukoneet ja lajittelu), mutta asiasanoitus ja luokitus ovat edelleen korvaamattomia taitoja. Niitä kone ei tule koskaan osaamaan yhtä hyvin. Inhimillinen kuvailu on ainoa keino muodostaa suhteita ja kokonaisuuksia asiasisällön perusteella. Tekniikka on hyvä tuki, mutta kaikkiin metatietoihin ei sekään pysty.

1 kommentti:

Johanna kirjoitti...

Itse en näe asiakirjojen asiasanoittamista niin tärkeänä kuin esimerkiksi kirjojen. Nykytekniikalla pysytään hakemaan jo melko hyvin koko sisällöstä ja useimmiten asiakirjat ovatkin asiankäsittelyjärjestelmissä tekstimuodossa kokonaan sähköisesti. Useimmat skannerit osaavat nimittäin skannata jo tekstintunnistuksella tai asiakirja on sähköisesti saapunut viranomaisen järjestelmiin tekstimuodossa. Asiakirjat ovat paljon lyhyempiä kuin kirjat ja sisältöhaut eivät kestä kovinkaan pitkiä aikoja. Jos ja kun sisältöhaku toimii moitteetta ja asiakirjat tyypillisesti on kuvailtu pakollisilla metatiedoilla (esim. otsikko, luokitus, diaarinumero, luottamuksellisuus...), joilla yleisimmin niitä haetaan, tarvitseeko asiakirjoja enää sen lisäksi asiasanoittaa? Asiasanoitus oli tärkeämpää aikana, jolloin asiakirjoja ei pääsääntöisesti vielä arkistoitu sähköisesti, vaan niistä täytettiin pelkät kuvailutiedot järjestelmiin (tämä pätee toki vielä vanhaan arkistoaineistoon).