Sidebar

Datafangst av sosiale medier


Thomas Sødring, Høgskolen i Oslo og Akershus 

Problemet er klassisk. Den teknologiske utviklingen skjer uten å ta hensyn til arkivet. Men hvis vi skulle tatt hensyn til arkivet, så hadde den teknologiske utviklingen aldri kommet så langt. Sosiale medier er kommet for å bli. Men disse mediene må temmes og integreres med arkivet.

Ved HiOA har vi sett nærmere hvordan det er mulig å integrere Facebook opp mot arkivet. Det er utviklet en ferdig løsning som integrerer Facebook og en Noark 5 arkivstruktur. Denne løsningen fungerer veldig bra, men vi ønsker imidlertid en kryssplattform-løsning. Derfor holder vi å utvikle dette nytt i en åpenkildekode applikasjon som heter FBFangst. Formålet med disse løsningene er å demonstrere hvordan arkivet og sosiale medier kan integreres. Med slike løsninger tilgjengelig, kan en kommune med dyktige IT folk selv videreutvikle dette til eget bruk, eller bruke løsningen til å etterspørre en bestilling fra en leverandør.


Egen applikasjon for datafangst
For å integrere Facebook og arkivet man lage det som kalles for en Facebook applikasjon. Dette er en type webbasert applikasjon, som kjører en egen maskin Internett (ekstern til Facebook) og som bruker lite av Facebooks egne ressurser. FBFangst er en slik webbasert applikasjon (utviklet i php) og vil kunne kjøres en maskin kommunen selv kontrollerer, noe som gjør det mye enklere å integrere Facebook mot arkivet.


En Facebook applikasjon får kun tilgang til de dataene brukeren selv godkjenner. Når FBFangst installeres i Facebook profilen brukeren selv samtykke til hvilken informasjon FBFangst har lov til å fange. Det er interessant å se at praktisk talt all informasjon kan fanges Facebook, lenge brukeren samtykker.
FBFangst vil være mest nyttig der en kommune bruker Facebook for innbyggerdialog. Kommunen kan opprette en gruppe og la diskusjonen skje der, for senere å fange og importere hele dialogen inn i arkivet. Det bør imidlertid være tydelig at deltakelse i Facebook-gruppen medfører at din identitet og kommentarer blir arkivert. FBFangst kan også brukes til å fange sider og innlegg på kommunens Facebook profil.

Integrasjon med NOARK 5
Det som er utviklet langt kan fange grupper, eventer og sider. Men FBFangst skal utvides til å fange mer. Personlige meldinger i innboksen bør også kunne fanges. FBFansgt er utviklet en måte som gjør at den lett kan integreres med andre Noark systemer hvis de er utvidet til å støtte denne type kilde. Applikasjonen stiller bare krav til en fornuftig utvidet dokumentfangst funksjonalitet i et Noark system. Disse kravene og forventet funksjonalitet bryter ikke med standarden. mange måter viser dette prosjektet fleksibiliteten i versjon 3 av Noark 5, da det tar i bruk mulighetene med VirksomhetspesifikkeMetadata og utvider Mappe med to nye Mapper: FBGruppeMappe og FBVeggInnlegg. FBGruppeMappe fanger data om gruppen som inkluderer tittel, eier, opprettelse osv.  FBVeggInnlegg representerer et innlegg veggen til gruppen og inneholder både tekst og brukeridentifikasjon.


FBFangst bruker en utvidelse av BasisRegistrering som heter FBRegistrering og hver kommentar til et vegginnlegg lagres som en egen registrering.  Disse utvidelsene vil også bli integrert i uttrekksmodulen slik at et uttrekk med disse dataene lett kan godkjennes ved avlevering til depot. Et av de viktige elementene her er bruken av Facebook identifikatorer og den virkelige identiteten til brukeren. Alle Facebook brukere er identifisert etter et unikt ID, en streng som består av 15 tall. Det er viktig å bevare denne informasjonen for å verifisere hvem som egentlig kommenterte, men samtidig er det ikke gitt at disse identifikatorer vil være i bruk i framtiden.

Dokumentfangst i sosiale medier er mulig
FBFangst viser at dokumentfangst fra Facebook er mulig. Det finnes mange forskjellige verktøy som kan hente ut Facebook informasjon. FBFangst er derfor ikke noe enestående programvare. Det innovative er imidlertid integrasjon mellom Facebook og Noark.  Integrasjon med Noark kjernen er også ukomplisert, noe webservices sørger for. Der det blir komplisert er når det skal gjennom sikkerhet/pålogging saksbehandlingssystemet/arkivet. Men dette kan løses.  Mange spørsmål dukker opp når en slikt applikasjon er ferdig, noen praktiske, noe etiske og dette er noe vi ønsker å jobbe med framover. 


FBFangst er utviklet for å vise hvor enkelt datafangst i sosiale medier kan være. Når vi er ferdig så trenger du bare å søke i Facebook for FBFangst og applikasjonen installeres rett i profilen din. Det eneste du vil bli nødt til å gjøre er å endre innstillingene til å peke til din egen Noark kjerne, men det kan også bli mulig å eksportere informasjonen til xml format for de som ønsker det. Dette er en kostnadseffektiv dokumentfangstløsning, som ivaretar autentisiteten. Sannheten er at utfordringen framover der kommunen bruker sosiale medier, ligger mer i hvordan kommunen skal ut til de som ikke er tilstede.

Les mer om prosjektet på: http://student.iu.hio.no/hovedprosjekter/2011/data/33/index.htm
Se eldre artikler...