maandag 20 augustus 2012

Maandag 20 augustus: Digital Recordkeeping

Het is nogal schrikwekkend om naar een congres te gaan waarvan je op voorhand al weet dat je er (bijna) niemand gaat kennen. Zeker nu we al iets verder zijn, weet ik dat ik de enige Belg ben. Naast enkele Nederlanders en een Duitser (van FamilySearch) die Nederlands sprak, ben ik een van de weinige Nederlandstaligen. Engels is de voertaal en er is simultaanvertaling voorzien voor Mandarijn Chinees, Frans, Engels, Spaans, Russisch en Japans.

Ook de workshop in kwestie was in het Engels. Als je weet dat we in het Nederlands een specifiek jargon hadden, dan is dat in het Engels ook zo. In het begin was het wat sukkelen met het het jargon en het feit dat de Australiërs ook een iets andere visie hebben op ons vak. Die visie deel ik wel met hen, maar het taalverschil is er wel.

Ik zal later een gescande versie van de cursus aan dit verslag hangen.

Wat is een "record"?
De workshop zelf was goed opgebouwd. We begonnen met een korte inleiding over wat nu een "record" was. Ik sukkel nog steeds om een goed Nederlandstalig equivalent te vinden. De definitie is als volgt:

"Information created, received and maintained as evidence and information by an organisation or person, in pursuance of legal obligations or in the transaction of business"

Grof vertaald gaat het eigenlijk over de volgende vragen: wie deed wat, wanneer, waarom en hoe? Records geven ons eigenlijk een antwoord op die vragen. Ook het concept van het origineel wordt in vraag gesteld door deze definitie: we bewaren het bewijs (evidence) van wat er gebeurd is en dat hoeft dus niet het origineel te zijn! Zolang we kunnen bewijzen dat onze records origineel zijn, in die zin niet gewijzigd, zitten we alvast goed.

Daarop bouwden we verder en keken we naar de meer klassieke archivistische principes en of deze in digitaal records management nog valabel zijn. Het gaat over:
- respect des fonds
- provenance (herkomstbeginsel)
- original order (oude orde behouden)
Deze principes worden sterk op de proef gesteld, maar blijven wel geldig. De sleutel om de principes te behouden is het verhaal van de metadata: die moet je gebruiken om de context te gaan bewaren.

Metadata
Dat brengt ons dan bij de volgende onderwerpen van de workshop: record metadata, of om het te zeggen zoals de lesgever: usefull information on stuff we manage! Nieuw voor mij was het onderscheid dat je kan tussen twee soorten record metadata:
- point of capture metadata: metadata die bij het capteren van het record worden vastgelegd, zoals de titel, beschrijving, naam, ...
- records process metadata: documenteren alle records, acties ondernomen op die records vanaf het moment van capteren. Deze metadata worden steeds aangevuld door de tijd heen om bij te dragen tot het beheer van de records, bewijs te leveren over dat beheer (audit trialing) en om bij te dragen tot de authenticiteit en betrouwbaarheid van het betrokken record. Dit alles is natuurlijk niet nieuw en is gekend, maar het opsplitsen was voor mij een nieuw concept. Goed om weten is dat de tweede soort record metadata vaak automatisch kunnen vastgelegd worden en dat de eerste vaak door een gebruiker moeten aangevuld worden. Spijtig genoeg voorzien de huidige zaaksystemen (business systems in het Engels) over voldoende mogelijkheden om de point of capture metadata vast te leggen, maar schieten ze spijtig genoeg te kort op vlak van de records process metadata.

Leuk was ook de vergelijking van metadata met een doos chocolade. Die kon gebruikt worden om het gebruik van metadata te illustreren. Jammer genoeg geen foto's ervan, maar stel je gewoon een groep van 30 archivarissen voor die met een mond vol chocolade met in hun handen snoepwikkels over metadata op die wikkels praten. Humoristisch, maar heel effectief!

Ik ga proberen om dit toch deels over te brengen. Beschouw een doos snoep, met zijn inhoud. Elk snoepje is een individueel record, met een snoeppapiertje, een wrapper met daarop zijn eigen specifieke metadata. Daar staat vanalles op, afhankelijk van het soort snoep: naam, waarvan het gemaakt is, wanneer het gemaakt is, gebruiksinformatie (vooral niet gebruiken als je allergisch bent; contains traces of nuts), ... Nu staat die informatie heel vaak niet op de wrappers van de inviduele snoepjes, maar wel op de doos, wat meteen de overerfbaarheid van metadata kan illustreren. In een voorbeeld stond de houdbaarheidsdatum en het batchnummer op de doos en niet op de individuele papiertjes. Door het feit dat de snoepjes zelf uit die ene doos kwamen, kon je afleiden dat die snoepjes die houdbaarheidsdatum en dat batchnummer hadden.

Na deze oefening gingen we over naar een aantal voorbeelden, waarbij beschouwd werd of deze goed of slecht waren. Dan kwamen we uit op een aantal standaard sets van record keeping metadata die waren ontwikkeld in Australië. De voorbeelden zelf maakten gebruik van de Queensland Record Keeping Metadatset (QRKMS - tekst hier te vinden), maar er zijn ook nog de Australian Government Record Keeping Metadata Set (AGRKMS - tekst hier te vinden), South Australian Record Keeping Metadata Set (SARKMS - tekst hier te vinden), New South Wales Record Keeping Metadata Set (NSWRKMS - tekst hier te vinden), ... Deze lijken allemaal goed op elkaar en zijn allemaal gebaseerd op ISO-23081, wat oorspronkelijk een Australische standaard was en zwaar gebaseerd is op Terry Cook's series system. Daar kom ik later op terug, tijdens een sessie op het congres was er hierover een bespreking.

De tekst van QRKMS is van juni 2012, heel recent, een versie die ik zelf nog niet gelezen heb en dus op een later moment met heel veel aandacht ga doornemen. Los van de workshop wil ik hier toch wat verder op ingaan. Ik heb zelf een vrij goede kennis van de sets, omdat ik ze in het verleden zelf al bestudeerd heb. Ik ben van mening dat het de moeite is een vergelijkbare standaard te ontwikkelen voor Vlaanderen en België. Een idee dat misschien verder moet bekeken worden. Voor de Stad Gent en het OCMW Gent is er reeds een basisset beschikbaar, ontwikkeld op basis van de bovenstaande Australische standaarden. Het voordeel van een universele, basisstandaard, is dat je hierdoor meer kan gaan uitwisselen en dat je tenminste voor één element dezelfde naam gaat gebruiken. Het gaat ook maar over een basisset, wat je eigenlijk zou moeten hebben, dus kan elke organisatie die nog verder gaan verrijken.

Terug naar de les, andere eigenschappen van metadata zijn dat deze al dan niet samengesteld en al dan niet per element kunnen herhaald worden. Overerving is ook een interessant concept (aangezien ik - althans hopelijk vanaf 1 september officieel - programmeur ben, ken ik dat concept vrij goed). Het houdt in dat wat je op een hoger niveau kan vastleggen daar vastlegt, en enkel op een lager niveau gaat herhalen als het anders is dan wat op het hoger niveau van toepassing was. Dit klinkt gelijkaardig aan het principe van multilevel description uit ISAD en dat is het eigenlijk ook. het is vrij abstract, maar een heel krachtig systeem.

Tijdens de bespreking komt ook het aspect van vernietigen van metadata naar boven. Algemeen wordt aanvaard dat je metadata ook na vernietiging moet bijhouden. Op die manier kan je tenminste gaan aantonen wat er was en hoe het beheerd werd. Minder eensgezindheid was er rond het al dan niet deels vernietigen of verwijderen van metadata bij permanent te bewaren records. Ik ben persoonlijk van mening dat niet alle metadata permanent hoeven bij gehouden te worden. Bepaalde metadata kunnen hun nut verliezen, zoals bijvoorbeeld de locaties waar een record precies in een archiefdepot werd bewaard. Of die dan moeten verwijderd worden is een andere zaak. De discussie rond mijn stelling bracht een consensus naar boven: niet alle metadata hebben een permanente waarde, maar het is vaak pragmatischer alle metadata te behouden. Het extra beheer dat noodzakelijk is om bepaalde metadata te vernietigen, is de moeite niet waard. In theorie kun je het dus wel doen. Je moet dan in eerste plaats gaan bepalen wat echt noodzakelijk is. Belangrijk blijft de mogelijkheid om verantwoording af te leggen over het beheer van de records. Voor te vernietigen records behoud je best een zogenaamde "stub" of een basisset metadata die je kan gebruiken om de beslissing tot vernietigen te verantwoorden.

Tot slot, enkele good practices rond metadata:
- Gebruik het metadataveld uitsluitend waarvoor het bestemd was. Ga niet vindingrijk te werk door andere gegevens in hetzelfde veld te gaan plaatsen. Als die nood er is, ontbreekt er gewoon een extra element.
- Maak het de gebruiker gemakkelijk: maak bijvoorbeeld zoveel mogelijk gebruik van gecontroleerde lijsten (dropdown lijsten).
- Herhaal een metadataveld waar dat nodig is. Metadata zijn herhaalbaar, niet louter single instance.

Context van computerarchitectuur en -structuur
Hierna gingen we over naar een ander onderwerp: de context waarin instellingen werken. We kregen een aantal cases over de situatie in Australië in 1998 die we analyseerden en vergeleken met onze eigen situatie nu. We kwamen tot de vaststelling dat er nog slechts weinig is veranderd.

Informatiesystemen en EDRMS (Electronic Documents and Records Management System)

Daarna ging de focus over op informatiesystemen die gebruikt worden in tal van organisaties. In de eerste plaats bespraken we op basis van een artikel van Terry Cook, die een samenvatting maakte van David Bearman, de voornaamste verschillen tussen een informatiesysteem en een EDRMS.

Algemeen kunnen we stellen dat een informatiesysteem data bevat die aan de volgende voorwaarden voldoet:
- snel vindbaar;
- efficiënt vanuit technisch standpunt;
- ondersteunt verschillende views en diverse manieren van gebruik;
- manipuleerbaar (wil zeggen dat de data ook overschrijfbaar is);
- niet redundant: oude data is ongewenst en wordt vaak vervangen (bijvoorbeeld een adres van een klant in een customer relation management systeem of CRM: een nieuw adres wordt over het oude heen geschreven)

Record management systemen zijn net het omgekeerde. Zij bevatten data die de volgende kenmerken hebben:
- tijdsgebonden (wanneer- aspect van het record-zijn);
- technisch gezien inefficiënt;
- direct gebonden aan het gebruik door de aanwezige metadata;
- onwijzigbaar (integriteit moet verzekerd worden);
- redundant: oude data is nietr voorbij gestreefd en is nog even waardevol als nieuwe data

Wat is een EDRMS? "A type of content management system and refers to the combined technologies of document management and records management systems as an integrated system." Belangrijk is dus het feit dat het enerzijds een documentbeheersysteem is, dat er recordsmanagement en dus lifecycle-management aan koppelt. In tegenstelling tot Australië waar EDRMS-systemen al vrij wijd verspreid zijn, is dit soort systemen in Europe nog niet doorgedrongen.

Wat zijn nu de belangrijkste bevinden die gemaakt zijn bij het implementeren van een EDRMS:
- duur!
- de vraag blijft of ze wel het eindpunt zijn? Is er niet nood aan een ander, achterliggend systeem?
- de verandering voor de gebruikers is aanzienlijk ten opzichte van vroegere systemen.
- de markt is heel complex: er zijn verschillende vendors die verschillende producten aanreiken, die in principe "propietary software" zijn, geen open en gedocumenteerde software. Dit brengt met zich mee dat je goed moet opletten voor een vendor lock-in: je bent plots gebonden aan je leverancier.
- er moet goed nagedacht worden over de configuratie
- ze kunnen enkele de courante office documenten beheren. Dit heeft als implicatie dat je naast een EDRMS vaak ook andere applicaties hebt draaien.

De overheid van Queensland heeft in het verleden een EDRMS willen implementeren. Na een langdurig keuze- en uitbestedingsproces kwamen ze uit bij Hummingbird, een Australisch product. Voor de configuratie bleken ze uiteindelijk afhankelijk te zijn van een externe consultant, die $ 3.000 per dag kostte en op de koop toe een terminale kanker had. Hij was de enige in gans Australië die beschikbaar was om de configuratie te doen. Over een risico gesproken.

Hummingbird zou later overgenomen worden door OpenText, die al hun eigen product hebben. Enige tijd na de overname werd dan ook aangekondigd dat Hummingbird niet meer ondersteund zou worden en uitgerangeerd werd. Dit toont aan dat het echt noodzakelijk is van bij het begin in een systeem een goede exitstrategie inte bouwen, zodat je zonder heel veel moeite je documenten en metadata kunt gaan exporteren naar een ander systeem zonder verlies.

Er zijn een aantal opkomende trends bij EDRMS:
- gebruik van meer open source software
- gebruik van software as e service (zoals cloud-toepassingen, ...). Ik ben zelf zwaar gekant tegen het outsourcen van datamanagement en het gebruik van clou-toepassingen. Dropbox bijvoorbeeld is volgens mij een bijzonder gevaarlijk product. Je hebt absoluut geen controle over je eigen data en weet zelfs niet waar ze staat. Vanuit veiligheidsstandpunt is dit geen goed idee.
- Opkomst van SharePoint: iedereen wordt er wild van, maar hou er wel rekening mee dat dit een samenwerkingstool is, geen RM-toepassing.
- opkomst van gestandardiseerde vereisten voor RM-toepassingen

Internationale standaarden nuttig voor implementeren van RM-toepassingen:
- ISO-13026 (niet zeker over het juiste nummer): digitalisering
- ISO-13008: Information and documentation -- Digital records conversion and migration process
- ISO-30300-30304: Information and documentation -- Management systems for records
- ISO-26122: Work Process Analysis for Records Management
- ISO-16175: Functional Requirements for Records in Electronic Office Environments (voormalige ICA Requirements)
- ISO-23081: metadata
- ISO-15489: Information and documentation -- Records management

Vooral ISO-16175, de vroegere ICA Requirements, zijn de moeite waard. Ik verwijs verder naar deze standaard als ICA Req, omdat dat de naam is waaronder die nog steeds bekend staat. De standaard is bijzonder leesbaar voor leken. Ze bestaat uit drie delen: een algemeen deel met de principes die algemeen geldend zijn, een deel over RM-systemen en een deel over business-systemen. De bedoeling is dat de deel 2 en 3 apart worden gezien (je gebruikt het een of het andere) in combinatie met het eerste deel. Later tijdens het congres ben ik naar een presentatie van een Frans project bij het ministerie van Buitenlandse Zaken gaan luisteren. Daar werd effectief aangeduid dat ICA Req heel nuttig was. MoReq werd als veel te ingewiikkeld en onleesbaar gezien. Op basis van wat toen nog ICA Req was, hebben de Fransen een lijst van eisen opgemaakt voor business-systemen bij het Franse Ministerie van Buitenlandse Zaken.

ICA Req stoelt op 12 principes, heel algemeen geformuleerd, waarvan de eerste 4 slaan op records en laatste 8 op de systemen waarin ze zitten. Ik geef die kort weer (er is geen Nederlandse vertaling vebschikbaar, dus heb ik ze zelf zo goed als mogelijk vertaald):
1. Digitale informatie over activiteiten en handelingen moet actief beheerd worden en betrouwbaar gehouden worden om te dienen als authentieke bewijs van "business activity".
2. Die informatie moet steeds aan zijn context gebonden zijn door het gebruik van metadata.
3. Informatie moet bewaard worden en toegankelijk blijven zolang als gebruikers die nodig hebben of andere richtlijnen dit voorschrijven.
4. Informatie moet vernietigd worden op een beheersbare en georganiseerde, systematische en controleerbare manier.
5. Systemen moeten goed informatiebeheer als een organisch onderdeel van het business proces ondersteunen.
6. Systemen voor het capteren en beheren van procesgebonden informatie moeten vertrouwen op gestandardiseerde metadata als een actief, dynamisch en centraal onderdeel van het beheer van de records.
7. Systemen moeten zoveel mogelijk interoparbiliteit over platformen, domeinen en zelfs door de tijd heen ondersteunen.
8. Systemen moeten gebouwd zijn op open standaarden en zijn best technologie-neutraal.
9. Systemen moeten in bulk informatie kunnen opnemen en kunnen exporteren in open en gestandardiseerde formaten.
10. Systemen moeten procesgebonden informatie in een veilige omgeving bewaren.
11. Zoveel als mogelijk moet metadata door het systeem zelf worden gegenereerd en vastgelegd.
12. Het moet voor de gebruiker zo simpel mogelijk gemaakt worden om records te capteren of te gebruiken.

Records en web 2.0

We staan op vlak van web 2.0 voor grote uitdagingen. We zouden als archivarissen een eerder afwachtende houding kunnen aannemen. De volgende blog geeft echter wat stof tot nadenken: http://rmfuturewatch.blogspot.com/

Op deze blog staat een manifestum:
1. I recognize that the world of information culture is changing fast and that records management needs to respond positively to these changes to provide systems, policies, advice and services that are helpful to my organization, my teams and my colleagues.
2. I will educate myself about the information culture of my users and look for ways to incorporate what I learn into the records management solutions we offer.
3. I will let go of previous practices if there is a better way to do things now and will actively work towards the elaboration and formulation of new principles and practices.
4. Whilst I recognize the need for final assured quality in record-keeping systems this should not inhibit constant experimentation, innovation and development.
5. I will help users to take advantage of the Web2.0 services they need to deliver the agreed benefits to our organization.
6. I will avoid requiring users to see things in records management terms but, rather, will shape services to reflect users' preferences and expectations.
7. I recognize that records management does not have all the answers and will work openly, collaboratively and constructively with other IM and IT professionals in tackling the issues we face.
8. I recognize that it is not easy for users to keep records and will endeavor to develop automated and embedded RM solutions so as not to add unnecessary burdens to their working life.
9. I will work to improve the organization’s capability of keeping and understanding its records so far as is possible, whilst recognizing that we will never have perfect solutions for capturing and managing our records.
10. I will, at all times, strive to maintain a balance between the needs of my users and the legal, regulatory and operational requirements of my organization.
11. I recognize that although technology moves quickly, organizations often change slowly and will work to expedite our responsiveness to change, whatever its pace.
12. I will strive to deliver a service both users and management can trust and that is transparent and open to all stakeholders.

Preservering

Een laatste onderwerp was preservatie. In de eerste plaats hadden we het over technologische afhankelijkheid. Er zijn drie niveaus:
- software waarin het programma is geschreven
- software die draait op specifieke besturingssystemen
- media waarop de informatie is opgeslagen.

OAIS wordt eveneens kort belicht.

Het allerlaatste waarover we het hebben, zijn digitale preservatietechnieken:
- emulatie
- migratie
- normalisatie (omzetten naar een geschikt formaat)

Tot slot
Interessant om op te volgen, zijn alvast de volgende zaken:
Future Proof blog - link - van New South Wales Public Records Office: geeft heel wat inzichten in digital records manegement.
Website van New South Wales Public Records Office - link - bevat heel wat basisinformatie die in de Vlaamse context makkelijk toepasbaar is.
Australasian Digital Record Keeping Initiative of ADRI - link

Geen opmerkingen:

Een reactie posten