I och med övergången till Stockholms universitetsbiblioteks nya hemsida byttes tekniken för att söka i bibliotekskatalogen Substansen ut. Den tidigare lösningen använde LIBRIS API XSearch och den nya består av en lokal Solrinstans.
Solrinstansen hämtar dagligen information om förändringar i Substansen via LIBRIS batchexport. Det här har fungerat väl för ändringar och nyförvärvad litteratur men vi har med den här lösningen inte fått reda på när vi gallrat det sista exemplaret av en bok.
För att lösa detta lade vi in en total omindexering av datat från LIBRIS varje helg. Det här har givit en inte särskilt optimal men för tillfället acceptabel lösning. Lösningen har inneburit att en bok som gallrats på måndagen har givit träff i katalogen i ytterligare fyra-fem dagar.
Nu har har räddningen kommit i form av en laddning Pythonkod som tröskar igenom förändringarna hos de olika dataströmmarna i LIBRIS nya OAI-PMH-tjänst och returnerar en lista med LibrisIdn som innehåller borttagna poster. Vi tar bort alla dessa poster från Solr varje natt och hamnar på så vis i takt med LIBRIS webbsök. Det här är en efterfrågad sak från många av de som indexerar LIBRIS i någon form i sina Discoverytjänster och vi är tacksamma för att LIBRIS skrivit och tillgängliggjort koden.
Hade vi byggt lösningen idag hade vi byggt den på OAI-PMH-tjänsten helt och hållet. Tyvärr fanns den inte på plats när vi implementerade vår lösning men det är lockande att implementera den. Man skulle nämligen då kunna hålla Solr-indexet uppdaterat i realtid. En morot i sammanhanget är att det skulle innebära att vara mer aktuellt än LIBRIS webbsök.