ATM mapping in PubMed

Sinds een week of twee heeft PubMed het mappen van zoektermen vernieuwd. Daarover heb ik al eerder een stukje over geschreven, met name naar aanleiding van een ‘brand’ e-mail van Donna Berryman. Ook Laika heeft hierover in haar blog geschreven.
Afgelopen week ben ik begonnen met het updaten van een zoekstrategie van drie jaar geleden: zijn er nieuwere termen bijkomen, is de mesh verandert, kon de strategie so wie so beter. Dat gaf mij meteen de kans om wat uitgebreider naar de ATM mapping van PubMed te kijken.
Wat Pubmed doet is niet helemaal onlogisch, alhoewel ik het met het eindresultaat niet altijd gelukkig ben. Even een voorbeeld:

kidney allograft:
oude mapping:
(“kidney”[MeSH Terms] OR “kidney”[Text Word]) AND (“transplantation, homologous”[MeSH Terms] OR allograft[Text Word])

ATM mapping:
(“kidney”[MeSH Terms] OR “kidney”[All Fields]) AND (“transplantation, homologous”[MeSH Terms] OR (“transplantation”[All Fields] AND “homologous”[All Fields]) OR “homologous transplantation”[All Fields] OR “allograft”[All Fields])

Wat er extra aan deze ‘zoekstrategie’ wordt toegevoegd zijn de termen: (“transplantation”[All Fields] AND “homologous”[All Fields]) OR “homologous transplantation”[All Fields]
Op zich geen gekke zoekstring, alleen zou ik het niet zo doen, inderdaad om te veel ruis te voorkomen. Nu zal dat met dit voorbeeld wel meevallen, maar bij andere teremn kan dit best wel uit de hand lopen, lijkt mij.

En verder wordt “allograft” in [All Fields] doorzocht in plaats van [Text Word]
En dat maakt een groot verschil uit. “All Fields” doorzoekt alle zoekvelden inclusief werkplek en ander irrelevante velden.
Dit is de definitie van PubMed voor All Fields: “Includes all search fields except for Place of Publication and Transliterated Title. Only terms enclosed in double quotes, truncated, or not found in one of the tables used in automatic term mapping will be searched in all fields”.

Bij Text Word worden “all words and numbers in the title, abstract, other abstract, MeSH terms, MeSH Subheadings, Publication Types, Substance Names, Personal Name as Subject, Corporate Author, MEDLINE Secondary Source” doorzocht. En dat is echt wat anders.

Hoe kun je deze mapping (deels) omzeilen. Want daar zijn we toch voor als informatiespecialist. Om goede zoekstrategieën te ontwerpen met een goede sensitiviteit en precisie, zonder al te veel ruis.
Mijn eerste poging was om achter een zoekterm [All Fields] te zetten. Maar als de zoekterm kan worden gemapt, zal Pubmed blijven mappen, en zul je evenveel hits vinden.
Haal je een deel ervan weg, dan vindt je ineens niets meer, en ook het toevoegen van [Text Word] helpt niet altijd:

placental blood stem cell transplantation 2733 hits
placental blood stem cell transplantation[All fields] 2733 hits
placental blood stem cell transplantation[Text Word] 0 hits
placental blood stem cell[All fields] 0 hits
placental blood stem cell[Text Word] 0 hits
placental blood stem cell 787 hits

Een andere mogelijkheid is om de zoekterm tussen “” te zetten. Dan probeert Pubmed nog steeds te mappen als de zoekterm omgezet kan worden naar een MeSH-term. Als er geen Mesh-term is wordt er niet gemapt en wordt gewoon de zoekterm zoals die is ingetypt gezocht, dus ook geen verdeling in losse termen met [All fields] er bij. Als een deel van je zoekterm tussen “” gemapt kan worden zal PuibMed dat doen, het andere deel blijft zoals het is aangeleverd.

De beste methode lijkt mij nog het expliciter aanbieden van de trefwoorden, bijvoorbeeld in bij de kidney allograft:
kidney allograft[text] OR (kidney[mesh] AND transplantation, homologous[mesh])

Anderzijds heb ik me afgevraagd of de extra hits die je krijgt niet worden verwijderd, als je de diverse termen aan het eind gaat combineren. Immers bij een PICO heb je 4 ‘sub-zoekstrategieën., die met AND worden ‘gekoppeld’. Hier kan ik nog geen antwoord opgeven, hopelijk binnenkort.

Een ander fenomeen is de term ‘therapy’. Deze wordt omgezet door PubMed naar “therapy”[Subheading] OR “therapy”[All Fields] OR “therapeutics”[MeSH Terms] OR “therapeutics”[All Fields]. In niet alle gevallen is omzetting naar “therapeutics[mesh][All Fields] gewenst.
Dit kan worden voorkomen door te zoeken naar therapy[text].

Zaak blijft om altijd via de Details-knop te controleren hoe PubMed voor je heeft gezocht. Dat was al standaard bij de vorige versie van mapping, en nu helemaal. Voorlopig ga ik met deze verandering pragmatisch om bij grote PICO-achtige zoekacties. In het geval van zoeken op één trefwoord, wat veel eindgebruikers doen, blijft het nodig om de vinger aan de pols te houden en ook eindgebruikers over de nieuwe mapping-method van PubMed te informeren: meer ruis en grotere aantallen hits.

Eén reactie to “ATM mapping in PubMed”

  1. ATM mapping bij PubMed(2) « de Bibliotheker’s Weblog Says:

    […] mapping bij PubMed(2) Zoals al eerder in deze blog gemeld krijg je bij de huidige ATM mapping van PubMed extra hits mee door de veranderde manier van […]

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s


%d bloggers op de volgende wijze: