Dynamic and basal ovarian reserve tests for outcome prediction in IVF treatment: comparisons and meta-analyses
In de introductie van dit proefschrift (hoofdstuk 1) worden de concepten van reproductieve veroudering bij de vrouw, respons in IVF als marker voor ovariële reserve en de manier waarop ovariële reserve testen geevalueerd zouden moeten worden besproken. De reproductieve veroudering van de vrouw is hoofdzakelijk gebaseerd op een afname van het aantal follikels/eicellen en een afname van de kwaliteit van deze follikels/eicellen (ovariële reserve). In de ovariële reserve van vrouwen van dezelfde chronologische leeftijd bestaat variatie. Ovariële reserve testen worden gebruikt om een inschatting te maken van de individuele reproductieve leeftijd. Lage ovariële respons is geassocieerd met verminderde ovariële reserve. Ovariële reserve verwijst naar de kwantiteit en kwaliteit van de ovariële follikelvoorraad. Lage respons kan met behulp van ovariële reserve testen vrij accuraat worden voorspeld, maar deze testen zijn niet in staat om een juiste voorspelling van de kans op zwangerschap te geven. Als hypothese werd aangenomen dat de voorspelling van zwangerschap bij IVF kan worden verbeterd wanneer de respons tijdens een eerste IVF cyclus als een aanvullende ovariële test wordt gebruikt, daarbij gebruik makende van het verwacht-lage respons (een lage respons bij een patiënte met afwijkende ovariële reserve testen) en onverwacht-lage respons ( een lage respons bij een patiënte met normale ovariële reserve testen) concept. Evaluatie van ovariële reserve testen met als referentie variabelen, respons en/of zwangerschap, moet beschikken over beoordeling van de voorspellende accuratesse en de klinische waarde van die test. Accuratesse is de nauwkeurigheid waarmee de uitkomstmaat wordt voorpeld. Klinische waarde omvat de vraag of het doen van die test een verandering in beleid, kosten, veiligheid of succeskansen met zich meebrengt.
In hoofdstuk 2 werden de onderzoeksthema’s van dit proefschrift gepresenteerd. Het eerste onderzoeksthema betrof de verbetering van de voorspelling van ovariële respons in IVF. De volgende vragen werden behandeld:
Vraag 1a:
Wat is het voorspellend vermogen en de klinische waarde van de basal en dynamische ovariële reserve testen; antrale follikel telling (AFC), FSH, ovarium volume (OVVOL) en de clomifeen citraat belastingstest (CCCT) in de voorspelling van lage respons in IVF, gebaseerd op een gestructureerd overzicht van de literatuur en meta-analyse?
Vraag 1b:
Wordt het voorspellend vermogen en de klinische waarde in de voorspelling van lage respons in IVF verbeterd door dynamische ovariële reserve testen (GnRH agonist stimulatie test (GAST) of CCCT) in vergelijking met basale ovariële reserve testen (GnRH agonist stimulatie test (GAST) of CCCT) in vergelijking met basale ovariële reserve testen?
Vraag 1c:
Wordt het voorspellend vermogen en de klinische waarde in de voorspelling van lage respons in IVF verbeterd door herhaalde dynamische ovariële reserve testen (GAST en CCCT), in vergelijking met een eenmalige dynamische test en/of basale test?
Vraag 1d:
Wat is de waarde van gestimuleerd oestradiol gemeten op dag 3 of 5, tijdens de IVF behandeling, in de voorspelling van ovariële hyperrespons?
In het tweede onderzoeksthema van dit proefschrift werd de verbetering van de voorspelling van zwangerschap na een IVF behandeling geevalueerd. We hebben getracht een antwoord op de volgende vragen te vinden:
Vraag 2a:
Wat is het voorspellend vermogen en de klinische waarde van de basale en dynamische ovariële reserve testen; AFC, FSH, OVVOL en CCCT, in de voorspelling van zwangerschap na IVF, gebaseerd op een gestuctureerd overzicht van de literatuur en meta-analyse?
Vraag 2b:
Is een verwachte lage respons in de eerste IVF behandelingscyclus voorspellend voor de zwangerschapskansen in de volgende cycli?Hoofdstuk 3 beschrijft een gestructureerd overzicht van de literatuur over antrale follikel telling (AFC), in vergelijking met basaal FSH, en een meta-analyse met betrekking tot het voorspellend vermogen ten aanzien van lage ovariële respons en het uitblijven van zwangerschap na IVF. Van de 25 geselecteerde artikelen bleken er 11 geschikt voor verdere analyse. Opvallend waren de methodologische verschillen tussen de diverse studies. De ROC curve voor de voorspelling van lage ovariële respons liet een beter onderscheidend vermogen zien voor AFC dan voor basaal FSH (p- waarde: 0.009). Het voorspellend vermogen ten aanzien van het uitblijven van zwangerschap is zeer laag voor zowel AFC als basaal FSH. De conclusie luidde dat de performance van AFC in de voorspelling van lage ovariële respons in IVF adequaat is en beter dan dat van basaal FSH.
Hoofdstuk 4 beschrijft een gestructureerd overzicht van de literatuur over ovarium volume (OVVOL) in vergelijking met antrale follikel telling (AFC) en een meta-analyse met betrekking tot het voorspellend vermogen ten aanzien van lage ovariële respons en het uitblijven van zwangerschap na IVF. Tien studies over OVVOL en 15 studies over AFC, waren geschikt voor verdere analyse. Vanwege de heterogeniteit tussen de diverse studies was het berekenen van een puntschatter voor sensitiviteit en specificiteit niet mogelijk. Wel was het mogelijk ROC-curves te bepalen en te vergelijken. Het onderscheidend vermogen van AFC in de voorspelling van lage ovariële respons was beter dan dat van OVVOL (p-waarde: 0.002). Het onderscheidend vermogen ten aanzien van het uitblijven van zwangerschap na IVF is voor beide testen slecht.
Alleen de AFC heeft enige klinische waarde ten aanzien van de voorspelling van lage ovariële response, omdat er daarmee een aanzienlijk aantal patiënten geidentificeerd kan worden die een grote kans hebben op een lage ovariële response in IVF. Voor zowel OVVOL als AFC was de klinische waarde ten aanzien van het voorspellen van uitblijven van zwangerschap slecht. Daarom luidde de conclusie dat AFC de test van eerste keus is in het voorspellen van de kwantitatieve ovariële reserve voorafgaand aan IVF. Het gebruik van de echo is echter niet adequaat genoeg in de identificatie van patiënten met een zeer lage zwangerschapskans.
Hoofdstuk 5 beschrijft een gestructureerd overzicht van de literatuur betreffende de clomifeen citraat belastingstest (CCCT) en het voorspellend vermogen met betrekking tot lage ovariële respons en het uitblijven van zwangerschap na IVF. Van de 34 geselecteerde artikelen bleken er 12 geschikt om verder te analyseren. Vanwege heterogeniteit tussen de diverse studies, kon er geen ROC-curve gemaakt worden. Sensitiviteit en specificiteit in de voorspelling van lage ovariële respons varieerde tussen, respectievelijk 35%-93% en 47%-98%. Voor voorspellingen van uiblijven van zwangerschap na IVF varieerde de sensitiviteit en specificiteit tussen, respectievelijk 13%-66% en 73%-97%.
Subanalyse van die studies waarin basaal FSH met de CCCT vergeleken kon worden (n = 6) liet zien, dat in de voorspelling van lage ovariële respons de sensitiviteit ietwat steeg, terwijl de specificiteit hetzelfde bleef of zelfs afnam. Voor het voorspellen van uitblijven van zwangerschap na IVF liet de CCCT een toename van de sensitiviteit zien ten koste van afname van de specificiteit. Daarom luidde de conclusie dat de CCCT nagenoeg geen additionele waarde heeft en derhalve niet gebruikt dient te worden als ovariële reserve test.
In hoofdstuk 6 wordt de waarde van een enkelvoudige of herhaalde GnRH agonist stimulatie test (GAST) vergeleken met dat van basale ovariële reserve testen met betrekking tot het voorspellen van de uitkomst van IVF. In totaal worden 57 vrouwen die hun eerste IVF stimulatie ondergingen in deze prospectieve studie geïncludeerd. De resultaten van deze studie lieten zien dat lage respons was geassocieerd met de GAST. Maar als we het voorspellend vermogen en de klinische waarde van de GAST vergelijken met dat van dag 3 AFC en inhibine B, dan blijkt de performance van zowel een enkelvoudige als een herhaalde GAST niet beter. De voorspellende waarde van de GAST (enkelvoudig en herhaald) met betrekking tot zwangerschap is slecht. Daarom zou volgens ons de GAST als een test om de uitkomst van een IVF behandeling te voorspellen niet langer gebruikt moeten worden.
In hoofdstuk 7 wordt het voorspellend vermogen en de klinische waarde van een enkelvoudige en herhaalde clomifeen citraat stimulatie test (CCCT) in de voorspelling van lage respons na IVF vergeleken met dat van basale ovariële reserve testen. In deze prospectieve studie werden in totaal 63 vrouwen die hun eerste IVF behandeling ondergingen geïncludeerd. De resultaten van deze studie lieten zien dat lage respons was geassocieerd met de CCCT. Maar in vergelijking met basaal FSH in combinatie met een AFC is het voorspellend vermogen en de klinische waarde van de CCCT nauwelijks beter. Wij zijn van mening dat dit minimale voordeel niet opweegt tegen de belasting die een CCCT met zich meebrengt. Daarom zou volgens ons de CCCT niet langer meer als test gebruikt moeten worden in het voorspellen van de uitkomst van een IVF behandeling.
In hoofdstuk 8 werd de waarde van serum oestradiol bepalingen vroeg in de stimulatiefase van een IVF behandeling (stimulatiedag 3 of stimulatiedag 5) bepaald als voorspeller van ovariële hyperrespons. In totaal werden 109 vrouwen die hun eerste IVF behandeling ondergingen in deze prospectieve studie geïncludeerd. Er werden twee uitkomst maten gedefinieerd. (1) Ovariële hyperrespons (= 15 eicellen bij punctie en/of piek oestradiol > 10.000 pmol/l, afbreken van de cyclus in verband met groei van meer dan 30 follikels, of ontwikkeling van het ovariëel hyperstimulatie syndroom (OHSS)). (2) Extreme respons (afbreken van de cyclus in verband met groei van meer dan 30 follikels, of ontwikkeling van OHSS). Deze groep representeert de ernstigere hyperresponders. Zowel ovariële hyperrespons als de sub-groep extreme response is significant geassocieerd met stimulatiedag 3 en 5 oestradiol. Echter, het klinisch nut van het voorspellen van ovariële hyperrespons leek beperkt vanwege de lage sensitiviteit en het hoge aantal fout-positieven. De klinische waarde van het voorspellen van extreme respons was beter. Daarom lijkt het niet zinvol, met het oog op de voorspelling van ovariële hyperrespons, oestradiol te meten vroeg in de stimulatie-fase van een IVF behandeling. Omdat oestradiol gemeten op stimulatiedag 5 adequaat is gebleken in de voorspelling van extreme respons, kan voorspelling van extreme respons nuttig zijn indien dosis-aanpassing leidt tot verbetering van de uitkomst.
In hoofdstuk 9 werd onderzocht of het identificeren van lage responders bruikbaar is om doorgaande zwangerschap te voorspellen in een reeks van behandelingscycli. Er werden 222 vrouwen geïncludeerd, die startten met de eerste van 3 IVF cycli. Survival analyse werd gebruikt om doorgaande zwangerschap te voorspellen na 3 cycli. Lage respons was gedefinieerd als de opbrengst van <4 eicellen of afbreken van de cyclus vanwege slechte of afwezige folliculaire groei. Patiënten met een lage respons in de eerste cyclus die ook voorspeld waren een lage respons te krijgen werden verwacht-lage responders genoemd.
Alleen leeftijd werd geselecteerd als onafhankelijke voorspeller van doorgaande zwangerschap na 3 cycli. Indien de respons in de eerste cyclus werd toegevoegd aan de leeftijd, dan neemt de kans op zwangerschap in de volgende cycli significant af in geval van een lage respons. Indien deze lage respons in de eerste cyclus onderverdeeld werd in verwacht- en onverwacht-lage respons dan neemt de kans op doorgaande zwangerschap verder af in geval van een verwacht-lage respons. Met leeftijd alleen konden echter geen patiënten geidentificeerd worden met een zeer lage kans op zwangerschap na 3 cycli. Vrouwen van 30 jaar met een lage respons in de eerste cyclus hadden een voorspelde cumulatieve zwangerschapskans in cyclus 2 en 3 van 24%. Dit was slechts 14% voor vrouwen van 40 jaar. Bij een verwacht-lage respons waren deze kansen beduidend lager (respectievelijk 12% en 6%).
Er kan daarom geconcludeerd worden dat leeftijd alleen als voorspeller van de cumulatieve zeangerschapskans niet bruikbaar is in het identificeren van patiënten met een slechte prognose. De cumulatieve zwangerschapskansen voor patiënten met een lage respons in de eerste cyclus kunnen een reden zijn om af te zien van verdere behandeling. In geval van een verwacht-lage respons moet verdere behandeling afgeraden worden vanwege de slechte prognose. Daarentegen hebben patiënten met een onverwacht-lage respons, ondanks hun leeftijd, nog altijd acceptabele zwangerschapskansen in de volgende cycli, hetgeen doorgaan met behandelen rechtvaardigd.
In hoofdstuk 10 worden de bevindingen besproken van de studies die zijn beschreven in dit proefschrift en de 5 onderzoeksvragen worden beantwoord. De ideale ovariële reserve test moet een aanzienlijk deel van die IVF patiënten identificeren, die nagenoeg geen kans meer hebben zwanger te worden met behulp van IVF. Uit de systematische en meta-analytische literatuur-overzichten in dit proefschrift kan geconcludeerd worden dat de huidige ovariële reserve testen slechts een zeer bescheiden voorspellend vermogen hebben en zijn daarom klinisch niet bruikbaar. Alhoewel de meerderheid van de testen goedkoop en niet al te belastend zijn, is het voorspellend vermogen beperkt. Met name in de voorspelling van zwangerschap. Het gebruik van deze testen met als doel patiënten een behandeling te onthouden moet vermeden worden. Het voorspellend vermogen van deze testen met betrekking tot lage respons is duidelijk beter. Het voorspellen van lage respons kan belangrijk zijn om die lage responders in de eerste behandelingscyclus te identificeren, die daadwerkelijk een verminderde ovariële reserve hebben. Deze patiënten hebben een duidelijk verminderde kans op zwangerschap in de vervolgcycli en voortzetten van de behandeling moet achterwege gelaten worden. Ons inziens moet een eerste IVF cyclus, zonder voorafgaande ovariële reserve testen, de nieuwe behandel-strategie worden, waarin leeftijd eveneens een belangrijke rol speelt.