In applications for generic medicinal products the concept of bioequivalence is fundamental. Two medicinal products, i.e. a test and a reference drugs containing the same active substance are considered bioequivalent if their bioavailability (rate and extent of absorption of an active substance that is absorbed from a drug product and becomes available at the site of action) after the administration of both products produce a similar therapeutic effect. The assessment of bioequivalence is based upon 90% confidence intervals for the ratio of the population geometric means (test/reference) for the parameters under consideration which should be contained within the limits 80%-125%. It is recommended using randomized, two-period, two-sequence, single dose crossover designs (2x2 crossover designs)
The number of subjects to be included should be based on an appropriate sample size calculation, though the number of evaluable subjects should not be less than 12.
Sometimes, there are drugs whose rate and extent of absorption is highly variable dose to dose within the same subject. The main problem with highly variable drugs is that to declare bioequivalence it requires a study with an unacceptably larger sample size. In this case, the usual approach to determine bioequivalence is ‘Reference Scaled Average Bioequivalence’ (RSABE), which is based on expanding the limits as a function of the within-subject variability in the reference formulation. But, using 2x2 crossover designs, it is not possible to estimate separately the test and reference variabilities, and thus it requires using more complex designs like replicated or semi-replicated crossover designs.
On the other hand, regulations also allow using common 2×2 crossover designs based on two-stage adaptive designs (TSD) with sample size re-estimation at an interim analysis. At an interim look (stage 1), if average bioequivalence is not declared with an initial sample size, they allow to increase it based on the intra-subject estimated variability and to enroll additional subjects at a stage 2, or to stop for futility in case of poor likelihood of bioequivalence. This is crucial because both parameters must clearly be pre-specified in protocols, and the strategy agreed with regulatory agencies in advance with emphasis on controlling the overall type I error.
Using Monte Carlo simulations, we show that RSABE and TSD methodologies achieve comparable statistical power, though the scaled method usually requires less sample size, but at the expense of each subject being exposed more times to the treatments. With an adequate initial sample size (not too low, e.g., 24 subjects), TSDs are a flexible and efficient option to consider: They have enough power (e.g., 80%) at the stage 1 for non-highly variable drugs and, if otherwise, they provide the opportunity to step up to a stage 2 that includes additional subjects.
Based on TSDs, we also present an iterative method to adjust the significance levels at each stage which preserves the overall type I error for a wide set of scenarios which should include the true unknown variability value, and which provides a power of at least 80%. TSDs work particularly well for coefficients of variation below 0.3 which are especially useful due to the balance between the power and the percentage of studies proceeding to stage 2. We present an R package to adjust the significance levels at each stage in order to control the overall type I error.
En aplicacions per a medicaments genèrics el concepte de bioequivalència és fonamental. Dos productes, un test i un de referència, amb el mateix principi actiu, es consideren bioequivalents si la seva biodisponibilitat (quantitat Cmax i velocitat Tmax d’una substància activa que s’absorbeix d’un fàrmac i està disponible en el seu lloc d¿acció) després de l'administració d’ambdós productes produeix un efecte terapèutic similar. Per això, l’interval de confiança del 90% per a la ràtio de les mitjanes (mitjanes geomètriques poblacionals) dels productes test i referència de les mesures farmacocinètiques han d’estar dins dels límits de bioequivalència 80%-125%. Es recomana utilitzar dissenys aleatoritzats encreuats 2x2, és a dir, de dos períodes i dues seqüències (en anglès 2x2 crossover designs) El nombre de subjectes que s’inclouen es basa en un càlcul adequat de la grandària mostral, tot i que aquest nombre sol ser petit però mai inferior a 12 subjectes. Però en cas de productes/fàrmacs d’alta variabilitat cal incloure molts més subjectes per aconseguir una potència estadística adequada, de manera que la bioequivalència es determina amb pocs subjectes però a través de l’escalat dels límits de bioequivalència (RSABE, Reference Scaled Average Bioequivalence), expandits en funció de la variabilitat intra-subjecte en el grup de referència. En aquest cas, amb dissenys 2x2 no és possible estimar per separat la variabilitat dels productes test i referència i cal fer servir dissenys més complexos com ara dissenys encreuats replicats o semi-replicats. Les agències reguladores també permeten utilitzar dissenys encreuats 2x2 adaptatius de dues etapes amb re-estimació de la grandària mostral en la primera (anàlisi provisional, en anglès interim analysis). Llavors, si no podem declarar bioequivalència a la primera etapa amb una grandària mostral inicial petita, podem incrementar la mostra en funció de la variabilitat intra-subjecte estimada i afegir nous subjectes en la segona, o parar l’estudi per futilitat si la probabilitat de declarar bioequivalència és finalment petita. Aquesta estratègia ha d’estar definida en el protocol, i prèviament acordada amb les agències reguladores amb especial èmfasi en el control de l’error de tipus I. Mitjançant simulacions de Monte Carlo, mostrem que les metodologies basades en RSABE i dissenys adaptatius bietàpics proporcionen una potència estadística similar, tot i que els mètodes escalats normalment requereixen menys grandària mostral tot i que cal exposar més vegades els subjectes als tractaments. Amb una grandària mostral inicial adequada (no molt petita, per exemple 24 subjectes), els dissenys bietàpics són una opció molt flexible i eficient a considerar: proporcionen una potència raonable (per exemple del 80%) a la primera etapa per fàrmacs que no són altament variables, i en cas contrari, proporcionen l’oportunitat de saltar a una segona etapa que inclou subjectes addicionals. Basant-nos en aquests dissenys adaptatius bietàpics, presentem un mètode iteratiu per ajustar el nivell de significació a cada etapa que preserva l’error de tipus I global per a un conjunt d’escenaris que molt probablement inclouen el vertader valor desconegut de la variabilitat intra-subjecte, i que proporciona una potència estadística d’almenys el 80%. Aquests dissenys funcionen particularment bé per coeficients de variació per sota de 0.3 pel balanç que proporcionen entre la potència estadística i el percentatge d’estudis que salten a la segona etapa. Presentem un paquet d’R que ens permet ajustar els nivells de significació a cada etapa i que controla l’error de tipus I global.
En aplicaciones para medicamentos genéricos el concepto de bioequivalencia es fundamental. Dos productos, uno ‘test’ y uno de ‘referencia’, con el mismo principio activo, se consideran bioequivalentes si su biodisponibilidad (cantidad ‘Cmax’ y velocidad ‘Tmax’ de una sustancia activa que se absorbe de un medicamento y está disponible en su lugar de acción) después de la administración de ambos productos produce un efecto terapéutico similar. Para ello, el intervalo de confianza del 90% para la ratio de las medias (medias geométricas poblacionales) de los productos test y referencia de las medidas farmacocinéticas tienen que estar dentro de los límites de bioequivalencia 80%-125%. Se recomienda utilizar diseños aleatorizados cruzados 2x2, de dos períodos y dos secuencias (en inglés 2x2 crossover designs).
El número de sujetos que se incluyen se basa en un cálculo adecuado del tamaño de muestra, aunque este número suele ser pequeño, pero nunca inferior a 12 sujetos.
Pero en el caso de productos/medicamentos de alta variabilidad es necesario incluir muchos más sujetos para conseguir una potencia estadística adecuada, de forma que la bioequivalencia se determina con pocos sujetos, pero a través del escalado de los límites de bioequivalencia (RSABE, ‘Reference Scaled Average Bioequivalence’), expandidos en función de la variabilidad intra-sujeto en el grupo de referencia. En este caso, con diseños 2x2 no es posible estimar por separado la variabilidad de los productos test y referencia y se requieren diseños más complejos como diseños cruzados replicados o semi-replicados.
Las agencias reguladoras también permiten usar diseños cruzados 2x2 adaptativos de dos etapas con re-estimación del tamaño del a muestra en la primera (análisis provisional, en inglés interim analysis). Entonces, si no podemos declarar bioequivalencia en la primera etapa con un tamaño de muestra inicial pequeño, podemos incrementar la muestra en función de la variabilidad intra-sujeto estimada y añadir nuevos sujetos en la segunda, o parar el estudio por futilidad si la probabilidad de declarar bioequivalencia es finalmente pequeña. Esta estrategia se define en el protocolo, previo acuerdo con las agencias reguladoras con especial énfasis en el control del error de tipo I.
Mediante simulaciones de Monte Carlo, mostramos que las metodologías basadas en RSABE y diseños adaptativos bietápicos proporcionan una potencia estadística similar, aunque los métodos escalados habitualmente requieren menos tamaño de muestra aun siendo necesario exponer más veces al sujeto a los tratamientos. Con un tamaño de muestra inicial adecuado (no muy pequeño, por ejemplo 24 sujetos), los diseños bietápicos son una opción muy flexible y eficiente a considerar: proporcionan una potencia razonable (por ejemplo, del 80%) en la primera etapa para medicamentos que no son altamente variables, y en caso contrario, proporcionan la oportunidad de saltar a una segunda etapa e incluir sujetos adicionales.
Basándonos en éstos diseños adaptativos bietápicos, presentamos un método iterativo para ajustar el nivel de significación en cada etapa que preserva el error de tipo I global para un conjunto de escenarios que muy probablemente incluyen el verdadero valor desconocido de la variabilidad intra-sujeto, y que proporciona una potencia estadística de al menos el 80%. Estos diseños funcionan particularmente bien para coeficientes de variación por debajo de 0.3 dado el balance que proporcionan entre la potencia estadística y el porcentaje de estudios que saltan a la segunda etapa. Presentamos un paquete de R que nos permite ajustar los niveles de significación en cada etapa y que controla el error de tipo I global.