Streng standardisierte Mittelwertdifferenz - Strictly standardized mean difference

In der Statistik ist die streng standardisierte Mittelwertdifferenz (SSMD) ein Maß für die Effektstärke . Es ist der Mittelwert dividiert durch die Standardabweichung einer Differenz zwischen zwei Zufallswerten jeweils aus einer von zwei Gruppen. Es wurde ursprünglich für die Qualitätskontrolle und Trefferauswahl beim Hochdurchsatz-Screening (HTS) vorgeschlagen und hat sich zu einem statistischen Parameter zur Messung von Effektstärken für den Vergleich von zwei beliebigen Gruppen mit Zufallswerten entwickelt.

Hintergrund

Beim High-Throughput-Screening (HTS) ist die Qualitätskontrolle (QC) entscheidend. Ein wichtiger QC Charakteristik in einem HTS - Assay ist , wie viel sich die positiven Kontrollen, Testverbindungen , und negative Kontrollen voneinander unterscheiden. Diese QC-Eigenschaft kann durch den Vergleich von zwei Well-Typen in HTS- Assays bewertet werden . Das Signal-Rausch-Verhältnis (S/N), das Signal-Hintergrund-Verhältnis (S/B) und der Z-Faktor wurden verwendet, um die Qualität von HTS- Assays durch den Vergleich zweier untersuchter Well-Typen zu bewerten . Der S/B berücksichtigt jedoch keine Angaben zur Variabilität; und das S/N kann die Variabilität nur in einer Gruppe erfassen und kann daher die Qualität des Assays nicht beurteilen, wenn die beiden Gruppen unterschiedliche Variabilitäten aufweisen. Zhang JH et al. schlug den Z-Faktor vor . Der Vorteil des Z-Faktors gegenüber S/N und S/B besteht darin, dass er die Variabilitäten in beiden verglichenen Gruppen berücksichtigt. Infolgedessen wurde der Z-Faktor allgemein als QC-Metrik in HTS-Assays verwendet. Das absolute Vorzeichen im Z-Faktor macht es unpraktisch, seine statistische Inferenz mathematisch abzuleiten.

Um einen besser interpretierbaren Parameter zur Messung der Differenzierung zwischen zwei Gruppen abzuleiten, schlug Zhang XHD SSMD vor, um die Differenzierung zwischen einer Positivkontrolle und einer Negativkontrolle in HTS-Assays zu bewerten. SSMD hat eine probabilistische Basis aufgrund ihrer starken Verbindung mit der d + -Wahrscheinlichkeit (dh der Wahrscheinlichkeit, dass die Differenz zwischen zwei Gruppen positiv ist). Die d + -Wahrscheinlichkeit entspricht in gewissem Maße dem etablierten Wahrscheinlichkeitsindex P( X  >  Y ), der in vielen Bereichen untersucht und angewendet wurde. Auf seiner probabilistischen Grundlage wurde SSMD sowohl für die Qualitätskontrolle als auch für die Trefferauswahl beim Hochdurchsatz-Screening verwendet.

Konzept

Statistische Parameter

Als statistischer Parameter ist SSMD (bezeichnet als ) definiert als das Verhältnis von Mittelwert zu Standardabweichung der Differenz zweier Zufallswerte jeweils aus zwei Gruppen. Angenommen, eine Gruppe mit Zufallswerten hat Mittelwert und Varianz und eine andere Gruppe hat Mittelwert und Varianz . Die Kovarianz zwischen den beiden Gruppen ist Dann ist die SSMD für den Vergleich dieser beiden Gruppen definiert als

Wenn die beiden Gruppen unabhängig sind,

Wenn die beiden unabhängigen Gruppen gleiche Varianzen haben ,

In einer Situation, in der die beiden Gruppen korreliert sind, besteht eine häufig angewandte Strategie, um die Berechnung von zu vermeiden, darin, zuerst gepaarte Beobachtungen von den beiden Gruppen zu erhalten und dann die SSMD basierend auf den gepaarten Beobachtungen zu schätzen. Basierend auf einer gekoppelten Differenz mit Bevölkerung mittleren und , SSMD ist

Statistische Schätzung

In der Situation, in der die beiden Gruppen unabhängig sind, leitete Zhang XHD die Maximum-Likelihood-Schätzung (MLE) und die Momentenmethode (MM) von SSMD ab. Es sei angenommen , daß die Gruppen 1 und 2 Probe haben mittlere und Probenvarianzen . Die MM-Schätzung von SSMD ist dann

Wenn die beiden Gruppen Normalverteilungen mit gleicher Varianz aufweisen , ist die einheitlich minimale Varianz unverzerrter Schätzwert (UMVUE) von SSMD

wo sind die Stichprobengrößen in den beiden Gruppen und .

In der Situation , in der die beiden Gruppen korreliert sind, auf der Grundlage einer Differenz gepaart mit einer Stichprobengröße , Probe Mittelwert und Probenvarianz , die Schätzung von MM SSMD ist

Die UMVUE-Schätzung von SSMD ist

SSMD sieht ähnlich aus wie t-Statistik und Cohens d, aber sie unterscheiden sich voneinander, wie in dargestellt.

Anwendung in Hochdurchsatz-Screening-Assays

SSMD ist das Verhältnis des Mittelwertes zur Standardabweichung der Differenz zwischen zwei Gruppen. Wenn die Daten unter Verwendung einer logarithmischen Transformation vorverarbeitet werden, wie wir es normalerweise in HTS-Experimenten tun, ist SSMD der Mittelwert der logarithmischen Änderung geteilt durch die Standardabweichung der logarithmischen Änderung in Bezug auf eine negative Referenz. Mit anderen Worten, SSMD ist die durchschnittliche Faltungsänderung (auf der logarithmischen Skala), die durch die Variabilität der Faltungsänderung (auf der logarithmischen Skala) bestraft wird. Für die Qualitätskontrolle ist ein Index für die Qualität eines HTS-Assays die Größe des Unterschieds zwischen einer positiven Kontrolle und einer negativen Referenz in einer Assay- Platte. Bei der Trefferauswahl wird die Größe der Effekte einer Verbindung (dh eines kleinen Moleküls oder einer siRNA ) durch die Größe der Differenz zwischen der Verbindung und einer negativen Referenz dargestellt. SSMD misst direkt die Größe der Differenz zwischen zwei Gruppen. Daher kann SSMD sowohl zur Qualitätskontrolle als auch zur Trefferauswahl in HTS-Experimenten verwendet werden.

Qualitätskontrolle

Die Anzahl der Wells für die Positiv- und Negativkontrollen in einer Platte in der 384-Well- oder 1536-Well-Plattform ist normalerweise relativ groß. Es sei angenommen , dass die positiven und negativen Kontrollen in einem Plattenprobe haben mittlere Proben Varianzen und Stichprobengrößen . Normalerweise gilt die Annahme, dass die Kontrollen die gleiche Varianz in einer Platte aufweisen. In einem solchen Fall wird die SSMD zur Beurteilung der Qualität dieser Platte geschätzt als

wo . Wenn die Annahme gleicher Varianz nicht zutrifft, wird die SSMD zur Bewertung der Qualität in dieser Platte geschätzt als

Bei deutlichen Ausreißern in den Kontrollen kann die SSMD geschätzt werden als

wo der Mediane und mittlere absolute Abweichung in den positiven und negativen Kontrollen.

Das auf dem Z-Faktor basierende QC-Kriterium wird häufig in HTS-Assays verwendet. Es hat sich jedoch gezeigt, dass dieses QC-Kriterium am besten für einen Assay mit sehr oder extrem starken positiven Kontrollen geeignet ist . In einem RNAi- HTS-Assay ist eine starke oder mäßige Positivkontrolle normalerweise aufschlussreicher als eine sehr oder extrem starke Positivkontrolle, da die Wirksamkeit dieser Kontrolle den interessierenden Treffern ähnlicher ist. Außerdem haben die Positivkontrollen in den beiden HTS-Experimenten theoretisch unterschiedliche Effektstärken. Folglich sollten sich die QC-Schwellenwerte für die moderate Kontrolle von denen für die starke Kontrolle in diesen beiden Experimenten unterscheiden. Darüber hinaus ist es üblich, dass zwei oder mehr Positivkontrollen in einem einzigen Experiment verwendet werden. Die Anwendung der gleichen Z-Faktor- basierten QC-Kriterien auf beide Kontrollen führt zu inkonsistenten Ergebnissen, wie in der Literatur dargestellt.

Die in der folgenden Tabelle aufgeführten SSMD-basierten QC-Kriterien berücksichtigen die Effektstärke einer Positivkontrolle in einem HTS-Assay, bei dem die Positivkontrolle (z. B. eine Hemmkontrolle) theoretisch niedrigere Werte als die Negativreferenz aufweist.

Qualitätstyp A: Moderate Kontrolle B: Starke Kontrolle C: Sehr starke Kontrolle D: Extrem starke Kontrolle
Exzellent
Gut
Unterlegen
Arm

In der Anwendung ist, wenn die Effektstärke einer Positivkontrolle biologisch bekannt ist, das entsprechende Kriterium anhand dieser Tabelle zu übernehmen. Andernfalls sollte die folgende Strategie helfen, zu bestimmen, welches QC-Kriterium angewendet werden sollte: (i) In vielen niedermolekularen HTS-Assays mit einer Positivkontrolle sollte normalerweise Kriterium D (und gelegentlich Kriterium C) angewendet werden, da diese Kontrolle normalerweise sehr oder extrem starke Effekte; (ii) für RNAi-HTS-Assays, bei denen die Zelllebensfähigkeit die gemessene Reaktion ist, sollte Kriterium D für die Kontrollen ohne Zellen (nämlich die Vertiefungen ohne hinzugefügte Zellen) oder Hintergrundkontrollen angewendet werden; (iii) in einem viralen Assay, bei dem die Menge an Viren in Wirtszellen von Interesse ist, wird normalerweise Kriterium C verwendet, und Kriterium D wird gelegentlich für die positive Kontrolle verwendet, die aus siRNA des Virus besteht.

Ähnliche QC-Kriterien auf SSMD-Basis können für einen HTS-Assay konstruiert werden, bei dem die positive Kontrolle (wie eine Aktivierungskontrolle) theoretisch höhere Werte als die negative Referenz aufweist. Weitere Details zur Anwendung von SSMD-basierten QC-Kriterien in HTS-Experimenten finden Sie in einem Buch.

Trefferauswahl

In einem HTS-Assay besteht ein primäres Ziel darin, Verbindungen mit einer gewünschten Größe der Hemm- oder Aktivierungswirkung auszuwählen . Die Größe der Verbindung Effekt wird durch die Größe der Differenz zwischen einem Test dargestellten Verbindung und einer negativen Referenzgruppe ohne spezifische Inhibierung / Aktivierung Wirkungen. Eine Verbindung mit einer gewünschten Effektgröße in einem HTS-Bildschirm wird als Hit bezeichnet. Das Auswählen von Treffern wird als Trefferauswahl bezeichnet. Es gibt zwei Hauptstrategien für die Auswahl von Treffern mit großen Effekten. Eines ist sicher Metrik (en) auf Rang zu verwenden und / oder zu klassifizieren , die Verbindungen durch ihre Wirkungen und dann die größte Anzahl von potenten auszuwählen Verbindungen , die für die Validierung der Praxis ist Assays . Die andere Strategie besteht darin, zu testen, ob eine Verbindung eine Wirkung hat, die stark genug ist, um ein voreingestelltes Niveau zu erreichen. Bei dieser Strategie müssen falsch-negative Raten (FNRs) und/oder falsch-positive Raten (FPRs) kontrolliert werden.

SSMD kann nicht nur die Größe der Effekte einstufen, sondern auch Effekte klassifizieren, wie in der folgenden Tabelle basierend auf dem Populationswert ( ) von SSMD gezeigt.

Effekt-Subtyp Schwellenwerte für negative SSMD Schwellenwerte für positive SSMD
Extrem stark
Sehr stark
Stark
Ziemlich stark
Mäßig
Ziemlich moderat
Ziemlich schwach
Schwach
Sehr schwach
Extrem schwach
Keine Wirkung

Die Schätzung der SSMD für Bildschirme ohne Replikate unterscheidet sich von denen für Bildschirme mit Replikaten.

In einem primären Screen ohne Replikate, wird den gemessenen Wert annimmt ( in der Regel auf der logarithmischen Skala) in einer gut für eine getestete Verbindung ist und die negative Referenz in dieser Platte weist Probengröße , Probe Mittelwert , Median , Standardabweichung und mittlere absolute Abweichung , die SSMD für diese Verbindung wird geschätzt als

wo . Wenn es in einem Assay Ausreißer gibt, die normalerweise bei HTS-Experimenten vorkommen, kann eine robuste Version von SSMD erhalten werden mit

In einem bestätigenden oder Primärsieb mit Replikaten, für die i-ten Testverbindung mit Replikaten, berechnen wir die paarweise Differenz zwischen dem gemessenen Wert ( in der Regel auf der log - Skala) der Verbindung und den Medianwerts einer negative Kontrolle in einer Platte, Ermitteln Sie dann den Mittelwert und die Varianz der gepaarten Differenz über die Replikate. Die SSMD für diese Verbindung wird geschätzt als

In vielen Fällen können Wissenschaftler sowohl SSMD als auch durchschnittliche Faltungsänderung für die Trefferauswahl in HTS-Experimenten verwenden. Das Dual-Taschenlampe Grundstück kann für alle Test sowohl durchschnittliche fache Veränderung und SSMD zeigen Verbindungen in einem Test und Hilfe zu integrieren beide wählen Treffer in HTS - Experimenten. Die Verwendung von SSMD zur Trefferauswahl in HTS-Experimenten wird Schritt für Schritt in

Siehe auch

Weiterlesen

Verweise