Methoden der AIDS-Forschung im Targeting

Samstag, September 5, 2009
By Stephan Noller
Methoden der AIDS-Forschung im Targeting

Viele Herausforderungen und Probleme im Predictive Targeting können nur mit modernsten Erkenntnissen zu Algorithmen und Prognosverfahren vernünftig gelöst werden. Es ist nämlich keineswegs trivial aus dem Nutzungsverhalten eines Users andere Präferenzen oder gar seine demographischen Eigenschaften mit ausreichender Qualität vorherzusagen.

Zugleich ist es aus der Sicht des Machine Learnings und der Statistik ein ausserordentlich spannender Task – man hat massenweise ziemlich valide gemessene Nutzungsdaten und kann diese mit weiteren Datenquellen (z.B. Befragungen, aber auch Kaufdaten, Clicks etc.) verknüpfen. Auch der Anspruch an die Ausgabe ist ziemlich sportlich weil im Online-Umfeld Vorhersagen eigentlich immer realtime getroffen werden müssen – denn ansonsten ist der User schon wieder weg.

Hinzu kommt noch ein anderes pragmatisches Problem insbs. wenn man mit Befragungsdaten arbeitet: Die Daten sind nur unter aktiver Mitwirkung der User zu bekommen und damit teuer. User sind schnell von zu vielen Befragungen genervt und Portalverantwortliche wollen Ihre Leser auch nicht verärgern.

Insofern muss auch aus diesem Grund an Möglichkeiten gearbeitet werden mit weniger Befragungsinformationen zum gleichen Ziel zu kommen. Dies wirkt sich natürlich auch auf die Geschwindigkeit aus mit der eine Targeting-Installation einsatzbereit sein kann…

Übrigens gilt das Problem auch für zahlreiche andere 3rd-party Datenquellen die man im Targeting einbeziehen kann – zusätzliche Daten stehen fast nie für die gesamte Audience zur Verfügung und müssen demnach hochgerechnet werden. Auch hier würde man demnach von Verfahren profitieren die die verfügbaren Daten effizienter und intelligenter nutzen.

Ein häufiges Grundproblem dabei ist dass die Daten auch noch “schief” sind oder schlicht aus unterschiedlichen Verteilungen stammen. So wäre es z.B. durchaus denkbar die Fragebogenantworten eines Portals auf die Nutzer eines anderen Portals hochzurechnen. Aber nur wenn die Populationen der beiden Portale nahezu identisch sind was die verwendeten Merkmale anbelangt. Andernfalls drohen die Hochrechnungen unter erheblichen Fehlern zu leiden – denn jede noch so kleine Schiefe in den Ausgangsdaten wird durch die Hochrechnung nicht selten ins tausendfache gesteigert… (das Problem haben wir hier auch schonmal im Zusammenhang mit dem Agentur-Targeting diskutiert)

Unsere Kollegen vom Max Planck Institut für Informatik (jetzt Uni Potsdam) haben eine sehr spannende Vorgehensweise gewählt um das Problem zu lösen, die zu beeindruckenden Ergebnissen geführt hat.

Spannend ist vor allem die Herkunft der Lösung. In der Diskussion des Problems hatten die Kollegen nämlich festgestellt, dass bestimmte Fragestellungen in der Aids-Therapieforschung den oben beschriebenen Fragestellungen ähneln. Denn bei den Medikamentencoktails mit denen in der HIV-Therapie gearbeitet wird handelt es sich ja üblicherweise um komplexe Kombinationen mehrerer Wirkstoffe. Und es erhält auch nicht jeder Patient die gleiche Kombination sondern die wirksame Kombination muss häufig mühevoll und zeitraubend empirisch ermittelt werden. Auch hier kämpft man mit einem ähnlichen Problem wie oben – es ist aufwändig und “teuer” ausreichend Testfälle zu bekommen. Natürlich ist das in der HIV-Therapie ein deutlich brisanteres Problem als im Online-Marketing – der Vergleich bewegt sich schon an der Grenze des Zumutbaren. Dennoch ist aus methodischer Perspektive ein ähnliches Problem zu lösen.

In einem Konferenzbeitrag auf der ICML 08 hat Dr. Steffen Bickel zunächst erläutert wie die machine learning Lösung für den Bereich der HIV-Therapie aussieht und welche Erfolge dort erzielt werden konnten:

Multi-Task Learning for HIV Therapy Screening

Als die Übertragbarkeit dieser erfolgreichen Lösung des Problems auf unser Online-Marketing-Problem immer klarer wurde, begannen wir mit ersten Implementierungen und Versuchen das fürs Predictive Targeting zu nutzen.

Die Ergebnisse können in einem späteren Beitrag für die NIPS 08 bewundert werden.

Was man an den Graphiken erkennen kann ist, dass alle Verfahren mit zunehmender Fallzahl an Präzision gewinnen. Die schwarz gepunktete Linie verdeutlich dabei den “Normalfall”, dass für ein Portal Targeting-Profile mit den Befragungsdaten dieses Portals gelernt werden. Die rot gepunktete Linie beschreibt ein generisches Modell das aus einem Portalverbund gewonnen wurde und ohne spezielle Verteilungsanpassungen auf das Zielportal angewendet wurde. Die blaue und die eng-gepunktete Linie zeigen schliesslich das Modell welches die oben geschilderten Erkenntnisse anwendet und die Verteilungsunterschiede zu gewichten versucht.
Wie man sieht produzieren die dergestalt angepassten Modelle grundsätzlich eine höhere Präzision als die einfacheren Modelle. Dies ist insbesondere in Ramp-Up-Phasen aber auch generell unter geringen Fallzahlen gegeben.

Damit wurde tatsächlich der Beweis erbracht, dass Transfer-Lernen helfen kann das Fallzahl-Problem im Predictive Targeting deutlich zu mildern und sogar höhere Genauigkeiten bei kleineren Fallzahlen zu generieren.

Man braucht gar keine Vermarkter-Verbünde vor Augen zu haben um zu ermessen, welche Bedeutung eine solche Lösung fürs Targeting hat – denn jedes stinknormale Vermarkter-Portfolio hat bereits eine Charakteristik die nach solchen Lösungen verlangt.

Share

Die 5 größten Predictive Targeting-Irrtümer – Nr.2: PBT = Low TKP

Freitag, September 4, 2009
By Christian Elsner
Die 5 größten Predictive Targeting-Irrtümer – Nr.2: PBT = Low TKP

Viele Leute denken bei PBT nur an gepimpte Performance-Kampagnen und ordnen es dadurch automatisch im Low-TKP-Bereich an. Das liegt wahrscheinlich auch an Irrtum Nr.1, wonach Targeting im Widerspruch zu gutem Content und damit hohen TKPs steht.

Tatsächlich ist das Bild aber sehr viel differenzierter. PBT ermöglicht viele verschiedene Einsatzarten, die sich preislich über das gesamte Portfolio eines Vermarkters erstrecken: (more)

Share

Targeting-Allianz: Vermarkter wachen auf

Dienstag, September 1, 2009
By Stephan Noller

Aus aktuellem Anlass heben wir heute nochmal diesen Artikel vom September vergangenen Jahres hervor:


Heute ging die Meldung über den Ticker, dass die Vermarkter Sevenone Media, G+J EMS, Tomorrow Focus und IP Deutschland eine Targeting-Allianz auf die Strasse bringen wollen, die sich gegenüber Google positioniert und große Reichweiten mit übergreifendem Targeting verfügbar machen soll.

Wir haben ja schon früher in diesem Blog dazu aufgerufen, dass die Vermarkter aufwachen und kluge Gegeninitiativen starten sollten, anstatt über Google zu jammern und den Gesetzgeber um Hilfe zu rufen. Insofern freuen wir uns sehr über diesen ersten Schritt und sind gespannt welche konkreten Produkte und Buchungsmöglichkeiten da an den Markt gebracht werden – wenn das Kartellamt grünes Licht geben wird.

Das Potential dieser Allianz ist jedenfalls groß – allerdings nur wenn die Motivation wirklich ist gutes Targeting mit intelligenten Produkten zu realisieren. D.h. es wird eine entscheidende Frage sein, welches Inventar mit welchen Buchungsmechanismen in die Allianz eingebracht wird. Und natürlich auch für welche Technologie man sich entscheidet (wie adzine auch richtig bemerkt).

Denn anders als die genannten Gegenspieler Google und GroupM hat diese Allianz ja auch etwas zu verlieren… (more)

Share

Die 5 größten Predictive Targeting-Irrtümer – Nr.1: Hochwertiger Content und PBT vertragen sich nicht

Montag, August 31, 2009
By Christian Elsner

Wenn man in Sachen Predictive Targeting unterwegs ist, begegnet man häufig einigen Vorurteilen, die sich hartnäckig halten. Manche davon sind wahr – viele nicht. Bis zur dmexco werde ich hier in einer kleinen Serie auf die Top5 dieser Predictive Targeting-Irrtümer eingehen.

Irrtum Nr. 1:
Hochwertiger Content und PBT vertragen sich nicht
(more)

Share

Agenturtargeting – was es kann und was nicht

Donnerstag, Juli 23, 2009
By Stephan Noller

Eine der heiß diskutierten Fragen in der Online-Branche derzeit ist die, ob es Agenturen gestattet sein sollte selbst Targeting zu machen..

Die Diskussion ist deswegen so heiß gelaufen, weil es um viel geht und deutlich mehr als nur methodische Aspekte diskutiert werden müssen.

Die einen befürchten, Agenturen wollten einen wesentlich größeren Teil der Wertschöpfung an sich reißen, indem sie Reichweite billig und in großer Menge einkaufen, mit Targeting veredeln und dem Werbekunden dann als spezifische und hochwertige Reichweite verkaufen (sog. Arbitrage-Modelle).

Die anderen sehen vor allem Datenschutzaspekte berührt, da Agenturen plötzlich Zugriff auf Userdaten verlangen, die bisher die Vermarkter und Websites für sich beansprucht haben. Aus der Sicht des Datenschutzes geht es vor allem darum die Datenverarbeitung für den User transparent und kontrollierbar zu halten – da ist Agentur-Targeting nicht gerade ein Schritt in die richtige Richtung.

Ein dritter Aspekt bei der ganzen Sache wird nicht so heftig diskutiert – ich meine aber völlig zu unrecht. Nämlich die Frage, ob Agentur-Targeting überhaupt vernünftig funktionieren kann? Und wenn ja, unter welchen Voraussetzungen? (more)

Share

Google AdSense jetzt für Targeting nutzbar!

Donnerstag, Juli 23, 2009
By Stephan Noller

Es wird ja derzeit viel über die neuen Google Services gesprochen, insbs. die Ad-Exchange auf Basis von Doubleclick und die Interest Based Ads, also das Targeting-System von Google.

Heute bin ich aber auf ein Phänomen gestossen, dass einen völlig unerwarteten Zugang zu Googles Werbesystem für Targetingdienstleister eröffnet. (more)

Share