Erklärung von Antwortausfällen und Bekämpfung von Verzerrung durch Antwortausfälle in eigenständig auszufüllenden Panelumfragen
Panelerhebungen sind ein wichtiges Instrument zur Untersuchung von Meinungen, Einstellungen und Präferenzen von Menschen. Sie sind unersetzlich für die Messung des sozialen Wandels. Die Aussagekraft und Verallgemeinerung von Panelerhebungen hängt dabei entscheidend davon ab, dass die Teilnehmer des Panels die Bevölkerung gut repräsentieren.
Wahrscheinlichkeitsbasierte Erhebungen stellen sicher, dass jede Person in der Zielpopulation eine (bekannte) Chance hat, in das Panel aufgenommen zu werden, indem sie nach dem Zufallsprinzip aus verfügbaren Stichprobenrahmen gezogen werden, wie z. B. aus amtlichen Registern wie dem Einwohnermeldeamt in Deutschland. Die in die Stichprobe aufgenommenen Personen werden dann zur Teilnahme an der Panelstudie eingeladen. Um repräsentativ für die Zielpopulation zu sein, sollten die Teilnehmer eines Panels eine Zufallsgruppe der in die Stichprobe aufgenommenen Personen sein und bleiben.
Studien zeigen, dass die Rücklaufquoten bei Umfragen sinken. Aus verschiedenen Gründen bricht ein Teil der Befragten die Umfrage ab. Gerade bei Panelerhebungen ist dies ein großes Problem, weil sich schwindende Antwortquoten über die Panelwellen hinweg kummulieren. Dies kann erhebliche Einschränkungen für die Aussagekraft der Erhebung nach sich ziehen.
Ziel des Projektes ist es, zur Erklärung von Antwortausfällen (nonresponse) in Panelumfragen beizutragen und Methoden zu entwickeln, um die Verzerrung von Schätzern durch Antwortausfälle (nonresponse bias) zu bestimmen. Darauf aufbauend sollen Algorithmen basierend auf Methoden des maschinellen Lernens entwickelt werden, um optimale Anreize/Treatments zu finden, welche die Verzerrung durch Antwortausfälle reduzieren. Dabei soll das sogenannte "Double Machine Learning" auf Paneldaten angewendet werden.
Laufzeit: 36 Monate
Weitere Projektteilnehmer
Barbara Felderer vom GESIS - Leibniz-Institut für Sozialwissenschaften