Репрезентативная выборка: выборка, в которой характеристики людей в основном соответствуют характеристикам генеральной совокупности.
Репрезентативная выборка в контексте: определяем эффективность кампании на этапе тестирования
Обычно перед запуском рекламной кампании проводится A/B-тестирование. Однако не каждый тест можно считать репрезентативным. И первая ошибка — это неправильное определение репрезентативной выборки. Следствием такой ошибки является трата денег на неэффективную рекламу.
Узнайте, что такое репрезентативная выборка и как правильно ее рассчитать.
Что такое репрезентативная выборка
Термины «популяция» и «репрезентативная выборка» знакомы всем, кто проводит A/B-тесты и хочет добиться статистически значимых результатов. На самом деле, большинство неудачных тестов происходит по двум причинам: малый размер выборки и недостаточное количество данных.
Сегодня, чтобы рассчитать репрезентативную выборку, больше не нужно знать сложные формулы и рассчитывать их вручную. Существуют простые в использовании веб-калькуляторы (Optimizely, Mindbox, VWO) и метод SurveyMonkey.
Чтобы работать со всеми этими инструментами, необходимо знать правила проведения тестов, работать с основными понятиями и понимать, как работают инструменты репрезентативной выборки.
Ниже приведены основные понятия, которые необходимо знать для расчета образца:
- Генеральная совокупность. Вся группа людей, мнение/действия которых для нас имеют значение. Для рекламодателей это все люди, на которых распространяются результаты A/B-теста. Это может быть аудитория ремаркетинга, подписчики в социальных сетях, покупатели в оффлайн-магазинах или даже просто мужчины в возрасте от 25 до 40 лет;
- Репрезентативная выборка. Определенный процент людей из генеральной совокупности, который будет проходить A/B-тестирование. То есть это часть нашей целевой аудитории;
- Достоверность (уровень доверия). Этот показатель характеризует вероятность того, что выборка окажется значимой для отобранных результатов. Задается в пределах 80–99%. Если достоверность ниже 80%, то таким данным нельзя доверять. Чаще всего достоверность задают на уровне 95%;
- Погрешность. Отображает уверенность в том, что полученные результаты характеризуют мнение (для контекста – поведение) генеральной совокупности. Допустимый процент ошибки в результатах. Обычно составляет от 1 до 10%. Наиболее часто используемый предел погрешности равен 5%.
Каждый из перечисленных веб-калькуляторов имеет свои особенности. Мы рассмотрим их ниже.
Например, тест предполагал, что новое описание в объявлении приведет больше посетителей на целевую страницу и что мы получим более высокий коэффициент конверсии. Однако тест трех вариантов описания не показал существенной разницы.
В таких случаях возникает вопрос, как сделать тест репрезентативным и улучшить результаты. Одна из возможностей — вызвать интерес целевой аудитории. Чтобы добиться этого, недостаточно просто изменить описание объявления или заголовок. Необходимы более существенные изменения. Вы можете изменить креативный дизайн или торговое предложение (увеличить скидку, изменить цену, предложить клиентам рассрочку).
3. выбрана неправильная метрика
Важно выбрать только одну метрику, которую необходимо улучшить, чтобы получить значимые результаты. Например, целью является увеличение коэффициента конверсии для новых посетителей. Это метрика, которую большинство веб-разработчиков используют для расчета выборки.
Однако если у вас недостаточно данных о конверсиях, вам следует сосредоточиться на других показателях. В таких случаях размер выборки можно рассчитать с помощью онлайн-калькулятора Mindbox.
Optimizely
Давайте сравним, как размер выборки, рассчитанный SurveyMonkey, отличается от результатов онлайн-калькулятора.
Вызовите онлайн-калькулятор и установите в нем значение
- Ожидаемую конверсию (Conversation rate). Берем средний показатель ожидаемой конверсии, учитывая предыдущий опыт. CR = 12% (как и в примере выше);
- Минимальное относительное изменение конверсии после изменения заголовка объявления. Принимаем этот показатель на уровне 14%. Поскольку максимальный показатель конверсии по предыдущим кампаниям был 13,7% ((13,7/12-1)*100%=14%);
- Уровень доверия. В предыдущем примере мы устанавливали его на уровне 99%. Для сравнения результатов также установим его на этом уровне.
Качественная репрезентативность означает, что в выборке представлены все группы, имеющиеся в популяции. Для достижения этого каждый элемент совокупности должен иметь равные шансы быть отобранным, а сама выборка должна быть составлена из однородных групп.
Простая случайная выборка — лучший метод создания репрезентативной выборки, поскольку в этом случае каждый член популяции имеет равные шансы быть отобранным.
Обеспечение репрезентативности
Например, если вы составляете выборку покупателей для опроса, люди из разных социальных групп будут включены в нее в соответствии с их долей в населении. В результате выборка будет представлять собой уменьшенное представительство генеральной совокупности.
Случайный отбор респондентов в выборку может быть обеспечен с помощью различных методов. Для опроса клиентов, например, номера карт клиентов определяются и случайным образом выбираются компьютерной программой с помощью генератора случайных чисел.
Качественная репрезентативность
На практике, однако, простой случайный выбор не всегда возможен. Причина этого заключается в том, что общая популяция не является однородной и может содержать группы людей.
Например, если опрос проводится по телефону, большинство ответов будет получено от пенсионеров, так как они менее заняты и с большей вероятностью с ними свяжутся. Если опрос касается продукта, ориентированного на молодежь, ценность мнения пенсионеров вряд ли будет очень высокой.
Для решения этой проблемы можно использовать стратифицированную случайную выборку, предварительно стратифицировав исходную совокупность по какому-либо признаку. Например, клиенты могут быть стратифицированы по возрасту. Затем страты могут быть стратифицированы по доле учреждений в группах, уменьшая или увеличивая долю той или иной группы при сохранении репрезентативности.
Другим вариантом является использование кластерной выборки, когда клиенты сначала делятся на качественно однородные группы — кластеры — и отбор из каждого кластера производится независимо. Вероятность выбора может быть одинаковой или разной для всех кластеров. Некоторые кластеры могут быть полностью исключены из отбора. В нашем примере клиенты могут быть сгруппированы по их социальному статусу — студенты, рабочие, пенсионеры, военные и т.д. Таким образом, доля пенсионеров в выборке может быть уменьшена или вовсе исключена.
Количественная репрезентативность показывает, достаточно ли количество элементов в выборке, чтобы представить характеристики совокупности с определенной погрешностью. Например, если размер совокупности неизвестен, а результат дается в виде относительной доли, количество единиц выборки, обеспечивающее количественную репрезентативность, можно рассчитать по следующей формуле.
Как правило, выборка считается репрезентативной, если результат оценки определенного параметра по этой выборке совпадает с результатом, оцененным по совокупности, с учетом погрешности (ошибки репрезентативности). Если оценка выборки отклоняется от оценки совокупности более чем на определенный уровень ошибки, такая выборка считается нерепрезентативной.
Репрезентативность оценивается на основе индивидуальных параметров выборки и совокупности. Однако выборка может быть репрезентативной по одним характеристикам и нерепрезентативной по другим. Поэтому говорить о репрезентативности как о дихотомическом свойстве выборки (репрезентативная или нерепрезентативная) было бы некорректно: Выборка может более точно отражать одни параметры популяции и менее точно — другие. Поэтому точнее говорить о том, насколько данная выборка репрезентативна по определенным параметрам.
При определении репрезентативности выборки главным вопросом является обоснование предела погрешности, в пределах которого выборка считается репрезентативной. Одна и та же выборка может быть достаточно репрезентативной для одной цели и недостаточно репрезентативной для другой. Кроме того, необходимо проверить репрезентативность выборки по параметрам, важным для объекта исследования. В маркетинговых исследованиях, например, пол, возраст, образование и т.д. важны для анализа клиентов.
Количественная репрезентативность
Следует отметить, что не все задачи бизнес-анализа требуют строгого статистического подтверждения репрезентативности выборки. Как правило, это задачи точного прогнозирования. Обычные задачи, например, связанные с определением предпочтений существующих и потенциальных покупателей, решаются путем регистрации типичной клиентской базы, которую можно найти непосредственно в торговых центрах.
Методы оценки репрезентативности
Данные, полученные в ходе выборочных опросов, представляют собой реализацию случайных переменных (возраст, опыт, доход и т.д.). На практике выборка обычно считается репрезентативной, если ее статистические параметры (среднее значение, дисперсия, стандартное отклонение и т.д.) не отличаются от параметров совокупности более чем на 5%.
Однако этот подход применим только в том случае, если известна вся генеральная совокупность и можно рассчитать ее статистические характеристики. На практике, однако, такое случается редко, поскольку некоторые потенциально интересные объекты исследования оказываются недоступными.
В этом случае формируются две независимые выборки, рассчитываются и сравниваются их характеристики, и если они совпадают (существенно не отличаются), то выборки считаются репрезентативными. Хотя такой подход весьма привлекателен в теории, его трудно реализовать на практике. Во-первых, создание нескольких образцов влечет за собой дополнительные расходы, а во-вторых, невозможно определить, какой образец является репрезентативным, если параметры образцов значительно отличаются.
Для сравнения двух выборок используются два типа критериев: непараметрические и параметрические. Первые не используют в расчетах значения параметров статистического распределения, а работают с
Статистические методы
Возникает вопрос: что делать, если аналитик имеет доступ только к выборке «как есть», и ее репрезентативность неудовлетворительна? Однако у него нет доступа к генеральной совокупности для построения более репрезентативной выборки (например, из-за проблем с сетью, невозможности повторных опросов из-за высокой стоимости и т.д.). В этом случае специальная процедура, называемая «ремонт образца», может улучшить ситуацию.
Все действия аналитиков, связанные с репрезентативностью, можно разделить на две фазы: Контроль и ремонт.
Контроль выборки и ремонт выборки считаются обязательными этапами любого выборочного исследования. Однако некоторые авторы не разделяют эти два этапа, а включают ремонт в общий процесс выборки. Некоторые вопросы, связанные с тестированием образцов, уже обсуждались.
Основной целью ремонта является улучшение качества выборки в том смысле, что она отражает зависимости и закономерности изучаемых процессов и явлений, которые необходимо выявить при анализе. Однако не следует путать ремонт выборки с улучшением качества данных в целом.
Ремонт выборки
Ремонт образцов обычно включает в себя следующие задачи:
Следует отметить, что единого, строгого подхода к ремонту образцов, как правило, не существует, хотя в литературе можно найти некоторые общие рекомендации. В большинстве практических случаев аналитик сам решает, какие преобразования применить к выборке для повышения ее репрезентативности.
- Контроль выборки — процедура сравнения генеральной совокупности и выборки, выявление степени их расхождения, обнаружение причин отклонений и разработка возможных способов их устранения.
- Ремонт выборки — процесс устранения расхождения генеральной совокупности и выборки.
Чтобы максимально увеличить шансы на получение репрезентативной выборки, при ее отборе необходимо помнить о двух вещах:
Существует множество способов составления выборки из популяции, но вот три метода, которые можно использовать для составления репрезентативной выборки:
Простая случайная выборка: случайный отбор людей с помощью генератора случайных чисел или другого метода случайного отбора.
- Коррекция выборки. Заключается в замене ранее выбранных объектов совокупности. Коррекция может потребоваться, например, если в выборке произошло искажение распределения объектов относительно исходной совокупности, например, получился избыток пенсионеров, мужчин, женщин или людей с определённым уровнем образования. Замена может быть произвольной (например, следующий клиент по списку) или эквивалентной (подыскивается клиент с теми же параметрами — пенсионера меняем на пенсионера и т.д.).
- Расширение основы выборки. Позволяет включить в выборку большее разнообразие наблюдений. Основа выборки — это подмножество элементов генеральной совокупности, из которого будет формироваться выборка. Использование основы выборки позволяет сделать отбор более целевым, исключив обработку данных, не относящихся к задаче анализа, лучше сфокусироваться на целевой группе. В анализе клиентской базы основой выборки могут быть только мужчины, только женщины, люди в возрасте от 30 до 60 и т.д. Если выборка получилась недостаточно репрезентативной, то решить проблему можно расширяя границы основы выборки. Например, если изначально основой выборки являлась только люди пенсионного возраста, то при необходимости она может быть расширена и на людей предпенсионного возраста.
- Взвешивание. При взвешивании объектам выборки могут присваиваться весовые коэффициенты, которые могут учитываться в алгоритме анализа. Например, повышенные весовые коэффициенты могут присваиваться клиентам, которые наиболее активно пользовались услугами компании (купили товаров и услуг на сумму выше некоторого порога). Логично предположить, что мнение таких клиентов будет более значимым.
Систематическая случайная выборка: каждый член популяции располагается в определенном порядке. Выберите случайную начальную точку и отберите каждого члена niocese для включения в выборку.
Как получить репрезентативный образец
Стратифицированная случайная выборка: разделение населения на группы. Случайным образом выберите несколько членов из каждой группы для включения в выборку.
1. Используйте соответствующий метод выборки.
В дополнение к использованию соответствующей процедуры выборки, убедитесь, что выборка достаточно велика, чтобы обеспечить достаточное количество данных для обобщения на более широкую популяцию.
Например, выборка из восьми учащихся — по одному мальчику и одной девочке из каждого класса — может представлять собой мини-версию более крупной популяции, но, скорее всего, она недостаточно велика, чтобы уловить всю вариативность, которая естественным образом возникает в ответах учащихся.
- Пример: Присвойте номер всем 1000 учащихся. Затем с помощью генератора случайных чисел выберите 100 случайных чисел и используйте соответствующих учащихся в качестве членов выборки.
- Преимущество: Простые случайные выборки обычно репрезентативны для интересующей нас совокупности, поскольку каждый член имеет равные шансы быть включенным в выборку.
Насколько большой должна быть ваша выборка?
- Пример. Создайте список в алфавитном порядке на основе фамилий всех 1000 учащихся, случайным образом выберите начальную точку и выберите каждого десятого учащегося для включения в выборку.
- Преимущество: систематические случайные выборки обычно репрезентативны для интересующей нас совокупности, поскольку каждый член имеет равные шансы быть включенным в выборку.
Это зависит от следующих факторов:
- Пример. Разделите всех учащихся по их классам: первокурсников, второкурсников, младших и старших классов. Случайным образом выберите 25 учеников из каждого класса для включения в выборку.
- Преимущество: стратифицированные случайные выборки гарантируют, что в выборку будет включено равное количество учащихся каждого класса.
2. Убедитесь, что выборка достаточно большая.
Даже если вы используете соответствующий метод выборки и убедитесь, что ваша выборка достаточно велика, имейте в виду следующее:
SurveyMonkey предоставляет способ определения репрезентативной выборки на основе уровня доверия и предельной погрешности.
Это можно сделать с помощью таблицы:
Репрезентативная выборка рассчитывается в пять этапов. Возьмем пример магазина электроинструментов.
- Размер совокупности: как правило, чем больше численность населения, тем больше должна быть выборка. Например, вам понадобится гораздо большая выборка, если вы хотите обобщить свои выводы на всю страну по сравнению с одним городом.
- Уровень достоверности: насколько вы хотите быть уверены в том, что истинное значение генеральной совокупности, которое вас интересует, попадает в ваш доверительный интервал. Общие уровни достоверности включают 90%, 95% и 99%. Чем выше уровень достоверности, тем больше должна быть ваша выборка.
- Погрешность: сколько ошибок вы готовы допустить. Ни одна выборка не будет идеальной, поэтому вы должны быть готовы допустить хотя бы некоторую ошибку. Большинство исследований сообщают о своих выводах с погрешностью, например, «40% студентов сообщили, что драма является их любимым жанром кино, с погрешностью +/- 5%». Чем меньше погрешность, тем меньше должна быть ваша выборка.
О чем следует помнить
Исходные данные: Магазин в Курске хочет привлечь новых покупателей на свой сайт и размещает рекламу.
- Всегда будет какая -то ошибка выборки. Выборка никогда не будет полностью репрезентативной для большей совокупности.
- В целом, чем больше выборка, тем больше вероятность того, что она будет репрезентативной для населения.
- Вам необходимо найти баланс между размером выборки и реальными переменными, такими как время и стоимость. Более крупная выборка может иметь больше шансов представить всю совокупность, но ее получение может быть более дорогим и трудоемким.
Как рассчитать размер выборки
Способ SurveyMonkey
Перед запуском проводится A/B-тест, в ходе которого тестируются два объявления с разными вариантами заголовков. Одно из предположений заключается в том, что второй вариант объявления привлечет больше целевых групп и будет иметь больше кликов и конверсий.
Шаг 1: Определите генеральную совокупность. Маркетологи интернет-магазинов собрали достаточно информации о покупателях. Целевая аудитория — мужчины из Курска в возрасте от 25 до 70 лет, которые интересуются ремонтом, строительством и DIY.
С помощью myTarget вы можете оценить приблизительный размер целевой аудитории. Эта платформа предлагает гибкие возможности таргетинга. Это помогает понять примерный охват рекламы, который можно рассматривать как общее население.
Сейчас мы будем говорить не о запуске кампании через myTarget, а об определении размера целевой аудитории. Подробнее о работе с объявлениями в системе вы можете узнать из руководства «Как настроить объявления в myTarget».
Сначала нужно зайти в свой профиль в myTarget и выбрать цель — «Конверсии» — «Трафик», а ниже ввести URL. Слева вы увидите прогноз целевой группы на неделю. Охват объявления уменьшается, когда вы настраиваете таргетинг.
Попробуйте уменьшить охват объявления и отрегулируйте настройки:
После доработки аудитория сократится до 43 000 — 144 000 человек:
Определите интересы. Потенциальные покупатели интересуются автомобилями, ремонтно-строительными работами и DIY:
Аудитория сократилась до 34 000 против 108 000.
Шаг 2: Определите точность теста. Для получения статистически значимых результатов необходимо установить уровень доверия 95-99% и предел погрешности 1-5%.
- возраст – 25–70 лет;
- пол – мужчины;
- география – Курск.
Например, предполагается, что пользователи с большей вероятностью нажмут на второе объявление. Мы предполагаем, что погрешность составляет 1%, поэтому уровень доверия равен 99%. Это означает, что от 98 до 100 % пользователей оценят второй вариант выше.
Шаг 3: Определите размер выборки с помощью таблицы. Общая численность нашего населения составляет около 100 000 человек. Подходящая выборка включает от 383 до 8763 человек. Чтобы получить наиболее полезные данные, необходимо установить уровень доверия на 99%. Таким образом, мы включим 660 человек.
Часто для получения статистически значимых результатов в выборке должно быть от 2 000 до 3 000 человек. И это большая проблема, когда за неделю было около двухсот конверсий.
Один из способов уменьшить размер выборки — снизить уровень доверия в настройках калькулятора до 80%. Если вы используете калькулятор Mindbox для поиска репрезентативной выборки, вы также можете уменьшить число мощности. Это снижает мощность данных, но статистическая значимость не теряется.
Например, если вы установите мощность Mindbox на 98% и уровень доверия на 99%, размер выборки для группы составит 5 030 человек.
Вы можете проверить значимость
Главные трудности в тестах при расчете выборки
Малое количество просмотров
О том, как увеличить трафик на узкотематические объявления, читайте в нашей статье «Узкотематические объявления: 9 советов по повышению эффективности».
Когда бюджет невелик, рекламодатель не может протестировать все заголовки, креативные элементы или рекламную копию.
Вот несколько советов, как сэкономить деньги:
1. сравните разные объявления. Тестирование сначала заголовков, а затем рекламной копии, дизайна и других элементов шаг за шагом требует времени и больших бюджетов. Если нет, кардинально измените заголовок, копию и дизайн и сравните радикально отличающиеся объявления.
Ниже приведены некоторые советы по расчету репрезентативной выборки и проведению репрезентативного теста.
Узкая тематика
Помогая своим клиентам с помощью контекстной и целевой рекламы, важно эффективно управлять кампаниями. Свяжите счета своих клиентов с Click.co.uk и получайте до 18% партнерского вознаграждения.
Выборка в психологии означает выбор определенных элементов или групп из множества. Выборочный метод исследования помогает определить причины определенных процессов, явлений, поведения и результатов. Оценив результаты исследования на определенной группе, исследователь может затем распространить гипотезу на более широкую область при определенных условиях и критериях.
- при расчете выборки нужно понизить уровень доверия. О том, как это работает, мы рассказали выше;
- не стоит запускать тест на конверсию в заказы. Метрика не подходит для рекламы узких тематик. Если переходов мало, то низким будет и уровень конверсии в заказы. При этом, чтобы получить статистически значимые результаты, нужно, чтобы рекламу увидело больше пользователей, чем при выборе показателя Click Rate.
Просто нереально изучить все человечество, чтобы определить конкретное направление или тенденцию. Поэтому выборка является важным методом проведения качественного исследования, позволяющим выявить желаемые закономерности или получить данные, опровергающие эти закономерности.
Эксперты выделяют следующие типы образцов в психологических исследованиях:
По сути, выборка — это целевая группа для эксперимента, помогающая исследователю достичь намеченной цели.
Цель исследования — достижение цели исследователя.
Мы рады помочь вам!
Ограниченный бюджет
Процедура выборки напрямую зависит от темы и цели исследования, а также от определения объекта исследования. Во-первых, автор исследовательской работы должен провести идентификацию:
Как только автор сможет ответить на эти вопросы, он перейдет к конкретным действиям: Планирование эксперимента, разработка плана действий и критериев оценки и т.д.
Самым важным шагом является определение образца. Исследователь должен четко представлять, какие группы анализировать и оценивать, какие критерии использовать для отбора испытуемых (возраст, пол, работа, образование, привычки, состояние здоровья и т.д.), что учитывать (какие факторы оказывают влияние) и т.д.
Рекомендации по расчету выборки
В большинстве случаев в психологических исследованиях все обстоятельства и параметры ситу
- Будьте последовательны. Узнайте, кто представляет вашу целевую аудиторию, кому лучше показывать рекламу для достижения поставленных целей. Вы можете потратить бюджет из-за неправильного таргетинга и получить непоказательные результаты по тестовым группам.
- Будьте терпеливы. Чтобы получить результаты, могут потребоваться 2 недели или несколько тысяч визитов. Не ждите небольших улучшений и тестируйте более крупные изменения.
- Не забывайте о правилах подсчета выборки. Устанавливайте при расчетах высокий уровень достоверности данных. Уменьшение показателя снижает значимость результатов.
Предположим, вы провели социологический опрос населения. Главный вопрос опроса: Удовлетворены ли вы своей нынешней зарплатой? Предположим, что в опросе приняли участие 100 человек. В результате вы получите следующие данные: 18 % респондентов отрицательно относятся к жаре, более 70 % относятся положительно и 12 % не могут ответить на вопрос. В такой форме невозможно применить результаты опроса ко всем людям, так как в опросе могут участвовать также безработные, члены семьи и т.д. Поэтому данная выборка не является репрезентативной.
Какие выборки бывают?
Однако, если сначала установить определенные критерии для отбора выборки, т.е. опросить только работников в возрасте от 18 до 65 лет, то результаты можно применить ко всему населению. В этом случае выборка считается репрезентативной.
Таким образом, результаты исследования носят не только узкий и частный характер, но и могут быть использованы в будущем. Важно, чтобы выборка была репрезентативной. Это требует определения компетентных и корректных параметров по отношению к темам, исходя из целей исследования.
Вы испытываете трудности в учебе?
- Узкие и широкие. Здесь вид зависит от числа испытуемых или количества выборок в одних экспериментах достаточно проанализировать 2 группы лиц, а в других и 5 будет мало.
- Зависимые и независимые. В данном случае исследователь отмечает, как действия одной группы влияют на ход событий в другой выборке, т.е. существуют ли определенные связующие элементы, сказывающиеся на жизни испытуемых каждой группы.
- Репрезентативная и нерепрезентативная. О данном термине мы говорим чуть позже (в этой же статье).
Помощь в написании бакалаврских и магистерских диссертаций!
Как происходит формирование выборки?
- Что он намерен изучать?
- Какие материалы потребуются ему для исследования?
- Какие требования будут предъявляться к объекту исследования?
- Какие методы и методики пригодятся?
- Объем выборки: количество испытуемых объектов в каждой группе, количество групп. Данный параметр определяется исходя из цели и задач исследований, предполагаемых мероприятий, возможно сравнение со схожими экспериментами;
- Индивидуальные качества объекта: наличие определенных навыков, умений, личностных характеристик;
- Дополнительные критерии: пол, возраст, опыт работы, привычки и пр.;
- Критерии выборки: однородность (соответствие конкретному признаку), разнородность (обычно анализируется одна группа лиц, не имеющих между собой явных сходств или различий, для проверки конкретно правила/теории).
Что значит репрезентативность выборки?