Черновик для статьи
Работаем с данными

Типы переменных

  1. Категориальные (как правило - не числовое значения, а качественные)
  2. Номинальный (Более двух уровней, качественные переменные. Страна, цвет и т.п., нельзя сравнить, нет истинного упорядочения.)
  3. Двоичный (да-нет, только два уровня)
  4. Порядковые (Более трех уровней, существует естественное упорядочение. Не всегда удается ранжировать. Размер напитка: маленький, средний, большой.)
  5. Количественные (измеряют величину, Всегда числа)
  6. Непрерывные (Рост, уровень pH, диапазон, можно найти среднее значение)
  7. Дискретные (только фиксированное число исчисляемых измерений между двумя величинами (количество детей в семье 1-15, не может быть 1,5)
Знакомство с аналитикой рекомендуется начинать (продолжать) при помощи знакомых инструментов, в данной статье, речь пойдет про Excel. По мере погружения экселевская база будет дополняться языками программирования R и Python.
Уровень знаний для знакомства со статьей, навыки Excel:
  • Абсолютные, относительные и смешанные ссылки. линк
  • Условная логика и условное агрегирование (операторы IF(), SUMIF()/SUMIFS() и т.д.)
  • Объединение источников данных линк
  • Сортировка, фильтрация и агрегирование данных с помощью свободных таблиц
  • Основы построения графиков (гистограммы, линейные диаграммы и т.п.)
Книга "Excel 2019, Библия пользователя". Майкл Александр
Знакомство с аналитикой рекомендуется начинать (продолжать) при помощи знакомых инструментов, в данной статье, речь пойдет про Excel. По мере погружения экселевская база будет дополняться языками программирования R и Python.
Любая аналитика начинается с "интервьюирования" данных или "разведочный анализ данных"
  • Классифицировать переменные как непрерывные, категориальные и т.п.
  • Обобщить переменные, используя описательную статистику
  • Визуализировать переменные с помощью диаграмм
Made on
Tilda