Как выполнить базовый анализ данных в Excel

Как выполнить базовый анализ данных в Excel

В большинстве случаев, когда вы запускаете статистику, вы хотите использовать статистическое программное обеспечение. Эти инструменты созданы для выполнения таких расчетов, как т -тесты, тесты хи-квадрат, корреляции и т. д. Excel не предназначен для анализа данных. Но это не значит, что вы не можете этого сделать.





К сожалению, статистические функции Excel не всегда интуитивно понятны. И они обычно дают эзотерические результаты. Поэтому вместо использования функций статистики мы собираемся использовать надстройку статистики Excel: Анализ данных Toolpak.





Toolpak, несмотря на довольно неудачное написание, включает в себя широкий спектр полезных статистических функций. Давайте посмотрим, что мы можем сделать со статистикой Excel.





Добавление пакета инструментов анализа данных Excel

Пока ты жестяная банка делать статистику без Data Analysis Toolpak, с ним намного проще. Чтобы установить Toolpak в Excel 2016, перейдите по ссылке Файл> Параметры> Надстройки .

Нажмите Идти рядом с 'Управление: надстройки Excel'.



В появившемся окне установите флажок рядом с Пакет аналитических инструментов а затем щелкните Ok .

Если вы правильно добавили Data Analysis Toolpak в Excel, вы увидите Анализ данных кнопка в Данные вкладка, сгруппированная в Анализ раздел:





Если вы хотите еще больше возможностей, обязательно ознакомьтесь с другими надстройками Excel.

Описательная статистика в Excel

Независимо от того, какой статистический тест вы проводите, вы, вероятно, захотите сначала получить описательную статистику Excel. Это даст вам информацию о средних, медианах, дисперсии, стандартном отклонении и ошибке, эксцессе, асимметрии и множестве других цифр.





Запустить описательную статистику в Excel просто. Нажмите Анализ данных на вкладке 'Данные' выберите Описательная статистика, и выберите диапазон ввода. Щелкните стрелку рядом с полем диапазона ввода, щелкните и перетащите, чтобы выбрать данные, и нажмите Входить (или щелкните соответствующую стрелку вниз), как показано на GIF-изображении ниже.

После этого не забудьте сообщить Excel, есть ли у ваших данных метки, хотите ли вы вывод на новом листе или на том же листе, а также если вам нужна сводная статистика и другие параметры.

После этого нажмите Ok , и вы получите свою описательную статистику:

Тест Стьюдента в Excel

В т -test - один из самых простых статистических тестов, который легко вычислить в Excel с помощью Toolpak. Щелкните значок Анализ данных и прокрутите вниз, пока не увидите значок т -тестовые варианты.

У вас есть три варианта:

  • t-тест: парные две выборки для средних значений следует использовать, когда ваши измерения или наблюдения были парными. Используйте это, когда вы выполняли два измерения одного и того же объекта, например, измеряли артериальное давление до и после вмешательства.
  • t-критерий: двухвыборочное предположение о равных отклонениях следует использовать, когда ваши измерения независимы (что обычно означает, что они были выполнены на двух разных группах субъектов). Мы обсудим часть «равных отклонений» чуть позже.
  • t-критерий: двухвыборочное предположение о неравных отклонениях также для независимых измерений, но используется, когда ваши отклонения не равны.

Чтобы проверить, равны ли дисперсии ваших двух выборок, вам необходимо выполнить F-тест. Находить F-тест с двумя выборками для различий в списке Инструменты анализа выберите его и нажмите Ok .

Введите два набора данных в поля диапазона ввода. Оставьте значение альфа 0,05, если у вас нет причин его менять - если вы не знаете, что это значит, просто оставьте. Наконец, нажмите Ok .

Excel выдаст вам результаты на новом листе (если вы не выбрали Выходной диапазон и ячейку на текущем листе):

Вы смотрите здесь на P-значение. Если оно меньше 0,05, у вас есть неравные отклонения . Итак, чтобы запустить т -test следует использовать опцию неравных дисперсий.

Чтобы запустить т -test, выберите соответствующий тест в окне «Инструменты анализа» и выберите оба набора данных так же, как вы это делали для F-теста. Оставьте значение альфа 0,05 и нажмите Ok .

Результаты включают в себя все, что вам нужно сообщить о т -тест: средние значения, степени свободы (df), t-статистика и P-значения как для одно-, так и для двусторонних тестов. Если значение P меньше 0,05, два образца значительно различаются.

Если вы не уверены, использовать ли односторонний или двусторонний т -проверьте, проверьте это объяснитель из Калифорнийского университета в Лос-Анджелесе .

ANOVA в Excel

Пакет Excel Data Analysis Toolpak предлагает три типа дисперсионного анализа (ANOVA). К сожалению, это не дает вам возможности проводить необходимые дополнительные тесты, такие как тесты Тьюки или Бонферрони. Но вы можете увидеть, есть ли связь между несколькими разными переменными.

Вот три теста ANOVA в Excel:

  • ANOVA: однофакторный анализирует дисперсию с одной зависимой переменной и одной независимой переменной. Желательно использовать несколько т -тесты, если у вас более двух групп.
  • ANOVA: двухфакторный с репликацией похож на парный т -тестовое задание; он включает в себя несколько измерений на отдельных объектах. «Двухфакторная» часть этого теста указывает на наличие двух независимых переменных.
  • ANOVA: двухфакторный без репликации включает две независимые переменные, но не повторяет измерения.

Здесь мы рассмотрим однофакторный анализ. В нашем примере мы рассмотрим три набора чисел, помеченных как «Вмешательство 1», «Вмешательство 2» и «Вмешательство 3». Чтобы запустить ANOVA, щелкните Анализ данных , затем выберите ANOVA: однофакторный .

Выберите диапазон ввода и обязательно сообщите Excel, находятся ли ваши группы в столбцах или строках. Я также выбрал здесь «Ярлыки в первой строке», чтобы имена групп отображались в результатах.

После удара Ok , получаем следующие результаты:

Обратите внимание, что значение P меньше 0,05, поэтому мы получили значимый результат. Это означает, что существует значительная разница как минимум между двумя группами в тесте. Но поскольку Excel не предоставляет тестов для определения который группы различаются, лучшее, что вы можете сделать, это посмотреть на средние значения, отображаемые в сводке. В нашем примере вмешательство 3 выглядит так, как будто оно наверное тот, который отличается.

Статистически это не так. Но если вы просто хотите увидеть, есть ли разница, и посмотреть, какая группа, вероятно, ее вызывает, это сработает.

Двухфакторный дисперсионный анализ более сложен. Если вы хотите узнать больше о том, когда использовать двухфакторный метод, см. это видео с Sophia.org и ' без репликации ' а также ' с тиражированием 'примеры из реальной статистики.

Корреляция в Excel

Расчет корреляции в Excel намного проще, чем т -тест или ANOVA. Использовать Анализ данных кнопку, чтобы открыть окно инструментов анализа, и выберите Корреляция .

Выберите диапазон ввода, определите группы как столбцы или строки и сообщите Excel, есть ли у вас метки. После этого нажмите Ok .

Вы не получите никаких показателей значимости, но вы можете увидеть, как каждая группа соотносится с другими. Значение единицы - абсолютная корреляция, указывающая на то, что значения точно такие же. Чем ближе к единице значение корреляции, тем сильнее корреляция.

Регрессия в Excel

Регрессия - один из наиболее часто используемых статистических тестов в промышленности, и Excel обладает удивительной мощностью для этого расчета. Здесь мы проведем быструю множественную регрессию в Excel. Если вы не знакомы с регрессией, посмотрите Руководство HBR по использованию регрессии в бизнесе .

Допустим, наша зависимая переменная - артериальное давление, а две наши независимые переменные - вес и потребление соли. Мы хотим увидеть, какой из них лучше предсказывает артериальное давление (или оба ли они хороши).

Нажмите Анализ данных и выберите Регресс . На этот раз нужно быть осторожным при заполнении полей диапазона ввода. В Входной диапазон Y поле должно содержать вашу единственную зависимую переменную. В Вход X Диапазон box может включать несколько независимых переменных. Для простой регрессии не беспокойтесь об остальном (хотя не забудьте сообщить Excel, если вы выбрали метки).

Вот как выглядит наш расчет:

После удара Ok , вы получите большой список результатов. Я выделил здесь P-значение как для веса, так и для потребления соли:

Как видите, значение P для веса больше 0,05, поэтому здесь нет значимой связи. Однако значение P для соли ниже 0,05, что указывает на то, что это хороший показатель артериального давления.

Если вы планируете представить данные регрессии, помните, что вы можете добавить линию регрессии на диаграмму рассеяния в Excel. Это отличное наглядное пособие для этого анализа.

Статистика Excel: на удивление способна

Хотя Excel не известен своей статистической мощностью, на самом деле он обладает некоторыми действительно полезными функциями, такими как инструмент PowerQuery , что удобно для таких задач, как объединение наборов данных. (Узнайте, как создать свой первый скрипт Microsoft Power Query.) Существует также надстройка статистики Data Analysis Toolpak, которая действительно раскрывает некоторые из лучших функций Excel. Я надеюсь, что вы узнали, как использовать Toolpak, и что теперь вы можете поиграть самостоятельно, чтобы выяснить, как использовать больше его функций.

как сделать снимок экрана в instagram без их ведома

Теперь, когда все это под вашим поясом, выведите свои навыки работы с Excel на новый уровень с помощью наших статей о использование функции поиска цели в Excel для дополнительной обработки данных а также поиск значений с помощью vlookup . В какой-то момент вы также можете узнать, как импортировать данные Excel в Python.

Делиться Делиться Твитнуть Эл. адрес Удалите эти файлы и папки Windows, чтобы освободить место на диске

Вам нужно очистить дисковое пространство на вашем компьютере с Windows? Вот файлы и папки Windows, которые можно безопасно удалить, чтобы освободить место на диске.

Читать далее
Похожие темы
  • Продуктивность
  • Таблица
  • Майкрософт Эксель
Об авторе Затем Олбрайт(Опубликовано 506 статей)

Данн - консультант по контент-стратегии и маркетингу, который помогает компаниям генерировать спрос и потенциальных клиентов. Он также ведет блог о стратегии и контент-маркетинге на dannalbright.com.

Ещё от Dann Albright

Подписывайтесь на нашу новостную рассылку

Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!

Нажмите здесь, чтобы подписаться