Как найти у в функции. Как найти область определения функции. Область значения функции

Вам понадобится

  • - ряд распределения из зависимой и независимой переменной;
  • - бумага, карандаш;
  • - компьютер и программа для работы с электронными таблицами.

Инструкция

Выберите две , между которыми, как вы полагаете, есть взаимосвязь, обычно берут , которые изменяются со временем. Учтите, что одна из переменных должна быть независимой, она будет выступать в качестве причины. Вторая при этом должна изменяться с ней – уменьшаться, увеличиваться или меняться случайным образом.

Измерьте значение зависимой переменной для каждого независимой. Занесите результаты в таблицу, в две строки или два столбца. Для обнаружения наличия связи нужно не менее 30 показаний, но для получения более точного результата позаботьтесь о наличии не менее 100 точек.

Постройте координатную плоскость, при этом на оси ординат отложите значения зависимой переменной, а на оси абсцисс – независимой. Подпишите оси и укажите единицы измерения каждого показателя.

Отметьте на графике точки корреляционного поля. На оси абсцисс найдите первое значение независимой переменной, а на оси ординат – соответствующее ему значение зависимой. Постройте перпендикуляры к этим проекциям и найдите первую точку. Отметьте ее, обведите мягким карандашом или ручкой. Точно также постройте все остальные точки.

Полученная совокупность точек и называется корреляционным полем . Проанализируйте полученный график, сделайте выводы о наличии сильной или слабой причинно-следственной связи, либо ее отсутствии.

Обратите внимание на случайные отклонения от графика. Если в целом прослеживается линейная или другая зависимость, но всю «картину» портят одна-две точки, оказавшиеся в стороне от общей совокупности, их можно случайными ошибками и не учитывать при интерпретации графика.

Если вам необходимо построить и проанализировать поле корреляции для большого количества данных, воспользуйтесь программами, предназначенными для работы с электронными таблицами, например, Excel, или приобретите специальные программы.

Взаимосвязь нескольких величин, во время которой изменения одной приводит к изменению остальных, называется корреляцией. Она бывает простой, множественной или частичной. Это понятие принято не только в математике, но и в биологии.

Слово корреляция произошло от латинского correlatio, взаимосвязь. Все явления, события и предметы, а также характеризующие их величины связаны между собой. Корреляционная зависимость отличается от функциональной тем, что в этом типе зависимости, каких-либо могут быть измерены только в среднем, приближенно.Корреляционная зависимость предполагает, что переменная величина соответствует изменениям независимой величины лишь с определенной степенью вероятности. Степень зависимости носит название коэффициента корреляции.В понятие корреляции - это соотношение строения и функций отдельных частей организма.Довольно часто понятием корреляция пользуются статистики. В статистке это взаимоотношение между статистическими величинами, рядами и группами. Для определения наличия или отсутствия или наличия корреляции используют специальный метод. Метод корреляции применяется для определения прямого или обратного в изменениях чисел в рядах, которые сравнивают. Когда найден, то саму меру или степень параллелизма. Но внутренние причинно-следственные факторы таким путем не отыскиваются. Основная задача статистики как науки - обнаруживать такие причинные зависимости другим наукам.По форме корреляционная связь может быть линейной или нелинейной, положительной и отрицательной. Когда с увеличением или убыванием одной из переменных другая так же растет или убывает, то взаимосвязь линейна. Если же при изменении одной величины, характер изменений другой нелинеен, то это корреляция нелинейна.Положительной корреляция считается тогда, когда повышение уровня одной величины сопровождается повышением уровня другой. Например, когда усиление звука сопровождается ощущением повышения его тона.Корреляция, когда рост уровня одной переменной сопровождается снижением уровня другой, называется отрицательной. В сообществах повышенный уровень тревожности особи приводит к тому, что снижается вероятность занять этой особью главенствующей ниши среди собратьев.Когда связь переменных отсутствует, корреляция носит названий нулевой.

Видео по теме

Источники:

  • Нелинейная корреляция в 2019

Корреляцией называют взаимную зависимость двух случайных величин (чаще - двух групп величин), при которой изменение одной из них приводит и к изменению другой. Коэффициент корреляции показывает, насколько вероятно изменение второй величины при смене значений первой, т.е. степень ее зависимости. Самый простой способ вычисления этой величины - воспользоваться соответствующей функцией, встроенной в табличный редактор Microsoft Office Excel.

Вам понадобится

Инструкция

Запустите Excel и откройте документ, содержащий группы данных, коэффициент корреляции между которыми требуется вычислить. Если такого документа еще не создано, то введите данные в - табличный редактор создает ее автоматически при запуске программы. Каждую из групп значений, корреляция между которыми вас интересует, вводите в отдельную колонку. Это не обязательно должны быть соседние колонки, вы свободны оформить таблицу наиболее удобным образом - добавить дополнительные столбцы с пояснениями к данным, заголовки колонок, итоговые ячейки с суммарными или средними значениями и т.д. Можно даже располагать данные не в вертикальном (в колонках), а в горизонтальном (в строках) направлении. Единственное требование, которое надо соблюдать - ячейки с данными каждой группы должны располагаться последовательно одна за другой, чтобы таким образом создавался непрерывный массив.

Перейдите в ячейку, которая должна будет содержать значение корреляции данных двух массивов, и кликните в меню Excel закладку «Формулы». В группе команд «Библиотека функций» щелкните по самой последней пиктограмме - «Другие функции». Раскроется выпадающий список, в котором вам следует перейти в раздел «Статистические» и выбрать функцию КОРРЕЛ. В результате откроется окно мастера функций с формой, предназначенной для заполнения. Это же окно можно вызвать и без вкладки «Формулы», просто щелкнув по пиктограмме вставки функции, размещенной левее строки формул.

Укажите первую группу коррелирующих данных в поле «Массив1» мастера формул. Чтобы ввести диапазон ячеек вручную наберите адрес первой и последней клеток, разделив их двоеточием (без пробелов). Другой вариант - просто выделите нужный диапазон мышкой, а нужную запись в это поле формы Excel поместит самостоятельно. Такую же операцию надо проделать и со второй группой данных в поле «Массив2».

Нажмите кнопку OK. Табличный редактор рассчитает и отобразит значение корреляции в ячейке с формулой. При необходимости вы можете сохранить этот документ для дальнейшего использования (сочетание клавиш Ctrl + S).

Различают два вида зависимости между экономическими явле­ниями : функциональную и статистическую. Зависимость между дву­мя величинами X и Y , отображающими соответственно два явле­ния, называется функциональной , если каждому значению величины x соответствует единственное значение величины Y и наоборот. Примером функциональной связи в экономике может служить за­висимость производительности труда от объема произведенной продукции и затрат рабочего времени. При этом следует отметить, что если Х – детерминированная, не случайная величина, то и фун­кционально зависящая от нее величина Y тоже является детерминированной. Если же Х – величина случайная, то и Y также случай­ная величина.

Однако гораздо чаще в экономике имеет место не функциональ­ная, а статистическая зависимость , когда каждому фиксирован­ному значению независимой переменой X соответствует не одно, а множество значений зависимой переменной Y, причем заранее нельзя сказать, какое именно значение примет Y . Это связано с тем, что на Y кроме переменной X влияют и многочисленные неконт­ролируемые случайные факторы. В этой ситуации Y является слу­чайной величиной, а переменная X может быть как детерминиро­ванной, так и случайной величиной.

Частным случаем статистичес­кой зависимости является корреляционная зависимость , при кото­рой функциональной зависимостью связаны фактор X и среднее значение (математическое ожидание) результативного показателя Y . Статистическая зависимость может быть выявлена лишь по результатам достаточно большого числа наблюдений. Графически статистическая зависимость двух признаков может быть представлена с помощью поля корреляции, при построении которого на оси абсцисс откладывается значение факторного признака X , а по оси ординат – результирующего Y .

Корреляционная связь частный случай статистической связи, при котором разным значениям переменной соответствуют разные средние значения другой переменной. Корреляционная связь предполагает, что изучаемые переменные имеют количественное выражение.

Если изучается связь между двумя признаками, налицо парная корреляция; если изучается связь между многими признаками – множественная корреляция.

В качестве примера на рис.

1 представлены данные, иллюстри­рующие прямую зависимость между х и у (рис. 1, а) и обратную зависимость (рис. 1, б). В случае «а» это прямая зависимость между, к примеру, среднедушевым доходом (х ) и сбережением (у ) в семье. В случае «б» речь идет об обратной зависимости. Такова, наш пример, зависимость между производительностью труда (х ) и себе­стоимостью единицы продукции (у ). На рис. 1 каждая точка характер изучает объект наблюдения со своими значениями х и у .

Рис. 1. Поле корреляции

На рис. 1 также представлены прямые линии, линейные уравнения регрессии типа , характеризующие функциональную зависимость между независимой переменной х и средним зна­чением результативного показателя у . Таким образом, по уравнению регрессии, зная х , можно восстановить лишь среднее значение у .

Наглядным изображением корреляционной таблицы служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладываются значения X, по оси ординат – Y, а точками показываются сочетания X и Y. По расположению точек можно судить о наличии связи.

Использование графического метода.

Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.

Совокупность точек результативного и факторного признаков называется полем корреляции.

На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.

Линейное уравнение регрессии имеет вид y = bx + a + ε

Здесь ε - случайная ошибка (отклонение, возмущение).

Причины существования случайной ошибки:

1. Невключение в регрессионную модель значимых объясняющих переменных;

2. Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.

3. Неправильное описание структуры модели;

4. Неправильная функциональная спецификация;

21. Корреляционно-регрессионный анализ.

Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты и направления связи и установление аналити­ческого выражения (формы) связи (регрессионный анализ).

Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (У) от факторных (х1, х2, …, хk).

Уравнение регрессии, или статистическая модель связи социально-эко­номических явлений, выражается функцией:

Yx = f(х1, х2, …, хn),

где “n” – число факторов, включенных в модель;

Хi – факторы, влияющие на результат У.

Этапы корреляционно-регрессионного анализа:

Предварительный (априорный) анализ. Он дает неплохие результаты если проводится достаточно квалифицированным исследователем.

Сбор информации и ее первичная обработка.

Построение модели (уравнения регрессии). Как правило эту процедуру выполняют на ПК используя стандартные программы.

Оценка тесноты связей признаков, оценка уравнения регрессии и анализ модели.

Прогнозирование развития анализируемой системы по уравнению регрессии.

На первом этапе формулируется задача исследования, определяется методика измерения показателей или сбора информации, определяется число факторов, исключаются дублирующие факторы или связанные в жестко-детерминированную систему.

На втором этапе анализируется объем единиц: совокупность должна быть достаточно большой по числу единиц и наблюдений (N>>50), число факторов “n” должно соответствовать количеству наблюдений “N”. Данные должны быть количественно и качественно однородны.

На третьем этапе определяется форма связи и тип аналитической функции (парабола, гипербола, прямая) и находятся ее параметры.

На четвертом этапе оценивается достоверность всех характеристик корреляционной связи и уравнения регрессии используя критерий достоверности Фишера или Стьюдента, производится экономико-технологический анализ параметров.

На пятом этапе осуществляется прогноз возможных значений результата по лучшим значениям факторных признаков, включенных в модель. Здесь выбираются наилучшие и наихудшие значения факторов и результата.

22. Виды уравнений регрессии.

Для количественного описания взаимосвязей между экономическими переменными в статистике используют методы регрессии и корреляции.

Регрессия - величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х.

Уравнение регрессии выражает среднюю величину одного признака как функцию другого.

Функция регрессии - это модель вида у = л», где у - зависимая переменная (результативный признак); х - независимая, или объясняющая, переменная (признак-фактор).

Линия регрессии - график функции у = f (x).

2 типа взаимосвязей между х и у:

1) может быть неизвестно, какая из двух переменных является независимой, а какая - зависимой, переменные равноправны, это взаимосвязь корреляционного типа;

2) если х и у неравноправны и одна из них рассматривается как объясняющая (независимая) переменная, а другая - как зависимая, то это взаимосвязь регрессионного типа.

Виды регрессий:

1) гиперболическая - регрессия равносторонней гиперболы: у = а + b / х + Е;

2) линейная - регрессия, применяемая в статистике в виде четкой экономической интерпретации ее параметров: у = а+b*х+Е;

3) логарифмически линейная - регрессия вида: In у = In а + b * In x + In E

4) множественная - регрессия между переменными у и х1 , х2 ...xm, т. е. модель вида: у = f(х1 , х2 ...xm)+E, где у - зависимая переменная (результативный признак), х1 , х2 ...xm - независимые, объясняющие переменные (признаки-факторы), Е- возмущение или стохастическая переменная, включающая влияние неучтенных факторов в модели;

5) нелинейная - регрессия, нелинейная относительно включенных в анализ объясняющих переменных, но линейная по оцениваемым параметрам; или регрессия, нелинейная по оцениваемым параметрам.

6) обратная - регрессия, приводимая к линейному виду, реализованная в стандартных пакетах прикладных программ вида: у = 1/a + b*х+Е;

    парная - регрессия между двумя переменными у и x, т. е, модель вида: у = f (x) + Е, где у -зависимая переменная (результативный признак), x – независимая, объясняющая переменная (признак - фактор), Е - возмущение, или стохастическая переменная, включающая влияние неучтенных факторов в модели.

    Ряды динамики и их виды

Динамический ряд всегда состоит из 2 элементов: 1) момент времени или временной период, по отношению к которому приводятся статистические данные, 2)статистического показателя, который называется уровнем динамического ряда.

В зависимости от содержания временного показателя, ряды динамики бывают моментные или интервальные

В зависимости от вида статистического показателя, динамические ряды подразделяются на ряды абсолютных, относительных и средних величин

Абсолютные показывают точные значения

Относительные показывают изменение удельных весов показателя в общей совокупности

Средние величины содержат об изменении во времени показателя, являющимся средним уровнем явления

    Показатели ряда динамики. Средний уровень ряда динамики.

Показатели: 1)средний уровень дин.ряда, 2)абс.приросты, цепные и базисные, ср.абс.прирост, 3)тымпы роста и прироста, цепные и базисные, ср.темп роста и прироста, 4)fmcjk.nystзначения 1% прироста

Средние показатели динамики

Обобщённые характеристики ряда динамики, с их помощью сравнивают интенсивность развития явления по отношению к разным объектам, например по странам, отраслям, предприятиям

Средний уровень в мом.времени уи. Методика расчета среднего уровня зависит от вида ряда(моментальный/интервальный)(с равными/разными интервалами). Если дан интервальныя ряд динамики абсолютных или средних вельчин с равными промежутками времени, то для расчета среднего уровня применяются формула для расчета средней простой. Если промежутки времени интервального ряда неравные, то средний уровень находят по средней арифметической взвешенной. Уср=сммУи*Ти/сммТи

25. Абсолютный прирост (дельта и) – это разность между двумя уровнями динамического ряда, которая пока­зывает, насколько данный уровень ряда превышает уровень, принятый за базу сравнения. Дельта и=Уи-У0

Дельта и=Уи-Уи-1

Абсолютное ускорение - разность между абсолютным приростом за данный период и абсолютным приростом за предыдущий период одинаковой дли­тельности: Дельта и с чертой=дельта и- дельта и-1. Абсолютное ускорение показывает, насколько увеличилась (уменьшилась) скорость изменения показателя. Показатель ускорения применяется для цепных абсолютных приростов. Отрицательная величина ускорения говорит о замедлении роста или об ускорении снижения уровней ряда.

    Показатели относительного изменения уровней ряда динамики.

Коэффициент роста (темп роста) - это отношение двух сравниваемых уровней, которое показывает, во сколько раз данный уровень превышает уровень базисного периода. Отражает интенсивность изменения уровней ряда динамики и показывает, во сколько раз увеличился уровень по сравнению с базисным, а в случае уменьшения - какую часть базисного уровня составляет сравниваемый уровень.

Формула расчета коэффициента роста: при сравнении с постоянной базой : K i .=y i /y 0 , при сравнении с переменной базой : K i .=y i /y i -1 .

Темп роста - это коэффициент роста, выраженный в процентах:

T р = К 100 %.

Темпы роста для любых рядов динамики являются интервальными показателями, т.е. характеризуют тот или иной промежуток (интервал) времени.

Темп прироста - относительная величина прироста, т. е. отношение абсолютного прироста к предыдущему или базисному уровню. Характеризует, на сколько процентов уровень данного периода больше (или меньше) базисного уровня.

Темп прироста - отношение абсолютного прироста к уровню, принятому за базу сравнения:

Тпр=Уи-У0/У0*100%

Темп прироста - разность между темпом роста (в процентах) и 100,

Теоретическая часть

Для различия направленности влияния одного признака на другой введены понятия положительной и отрицательной связи.

Если с увеличением (уменьшением) одного признака в основном увеличиваются (уменьшаются) значения другого, то такая корреляционная связь называется прямой или положительной.

Если с увеличением (уменьшением) одного признака в основном уменьшаются (увеличиваются) значения другого, то такая корреляционная связь называется обратной или отрицательной.

Корреляционные поля и их использование в предварительном анализе корреляционной связи

При постановке вопроса о корреляционной зависимости между двумя статистическими признаками Х и У проводят эксперимент с параллельной регистрацией их значений.

Пример -
Будем называть корреляционным полем зону разброса таким образом полученных точек на графике. Визуально анализируя корреляционное поле на рисунке 8, можно заметить, что оно как бы вытянуто вдоль какой-либо прямой линии. Такая картина характерна для так называемой линейной корреляционной взаимосвязи между признаками. При этом можно в общем предположить, что с увеличением конечной скорости разбега увеличивается и длина прыжка, и наоборот. Т.е. между рассматриваемыми признаками наблюдается прямая (положительная) взаимосвязь.

Наряду с этим примером из множества других возможных корреляционных полей можно выделить следующие (рис.9-11):

На рисунке 9 тоже просматривается линейная взаимосвязь, но с увеличением значений одного признака, уменьшаются значения другого, и наоборот, т.е. связь обратная или отрицательная. Можно предположить, что на рисунке 11 точки корреляционного поля разбросаны около какой-то кривой линии. В таком случае говорят, что между признаками существует криволинейная корреляционная связь.

В отношении корреляционного поля, изображенного на рисунке 10, нельзя сказать, что точки располагаются вдоль какой-то прямой или кривой линии, оно имеет сферическую форму. В этом случае говорят, что признаки Х и Y не зависят друг от друга.



Кроме этого по корреляционному полю можно примерно судить о тесноте корреляционной связи, если эта связь существует. Здесь говорят: чем меньше точки разбросаны около воображаемой усредненной линии, тем теснее корреляционная связь между рассматриваемыми признаками.

Визуальный анализ корреляционных полей помогает разобраться в сущности корреляционной взаимосвязи, позволяет высказать предположение о наличии, направленности и тесноте связи. Но точно сказать, имеется связь между признаками или нет, линейная связь или криволинейная, тесная связь (достоверная) или слабая (недостоверная), с помощью этого метода нельзя. Наиболее точным методом выявления и оценки линейной взаимосвязи между признаками является метод определения различных корреляционных показателей по статистическим данным.

3. Коэффициенты корреляции и их свойства

Часто для определения достоверности взаимосвязи между двумя признаками(Х, У) используютнепараметрический (ранговый) коэффициент корреляции Спирмена и параметрический коэффициент корреляции Пирсона . Величина этих показателей корреляционной связи определяется по следующим формулам:

(1)

Где: dx - ранги статистических данных признака х;

dy - ранги статистических данных признака у.

(2)

Где: - статистические данные признака х,

Статистические данные признака у.

Эти коэффициенты обладают такими мощными признаками:

1. На основании коэффициентов корреляции можно судить только о прямолинейной корреляционной взаимосвязи между признаками. О криволинейной связи с их помощью ничего сказать нельзя.
2. Значения коэффициентов корреляции есть безразмерная величина, которая не может быть меньше -1 и больше +1, т.е.
3.
4. Если значения коэффициентов корреляции равны нулю, т.е. = 0 или = 0, то связь между признаками х, у отсутствует.
5. Если значения коэффициентов корреляции отрицательные, т.е. < 0 или < 0, то связь между признаками Х и Y обратная .
6. Если значения коэффициентов корреляции положительные, т.е. > 0 или y> 0 , то связь между признаками Х и Y прямая (положительная).
7. Если коэффициенты корреляции принимают значения +1 или -1, т.е. = ± 1 или = ± 1, то связь между признаками Х и Y линейная (функциональная) .
8. Только по величине коэффициентов корреляции нельзя судить о достоверности корреляционной связи между признаками. Эта достоверность еще зависит от числа степеней свободы.

Практическая часть.

Определите коэффициент корреляции между температурой тела и частотой пульса и дайте оценку выявленной взаимосвязи.

При постановке вопроса о корреляционной зависимости между двумя статистическими признаками Х и У проводят эксперимент с параллельной регистрацией их значений.

Пример 8.1.

Определить, зависит ли результат прыжка в длину с разбега (признак Х) от величины конечной скорости разбега (признак У). Для ответа на этот вопрос параллельно с регистрацией результата Х каждого прыжка спортсмена или группы спортсменов регистрируют и величину конечной скорости разбега Y . Пусть они таковы:

Таблица 5

I
xi (см)
yi (м/с) 10,7 10,5 10,1 9,8 10,1 10,5 9,1 9,6

Представим таблицу 5 в виде графика в прямоугольной системе координат, где на горизонтальной оси будем откладывать длину прыжка (Х), а на вертикальной - величину конечной скорости разбега в этом прыжке (Y).
function PlayMyFlash(cmd){ Corel_.TPlay(cmd); }

№1 !!! №2 !!! №3 !!! №4 !!! №5!!! №6 !!! №7 !!! №8!!!

Рис. 8. График корреляционного поля.

Будем называть корреляционным полем зону разброса таким образом полученных точек на графике. Визуально анализируя корреляционное поле на рисунке 8, можно заметить, что оно как бы вытянуто вдоль какой-либо прямой линии. Такая картина характерна для так называемой линейной корреляционной взаимосвязи между признаками. При этом можно в общем предположить, что с увеличением конечной скорости разбега увеличивается и длина прыжка, и наоборот. Т.е. между рассматриваемыми признаками наблюдается прямая (положительная) взаимосвязь.

Наряду с этим примером из множества других возможных корреляционных полей можно выделить следующие (рис.9-11):

На рисунке 9 тоже просматривается линейная взаимосвязь, но с увеличением значений одного признака, уменьшаются значения другого, и наоборот, т.е. связь обратная или отрицательная. Можно предположить, что на рисунке 11 точки корреляционного поля разбросаны около какой-то кривой линии. В таком случае говорят, что между признаками существует криволинейная корреляционная связь.

В отношении корреляционного поля, изображенного на рисунке 10, нельзя сказать, что точки располагаются вдоль какой-то прямой или кривой линии, оно имеет сферическую форму. В этом случае говорят, что признаки Х и Y не зависят друг от друга.

Кроме этого по корреляционному полю можно примерно судить о тесноте корреляционной связи, если эта связь существует. Здесь говорят: чем меньше точки разбросаны около воображаемой усредненной линии, тем теснее корреляционная связь между рассматриваемыми признаками.

Визуальный анализ корреляционных полей помогает разобраться в сущности корреляционной взаимосвязи, позволяет высказать предположение о наличии, направленности и тесноте связи. Но точно сказать, имеется связь между признаками или нет, линейная связь или криволинейная, тесная связь (достоверная) или слабая (недостоверная), с помощью этого метода нельзя. Наиболее точным методом выявления и оценки линейной взаимосвязи между признаками является метод определения различных корреляционных показателей по статистическим данным.

3. Коэффициенты корреляции и их свойства

Часто для определения достоверности взаимосвязи между двумя признаками(Х, У) используютнепараметрический (ранговый) коэффициент корреляции Спирмена и параметрический коэффициент корреляции Пирсона . Величина этих показателей корреляционной связи определяется по следующим формулам:

(1)

Где: dx - ранги статистических данных признака х;

dy - ранги статистических данных признака у.

(2)

Где: - статистические данные признака х,

Статистические данные признака у.

Эти коэффициенты обладают такими мощными признаками:

1. На основании коэффициентов корреляции можно судить только о прямолинейной корреляционной взаимосвязи между признаками. О криволинейной связи с их помощью ничего сказать нельзя.
2. Значения коэффициентов корреляции есть безразмерная величина, которая не может быть меньше -1 и больше +1, т.е.
3.
4. Если значения коэффициентов корреляции равны нулю, т.е. = 0 или = 0, то связь между признаками х, у отсутствует.
5. Если значения коэффициентов корреляции отрицательные, т.е. < 0 или < 0, то связь между признаками Х и Y обратная .
6. Если значения коэффициентов корреляции положительные, т.е. > 0 или y> 0 , то связь между признаками Х и Y прямая (положительная).
7. Если коэффициенты корреляции принимают значения +1 или -1, т.е. = ± 1 или = ± 1, то связь между признаками Х и Y линейная (функциональная) .
8. Только по величине коэффициентов корреляции нельзя судить о достоверности корреляционной связи между признаками. Эта достоверность еще зависит от числа степеней свободы.

Где: n - число коррелируемых пар статистических данных признаков Х и Y.

Чем больше n , тем выше достоверность связи при одном и том же коэффициенте корреляции.

Кроме перечисленных общих свойств у рассматриваемых коэффициентов корреляции имеются и различия. Главное их отличие состоит в том, что коэффициент Пирсона ( может быть использован только в случае нормальности распределения признаков Х и Y , коэффициент Спирмена () может быть использован для признаков с любым видом распределения. Если рассматриваемые признаки имеют нормальное распределение, то целесообразнее определять наличие корреляционной связи с помощью коэффициента Пирсона (), т.к. в этом случае он будет иметь меньшую погрешность, чем коэффициент Спирмена ().

Пример 8.2.

Определить с помощью рангового коэффициента корреляции Спирмена существует ли взаимосвязь между результатами прыжка в длину с разбега (X) и конечной скоростью разбега (Y) группы спортсменов (данные примера 8.1, табл. 5).

В формуле (1) dx и dy ранги статистических данных, т.е. места вариант в их ранжированной совокупности. Если в совокупности несколько одинаковых данных, то их ранги равны и определяются как среднее значение от мест, занимаемых этими вариантами. Например,

Данные xi
Ранги dx 4,5 4,5 4,5 4,5 7,5 7,5
3 + 4 + 5 + 6 7 + 8

Пользуясь этим правилом, определим ранги данных таблицы 5. Для удобства все запишем в виде таблицы 6.

Таблица 6

dx dy dx - dy
9,1 1 - 1 = 0 02 = 0
9,6 2 - 2 = 0 02 = 0
9,8 3 - 3 = 0 02 = 0
10,1 4 - 4 = 0 02 = 0
10,5 6,5 5 - 6,5 = - 1,5 (- 1,5)2 = 2,25
10,5 6,5 6 - 6,5 = - 0,5 (- 0,5)2 = 0,25
10,3 7 - 5 = 2 22 = 4
10,7 8 - 8 = 0 02 = 0
(dx-dy) = 0

В данном случае имеем 8 пар значений, т.е. 8 коррелируемых пар. Значит n = 8. Подставив полученное в формулу (1), будем иметь:

Вывод:

(0,92 > 0) , то между признаками Х и У У Х ), и наоборот - с уменьшением скорости разбега уменьшается длина прыжка. Достоверность коэффициента корреляции Спирмена определяется по таблице критических значений рангового коэффициента корреляции .

б) т.к. полученное значение коэффициента корреляции = 0,9 больше табличного значений = 0,88, соответствующего уровню b = 99%, то уверенность в правильности вывода (а) больше 99%. Такая достоверность позволяет распространить вывод (а) на всю генеральную совокупность, т.е. на всех прыгунов в длину.

Если не производится предварительной проверки рассматриваемых совокупностей на нормальность распределения, то, в случае недостоверности коэффициента корреляции Пирсона, следует проверить наличие связи еще и по коэффициенту Спирмена.

Пример 8.3.

Ранговым коэффициентом корреляции можно выявлять взаимосвязи между переменными, имеющими любые статистические распределения. Но если эти переменные имеют нормальное распределение (Гаусса), то более точно связь можно установить с помощью нормированного (Бравэ-Пирсона) коэффициента корреляции.

Предположим, что в нашем примере и - отвечают закону нормального распределения, и проверим наличие связи между результатами тестаX и Y c помощью расчета нормированного коэффициента корреляции.

Из формулы (1) видно, что для вычисления необходимо найти средние значения признаковX, Y и отклонения каждого статистического данного от его среднего . Зная эти значения, можно найти суммы по которым не сложно вычислить

По данным таблице 5 заполним таблицу 7:

Таблица 7

962 = 9216 10,7 0,6 0,62 = 0,36 96 · 0,6 = 57,6
262 = 676 10,5 0,4 0,42 = 0,16 26 · 0,4 = 10,4
10,3 0,2 0,04 5,4
- 4 9,8 - 0,3 0,09 1,2
10,1 0,00 1,0
10,5 0,4 0,16 3,2
- 92 9,1 - 1,0 1,00 9,2
- 64 9,6 - 0,5 0,25 32,0
= 23262 = 2,06 = 201

Подставив сумму столбца 7 в числитель формулы (1), а суммы столбцов 3 и 6 в знаменатель, получим:

Вывод:

а) т.к. значение коэффициента корреляции положительное (0.92>0) , то между Х и Y наблюдается прямая связь, т.е. с увеличением скорости разбега (признакY ) увеличивается длина прыжка (признак Х ) и наоборот - с уменьшением скорости разбега уменьшается длина прыжка. Очень важно знать уверенность в правильности полученного вывода.




Top