Экспоненциальная корреляционная функция. Устройство для определения параметров экспоненциально косинусной корреляционной функции. Корреляционный анализ в Excel

Уже использовалась с целью показать, как работает широкая шина в повороте. Пусть полукруг в нижней части – это часть шины (ее поперечный срез), которая в точке Пк контактирует с дорожным полотном. Желтые кружки в верхней части – центры масс: Цм – мотоцикла, Цп – пилота, Цс – системы «пилот-мотоцикл». Пунктирная линия, проходящая через Цм и поперечный срез шины - линия вертикальной симметрии байка.

Все остальное я отдаю на откуп вашему воображению, пользуясь которым, вы можете вообразить, например, CBR600RR и симпатичную девушку в качестве ее пилота. Это может быть прекрасное утро и горный серпантин. Допустим, она только что обогнала вас и едет впереди, при этом дорога уходит вправо, и вы оба закладываете байки в правый поворот. Эх… скорей бы лето.
На Рис.1 изображены основные силы, которые при этом будут действовать на мотоциклы, изображены графически в виде векторов. При этом направление вектора указывает на направление действия силы, а его длина пропорциональна величине действующей силы.
Силы, сверху вниз:

Цб. – центробежная сила. Сила, которая пытается вас опрокинуть и вытолкать наружу поворота. Сила приложена к центру масс и направлена горизонтально влево.
Тж. – сила тяжести. Сила, с которой все, что так или иначе относится к планете Земля, притягивается по направлению к ее центру. Сила приложена к центру масс и направлена вертикально вниз.
Тж.+Цб. – результат совместного действия центробежной и силы тяжести. Геометрически представляет собой сумму векторов Тж. и Цб. Сила направлена в точку контакта шины с дорогой. Это является условием поддержания равновесия в повороте(далее станет яснее почему).

Если на этом остановится, то наша условная модель мотоцикла завертится в спираль и направится куда-то к центру планеты, т.к. перечисленные силы останутся ничем не скомпенсированы. В реальности же, покуда есть дорога под колесами, этого не произойдет. Наличие опоры рождает силы равные по величине и противоположные по направлению силам уже обозначенным:

Оп. – реакция опоры. Сила направлена вертикально вверх и равна по величине силе тяжести.
Тр. – сила трения. Рождается в паре с любой силой, которая пытается сдвинуть объект относительно поверхности, на которой он находится. В нашем случае работает в паре с центробежной силой.
Тр.+Оп. – результат совместного действия сил реакции опоры и трения. Сила равна по величине и противоположна по направлению силе Тж.+Цб.

Теперь, когда каждая сила работает в паре, система находится в равновесии. Для девушки-пилота Хонды и для вас, едущего за ней, подобное равновесие значит только одно - вы остаетесь стабильны на всем протяжении поворота.

Представим теперь, что вы проходите этот поворот впервые. И сначала девушка, а потом и вы вдруг понимаете, что его радиус уменьшается, но вы все еще не видите выхода. На Рис.1 , т.е. для текущей модели вашего движения, уменьшающийся радиус поворота будет означать рост центробежной силы. Красный вектор Цб отмеченный на рисунке моделирует эту ситуацию. При этом изменится и результирующий вектор Тж+Цб . Теперь он направлен не в пятно контакта, а в точку находящуюся снаружи от траектории движения. Это означает, что теперь сила Тж+Цб пытается опрокинуть байк с некоторым плечом L наружу поворота.

Понимая, что вас выталкивает наружу, вы можете попытаться рулением вернуть изменивший направление вектор Тж+Цб обратно в пятно контакта и следовать исходной траектории. Смотрим Рис.2. Для этого вам придется наклонить байк ниже и, в нашем случае, необходимый угол наклона составит 62 градуса (на рисунке отмечен угол относительно дороги в 28 градусов. 90-28=62 – угол относительно вертикали или угол наклона). В теории это возможно. На практике, угол наклона в 60 градусов будет предельным даже для «боевого» спортивного мотоцикла moto GP класса. Понимая это, и то что одно лишь руление в подобном случае подведет вас вплотную к пределу возможностей мотоцикла, ни девушка, ни вы, будучи в здравом уме, рисковать не намерены (ведь выхода из поворота еще не видно). Вы принимаете решение свесится с байка в сторону поворота.

На Рис.3 видно, что смещая свой центр тяжести (Цп) вниз, вы смещаете и общий с мотоциклом центр тяжести (Цс) вниз. Это позволяет вам не только вернуть вектор Тж.+Цп. в пятно контакта, но при этом сохранить относительно безопасный угол наклона мотоцикла.

Вот, собственно и все. Надеюсь, кому-то это поможет или натолкнет на интересные вопросы и более подробное изучение темы.

P.s. догнали ли вы потом девушку или нет - решайте сами)).

Если задавать вопрос "почему велосипед не падает?" всем подряд, то большинство, скорее всего, не смогут ответить на него. Просто пожмут плечами. Меньшая часть, считающая себя технически грамотными людьми, ответит, что это, вероятно, из-за эффекта гироскопа. И, наверно, будут удивлены, узнав, что гироскоп не имеет к этому никакого отношения, это показал эксперимент в котором нивелировали этот эффект, а велосипед продолжал ехать. И лишь незначительное меньшинство ответит правильно. Итак, почему не падают велосипедисты?

Велосипед не падает из-за центробежной силы

Для сохранения равновесия любого тела необходимо, чтобы перпендикуляр, опущенный из центра его тяжести, не выходил за площадь опоры. Чем меньше последняя, тем менее устойчиво положение.

Площадь опоры велосипеда предельно мала – по сути, она представляет собой прямую линию, проведенную между точками касания колесами земли. Поэтому велосипед (с велосипедистом или без него) не может стоять, находясь в неподвижном положении. Но при движении устойчивость чудесным образом возвращается к нему. Почему это происходит?

Все дело в центробежной силе, которая возникает при подруливании. Если движущийся велосипед начинает наклоняться в какую-нибудь сторону, велосипедист слегка поворачивает руль в сторону наклона, заставляя машину поворачиваться. При этом возникает центробежная сила, направленная в сторону, противоположную наклону. Она-то и возвращает велосипед в вертикальное положение. Двухколесный велосипед не способен ехать строго по прямой. Если его руль зафиксировать в неподвижном положении, он обязательно упадет, потому что исключается возможность подруливания.

Этот процесс – отклонение от вертикали и возвращение к ней – происходит непрерывно. Велосипедист даже не задумывается о том, что происходит. Его руки автоматически совершают подруливание, которое необходимо для сохранения вертикального положение. К слову сказать, именно в приобретении автоматизма подруливания и состоит обучение езды на велосипеде.

Конструкция велосипеда и поддержание равновесия

Конструкция рулевой колонки и передней вилки велосипеда облегчает автоматическое поддержание равновесия. Ось рулевой колонки (передней вилки) проходит не вертикально, а наклонно к земле. Точка ее пересечения с грунтом располагается впереди того места, где переднее колесо соприкасается с дорогой. Такая схема способствует тому, что если переднее колесо случайно отклоняется от среднего положения, сразу возникает момент реактивных сил, который возвращает его на место.

При наклоне велосипеда реакция опоры переднего колеса, которая приложена в точке его касания с землей и направлена вверх, автоматически поворачивает колесо в сторону наклона. Возникает центробежная сила и велосипед возвращается в вертикальное положение.

Для лучшего понимания этого процесса, нужно просто принять во внимание, что схема сил, действующих на переднее колесо велосипеда, является примерно такой же, как и у тележек с вращающимися колесами. В какую сторону тележку не толкать, колеса автоматически поворачиваются в нужном направлении. Кстати, именно эта особенность конструкции велосипеда обеспечивает возможность езды, не держась руками за руль. Велосипед самостоятельно поддерживает равновесие. А чтобы выполнить поворот, достаточно сместить центр тяжести своего тела в сторону.

Степень способности конкретного велосипеда поддерживать динамическое равновесие определяется конструкцией его рулевой колонки и вилки. Главный параметр здесь – расстояние от точки соприкосновения переднего колеса с землей, до точки пересечения оси рулевой колонки (передней вилки) с грунтом. Как уже говорилось, последняя находится впереди первой. Реактивный момент, действующий на колесо при его повороте, будет тем выше, чем больше это расстояние. Для оптимальных динамических характеристик велосипеда требуется не самый большой, а строго определенный реактивный момент. Слишком малый уменьшит автоматическое поддержание равновесия, чрезмерно большой – приведет к возникновению «шимми». Поэтому наклон оси рулевой колонки и параметры передней вилки при проектировании велосипеда выбираются очень тщательно.

Что такое «шимми»

При высокой скорости (выше 30 км/час) переднее колесо велосипеда может начать самопроизвольно вилять вправо-влево. Это явление, которое, кстати, имеет место и в авиации, называется «speed wobbles» или «шимми». Причина его заключается не в неисправности велосипеда (плохой сборке или ослаблении креплений), а в том, что возникает резонанс переднего колеса. «Шимми» очень опасно в том случае, когда велосипедист едет «без рук», то есть не держится за руль. Чтобы погасить возникший резонанс, нужно снизить скорость или изменить позу.

Велосипед – энергоэффективней

По затратам энергии на единицу преодоленного расстояния велосипед эффективней не только ходьбы, но и езды на автомобиле. При движении велосипеда со скоростью 30 км/час тратится 15 ккал на 1 км. Ходьба со скоростью 5 км/час приводит к сжиганию 60 ккал на 1 км. То есть по энергозатратам на единицу расстояния движение на велосипеде в 4 раза эффективнее ходьбы.


… и функциональней

Если рассматривать езду на велосипеде с точки зрения спортивной нагрузки, то она тоже оказывается предпочтительней ходьбы. Катание на велосипеде отнимает 450 ккал в час, в то время как при ходьбе тратится только 300 ккал. Конечно, физическую нагрузку можно увеличить, перейдя с шага на бег. Но в этом случае возрастает нагрузка на колени и голеностопные суставы, что нежелательно, поскольку со временем может привести к травме этих проблемных мест.

Когда женщины быстрее

Тренированный мужчина, даже не будучи профессиональным спортсменом, может длительное время развивать мощность 250 Вт или 0,33 л. с. При езде на велосипеде по ровной дороге это примерно соответствует скорости 30 км/час. Женщины не могут развивать такой мощности, как мужчины, но в расчете на единицу веса их энергетические показатели превосходят мужские. При езде по ровной дороге, когда вся мощность тратится в основном на преодоление сопротивления воздуха, женщины едут медленнее, чем мужчины. Зато при езде в гору, когда энергия тратится на преодоление силы тяжести, они способны ехать быстрее сильной половины.

РАССЕЯНИЕ НА СТАТИСТИЧЕСКИ НЕРОВНОЙ ПОВЕРХНОСТИ С ПРОИЗВОЛЬНЫМИ КОРРЕЛЯЦИОННЫМИ СВОЙСТВАМИ

В. В. Ахияров

МГТУ им. Н.Э. Баумана

Аннотация. Р ассмотрено решение задачи рассеяния на статистически неровной поверхности методом Монте-Карло. Представлен алгоритм формирования ансамбля поверхностей с требуемыми корреляционными свойствами. Приведены индикатрисы рассеяния на поверхностях с гауссовой и экспоненциальной функциями корреляции, а также на многомасштабной поверхности.

Ключевые слова: рассеяние радиоволн, метод Монте-Карло.

Abstract. T he solution of scattering by a statistically rough surface using the Monte - Carlo method is considered . The formation technique of statistically rough surfaces with specified correlation function is presented. Scattering indicatrices for surfaces with Gaussian and exponential correlation functions , as well as for multiscale surface, are shown.

Keywords: radiowave scattering, Monte-Carlo simulation.

Как правило, задача рассеяния на статистически неровной поверхности решается методами статистической радиофизики (метод малых возмущений, метод касательной плоскости и т.д.). При этом полагается, что неровности являются гладкими и пологими, что соответствует гауссовой корреляционной функции рассеивающей поверхности . Такая идеализация является удобной, но не всегда оправданной, поскольку в реальных условиях характер неровностей может быть произвольным. Поэтому в настоящее время для решения задачи рассеяния широко используется м етод Монте-Карло, который заключается в численном решении задачи дифракции на ансамбле случайных поверхностей и статистической обработке полученных реализаций рассеянных волновых полей. По сравнению с методами статистической радиофизики такой подход является более универсальным, поскольку он не накладывает строгих ограничений на статистические характеристики рассеивающей поверхности.

В данной работе для простоты неровности поверхности считаются цилиндрическими с образующими, параллельными оси Y (см. рис.1). Статистическими характеристиками такой поверхности являются среднеквадратичное отклонение (СКО) s относительно среднего уровня , интервал корреляции l и корреляционная функция .

Рис.1. Геометрия задачи.

Каждую возможную реализацию рассеивающей поверхности можно рассматривать как процесс на выходе фильтра с импульсной характеристикой , которая связана с выражением :

. (1)

Если на вход фильтра подается белый шум с математическим ожиданием и СКО s , то функция случайных высот определяется интегралом свертки :

. (2)

В области пространственных частот свертка (2) соответствует произведению спектров импульсной характеристики и белого шума. Поэтому формирование функции удобно выполнять с использованием преобразования Фурье .

Рассмотрим алгоритм решения задачи дифракции на случайной идеально проводящей поверхности при горизонтальной поляризации падающего поля (ТЕ-поляризация). Для расчета поверхностной плотности тока используется скалярное интегральное уравнение Фредгольма первого рода [ , ]:

, (3)

где – искомая плотность поверхностного электрического тока, – падающее поле на рассеивающей поверхности, – функция Ганкеля второго рода нулевого порядка, x и x ¢ – точки наблюдения и интегрирования, – волновое сопротивление свободного пространства, волновое число .

В дальней зоне рассеянное поле определяется выражением [ , ]:

, (4)

где q s – угол рассеяния (см. рис.1).

Для ограничения области расчетов на интервале интегрирования поле источника моделируется волновым пучком :

, (5)

где q i угол падения (от вертикали),

, (6)

а параметр g выбирается в соответствии с условием:

, . (7)

Решение задачи дифракции для ансамбля рассеивающих поверхностей позволяет определить коэффициент рассеяния :

, (8)

а также коэффициенты когерентного и некогерентного рассеяния:

, (9.а)

. (9.б)

где * – комплексное сопряжение, – дисперсия флуктуаций рассеянного поля:

.

Рассмотрим результаты решения задачи рассеяния для ансамблей поверхностей с гауссовой

(10)

И экспоненциальной

(11)

корреляционными функциями.

Необходимо отметить, что использование кривой Гаусса (10) дает удовлетворительное согласие с экспериментом при вычислении рассеянного поля только вблизи зеркальных углов. Использование экспоненциальной корреляционной функции в ряде случаев позволяет получить лучшее соответствие экспериментальных и теоретических результатов .

Высоты неровностей рассеивающих поверхностей полагаются малыми (в масштабе длины волны), т.е. выполняется критерий Релея :

, (12)

где x высота отдельной неровности.

На рис.2 представлены индикатрисы рассеяния на поверхности с гауссовой функцией корреляции для угла падения (направление облучения здесь и далее на всех рисунках показано стрелкой). Каждая поверхность размером была сформирована из значений случайных высот , СКО неровностей , интервал корреляции , усреднение проводилось по реализациям рассеянного поля (здесь и далее считаем, что единицей измерения D , s и l является длина электромагнитной волны).

Рис.2. Индикатрисы рассеяния на поверхности с гауссовой

Из представленного рисунка видно, что рассеяние в зеркальном направлении обусловлено когерентной составляющей , а форма индикатрисы некогерентного рассеяния близка к гауссовой.

Результаты расчетов для ансамбля поверхностей с экспоненциальной функцией корреляции представлены на рис.3. Исходные данные – те же, что и в предыдущем случае: , , , , . Сравнение результатов, представленных на рис.2 и рис.3, свидетельствует о том, амплитуда когерентной составляющей в обоих случаях остается примерно постоянной, а увеличение рассеяния в зеркальном направлении при экспоненциальной корреляции обусловлено вкладом некогерентного рассеяния.

Рис.3. Индикатрисы рассеяния на поверхности с экспоненциальной

функцией корреляции при и .

Сплошная линия – , пунктир – , точки – .

, (13)

где a - произвольное нечетное число, .

На рис.4 показаны результаты расчетов по формуле (13) при и на интервале . Видно, что увеличенный участок подобен всей функции, т.е. форма поверхности не изменяется от того, рассматриваем мы ее вблизи или издалека. Следует отметить, что данная функция является непрерывной и не дифференцируема ни в одной точке.

Рис.4. Функция Вейерштрасса.

Чтобы сформировать ансамбль реализаций многмасштабных поверхностей, требуется вычислить корреляционную функцию выражения (13). Для расчетов были выбраны следующие значения: , , и , при этом можно ограничиться четырьмя членами ряда в формуле (13).

На рис.5 представлена возможная реализация многомасштабной рассеивающей поверхности со значением СКО , на рис.6 – нормированная корреляционная функция (сплошная кривая – исходная функция, кружки – расчеты для ансамбля из реализаций). Видно, что исходная функция и результаты моделирования практически совпадают.

Рис.5. Возможная реализация рассеивающей поверхности.

Рис.6. Нормированная корреляционная функция.

Сплошная линия – исходные данные, кружки – результат моделирования.

Далее были выполнены расчеты коэффициентов рассеяния для ансамбля многомасштабных поверхностей при углах падения (рис.7.а) и (рис.7.б). Поскольку неровности являются малыми в масштабе длины волны, наблюдается интенсивное когерентное рассеяние в зеркальном направлении.

Рис.7. Индикатрисы рассеяния при и

и различных углах падения: а – ; б – .

Сплошная линия – , пунктир – , точки – .

Рис.8. Брэгговское рассеяние на многомасштабной поверхности.

Индикатрисы некогерентного рассеяния имеют характерную особенность в виде двух пиков, сдвинутых относительно зеркального направления (на рис.7 они отмечены цифрами 1 и 2). Известно, что механизм рассеяния на многомасштабной поверхности является брэгговским , а поскольку исходная функция Вейерштрасса (13) была получена суммированием периодических функций при различных значениях n , следует предположить, что интенсивному некогерентному рассеянию соответствует . На рис.8 представлена геометрия задачи с использованием следующих обозначений: g 1 , g 2 , K 1 и K 2 – отклонения от зеркального направления и соответствующие волновые векторы, K – волновой вектор в направлении зеркального рассеяния:

. (14)

Вектор определяется соотношением: , формула для определения его модуля приведена в : , тогда при получим . Далее с использованием (14) можно определить углы рассеяния g 1 и g 2 . Проще всего это сделать для случая : , что примерно соответствует представленным на рис.7.а результатам.

Помимо этого, при наблюдается еще один пик, отмеченный цифрой 3 на рис.7.б. Поскольку его амплитуда меньше, чем у пиков 1 и 2, можно предположить, он соответствует случаю , т.е. рассеянию более высокого порядка.

Следует отметить, что индикатрисы рассеяния, подобные представленным на рис.7.а, наблюдались экспериментально в оптическом диапазоне . Экспериментальные образцы рассеивающих поверхностей были созданы искусственно: стеклянная пластина покрывалась фоторезистом, засвечивалась лазером и далее на полученную спекл-структуру наносилось тонкое металлическое покрытие. В ходе экспериментов при угле падения были получены индикатрисы рассеяния с тремя пиками: центральным и двумя симметричными относительно направления обратного рассеяния. Симметричные пики имели меньшую амплитуду, а их отклонение от направления находились в пределах .

Представленные в данной работе результаты свидетельствуют о том, что метод Монте-Карло является эффективным инструментом для численного решения задачи рассеяния радиоволн и при его использовании практически не накладываются ограничения на статистические характеристики поверхности.

Литература

1. Басс Ф.Г., Фукс И.М. Рассеяние волн на статистически неровной поверхности. М.: Наука. 1972.

2. Левин Б.Р. Теоретические основы статистической радиотехники. Книга первая. М.: Сов. Радио . 1969.

3. Wagner R.I., Song J., Chew W.C. Monte Carlo Simulation of Electromagnetic Scattering from Tow-Dimentional Random Rough Surfaces //IEEE Trans. 1997. V . AP-45. No. 2. P. 235–245.

4. Axline R.M., Fung Adrian K. Numerical Computation of Scattering from a Perfectly Conducting Random Surface // IEEE Trans. 1978. V . AP-26. No. 3. P. 482–488.

5. Fung A.K., Chen M.F. Numerical Simulation of Scattering from Simple and Composite Random Surfaces // J. Opt. Soc. Am. A. 1985. V. 2. No. 12. P.2274– 2284.

6. Toporkov J.V., Awadallah R.S., Brown G.S. Issues Related to the Use of a Gaussian-Like Incident Field for Low-Grazing-Angle Scattering // J. Opt. Soc. Am. A. 1999. V. 16. No. 1. P. 176-187.

7. Dwight L. J., Sun X. Scattering from fractally corrugated surface // J. Opt. Soc. Am. A. 1990. V. 7. No. 6. P. 1131-1139.

8. O’Donnell K.A., Mendez E.R. Experimental Study of Scattering from Characterized Random Surfaces // J. Opt. Soc. Am. A. 1987. V. 4. No. 7. P. 1194-1205.

Регрессионный и корреляционный анализ – статистические методы исследования. Это наиболее распространенные способы показать зависимость какого-либо параметра от одной или нескольких независимых переменных.

Ниже на конкретных практических примерах рассмотрим эти два очень популярные в среде экономистов анализа. А также приведем пример получения результатов при их объединении.

Регрессионный анализ в Excel

Показывает влияние одних значений (самостоятельных, независимых) на зависимую переменную. К примеру, как зависит количество экономически активного населения от числа предприятий, величины заработной платы и др. параметров. Или: как влияют иностранные инвестиции, цены на энергоресурсы и др. на уровень ВВП.

Результат анализа позволяет выделять приоритеты. И основываясь на главных факторах, прогнозировать, планировать развитие приоритетных направлений, принимать управленческие решения.

Регрессия бывает:

  • линейной (у = а + bx);
  • параболической (y = a + bx + cx 2);
  • экспоненциальной (y = a * exp(bx));
  • степенной (y = a*x^b);
  • гиперболической (y = b/x + a);
  • логарифмической (y = b * 1n(x) + a);
  • показательной (y = a * b^x).

Рассмотрим на примере построение регрессионной модели в Excel и интерпретацию результатов. Возьмем линейный тип регрессии.

Задача. На 6 предприятиях была проанализирована среднемесячная заработная плата и количество уволившихся сотрудников. Необходимо определить зависимость числа уволившихся сотрудников от средней зарплаты.

Модель линейной регрессии имеет следующий вид:

У = а 0 + а 1 х 1 +…+а к х к.

Где а – коэффициенты регрессии, х – влияющие переменные, к – число факторов.

В нашем примере в качестве У выступает показатель уволившихся работников. Влияющий фактор – заработная плата (х).

В Excel существуют встроенные функции, с помощью которых можно рассчитать параметры модели линейной регрессии. Но быстрее это сделает надстройка «Пакет анализа».

Активируем мощный аналитический инструмент:

После активации надстройка будет доступна на вкладке «Данные».

Теперь займемся непосредственно регрессионным анализом.



В первую очередь обращаем внимание на R-квадрат и коэффициенты.

R-квадрат – коэффициент детерминации. В нашем примере – 0,755, или 75,5%. Это означает, что расчетные параметры модели на 75,5% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо – выше 0,8. Плохо – меньше 0,5 (такой анализ вряд ли можно считать резонным). В нашем примере – «неплохо».

Коэффициент 64,1428 показывает, каким будет Y, если все переменные в рассматриваемой модели будут равны 0. То есть на значение анализируемого параметра влияют и другие факторы, не описанные в модели.

Коэффициент -0,16285 показывает весомость переменной Х на Y. То есть среднемесячная заработная плата в пределах данной модели влияет на количество уволившихся с весом -0,16285 (это небольшая степень влияния). Знак «-» указывает на отрицательное влияние: чем больше зарплата, тем меньше уволившихся. Что справедливо.



Корреляционный анализ в Excel

Корреляционный анализ помогает установить, есть ли между показателями в одной или двух выборках связь. Например, между временем работы станка и стоимостью ремонта, ценой техники и продолжительностью эксплуатации, ростом и весом детей и т.д.

Если связь имеется, то влечет ли увеличение одного параметра повышение (положительная корреляция) либо уменьшение (отрицательная) другого. Корреляционный анализ помогает аналитику определиться, можно ли по величине одного показателя предсказать возможное значение другого.

Коэффициент корреляции обозначается r. Варьируется в пределах от +1 до -1. Классификация корреляционных связей для разных сфер будет отличаться. При значении коэффициента 0 линейной зависимости между выборками не существует.

Рассмотрим, как с помощью средств Excel найти коэффициент корреляции.

Для нахождения парных коэффициентов применяется функция КОРРЕЛ.

Задача: Определить, есть ли взаимосвязь между временем работы токарного станка и стоимостью его обслуживания.

Ставим курсор в любую ячейку и нажимаем кнопку fx.

  1. В категории «Статистические» выбираем функцию КОРРЕЛ.
  2. Аргумент «Массив 1» - первый диапазон значений – время работы станка: А2:А14.
  3. Аргумент «Массив 2» - второй диапазон значений – стоимость ремонта: В2:В14. Жмем ОК.

Чтобы определить тип связи, нужно посмотреть абсолютное число коэффициента (для каждой сферы деятельности есть своя шкала).

Для корреляционного анализа нескольких параметров (более 2) удобнее применять «Анализ данных» (надстройка «Пакет анализа»). В списке нужно выбрать корреляцию и обозначить массив. Все.

Полученные коэффициенты отобразятся в корреляционной матрице. Наподобие такой:

Корреляционно-регрессионный анализ

На практике эти две методики часто применяются вместе.

Пример:


Теперь стали видны и данные регрессионного анализа.

И корреляция

1.1. Понятие регрессии

Парной регрессией называется уравнение связи двух переменных у и х

вида y = f (x ),

где у – зависимая переменная (результативный признак); х – независимая, объясняющая переменная (признак-фактор).

Различают линейные и нелинейные регрессии.

Линейная регрессия описывается уравнением: y = a + b × x +e .

Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.

Примеры регрессий, нелинейных по объясняющим переменным, но ли-

нейных по оцениваемым параметрам:

· полиномы разных степеней

· равносторонняя гипербола:

Примеры регрессий, нелинейных по оцениваемым параметрам:

· степенная

· показательная

· экспоненциальная

Наиболее часто применяются следующие модели регрессий:

– прямой

– гиперболы

– параболы

– показательной функции

– степенная функция

1.2. Построение уравнения регрессии

Постановка задачи. По имеющимся данным n наблюдений за совместным

изменением двух параметров x и y {(xi ,yi ), i=1,2,...,n} необходимо определить

аналитическую зависимость ŷ=f(x) , наилучшим образом описывающую данные наблюдений.

Построение уравнения регрессии осуществляется в два этапа (предполагает решение двух задач):

– спецификация модели (определение вида аналитической зависимости

ŷ=f(x) );

– оценка параметров выбранной модели.

1.2.1. Спецификация модели

Парная регрессия применяется, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной.

Применяется три основных метода выбора вида аналитической зависимости:

– графический (на основе анализа поля корреляций);

– аналитический, т. е. исходя из теории изучаемой взаимосвязи;

– экспериментальный, т. е. путем сравнения величины остаточной дисперсии D ост или средней ошибки аппроксимации , рассчитанных для различных

моделей регрессии (метод перебора).

1.2.2. Оценка параметров модели

Для оценки параметров регрессий, линейных по этим параметрам, используется метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических значений ŷx при тех же значениях фактора x минимальна, т. е.

В случае линейной регрессии параметры а и b находятся из следующей

системы нормальных уравнений метода МНК:

(1.1)

Можно воспользоваться готовыми формулами, которые вытекают из этой

(1.2)

Для нелинейных уравнений регрессии, приводимых к линейным с помощью преобразования (x , y ) → (x’ , y’ ), система нормальных уравнений имеет

вид (1.1) в преобразованных переменных x’ , y’ .

Коэффициент b при факторной переменной x имеет следующую интерпретацию: он показывает, на сколько изменится в среднем величина y при изменении фактора x на 1 единицу измерения .

Гиперболическая регрессия :

x’ = 1/x ; y’ = y .

Уравнения (1.1) и формулы (1.2) принимают вид

Экспоненциальная регрессия:

Линеаризующее преобразование: x’ = x ; y’ = lny .

Модифицированная экспонента : , (0 < a 1 < 1).

Линеаризующее преобразование: x’ = x ; y’ = ln y – К│.

Величина предела роста K выбирается предварительно на основе анализа

поля корреляций либо из качественных соображений. Параметр a 0 берется со

знаком «+», если y х > K и со знаком «–» в противном случае.

Степенная функция:

Линеаризующее преобразование: x’ = ln x ; y’ = ln y .

Показательная функция:

Линеаризующее преобразование: x’ = x ; y’ = lny .

https://pandia.ru/text/78/146/images/image026_7.jpg" width="459" height="64 src=">

Парабола второго порядка :

Парабола второго порядка имеет 3 параметра a 0, a 1, a 2, которые определяются из системы трех уравнений

1.3. Оценка тесноты связи

Тесноту связи изучаемых явлений оценивает линейный коэффициент

парной корреляции rxy для линейной регрессии (–1 ≤ r xy ≤ 1)

и индекс корреляции ρxy для нелинейной регрессии

Имеет место соотношение

Долю дисперсии, объясняемую регрессией , в общей дисперсии результативного признака у характеризует коэффициент детерминации r2xy (для линейной регрессии) или индекс детерминации (для нелинейной регрессии).

Коэффициент детерминации – квадрат коэффициента или индекса корреляции.

Для оценки качества построенной модели регрессии можно использовать

показатель (коэффициент, индекс) детерминации R 2 либо среднюю ошибку аппроксимации.

Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше модель описывает исходные данные.

Средняя ошибка аппроксимации – среднее относительное отклонение

расчетных значений от фактических

Построенное уравнение регрессии считается удовлетворительным, если

значение не превышает 10–12 %.

1.4. Оценка значимости уравнения регрессии, его коэффициентов,

коэффициента детерминации

Оценка значимости всего уравнения регрессии в целом осуществляется с

помощью F -критерия Фишера.

F- критерий Фишера заключается в проверке гипотезы Но о статистической незначимости уравнения регрессии. Для этого выполняется сравнение

фактического F факт и критического (табличного) F табл значений F- критерия

Фишера.

F факт определяется из соотношения значений факторной и остаточной

дисперсий, рассчитанных на одну степень свободы

где n – число единиц совокупности; m – число параметров при переменных.

Для линейной регрессии m = 1 .

Для нелинейной регрессии вместо r 2 xy используется R 2.

F табл – максимально возможное значение критерия под влиянием случайных факторов при степенях свободы k1 = m , k2 = n – m – 1 (для линейной регрессии m = 1) и уровне значимости α.

Уровень значимости α вероятность отвергнуть правильную гипотезу

при условии, что она верна. Обычно величина α принимается равной 0,05 или

Если F табл < F факт, то Н0 -гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл > F факт, то гипотеза Но не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Для оценки статистической значимости коэффициентов линейной регрессии и линейного коэффициента парной корреляции применяется

t- критерий Стьюдента и рассчитываются доверительные интервалы каждого

из показателей.

Согласно t- критерию выдвигается гипотеза Н0 о случайной природе показателей, т. е. о незначимом их отличии от нуля. Далее рассчитываются фактические значения критерия t факт для оцениваемых коэффициентов регрессии и коэффициента корреляции путем сопоставления их значений с величиной стандартной ошибки

Стандартные ошибки параметров линейной регрессии и коэффициента

корреляции определяются по формулам

Сравнивая фактическое и критическое (табличное) значения t- статистики

t табл и t факт принимают или отвергают гипотезу Но.

t табл – максимально возможное значение критерия под влиянием случайных факторов при данной степени свободы k = n– 2 и уровне значимости α.

Связь между F- критерием Фишера (при k 1 = 1; m =1) и t- критерием Стьюдента выражается равенством

Если t табл < t факт, то Но отклоняется, т. е. a, b и не случайно отличаются

от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл > t факт, то гипотеза Но не отклоняется и признается случайная природа формирования а, b или https://pandia.ru/text/78/146/images/image041_2.jpg" width="574" height="59">

F табл определяется из таблицы при степенях свободы k 1 = 1, k 2 = n –2 и при

заданном уровне значимости α. Если F табл < F факт, то признается статистическая значимость коэффициента детерминации. В формуле (1.6) величина m означает число параметров при переменных в соответствующем уравнении регрессии.

1.5. Расчет доверительных интервалов

Рассчитанные значения показателей (коэффициенты a , b , ) являются

приближенными, полученными на основе имеющихся выборочных данных.

Для оценки того, насколько точные значения показателей могут отличаться от рассчитанных, осуществляется построение доверительных интервалов.

Доверительные интервалы определяют пределы, в которых лежат точные значения определяемых показателей с заданной степенью уверенности, соответствующей заданному уровню значимости α.

Для расчета доверительных интервалов для параметров a и b уравнения линейной регрессии определяем предельную ошибку Δ для каждого показателя:

Величина t табл представляет собой табличное значение t- критерия Стьюдента под влиянием случайных факторов при степени свободы k = n –2 и заданном уровне значимости α.

Формулы для расчета доверительных интервалов имеют следующий вид:

https://pandia.ru/text/78/146/images/image045_3.jpg" width="188" height="62">

где t γ – значение случайной величины, подчиняющейся стандартному нормальному распределению, соответствующее вероятности γ = 1 – α/2 (α – уровень значимости);

z’ = Z (rxy) – значение Z- распределения Фишера, соответствующее полученному значению линейного коэффициента корреляции rxy .

Граничные значения доверительного интервала (r– , r+ ) для rxy получаются

из граничных значений доверительного интервала (z– , z+ ) для z с помощью

функции, обратной Z- распределению Фишера

1.6. Точечный и интервальный прогноз по уравнению линейной

регрессии

Точечный прогноз заключается в получении прогнозного значения уp , которое определяется путем подстановки в уравнение регрессии

соответствующего (прогнозного
) значения x p

Интервальный прогноз заключается в построении доверительного интервала прогноза, т. е. нижней и верхней границ уpmin, уpmax интервала, содержащего точную величину для прогнозного значения https://pandia.ru/text/78/146/images/image050_2.jpg" width="37" height="44 src=">

и затем строится доверительный интервал прогноза , т. е. определяются нижняя и верхняя границы интервала прогноза

Контрольные вопросы:

1. Что понимается под парной регрессией?

2. Какие задачи решаются при построении уравнения регрессии?

3. Какие методы применяются для выбора вида модели регрессии?

4. Какие функции чаще всего используются для построения уравнения парной регрессии?

5. Какой вид имеет система нормальных уравнений метода наименьших квадратов в случае линейной регрессии?

6. Какой вид имеет система нормальных уравнений метода наименьших квадратов в случае гиперболической, показательной регрессии?

7. По какой формуле вычисляется линейный коэффициент парной корреляции r xy ?

8. Как строится доверительный интервал для линейного коэффициента парной корреляции?

9. Как вычисляется индекс корреляции?

10. Как вычисляется и что показывает индекс детерминации?

11. Как проверяется значимость уравнения регрессии и отдельных коэффициентов?

12. Как строится доверительный интервал прогноза в случае линейной регрессии?

Лабораторная работа № 1

Задание.1 На основании данных табл. П1 для соответствующего варианта (табл. 1.1):

1. Вычислить линейный коэффициент парной корреляции.

2. Проверить значимость коэффициента парной корреляции.

3. Построить доверительный интервал для линейного коэффициента парной корреляции.

Задание. 2 На основании данных табл. П1 для соответствующего варианта (табл. 1.1):

1. Построить предложенные уравнения регрессии, включая линейную регрессию.

2. Вычислить индексы парной корреляции для каждого уравнения.

3. Проверить значимость уравнений регрессии и отдельных коэффициентов линейного уравнения.

4. Определить лучшее уравнение регрессии на основе средней ошибки аппроксимации.

5. Построить интервальный прогноз для значения x = x max для линейного

уравнения регрессии.

Требования к оформлению результатов

Отчет о лабораторной работе должен содержать разделы:

1. Описание задания;

2. Описание решения лабораторной работы (по этапам);

3. Изложение полученных результатов.

Таблица П1

Исходные данные к лабораторным работам1, 2

Наличие предметов длительного пользования в домашних хозяйствах по регионам Российской Федерации (европейская часть территории без республик Северного Кавказа) (по материалам выборочного обследования бюджетов домашних хозяйств; на 100 домохозяйств; штук)




Top