Международный союз по охране новых сортов растений женева


Скачать 402.63 Kb.
НазваниеМеждународный союз по охране новых сортов растений женева
страница1/6
Дата публикации01.04.2013
Размер402.63 Kb.
ТипЛитература
referatdb.ru > Информатика > Литература
  1   2   3   4   5   6







R

TGP/8.5 Проект 2

ОРИГИНАЛ: английский

ДАТА: 8 мая, 2003 г.

МЕЖДУНАРОДНЫЙ СОЮЗ ПО ОХРАНЕ НОВЫХ СОРТОВ РАСТЕНИЙ

ЖЕНЕВА



Сопроводительный документ
к
Общему введению к экспертизе
отличимости, однородности и стабильности и
разработке согласованных описаний новых сортов растений (документ TG/1/3)

^ ДОКУМЕНТ TGP/8
“ИСПОЛЬЗОВАНИЕ СТАТИСТИЧЕСКИХ ПРОЦЕДУР ПРИ
ПРОВЕДЕНИИ ИСПЫТАНИЙ НА ОТЛИЧИМОСТЬ, ОДНОРОДНОСТЬ И СТАБИЛЬНОСТЬ”



^ Раздел TGP/8.5: Статистические методы для экспертизы ООС



Документ разработан экспертами из Соединённого Королевства

подлежит обсуждению

Техническим рабочим органом по автоматизации и компьютерным программам (TWC) на двадцать первой сессии, планируемой к проведению в Tjele, Denmark, с 10 по 17 июня 2003 г.




рАЗДЕЛ 8.5

^ СТАТИСТИЧЕСКИЕ МЕТОДЫ ДЛЯ ЭКСПЕРТИЗЫ ООС 3


8.5.1 АНАЛИЗ ОШИБКИ (ANALYSIS OF VARIANCE - ANOVA) 3

Двухфакторный ANOVA 3

Модель данных 3

Анализ двухфакторной таблицы 5

Однофакторный ANOVA 7

Модель данных 7

Анализ однофакторной таблицы 8

Допущения в отношении данных 9

Точность средних значений и различия между средними значениями 10

^ Сравнение средних значений 11

ANOVA’s более высоких порядков 11

Несбалансированные данные и метод подгоночных констант 12

Попарный t-test 13

Попарный t-test с использованием one-sample t-test для отличий 14

Попарный t-test с использованием двухфакторного anova 14

ЛИТЕРАТУРА 15

ПРИЛОЖЕНИЯ 16

^ ПРИЛОЖЕНИЕ A1 16

Пример двухфакторного ANOVA (того же рода, как Пример A) 16

Пример двухфакторного ANOVA (того же рода, как Пример B) 17

ПРИЛОЖЕНИЕ A2 19

Пример однофакторного anova (того же рода, как Пример C) 19

Пример однофакторного anova (того же рода, как Пример D) 20

^ ПРИЛОЖЕНИЕ A3 22

Пример попарного t-test (того же рода, как Пример E) 22

Попарный t-test с использованием one-sample t-test для отличий 22

Попарный t-test с использованием двухфакторного ANOVA 23



^

рАЗДЕЛ 8.5

СТАТИСТИЧЕСКИЕ МЕТОДЫ ДЛЯ ЭКСПЕРТИЗЫ ООС

8.5.1 АНАЛИЗ ОШИБКИ (ANALYSIS OF VARIANCE - ANOVA)





  1. Анализ ошибки (ANOVA) данных проведённого опыта имеет две цели. Во-первых, в нём общая изменчивость данных подразделяется на отдельные составляющие, где каждая составляющая представляет свой источник изменчивости, так что может быть оценена относительная значимость каждого источника. Во-вторых, он обеспечивает оценку случайной изменчивости данных. Это может быть использовано в качестве оценки достоверности при сравнении вычисленных средних величин.




  1. ANOVA может иметь множество форм. Здесь в подробностях будет обсуждаться только две формы. Имеется две формы, которые являются частью статистических методов, рекомендованных УПОВ. В простейшей своей части они оба оперируют с nm таблицей данных. Это:-




  • Двухфакторный ANOVA, - напр., используется в анализе годовых сортовых средних по некоторому признаку у v сортов, выращенных в каждом из y лет, оцененных по критерию «объединённая по годам отличимость» (Combined Over Years Distinctness (COYD)). Попарный t-test - это особый случай двухфакторного anova.




  • Однофакторный ANOVA, - напр., используется в анализе годовых данных по сортам, преобразованных в log(SD+1)’s (мера однородности) по некоторому признаку у v реферативных сортов, выращенных в каждом из y лет, оцененных по критерию «объединённая по годам однородность» (Combined Over Years Uniformity (COYU)).




  1. Применение конкретной формы ANOVA зависит от происхождения данных. Это определяет модель данных, т.е. те факторы, которые, по всей вероятности, вызывают изменчивость данных, что в свою очередь определяет, на какие составляющие подразделяется общая вариация и, следовательно, форму ANOVA.



^

Двухфакторный ANOVA




Модель данных






  1. В двухфакторном ANOVA, таблица данных, размерностью nm, соответствует nm значениям данных, характеризующимся двумя факторами: Фактор 1 с m уровнями и Фактор 2 с n уровнями. Обычно заинтересованность будет только в одном из факторов, в то время как другой будет присутствовать просто потому, что он поясняет изменчивость данных. Например, (Пример А) каждое значение данных может быть средним по всем растениям на делянке для некоторого признака в испытании из vb делянок, заложенных в b блоках (Фактор 1) по v сортам (Фактор 2) - фактор, представляющий интерес.


  2. Альтернативно, для упомянутого выше примера COYD (Пример B), значения данных могут состоять из vy годовых сортовых средних значений для некоторого признака по v сортам (Фактор 2, - фактор, представляющий интерес), выращенных в каждом из y лет (Фактор 1).

  3. Если x представляет собой одно из nm значений данных из таблицы данных nm, то модель, поясняющая вариацию в данных выглядит следующим образом :-

Таким образом, каждое из nm значений данных состоит из суммы эффектов (воздействий/влияний). “Эффект фактора 1” и “эффект фактора 2” образуются вследствие конкретных уровней фактора 1 и 2, воздействующих на значения данных. Взаимодействие между факторами осуществляется тогда, когда эффекты одного фактора отличаются, т.е. не согласуются, от уровня к уровню другого фактора. Так, взаимодействие Фактор 1 х Фактор 2 имеет место, когда эффекты Фактора 1 отличаются от уровня к уровню Фактора 2. В модели, представленной выше, остаточная дисперсия данных – это величина, дополнительная к эффекту Фактора 1 и эффекту Фактора 2, которая появляется вследствие особой комбинации уровней фактора 1 и 2. Это величина может быть следствием частью подлинного взаимодействия или же может быть лишь следствием случайной вариации (изменчивости). Поскольку имеется только одно единственное значение данных для каждой комбинации уровней Фактора 1 и Фактора 2, - невозможно определить следствием чего именно.


  1. Для Примера A модель, поясняющая вариацию в данных, выглядит следующим образом:

В данном примере каждое из vb значений данных (одно для каждой из vb делянок) состоит из суммы «эффект блока», который зависит от того, в каком блоке расположена делянка, плюс «эффект сорта» – зависит от того, какой сорт посеян на делянке, плюс остаточная дисперсия. Эта остаточная дисперсия представляет собой величину, дополнительную к эффектам сорта и блока. Поскольку имеется лишь одно единственное значение данных по каждому сорту в каждом блоке, невозможно разделить эффекты взаимодействия и случайную вариацию. Однако, поскольку ожидается, что сортовые эффекты не различаются от блока к блоку, или, другими словами, взаимодействие сорт х блок считается незначительным, остаток, по всей вероятности, является следствием случайной вариации.


  1. Для Примера B (COYD) модель, поясняющая вариацию в данных, выглядит следующим образом:-

Здесь каждое из vy годовых сортовых средних состоит из суммы эффектов. «Эффект года» – величина, образующаяся в зависимости от года, в котором было зарегистрировано годовое среднее по сорту. Годовые эффекты могут быть, а могут и не быть одинаковыми по всем годам. «Эффект сорта» - величина, образующаяся в зависимости от того, для какого сорта вычисляется годовое сортовое среднее, и может быть, а может и не быть одинаковым для всех сортов. Остаточная дисперсия представляет собой величину, дополнительную к эффекту сорта и эффекту года, которая появляется вследствие выращивания конкретного сорта в конкретном году. Эта величина может быть частью следствием подлинного взаимодействия сорт х год или же может быть только следствием случайной вариации, вызванной тем, что средние значения были вычислены на разном числе растений, выращенных на разных делянках, и, возможно следствием ошибки измерения. Поскольку имеется лишь одно единственное годовое сортовое среднее по каждому сорту в каждом году, оказывается невозможным провести различие между эффектами взаимодействия и случайной вариацией.

^

Анализ двухфакторной таблицы





  1. В результате применения двухфакторного ANOVA получается след. таблица:-

Источник вариации

Степени свободы

Сумма квд-тов

Средний квадрат

F-коэфф.

Фактор 1

m - 1

-

-

-

Фактор 2

n - 1

-

-

-

Остаточная

(n - 1)(m - 1)

-

-




Общая

nm - 1

-








[Поскольку вычисления ANOVA, вероятнее всего, будут выполняться на компьютере, подробности здесь не приведены. Заинтересованный читатель может найти их в надлежащей лит-ре по статистике, как, например, DAGNELIE (1998 и 1981), Kala (2002), Mead et al (1993), и Sokal and Rohlf (1995).]


  1. Для Примера A, таблица двухфакторного ANOVA выглядит след. образом:-

Источник вариации

Степени свободы

Сумма квд-тов

Средний квадрат

F-коэфф.

Блок

b - 1

-

-

-

Сорт

v - 1

-

-

-

Остаточная

(b - 1)(v - 1)

-

-




Общая

vb - 1

-










  1. Для Примера В (COYD), таблица двухфакт. ANOVA выглядит след. образом:-

Источник вариации

Степени свободы

Сумма квд-тов

Средний квадрат

F-коэфф.

Год

y - 1

-

-

-

Сорт

v - 1

-

-

-

Остаточная

(y - 1)(v - 1)

-

-




Общая

vy - 1

-










  1. Общая вариация данных измеряется общей суммой квадратов, которая есть сумма квадратов отклонений всех значений от их средних величин, т.е. . Она подразделяется на «суммы квадратов», представляющих три составляющих источника вариации, заключенные в модели данных: вариацию вследствие Фактора 1, вариацию вследствие Фактора 2 и остаточную вариацию. Эти суммы квадратов разделяются по их степеням свободы (df), которые дают «средние квадраты», которые могут подвергнуться прямому сравнению, для того чтобы оценить относительные величины разных источников вариации. Это выполняется в последней графе, где F-коэффициенты – это отношение каждого из средних квадратов по фактору 1 и фактору 2 к среднему квадрату остатка. При условии допущений, обсуждаемых ниже, о действительности данных, сравнение этих F-коэффициентов с F-табличным по количеству степеней свободы df для средних квадратов в числителе и знаменателе даст «“F-test’s» по значимости вариации вследствие присутствия факторов 1 и 2, т.е. проверку, оказывают ли факторы 1 и 2 значительные воздействия.

  2. Средний квадрат остатка есть ошибка. Она оценивает объединённую вариацию вследствие взаимодействия Фактор 1 х Фактор 2 и случайной вариации. Следовательно, на неё часто ссылаются как на «средний квадрат фактор1-на-фактор 2» (“Factor 1-by-Factor 2 mean square”), напр., «средний квадрат сорт-на-блок» (“variety-by-block mean square”) в Примере A, или «средний квадрат сорт-на-год» (“variety-by-year mean square”) в примере COYD (Пример B).




  1. Статистика показывает, что в двухфакторном ANOVA допустимо воспользоваться средним квадратом остатка для оценки ошибки или стандартных ошибок средних значений, вычисленных с использованием данных. Это – случай, когда взаимодействие Фактор 1 х Фактор 2 полагается незначительным, как в Примере А, или же существенным, как примере COYD (Пример B).




  1. Рабочие примеры двухфакторного ANOVA даны в Приложении A1. Они такого же рода, как Примеры А и В выше.



^

Однофакторный ANOVA

Модель данных





  1. В однофакторном ANOVA, таблица данных, размерностью nm , соотносится с данными, подразделёнными на m групп по единственному фактору, представляющему интерес, так что в пределах каждой группы имеются n независимых повторений. Важно отметить, что повторения не взаимосвязаны в пределах каждой группы, т.е. нет ничего общего между ith повторением в одной группе и ith повторением в другой группе. Например, (Пример С) каждое значение данных может представлять собой урожайность с делянки в испытании из tr делянок, заложенных в r повторениях по каждой из t обработок (фактор, представляющий интерес). Или же каждое значение данных может быть средней величиной по всем растениям на делянке по некоторому признаку и для tr делянок.






  1. Альтернативно, как в приведённом выше примере COYU (Пример D), они могут состоять из годовых данных по сортам, преобразованным в log(SD+1)’s для v реферативных сортов (повторений), выращенных в каждом из y лет (фактор, представляющий интерес); данные – по некоторому признаку.




  1. Читатель может удивиться, увидев преобразованные в log(SD+1)’s данные по v сортам за год, с которыми обращаются как с повторениями, а не как со вторым фактором, как в двухфакторном ANOVA. Год включён в ANOVA в качестве фактора потому, что можно ожидать, что предельные уровни однородности, приведённые к log(SD+1)’s, изменяются от года к году. Однако, обращение с уровнями однородности v сортов, которые они демонстрируют в течение года, как с повторениями, позволяет, чтобы вариация между ними использовалась в качестве оценки случайной вариации в однородности между реферативными сортами, которые все считаются однородными. Это закладывается для того, чтобы эта оценка случайной вариации в однородности между (однородными) реферативными сортами использовалась для сравнения однородности сорта-кандидата со средней однородностью (однородных) реферативных сортов. Это выполняется для того чтобы понять, насколько экстремально однородность сорта-кандидата отличается от однородности реферативных сортов.




  1. Если x представляет собой одно из nm значений данных в таблице данных, размерностью nm, модель, поясняющая вариацию данных, выглядит следующим образом: -


x = эффект фактора + случайная вариация
Таким образом, каждое из nm значений данных состоит из суммы «эффект фактора», образующегося вследствие конкретного уровня фактора, воздействующего на значения данных, плюс величина остатка, которая есть случайная вариация. Это означает, что вариация между значениями данных в пределах группы считается случайной вариацией.


  1. Для Примера C, модель, поясняющая вариацию данных, выглядит следующим образом:-

x = эффект обработки + случайная вариация
Здесь каждая из tr деляночных урожайностей есть сумма “эффекта обработки», образующегося вследствие обработки делянки, и величины остатка вследствие случайной вариации.


  1. Для Примера D (COYU), модель, поясняющая вариацию данных, выглядит следующим образом:-

x = эффект года + случайная вариация
Здесь каждое из vy годовых значений по сорту, переведённых в log(SD+1)’s, т.е. меры однородности, есть сумма “эффекта года” и величины остатка вследствие случайной вариации. Это равнозначно признанию того, что, по всей вероятности, однородность год от года изменяется, и, как ожидается, будет варьировать случайным образом от сорта к сорту в пределах года. Замечание: отсутствие сортового эффекта в модели указывает на то, что в течение года, не считая случайной вариации, ожидается, что однородность будет одинаковой по всем реферативным сортам.

^

Анализ однофакторной таблицы





  1. В результате применения однофакторного ANOVA получается следующая таблица:-

Источник вариации

Степени свободы

Сумма квд-тов

Средний квадрат

F-коэфф.

Фактор

m - 1

-

-

-

Остаточная

m(n - 1)

-

-




Общая

nm - 1

-








[Опять-таки, подробности вычислений ANOVA здесь не приведены, но их можно найти в DAGNELIE (1998 и 1981), Kala (2002), Mead et al (1993), и Sokal and Rohlf (1995).]


  1. Для Примера C, таблица однофакторного ANOVA выглядит след. образом:-

Источник вариации

Степени свободы

Сумма квд-тов

Средний квадрат

F-коэфф.

Обработка

t - 1

-

-

-

Остаточная

t(r - 1)

-

-




Общая

tr - 1

-









  1. Для Примера D (COYU), таблица однофакторного ANOVA выглядит след. образом:-

Источник вариации

Степени свободы

Сумма квд-тов

Средний квадрат

F-коэфф.

Год

y - 1

-

-

-

Остаточная

y(v - 1)

-

-




Общая

vy - 1

-










  1. Общая вариация данных подразделяется на “суммы квадратов”, представляющие двухкомпонентные источники вариации в модели данных, т.е. вариацию по фактору, представлящему интерес и остаточную, или случайную вариацию. Суммы квадратов разделяются по их степеням свободы (df), чтобы получить непосредственно сравнимые «средние квадраты», используемые для сравнения двух источников вариации. Это выполняется в последней графе, где F-коэффициент это отношение среднего квадрата фактора к среднему квадрату остатка. При условии выполнения допущений, обсуждаемых ниже, о действительности данных, сравнение F-коэффициента с F-табличным по числу степеней свободы m - 1 и m(n - 1) даст «“F-test’s» по значимости вариации вследствие фактора, представляющего интерес, т.е. проверку, оказывает ли этот фактор значительное воздействие.




  1. Средний квадрат остатка – это мера, объединяющая группы вариации данных от повторения к повторению в пределах группы. Таким образом, это есть ошибка (variance), и она оценивает случайную вариацию для nm таблицы данных, которая подверглась анализу. Следовательно, она может использоваться для оценки ошибки или стандартных ошибок (variance or standard errors) средних значений.




  1. Рабочие примеры однофакторного ANOVA даны в Приложении A2. Они такого же рода, как Примеры C и D, приведённые выше.



^

Допущения в отношении данных


  1. Для применения однофакторного и двухфакторного ANOVA необходимы два допущения. Это:-


(a) изменчивость (variability) данных в таблице данных, размерностью nm, должна быть одна и та же для разных уровней различаемых факторов.

Так, для двухфакторного ANOVA допускается, что изменчивость vb средних значений одинаковая по всем сортам и всем блокам в Примере А, и что изменчивость vy годовых сортовых средних одинаковая по всем сортам и всем годам в Примере В (COYD).

Для однофакторного ANOVA допускается, что вариация (variation) в урожайности с делянок между повторениями для одной обработки одинаковая для всех обработок в Примере С. Также в однофакторном ANOVA в примере COYU (Пример D) допускается, что вариация между приведёнными log(SD+1)’s разных сортов в пределах года одинакова от года к году;
(b) модель описывает данные адекватно, если эффекты выделяемых факторов являются аддитивными. Например (Пример А), допускается, что ожидаемая разница в значениях данных по двум сортам одинакова для всех блоков.
Неспособность удовлетворить данному допущению приведёт к большим остаткам, поскольку остаток – это часть значения данных, которая не объясняется эффектами аддитивного фактора. Это в свою очередь приведёт к большому среднему квадрату остатка, который даст большие стандартные ошибки средних значений, и поэтому потребуются бóльшие различия между средними величинами факторов, чтобы они были признаны значимыми.
Примером подобной неспособности удовлетворить этому допущению может служить ситуация, когда имеет место взаимодействие сорт-х-год, т.е. когда сортовые эффекты не согласуются по годам в двухфакторном ANOVA, пример COYD (Пример B). Здесь только большие различия между сортами были бы признаны значимыми.


  1. Для F-тестов коэффициентов квадратов средних значений ANOVA и t-тестов, основанных на средних квадратах ANOVA (или эквивалентного использования LSD’s, основанных на средних квадратах ANOVA) также необходимо допустить, что значения данных независимы, и что случайная вариация данных имеет приблизительно нормальное распределение.



^

Точность средних значений и различия между средними значениями


  1. Пусть и будут средними значениями факторов для и значений данных из таблицы данных, размерностью nm, которые подверглись анализу ANOVA (или получены от эквивалентных данных). Точность среднего значения , где i = 1 или 2, измеряется стандартной ошибкой (), которая вычисляется по формуле:



Где RMS – это средний квадрат остатка (residual mean square), полученного ANOVA на nm таблице данных. Точность разницы двух средних значений, , измеряется стандартной ошибкой (), которая вычисляется по формуле



^

Сравнение средних значений


  1. Значимость разницы между и можно проверить:-

  • сравнивая two sample t-статистики с t-табличным Стьюдента при степенях свободы df для RMS, либо используя one-tailed test, если известно apriori, которое из средних значений будет больше, либо используя two-tailed test - в противоположном случае;

  • или же сравнивая абсолютную разницу между средними значениями, , со 100p% наименьшим значимым отличием (least significant difference (LSD)), т.е. сравнивая

с

г


де t есть 100p% critical value (критическое значение) из t-таблиц Стьюдента со степенями свободы df для RMS. Критическое значение должно быть one-tailed значением, если известно apriori, которое из средних значений больше, и - two-tailed - в противоположном случае.


^

ANOVA’s более высоких порядков


  1. ANOVA была введена как подмножество общей вариации между значениями данных в таблице данных, размерностью nm , так что она :-

  • допускает сравнение различных источников вариации;

  • обеспечивает оценку случайной вариации, затрагивающей nm значений данных.

Таблица nm данных может состоять из средних величин, вычисленных по таблице данных более высокого порядка, как, например, lnm таблице данных или klnm таблице данных. Например, в упомянутом выше two-way ANOVA, пример COYD (Пример B), таблица данных vy содержит годовые сортовые средние значения для v сортов в каждом из y годов, и они могут рассматриваться как вычисленные по lvy таблице средних по делянкам от испытаний с l блоками и v сортами в каждом из y годов. Или же они могут рассматриваться как вычисленные по klvy таблице измерений на k растениях на каждой делянке от испытаний с l блоками и v сортами в каждом из y годов.


  1. Если nm таблица данных принимает форму средних величин, вычисленных на таблице более высокого порядка, экспериментатор может анализировать данные с использованием многофакторного ANOVA, который есть логическое продолжение двухфакторного ANOVA. В данном случае общая вариация подразделяется на компоненты от каждого фактора, состоящие из таблицы данных, плюс компоненты для двухфакторного, трёхфакторного ANOVA и компоненты для более высоких порядков взаимодействий факторов. Как в двухфакторном ANOVA, компоненты вариации могут сравниваться с использованием отношений средних квадратов. Здесь также средний квадрат остатка есть ошибка (variance), которая оценивает случайную вариацию при уровне значений данных из таблице данных, подвергшихся анализу.




  1. Если значения данных заключены в более чем двухфакторную таблицу данных, экспериментатор имеет выбор для анализа их либо с помощью многофакторного ANOVA либо путём вычисления nm таблицы средних величин и применяя двухфакторный ANOVA. Таким образом, вне зависимости от использованного подхода, относительные величины средних квадратов будут одинаковы, и ошибки (variances), оцениваемые по среднему квадрату остатка в двухфакторном ANOVA, могут быть получены на основании средних квадратов, полученных с использованием ANOVA более высоких порядков. Однако для целей COYD важно, что средние значения сортов сравниваются с использованием ошибок (variances) или стандартных ошибок (standard errors), основанных на среднем квадрате, вычисленном по сортам и годам (variety-by-year mean square), в качестве оценки случайной вариации, такой же, как средний квадрат остатка из двухфакторного ANOVA.


^

Несбалансированные данные и метод подгоночных констант


  1. Таблица данных, размерностью nm, которая имеет значение в каждой из nm клеток таблицы, является сбалансированной. Если значения данных отсутствуют в одной или более клеток, она – не сбалансированная, или не полная.




  1. Хотя данные для однофакторного ANOVA были введены для простоты как имеющие одинаковое (n) повторение в каждой из m групп, т.е. сбалансированными, это необязательное требование для однофакторного ANOVA. Если, вместо сбалансированности, данные состоят из общего количества w значений данных, неодинаково повторяющихся в m группах, вычисления идут тем же путём, и таблица ANOVA выглядит похожей на полученную по однофакторному ANOVA, за исключением того, что отличается число степеней свободы df. Общее df равно w-1, факторное df равно m-1, и df остатка вычисляется путём вычитания факторного df из общего df, т.е. (w-1) - (m-1).




  1. В противоположность, данные для двухфакторного ANOVA должны быть сбалансированы. Если данные не сбалансированы, т.е. в некоторых ячейках таблицы nm не содержится данных, двухфакторный ANOVA не может быть применён. Вместо него должны быть использованы некоторые другие методы анализа двухфакторных данных, такие как метод подгоночных констант (Fitting Constants, или Fitcon (Yates (1933)) или ограниченного максимума подобия (restricted maximum likelihood (REML) (Patterson and Thompson (1971)). Несбалансированные данные могут появляться в вышеупомянутом двухфакторном ANOVA, пример COYD (Пример B), если один или более из v сортов либо отсутствовал в испытании, либо был не способен вырасти в одном или более из y лет. Они также появляются при вычислении долгосрочного (Long Term) LSD для использования в долгосрочном COYD. В данном случае должна быть подвергнута анализу таблица годовых сортовых средних значений (variety-by-year means), которая охватывает большее число лет и сортов, чем присутствовали в годы проведения испытаний. Поскольку не все сорта присутствуют во все годы, таблица не сбалансирована. Как и двухфакторный ANOVA, Fitcon подразделяет общую вариацию данных на различные составляющие в зависимости от разных источников вариации, а средний квадрат остатка обеспечивает оценку случайной вариации. Число степеней свободы df – такое же, как для двухфакторного ANOVA, за исключением того, что общее df равно w-1, где w – общее число данных, и df остатка вычисляется путём вычитания df для каждого из факторов 1 и 2 из общего df, т.е. равно (w-1) - (m-1) - (n-1).




  1. Если данные не сбалансированы ни однофакторным anova, ни двухфакторным анализом, таким как Fitcon или REML, стандартные ошибки, необходимые для LSD’s или t-tests для сравнения факторных средних становятся более сложными, потому что они различаются в зависимости от того, какое факторное среднее с каким сравнивается. В однофакторном ANOVA это просто затрагивает повторение факторных средних ( и ), и стандартные ошибки вычисляются как показано выше. В двухфакторном анализе стандартные ошибки дополнительно усложнены, потому что они зависят от пропущенных значений для средних значений двух факторов, подвергающихся сравнению. Однако они с легкостью вычисляются компьютерной программой.


^

Попарный t-test


  1. Попарный t-test это особый случай двухфакторного ANOVA, где фактор, представляющий интерес, имеет лишь два уровня. Так, он применяется, когда имеется n2 таблица данных, соответствующая 2n значениям данных, различаемых по двум факторам: Фактор 1 – с n уровнями и Фактор 2 – фактор, представляющий интерес с 2-мя уровнями.




  1. Примеры попарного t-test:-


(a) Каждое значение данных может быть урожайностью с делянки от испытания с 2b делянками, заложенными в b блоках (Фактор 1) при 2-х обработках (Фактор 2);
(
b) при испытаниях на ООС, когда закладывается особое испытание для проверки отличимости между двумя сортами с использованием дополнительных признаков. В испытании высаживается некоторое число растений. Это повторяется во времени в s независимых посевах. В данном примере (Пример E) значения данных – это 2s средних величин по дополнительному признаку, каждое из которых основывается на фиксированном числе высаженных растений от s посевов (Фактор 1) двух сортов (Фактор 2).


  1. Анализ может проводиться одним из двух следующих способов:-



^

Попарный t-test с использованием one-sample t-test для отличий





  1. Получаем разницу двух значений данных (одно значение данных по каждому из двух уровней Фактора 2, представляющего интерес) для каждого из n уровней Фактора 2. Это даст n различий, обозначенных как di, i=1,…,n. Вычисляются среднее отличие и ошибка отличий (variance of the differences) и используются для получения one sample t-статистики следующим образом:-



где есть среднее отличие, а - стандартная ошибка (standard error) среднего отличимя, и есть ошибка отличий, которая проще вычисляется по формуле: .
При условии, что допущения в отношении данных, обсуждённые выше, действительны, данная t-статистика может сравниваться с t-табличными Стьюдента при n-1 степенях свободы df в one-tailed test, если знак среднего отличия известен a priori, или же в two-tailed test – в противположном случае. Это будет проверка на то, отличается ли существенно от нуля среднее отличие, т.е. имеет ли Фактор 2 значимый эффект.

^

Попарный t-test с использованием двухфакторного anova





  1. Стандартный двухфакторный ANOVA на n2 таблице данных даст таблицу ANOVA с F-коэффициентами для каждого из средних квадратов Факторов 1 и 2, делёнными на средний квадрат остатка. При условии действительности допущений для данных, обсуждённых выше, сравнение этих F-коэффициентов с F-табличными со степенями свободы для средних квадратов в числителе и знаменателе, обеспечит “F-test’s” для проверки, имеют ли Факторы 1 и 2 значимые эффекты.

  2. Для Примера E, двухфакторная таблица ANOVA выглядит следующим образом:-

Источник вариации

Степени свободы

Сумма квд-тов

Средний квадрат

F-коэфф.

Посев

s - 1

-

-

-

Сорт

1

-

-

-

Остаточная

s - 1

-

-




Общая

2s - 1

-










  1. Средний квадрат остатка, полученный в двухфакторном ANOVA может использоваться для оценки ошибки (variance) или стандартных ошибок средних значений (standard errors of means), вычисленных на данных. Они могут использоваться для вычисления two sample t-статистики (или эквивалентного LSD), который может использоваться для проверки значимости отличия между двумя средними значениями по Фактору 2, т.е. проверки, имеет ли Фактор 2 значимый эффект.




  1. Вне зависимости от использованного способа анализа, значимость проверки эффекта Фактора 2 будет одна и та же. Другими словами, значимость в t-test в прежнем методе будет та же самая, что и значимость, полученная в F-test для эффектов Фактора 2, и значимость в t test двух средних значений Фактора 2 – по последнему методу.




  1. Рабочий пример попарного t-test подобного же рода дан в Приложении А3 в виде Примера Е.



ЛИТЕРАТУРА

DAGNELIE Pierre. (1981). ^ Principes d’expérimentation
DAGNELIE Pierre. (1998). Statistique théorique et appliquée volume 2 inférence statistique à une et deux dimensions. Bibliothèque des universités Statistique
Kala, R. (2002). Statystyka dla przyrodnikow, Agric. Univ. of Poznan
Mead, R., Curnow, R. N. and Hasted, R. M. (1993). ^ Statistical Methods in Agriculture and Experimental Biology. Chapman & Hall, London.
Patterson, H. D. and Thompson, R. (1971). Recovery of interblock information when block sizes are unequal. Biometrika, 58, 545-554.
Sokal, R. R. and Rohlf, F. J. (1995). Biometry, W. H. Freeman Company
Yates, F. (1933). The principles of orthogonality and confounding in replicated experiments. Journal of Agricultural Science, Cambridge, 23, 108-45.
  1   2   3   4   5   6

Похожие рефераты:

Международный союз по охране новых сортов растений женева
Tgp/12 1: Признаки, выраженные в ответ на внешние факторы: устойчивость к болезням
Международный союз по охране новых сортов растений женева п роект
Советом на его сорок первой очередной сессии, которая состоится в Женеве, 25 октября 2007г
Международный союз по охране новых сортов растений женева
Техническим Рабочим Органом по автоматизации и компьютерным программам (twc), на двадцатой сессии, планируемой к проведению в Texcoco,...
Международный союз по охране новых сортов растений женева
Техническим Рабочим Органом по автоматизации и компьютерным программам (twc), на двадцать первой сессии, планируемой к проведению...
Статья Роды и виды, подлежащие охране Статья Режим, устанавливаемый...
Конвенция от 2 декабря 1961 г. "Международная конвенция по охране новых сортов растений"
Закон Республики Беларусь от 24 июня 2002 г. №115-з "О присоединении...

Государственное учреждение «Государственная инспекция по испытанию...

Государственное учреждение «Государственная инспекция по испытанию...

Государственное учреждение «Государственная инспекция по испытанию...

Государственное учреждение «Государственная инспекция по испытанию...


Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
referatdb.ru
referatdb.ru
Рефераты ДатаБаза