Факультет

Студентам

Посетителям

Современные статистические методы в сельскохозяйственных исследованиях

Современные статистические методы совершили революцию в проведении эксперимента в большинстве областей сельскохозяйственных исследований.

Эти методы широко используются и приспособлены к сбору, классификации и интерпретации количественных данных. Они измеряют и объясняет эффекты случайной изменчивости. Они включают вычисление констант, как, например, значение средних и проценты. В современном эксперименте используют стандартное отклонение, коэффициент вариации, дисперсионный анализ, коэффициенты корреляции, регрессию, ковариансы и т. д. Эти величины связаны со случайными изменениями в противоположность систематическим ошибкам или отклонениям. Остаточная изменчивость, обусловленная неконтролируемыми причинами, обычно называется экспериментальной ошибкой.

Экспериментальная ошибка. При испытании гибридов всегда наблюдается некоторая степень изменчивости признаков растения. Такая изменчивость может быть обусловлена отсутствием точности при измерении результатов. Обычно изменчивость обусловлена сочетанием факторов.

Салмон и Хансон указали, что эксперимент принципиально отличается от наблюдения явления в природе тем, что большинство условий, влияющих на результат, контролируется или оценивается. Климатические и погодные условия не могут контролироваться. Почва, вредные насекомые и возбудители болезней могут лишь частично контролироваться, и иногда полностью оценить их трудно или невозможно. Обычно лучшее, что можно сделать, это поставить эксперимент таким образом, чтобы все сравниваемые переменные были подвергнуты действию одинаковых условий, и по возможности фиксировать действие неконтролируемых условий на экспериментальные результаты. Например, в испытаниях урожайности кукурузы все образцы следует высевать в один день с одинаковой нормой высева и на одном и том же выравненном поле, которое предварительно было подготовлено и удобрено по возможности равномерно. Все образцы должны иметь одинаковые условия для проявления максимальной урожайности.

Отдельные растения в поле могут быть генетически сходны. Однако урожайность может изменяться от растения к растению вследствие различий в топографии участка, плодородия почвы, количества доступной влаги и других факторов. Случайные ошибки всегда вероятны, но вероятные ошибки не обязательно случайны. Зашедшая в поле корова может уничтожить растения на некоторых делянках или их частях. Захождение коровы в поле может быть случайным, но колебания урожайности не будут случайными.

Другие ошибки. Салмон и Хансон обсуждали вопрос, почему возникают ошибки. Важным источником ошибок является слишком большая готовность принять правдоподобные теории и частая тенденция придерживаться их и после того, как они перестали быть полезными. Другим частым источником ошибок может быть слишком большое доверие к обобщениям, полученным в лабораторных и тепличных экспериментах. Большинство лабораторных экспериментов должно быть проверено в полевых условиях. Около 50 лет назад на выставках кукурузы в США победители определялись на основании искусственных выставочных стандартов. Эти стандарты основное внимание уделяли выравненности початков и зерен, цилиндрическим или слегка коническим початкам с глубокими сильно зубовидными зернами и прямыми рядами зерен на початке. Особое значение придавалось выравненности початков и зерна по размеру, форме и окраске. Освобождение от иллюзии началось, когда несколько скептиков провели полевые испытания, в которых семена от початков, получивших призы, сравнивались с семенами, отобранными на том же поле. В действительности выставки были конкурсами красоты початков и мало были связаны с испытанием урожайности.

Выбор места. Почвенные и климатические условия контрольного поля должны быть сходными с теми, в которых культура будет выращиваться фермерами. Другим требованием для проведения удовлетворительных испытаний урожайности является выравненность поля. На многих полях почва неоднородна из-за различий топографии, плодородия, влажности и предшествующих культур. Природа и степень неоднородности почвы может быть определена при помощи испытаний на однородность или холостых проб.

Бун предложил способы для сохранения однородности опытного поля и пригодности его для повторного использования. Исследования показали, что для большинства экспериментальных сельскохозяйственных работ необходимы по возможности максимально однородные условия. Обычно необходимо повторное использование опытных полей. В некоторых исследовательских программах неоднородность может увеличиваться, уменьшая пригодность полей для повторного использования. Проведение других экспериментальных исследований может влиять на однородность в меньшей степени. Четкие экспериментальные планы и различные методы статистического анализа могут уменьшать влияние однородности. Тщательное проведение приемов обработки почвы также может уменьшать причины неоднородности. Обязательными требованиями являются обозначение границ участков и аккуратное ведение записей. Если появляется контролируемая неоднородность (как при изучении плодородия почвы), по завершении исследования на необработанные участки следует внести соответствующие материалы для восстановления однородности. Все внесения как различных, так и однородных материалов должны проводиться аккуратно. Севообороты и вспашка в разных направлениях могут уменьшить неоднородность. Временные проходы между опытными делянками должны обрабатываться во избежание «пограничного эффекта» крайних рядков растений.

Контроль конкуренции. Часто растущие на краях и концах делянок растения оказываются более мощными и урожайными, чем растущие в середине делянки, так как им достается больше удобрений, света и влаги. Конкуренция между сортами, различающимися по группам спелости или размерам, может контролироваться путем многорядного посева участков и удаления крайних рядков перед уборкой урожая. Очевидно, что такая методика требует больше земли и труда, чем работа на делянках меньшего размера.

Гентер обнаружил, что при совместном посеве раннеспелых и позднеспелых гибридов у первых конкуренция была меньше, чем у позднеспелых. На делянках с раннеспелыми гибридами по краям урожайность была в среднем на 5,9% выше.

Размер и форма делянки. Размер и форма делянки влияют на точность опыта. В определенных пределах увеличение размера делянки обычно приводит к уменьшению ошибки оценки урожайности по одной делянке. Однако увеличение размера делянки также увеличивает площадь занятой блоками земли, что обычно приводит к увеличению гетерогенности в пределах блоков. Оптимальный размер делянки обычно является компромиссом между этими двумя противоположными тенденциями. Опыты показали, что длинные узкие делянки обычно. дают меньшие ошибки, чем квадратные.

Брайан пришел к выводу, что для получения одинаковой точности определения возможной урожайности при изучении гибридов требуется наполовину меньше растений, чем при исследовании свободноопыляющихся сортов кукурузы. Одни исследователи используют делянки 2X5 или 2Х10 гнезд. Другие же используют делянки шириной 4 рядка и длиной 9 м и убирают два центральных рядка самоходным комбайном. В общем при сравнении более однородных простых или трехлинейных гибридов можно использовать меньшие делянки, чем при сравнении двойных гибридов, синтетиков или свободноопыляющихся сортов.

Югенхеймер для предварительного просмотра большого числа контрольных гибридов использовал «микротесты», состоящие из повторяющихся одногнездных делянок. Эффективное использование для испытания одногнездных делянок требует однородной почвы и практически 100%-ной густоты стояния. Однако проводимое в четырех повторностях испытание 2000 гибридов при сравнении в микротестах требует лишь около 0,8 га земли по сравнению с 16 га, необходимыми при испытании на участках 2Х10 гнезд. Очевидно, для предварительной оценки большого числа гибридов легче и дешевле получить 0,8 га однородной почвы, чем 16 га. Экономия земли, работы и времени является дополнительным преимуществом использования микротестов. Они требуют меньше семян и позволяют испытывать больше материала в большем числе повторностей в более разнообразных условиях и дешевле, чем участки большего размера. Микротесты оказались эффективными при оценке урожайности, сроков созревания, высоты растений, высоты прикрепления початков и устойчивости к болезням и вредным насекомым. Однако некоторые исследователи предпочитают для испытания гибридов использовать участки большего размера, для того чтобы наблюдать за большим числом растений.

Шерц сравнил точность одногнездных делянок и делянок 2X8 гнезд при испытании трехлинейных гибридов кукурузы на урожайность, срок созревания, полегание, высоту растений и прикрепления початков. Он нашел, что одногнездные делянки имеют потенциальное значение при предварительном испытании большого числа образцов на некоторые признаки. Одногнездные делянки давали относительно точные результаты при определении полегаемости растений. Результаты в отношении высоты растений и урожайности были неубедительны.

Простой гибрид кукурузы WF9XM14 при испытании однородности выращивался Вернсманом в Де-Калбе (Иллинойс) на 2240 одногнездных делянках по четыре растения в гнезде. Каждое гнезда убирали отдельно. Вес зерна и число неполегших растений на гнезда фиксировали на перфокартах. До анализа данных размер опытной площади был уменьшен с 40X56 до 36X36 гнезд, для того чтобы облегчить размещение на идентичных площадках делянок всех размеров.

Данные по отдельным гнездам объединялись в различных сочетаниях, образуя 57 делянок разных размеров и форм. Для каждого размера делянок была вычислена дисперсия между делянками. Дисперсия на гнездо и относительная эффективность для каждого размера делянок были получены путем деления дисперсии между делянками на число гнезд на делянке и дисперсии одногнездных делянок на дисперсии делянок большего размера соответственно.

Оптимальные размеры делянок для анализа урожайности и неполегаемости растений были определены методом максимальной кривизны и на основании дисперсионного закона Смита. По методу максимальной кривизны на график наносили коэффициент вариации и размер делянок, и было установлено, что оптимальными, для анализа урожайности и неполегаемости растений являются размеры, делянок 1X9 и 1X6 гнезд соответственно.

При использовании второго метода коэффициент регрессии для дисперсии между гнездами и размером делянок оказался 0,72 для урожайности и 0,15 для неполегаемости растений. Коэффициент регрессии для неполегаемости (0,15) был близок к нулю. Это приводит к предположению, что на неполегаемость влияет меньшее число факторов, чем на урожайность. Были определены два фактора стоимости: К2 — часть стоимости, пропорциональная числу делянок на вариант, а К1 — часть стоимости, пропорциональная общей площади на вариант. Эти оценки равны соответственно 74 и 26%. Для оценки оптимальных размеров делянок эти факторы были объединены с коэффициентами регрессии. Оптимальный размер делянок был оценен величинами 7,3 гнезда для урожайности и 5,0 гнезд для неполегаемости, Эти значения хорошо согласуются с предсказаниями, полученными при помощи предыдущего метода анализа. Так как для определения урожайности требуется больший размер делянок, чем для оценки неполегаемости, следует рекомендовать использование большего размера делянок.

Хотя результаты не были статистически достоверны, меньшие дисперсии обычно были связаны с длинными узкими делянками, а не с примерно квадратными делянками равного размера. Меньшие оценки дисперсии были получены при ориентировке длинной оси делянки в направлении градиента плодородия. Однако направление ориентации, дававшее меньшие дисперсии для урожайности, давало большие дисперсии для неполегаемости, что указывает на различие факторов, создающих градиенты для этих двух признаков.

Используя установленные величины дисперсии для каждого размера делянки, было определено необходимое число повторностей для данной степени точности в будущих опытах. Было вычислено, что для выявления 10%-ной разницы между средними по варианту будет необходимо 36 повторностей для одногнездных делянок или 5 повторностей для делянок 1X9 гнезд.

Необходимость повторности. Увеличение числа повторностей обычно уменьшает экспериментальную ошибку в большей степени, чем увеличение размера делянки. Среднее по нескольким повторностям дает более точную оценку признаков образца, чем одна делянка. В общем, точность возрастает пропорционально квадратному корню из числа повторнортей.

Повторность может увеличить масштаб эксперимента. Повторности, различающиеся по плодородию, норме высева и т. д., могут дать дополнительную информацию при испытании. Введение определенных взаимодействий может создать проблемы. Условия в пределах отдельных повторностей должны быть по возможности одинаковы.

Повторности дают информацию, позволяющую оценить неконтролируемую изменчивость, известную как экспериментальная ошибка. Повторности также позволяют использовать схему эксперимента, которая поможет контролировать экспериментальную ошибку.

Число повторностей, требуемых при испытании продуктивности, зависит от изменчивости почвы, изменчивости испытываемого материала, требуемой степени точности и доступного количества семян, земли и труда. В большинстве испытаний продуктивности используется от двух до шести повторностей.

Кармер и Джекобс и Кармер сообщали о числе повторностей, требуемых для точного определения оптимальной густоты стояния растений и максимальной урожайности кукурузы. Связь между урожаем кукурузы и густотой стояния кукурузы может быть выражена моделью экспоненциальной регрессии:

Y = NAKn + ошибка,

где Y — урожай зерна на единицу площади, N — число растений на единицу площади, а A и K — параметры, требующие оценки. На точность оценки A и K в модели экспоненциальной регрессии и на точность оценки оптимальной густоты стояния растений и максимальной урожайности влияет используемый в эксперименте конкретный набор вариантов густоты стояния растений. Методика определения числа повторностей, необходимых для получения разумных пределов точности оценок, описана Кармером. Он также дал два иллюстрирующих примера.

Повторности опыта в данной местности и повторения испытаний в разных местностях и (или) в разные годы выполняют совершенно различные функции. Если основной интерес вызовет определение продуктивности группы гибридов, проявляемой ими в данном районе, число повторностей в пределах каждой местности, достаточное для получения высокой точности, является крайне дорогостоящей процедурой. Наиболее эффективным использованием данного числа делянок будет получение максимально широкой выборки местностей и (или) лет, хотя это может привести к ограничению числа повторностей в каждом отдельном испытании.

Желательность рандомизации. Рандомизация означает случайное размещение каждого образца в пределах повторности. Фишер указал, что рандомизация порядка образцов в блоках позволяет получить несмещенную оценку ошибки. Это гарантирует, что образец каждой повторности не будет постоянно ставиться в выгодное или невыгодное положение известным и неизвестным источником изменчивости. Для рандомизации образцов в каждой повторности можно использовать опубликованные таблицы случайных чисел, пронумерованные шары или карты или специальные компьютерные программы.

Описание мер или статистических терминов. Интерпретация результатов современных испытаний продуктивности включает использование статистики. Поэтому кратко будут рассмотрены некоторые общеупотребительные термины и символы.

Тремя мерами группы или расположения являются:

1. Среднее значение, или средняя арифметическая, — сумма наблюдений или мер, деленная на их число.

2. Мода — класс с наибольшей частотой в выборке.

3. Медиана — среднее из наблюдаемых отдельных значений в серии.

В число нескольких мер вариации или рассеяния входят:

1. Размах — разность между самым большим и самым малым значениями.

2. Стандартное отклонение — мера изменчивости в терминах единиц измерения.

3. Стандартное отклонение выборочной средней измеряет степень вариации средних в серии выборок.

4. Дисперсия — квадрат стандартного отклонения.

5. Коэффициент вариации — мера изменчивости, выраженная в процентах от среднего значения. Он дает возможность сравнивать изменчивость двух популяций с сильно различающимися средними значениями.

Некоторыми мерами связи между переменными являются:

1. Коэффициент корреляции, используемый как мера степени связи между двумя признаками, определяемыми одновременно. Полная положительная корреляция равна +1, а полная отрицательная корреляция равна —1. Отсутствие корреляции обозначается как r=0. Промежуточные значения обозначают промежуточную степень связи. Типами корреляции являются простая, частичная и множественная.

2. Коэффициент регрессии — скорость изменения одной переменной (зависимая переменная) на единицу скорости изменения другой (независимая переменная).

Хантсбергер дает более полное объяснение вышеупомянутых статистических терминов.

Дисперсионный анализ используется для определения статистической значимости результатов путем разделения полной изменчивости на ряд компонентов, приписываемых известным или контролируемым источникам изменчивости, и рассмотрения оставшейся части изменчивости, обусловленной неконтролируемыми причинами, которая именуется ошибкой. В то время, как t-критерий оценивает разницу между двумя средними значениями, дисперсионный анализ позволяет оценивать различия между многими средними.

Критерии значимости для группы ранжированных средних были перечислены Федерером. Он рассматривает относительные достоинства следующих критериев.

1. Множественные критерии размаха: НСР (LDS) или множественный t-критерий; критерий Стьюдента-Неймана-Кеулса; множественный критерий размаха Дункана; критерий Тьюки.

2. Множественные F-критерии: критерий наименьшей значимости разности Фишера; критерий множественных сравнений Дункана; критерий Шеффе.

3. Критерий интервалов, выпадов и дисперсии Тьюки.

4. Выбор наибольших n средних из набора v средних значений.