(Самвел @ 05.03.2015 02:20)
К сожелению да, это исход-частота, как вы это называете. Априори принимали что контроль это 100% и увы данные окончательные и пересчитать нельзя. Я понимаю что дизайн был не совсем корректный, но других данных нет, а ребят жалко, много работы. Вопрос собствено вот в чем, можно ли считать эти данные как есть ановой. Если никак нельзя то (1) почему и (2) как лучше посчитать чтобы минимально потерять мощность и в тоже время былобы статистически грамотно. Спасибо.
1). Как было бы грамотнее. Если условия эксперимента стандартизованы, в одинаковых тестах должны получаться близкие значения. Ну, например, для контроля 256, 280, 220 каких-то единиц, а в варианте опыта - 74, 90, 64 единицы.
Эти сырые данные и есть собственно данные и собираться должны именно они. Тогда никаких проблем для анализа ановой бы не возникло. А для демонстрации величины эффекта относительно контроля можно их пересчитать в % от контроля, показать на графике и обсуждать. Даже если вариабельность между репликами эксперимента велика, её просто нужно грамотно учесть в ходе дисперсионного анализа - в точности аналогично анализу повторных измерений. Скорее всего, у ребят, которых жалко, такие исходные данные есть. Иначе нечего их жалеть
! Если выложите такие 20 х 5 цифр - попробуем обсчитать корректно ановой.
2). Могу допустить, что по какой-то нехорошей методике, результаты
должны пересчитываться в % от контроля. Тогда хуже. Ановой это не обсчитать, программы откажутся. В качестве несколько провокационного предложения могу предложить искусственно уменьшить одно из пяти 100% на небольшую величину, ну, например, взять не 100%, а 99,9%. Это позволит технически избежать проблемы с нулевой дисперсией. Ясно, что это не очень хорошо, но на подобные вещи иногда идут. Так, при вычислении отношения правдоподобия (G-критерий) за логарифм ячеек с нулевым значением принимают ноль, хотя реально он не ноль, а вообще не определён или же добавляют ко всем ячейкам константу. Константу добавляют к нулям чтобы избежать сходных проблем при работе с композиционными данными, и др. Если добавление константы практикуется для обхода технических сложностей, то почему бы что-то не отнять? Например 0,1 из одной 100?
Однако здесь есть ещё подводные камни: распределение % априори ненормальное. Т.е. для ановы данные в % нужно предварительно преобразовать угловым преобразованием. Например, фи-преобразованием (преобразованием арксинуса): фи=2*arcsin(sqrt(p)), где р - частота в долях единицы, те. % делённых на 100.
3). Чтобы не мудрить, я бы обсчитал такие данные по Краскелу - Уоллису. И программы посчитают, и преобразовывать ничего не нужно. Для сравнения с контрольной группой в рамках критерия Краскела - Уоллиса используют критерий (метод) Стилла (Still test) - это прямой ранговый аналог критерия Даннетта (Dunnett test) для сравнения с контрольной группой в рамках дисперсионного коммплекса; есть в KyPLot. Для множественных сравнений (не только с контролем) в рамках К - У можно использвовать методы Данна (есть в безымянном виде в Statistica), Стилла - Двасса (есть в KyPLot) и др. методы (есть в R).