Систематические и случайные ошибки опыта реферат

Изучение
всех влияющих на исследуемый объект
факторов одновременно провести
невозможно, поэтому в эксперименте
рассматривается их ограниченное число.
Остальные активные факторы стабилизируются,
т.е. устанавливаются на каких-то одинаковых
для всех опытов уровнях.

Некоторые
факторы не могут быть обеспечены
системами стабилизации (например,
погодные условия, самочувствие оператора
и т.д.), другие же стабилизируются с
какой-то погрешностью (например,
содержание какого-либо компонента в
среде зависит от ошибки при взятии
навески и приготовления раствора).
Учитывая также, что измерение
параметра у осуществляется
прибором, обладающим какой-то погрешностью,
зависящей от класса точности прибора,
можно прийти к выводу, что результаты
повторностей одного и того же опыта ук будут
приближенными и должны отличаться один
от другого и от истинного значения
выхода процесса. Неконтролируемое,
случайное изменение и множества других
влияющих на процесс факторов
вызывает случайныеотклонения
измеряемой величины ук от
ее истинного значения — ошибку опыта.

Каждый
эксперимент содержит элемент
неопределенности вследствие ограниченности
экспериментального материала. Постановка
повторных (или параллельных) опытов не
дает полностью совпадающих результатов,
потому что всегда существует ошибка
опыта (ошибка воспроизводимости). Эту
ошибку и нужно оценить по параллельным
опытам. Для этого опыт воспроизводится
по возможности в одинаковых условиях
несколько раз и затем берется среднее
арифметическое всех результатов. Среднее
арифметическое у равно сумме всех n
отдельных результатов, деленной на
количество параллельных опытов n:

Отклонение
результата любого опыта от среднего
арифметического можно представить как
разность y2— ,
где y2 —
результат отдельного опыта. Наличие
отклонения свидетельствует об
изменчивости, вариации значений повторных
опытов. Для измерения этой изменчивости
чаще всего используют дисперсию.

Дисперсией
называется среднее значение квадрата
отклонений величины от ее среднего
значения. Дисперсия обозначается s2 и
выражается формулой:

где
(n-1) — число степеней свободы, равное
количеству опытов минус единица. Одна
степень свободы использована для
вычисления среднего.

Корень
квадратный из дисперсии, взятый с
положительным знаком, называется средним
квадратическим отклонением, стандартом
или квадратичной ошибкой:

Ошибка
опыта является суммарной величиной,
результатом многих ошибок: ошибок
измерений факторов, ошибок измерений
параметра оптимизации и др. Каждую из
этих ошибок можно, в свою очередь,
разделить на составляющие.

Все
ошибки принято разделять на два класса:
систематические и случайные (рисунок
1).

Систематические
ошибки порождаются причинами, действующими
регулярно, в определенном направлении.
Чаще всего эти ошибки можно изучить и
определить количественно. Систематическая
ошибка
 
это ошибка, которая остаётся постоянно
или закономерно изменяется при повторных
измерениях одной и той же величины. Эти
ошибки появляются вследствие неисправности
приборов, неточности метода измерения,
какого либо упущения экспериментатора,
либо использования для вычисления
неточных данных. Обнаружить систематические
ошибки, а также устранить их во многих
случаях нелегко. Требуется тщательный
разбор методов анализа, строгая проверка
всех измерительных приборов и безусловное
выполнение выработанных практикой
правил экспериментальных работ. Если
систематические ошибки вызваны известными
причинами, то их можно определить.
Подобные погрешности можно устранить
введением поправок.

Систематические
ошибки находят, калибруя измерительные
приборы и сопоставляя опытные данные
с изменяющимися внешними условиями
(например, при градуировке термопары
по реперным точкам, при сравнении с
эталонным прибором). Если систематические
ошибки вызываются внешними условиями
(переменной температуры, сырья и т.д.),
следует компенсировать их влияние.

Случайными ошибками
называются те, которые появляются
нерегулярно, причины, возникновения
которых неизвестны и которые невозможно
учесть заранее. Случайные ошибки
вызываются и объективными причинами и
субъективными. Например, несовершенством
приборов, их освещением, расположением,
изменением температуры в процессе
измерений, загрязнением реактивов,
изменением электрического тока в цепи.
Когда случайная ошибка больше величины
погрешности прибора, необходимо
многократно повторить одно и тоже
измерение. Это позволяет сделать
случайную ошибку сравнимой с погрешностью
вносимой прибором. Если же она меньше
погрешности прибора, то уменьшать её
нет смысла. Такие ошибки имеют значение,
которое отличается в отдельных измерениях.
Т.е. их значения могут быть неодинаковыми
для измерений сделанных даже в одинаковых
условиях. Поскольку причины, приводящие
к случайным ошибкам неодинаковы в каждом
эксперименте, и не могут быть учтены,
поэтому исключить случайные ошибки
нельзя, можно лишь оценить их значения.
При многократном определении какого-либо
показателя могут встречаться результаты,
которые значительно отличаются от
других результатов той же серии. Они
могут быть следствием грубой ошибки,
которая вызвана невнимательностью
экспериментатора.

Систематические
и случайные ошибки состоят из множества
элементарных ошибок. Для того чтобы
исключать инструментальные ошибки,
следует проверять приборы перед опытом,
иногда в течение опыта и обязательно
после опыта. Ошибки при проведении
самого опыта возникают вследствие
неравномерного нагрева реакционной
среды, разного способа перемешивания
и т.п.

При
повторении опытов такие ошибки могут
вызвать большой разброс экспериментальных
результатов.

Очень
важно исключить из экспериментальных
данных грубые ошибки, так называемый
брак при повторных опытах. Грубые
ошибки
 легко
обнаружить. Для выявления ошибок
необходимо произвести измерения в
других условиях или повторить измерения
через некоторое время. Для предотвращения
грубых ошибок нужно соблюдать аккуратность
в записях, тщательность в работе и записи
результатов эксперимента. Грубая ошибка
должна быть исключена из экспериментальных
данных. Для отброса ошибочных данных
существуют определённые правила.

Например,
используют критерий Стьюдента t (Р; f):
Опыт считается бракованным, если
экспериментальное значение критерия
t по модулю больше табличного значения
t (Р; f).

Если
в распоряжении исследователя имеется
экспериментальная оценка дисперсии
S2(yk)
с небольшим конечным числом степеней
свободы, то доверительные ошибки
рассчитываются с помощью критерий
Стьюдента t (Р; f):

?()
= t (Р; f)* S(yk)/=
t (Р; f)* S()

?(yk)
= t (Р; f)* S(yk)

6.
Результат прямого измерения
  случайная
величина, подчиняющаяся нормальному
закону распределения

Результаты,
которые получаются при экспериментальном
исследовании какого-либо технологического
процесса, зависят от целого ряда факторов.
Поэтому результат исследования является
случайной величиной, распределённой
по нормальному закону распределения.
Оно названо нормальным, т. к. именно
это распределение для случайной величины
является обычным и
называется гаусовским или лапласским. Под распределением
случайной величины
понимают
совокупность всех возможных значений
случайной величины и соответствующих
им вероятностей.

Законом
распределения случайной величины
 называется
всякое соотношение, устанавливающее
связь между возможными значениями
случайной величины и соответствующим
им вероятностям.

При
экспериментальном исследовании
какого-либо технологического процесса
измеряемый результат последнего является
случайной величиной, на которую оказывает
влияние огромное число факторов
(изменение погодных условий, самочувствие
оператора, неоднородность сырья, влияние
износа измерительной и стабилизирующей
аппаратуры и т.д. и т.п.). Именно поэтому
результат исследования является
случайной величиной, распределенной
по нормальному закону. Однако если
исследователь какой-либо активный
фактор не заметил или отнес его к
неактивным, а неконтролируемое изменение
этого фактора может вызвать несоразмерно
большое изменение эффективности процесса
и параметра, характеризующего эту
эффективность, то распределение
вероятности последнего может нормальному
закону не подчиниться.

Точно
так же приведет к нарушению нормальности
закона распределения наличие в массиве
экспериментальных данных грубых ошибок.
Именно поэтому в первую очередь проводят
анализ на наличие в экспериментальных
данных грубых ошибок с принятой
доверительной вероятностью.

Случайная
величина будет распределена по нормальному
закону, если она представляет собой
сумму очень большого числа взаимно
зависимых случайных величин, влияния
каждой из которых ничтожно мало. Если
измерения искомой величины y проведены
много раз, то результат можно наглядно
представить, построив диаграмму, которая
показывала бы, как часто получались те
или иные значения. Такая диаграмма
называется гистограммой. Что
бы построить гистограмму нужно разбить
весь диапазон измеренных значений на
равные интервалы. И посчитать сколько
раз каждая величина попадает в каждый
интервал.

Если
измерения продолжать до тех пор, пока
число измеренных значений n не станет
очень большим, то ширину интервала можно
сделать очень малой. Гистограмма перейдёт
в непрерывную прямую, которая
называется кривой
распределения
.

В
основе теории случайных ошибок лежат
два предположения:

1.
при большом числе измерений случайные
погрешности одинаково велики, но с
разными знаками встречаются одинаково
часто;

2.
большие (по абсолютной величине)
погрешности встречаются реже, чем малые.
Т. е. вероятность появления погрешности
уменьшается с ростом её величины.

Согласно
закону больших чисел при бесконечно
большом числе измерений n, истинное
значение измеряемой величины y равно
среднеарифметическому значению всех
результатов измерений ?

Для
всех m-повторностей можно записать:

Разделив
это уравнение на число повторностей m,
получим после подстановки:

За
экспериментальную оценку истинного
значения (математического ожидания)
критерия оптимальности у принимается среднеарифметическая
оценка
результатов
всех т повторностей:

Если
число m велико (m>?), то будет справедливо
равенство:

Таким
образом, при бесконечно большом числе
измерений истинное значение измеряемой
величины y равно среднеарифметическому
значению ? всех результатов произведённых
измерений: y=?, при m>?.

При
ограниченном числе измерений (m??)
среднеарифметическое значение y будет
отличаться от истинного значения, т.е.
равенство y=? будет неточным, а приближённым:
y?? и величину этого расхождения необходимо
оценить.

Если
в распоряжении исследователя имеется
только единичный результат измерения
yk,
то оценка истинного значения измеряемой
величины будет менее точной. чем
среднеарифметическая оценка при любом
числе повторностей: |y-?|<|y-yk|.

Появление
того или иного значения yk в процессе
измерения является случайным событием.
Функция плотности нормального
распределения случайной величины
характеризуется двумя параметрами:

·
истинным значением y;

·
среднеквадратичным отклонением ?.

а)
б)

Рисунок
— 1а — кривая плотности нормального
распределения; 1б — кривая плотности
вероятности нормально распределенной
случайной величины при различных
дисперсиях

Плотность
нормального распределения (рис. 1а)
симметрична относительно y и достигает
максимального значения при yk= y, стремится
к 0 при увеличении.

Квадрат
среднеквадратичного отклонения
называется дисперсией случайной величины
и является количественной характеристикой
разброса результатов вокруг истинного
значения y. Мера рассеяния результатов
отдельных измерений yk от среднего
значения ? должна выражаться в тех же
единицах, то и значения измеряемой
величины. В связи с этим в качестве
показателя разброса гораздо чаще
используют величину ?:

Значения
этой величины определяют форму кривой
распределения py. Площади под тремя
кривыми одинаковы, но при малых значения
? кривые идут более круто и имеют большее
значение py. С увеличением ? значение py
уменьшается и кривая распределения
растягивается вдоль оси y. Т.о. кривая 1
характеризует плотность распределения
случайной величины, воспроизводимость
которой в повторных измерениях лучше,
чем воспроизводимость случайных величин
имеющих плотность распределения 2, 4. На
практике не возможно произвести слишком
много замеров. Поэтому нельзя построить
нормальное распределение, чтобы точно
определить истинное значение y. В этом
случае хорошим приближением к истинному
значению можно считать ?, а достаточно
точной оценкой ошибки выборочную
дисперсию ??n, вытекающую из закона
распределения, но относящуюся к конечному
числу измерения. Такое название величины
??n объясняется тем, что из всего множества
возможных значений yk, т.е. из генеральной
совокупности выбирают лишь конечное
число значений равное m, называемых
выборкой, которая характеризуется
выборочным средним значением и выборочной
дисперсией.

Соседние файлы в папке planirovanie

  • #
  • #
  • #
  • #
  • #
  • #

Обработка результатов эксперимента

Обработка результатов эксперимента

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ
1. ОШИБКИ ИЗМЕРЕНИЙ
1.1. Цели математической обработки результатов эксперимента
1.2. Виды измерений и причины ошибок
1.3. Типы ошибок измерения
1.4. Свойства случайных ошибок
1.5. Наиболее вероятное значение измеряемой величины
1.6. Оценка точности измерений
1.7. Понятие доверительного интервала и доверительной вероятности
1.8. Обнаружение промахов
1.9. Ошибки косвенных измерений
1.10. Правила округления чисел
1.11. Порядок обработки результатов измерений
1.12. Обработка результатов измерений диаметра цилиндра
Контрольные вопросы
2. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
2.1. Виды случайных величин и законы их распределения
2.2. Числовые характеристики случайных величин, заданных своими распределениями
2.3. Основные дискретные и непрерывные законы распределения
2.4. Понятие статистической гипотезы и статистического критерия
2.5. Вероятность ошибок первого и второго рода
2.6. Проверка гипотезы вида закона распределения вероятностей
Контрольные вопросы
3. НАХОЖДЕНИЕ ИНТЕРПОЛИРУЮЩИХ КРИВЫХ
3.1. Графический метод обработки результатов
3.2. Функциональные шкалы и их применение
3.3. Аналитические методы обработки результатов
3.3.1. Способ средней
3.3.2. Метод наименьших квадратов
3.3.3. Интерполирование функций
3.3.4. Параболическое интерполирование
Контрольные вопросы
4. ОСНОВЫ НОМОГРАФИИ
4.1. Номограммы в декартовой системе координат
4.2. Составные номограммы с помеченными линиями
Контрольные вопросы
5. ТИПОВЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
ЛИТЕРАТУРА

Изложены некоторые разделы математической обработки результатов наблюдений и экспериментов о действиях со случайными величинами, определения и оценки законов их распределения, аналитического и графического отображения результатов.

ВВЕДЕНИЕ

При исследовании технических систем могут использоваться теоретические и эмпирические методы познания. Каждое из этих направлений обладает относительной самостоятельностью, имеет свои достоинства и недостатки. В общем случае, теоретические методы в виде математических моделей позволяют описывать и объяснять взаимосвязи элементов изучаемой системы или объекта в относительно широких диапазонах изменения переменных величин. Однако при построении теоретических моделей неизбежно введение каких-либо ограничений, допущений, гипотез и т.п. Поэтому возникает задача оценки достоверности ( адекватности ) полученной модели реальному процессу или объекту. Для этого проводится экспериментальная проверка разработанных теоретических моделей. Практика является решающей основой научного познания. В ряде случаев именно результаты экспериментальных исследований дают толчок к теоретическому обобщению изучаемого явления. Экспериментальное исследование дает более точное соответствие между изучаемыми параметрами. Но не следует и преувеличивать результаты экспериментальных исследований, которые справедливы только в пределах условий проведенного эксперимента.

Таким образом, теоретические и экспериментальные исследования дополняют друг друга и являются составными элементами процесса познания окружающего нас мира.

Как правило, результаты экспериментальных исследований нуждаются в определенной математической обработке. В настоящее время процедура обработки экспериментальных данных достаточно хорошо формализована и исследователю необходимо только ее правильно использовать. Круг вопросов, решаемых при обработке результатов эксперимента, не так уж велик. Это
вопросы подбора эмпирических формул и оценка их параметров, вопросы оценки истинных значений измеряемых величин и точности измерений, вопросы исследования корреляционных зависимостей и некоторые другие.

Настоящее учебное пособие не претендует на оригинальность. Оно содержит некоторые результаты фундаментальных и прикладных работ в области обработки результатов экспериментальных исследований [1…13]. Пособие может служить практическим руководством по обработке результатов эксперимента как студентам, так и научным сотрудникам и инженерам.

1. ОШИБКИ ИЗМЕРЕНИЙ

Основой всего естествознания является наблюдение и эксперимент.

Наблюдение
это систематическое, целенаправленное восприятие того или иного объекта или явления без воздействия на изучаемый объект или явление. Наблюдение позволяет получить первоначальную информацию по изучаемому объекту или явлению.

Эксперимент
метод изучения объекта, когда исследователь активно и целенаправленно воздействует на него путем создания искусственных условий или использует естественные условия, необходимые для выявления соответствующих свойств. Достоинствами эксперимента по сравнению с наблюдением реального явления или объекта является:

1. Возможность изучения в “чистом виде”, без влияния побочных факторов, затемняющих основной процесс;

2. В экспериментальных условиях можно получить результат более быстро и точно;

3. При эксперименте можно проводить испытания столько раз, сколько это необходимо.

Результат эксперимента или измерения всегда содержит некоторую погрешность. Если погрешность мала, то ею можно пренебречь. Однако при этом неизбежно возникают два вопроса: во
первых, что понимать под малой погрешностью, и, во
вторых, как оценить величину погрешности. То есть, и результаты эксперимента нуждаются в определенном теоретическом осмыслении.

1.1. Цели математической обработки результатов эксперимента

Целью любого эксперимента является определение качественной и количественной связи между исследуемыми параметрами, либо оценка численного значения какого-либо параметра.

В некоторых случаях вид зависимости между переменными величинами известен по результатам теоретических исследований. Как правило, формулы, выражающие эти зависимости, содержат некоторые постоянные, значения которых и необходимо определить из опыта.

Другим типом задачи является определение неизвестной функциональной связи между переменными величинами на основе данных эксперимента. Такие зависимости называют эмпирическими.

Однозначно определить неизвестную функциональную зависимость между переменными невозможно даже в том случае, если бы результаты эксперимента не имели ошибок. Тем более не следует этого ожидать, имея результаты эксперимента, содержащие различные ошибки измерения.

Поэтому следует четко понимать, что целью математической обработки результатов эксперимента является не нахождение истинного характера зависимости между переменными или абсолютной величины какой-либо константы, а представление результатов наблюдений в виде наиболее простой формулы с оценкой возможной погрешности ее использования.

1.2. Виды измерений и причины ошибок

Под измерением понимают сравнение измеряемой величины с другой величиной, принятой за единицу измерения.

Различают два типа измерений: прямые и косвенные. При прямом измерении измеряемая величина сравнивается непосредственно со своей единицей меры. Например, измерение микрометром линейного размера, промежутка времени при помощи часовых механизмов, температуры
термометром, силы тока
амперметром и т.п. Значение измеряемой величины отсчитывается при этом по соответствующей шкале прибора.

При косвенном измерении измеряемая величина определяется (вычисляется) по результатам измерений других величин, которые связаны с измеряемой величиной определенной функциональной зависимостью. Например, измерение скорости по пройденному пути и затраченному времени, измерение плотности тела по измерению массы и объема, температуры при резании по электродвижущей силе, величины силы
по упругим деформациям и т.п.

При измерении любой физической величины производят проверку и установку соответствующего прибора, наблюдение их показаний и отсчет. При этом никогда истинного значения измеряемой величины не получить. Это объясняется тем, что измерительные средства основаны на определенном методе измерения, точность которого конечна. При изготовлении прибора задается класс точности. Его погрешность определяется точностью делений шкалы прибора. Если шкала линейки нанесена через 1 мм , то точность отсчета 0,5 мм не изменить если применим лупу для рассматривания шкалы. Аналогично происходит измерение и при использовании других измерительных средств.

Кроме приборной погрешности на результат измерения влияет еще ряд объективных и субъективных причин, обуславливающих появление ошибки измерения
разности между результатом измерения и истинным значением измеряемой величины. Ошибка измерения обычно неизвестна, как неизвестно и истинное значение измеряемой величины. Исключение составляют измерения известных величин при определении точности измерительных приборов или их тарировке. Поэтому одной из важнейших задач математической обработки результатов эксперимента и является оценка истинного значения измеряемой величины по данным эксперимента с возможно меньшей ошибкой.

1.3. Типы ошибок измерения

Кроме приборной погрешности измерения (определяемой методом измерения) существуют и другие, которые можно разделить на три типа:

1. Систематические погрешности обуславливаются постоянно действующими факторами. Например, смещение начальной точки отсчета, влияние нагревания тел на их удлинение, износ режущего лезвия и т.п. Систематические ошибки выявляют при соответствующей тарировке приборов и потому они могут быть учтены при обработке результатов измерений.

2. Случайные ошибки содержат в своей основе много различных причин, каждая из которых не проявляет себя отчетливо. Случайную ошибку можно рассматривать как суммарный эффект действия многих факторов. Поэтому случайные ошибки при многократных измерениях получаются различными как по величине, так и по знаку. Их невозможно учесть как систематические, но можно учесть их влияние на оценку истинного значения измеряемой величины. Анализ случайных ошибок является важнейшим разделом математической обработки экспериментальных данных.

3. Грубые ошибки (промахи) появляются вследствие неправильного отсчета по шкале, неправильной записи, неверной установки условий эксперимента и т.п. Они легко выявляются при повторном проведении опытов.

В дальнейшем будем считать, что систематические и грубые ошибки из результатов эксперимента исключены.

1.4. Свойства случайных ошибок

Случайные ошибки бывают как положительные, так и отрицательные разной величины, не превосходящей определенного предела. Если обозначить через Х истинное значение измеряемой величины, а результат первого измерения
а1, то разность

Х а1 = х1 или а1
Х = х1

называют истинной абсолютной ошибкой одного измерения. Одновременно она является случайной (при исключении систематических и грубых ошибок).

Если измерения провести многократно в одних и тех же условиях, то результаты отдельных измерений одинаково надежны. Такую совокупность измерений а1, а2 …аn называют равноточными измерениями. Если проанализировать достаточно большую серию равноточных измерений и соответствующих случайных ошибок измерений, то можно выделить 4 свойства случайных ошибок:

1. Число положительных ошибок почти равно числу отрицательных;

2. Мелкие ошибки встречаются чаще, чем крупные;

  1. Величина наиболее крупных ошибок не превосходит некоторого определенного предела, зависящего от точности измерения. Самую большую ошибку в ряду равноточных измерений называют предельной ошибкой;

4. Частные от деления алгебраической суммы всех случайных ошибок на их общее близко к нулю, т.е.

На основе указанных свойств при учете некоторых допущений математически достаточно строго выводится закон распределения ошибок, описываемый следующей функцией:

,

где s
дисперсия измерений (см. ниже);

е
основание натуральных логарифмов;

х
истинная абсолютная ошибка измерений.

Закон распределения случайных ошибок является основным в математической теории погрешностей. Иначе его называют нормальным законом распределения. Особое значение в пользу широкого использования закона Гаусса имеет следующее обстоятельство: если суммарная ошибка измерения появляется в результате совместного действия ряда причин, каждая их которых вносит малую долю в общую ошибку (т.е. нет доминирующих причин), то по какому бы закону не были распределены ошибки, вызываемые каждой из причин, результат их совместного действия приведет

к нормальному распределению ошибок. Эта закономерность является следствием так называемой центральной предельной теоремы Ляпунова и хорошо соотносится с введенным понятием случайной ошибки.

Наряду с нормальным законом распределения ошибок могут встречаться и другие.

1.5. Наиболее вероятное значение измеряемой величины

Допустим, что для определения истинного значения Х измеряемой величины было сделано n равноточных измерений с результатами а1, а2 .. .аn. Естественно, что ряд этих чисел будет больше Х, другие меньше Х и неясно, какое из этих чисел ближе всего подходит к Х.

Представим результаты измерений в виде очевидных равенств:

а1 = Х Dх1;
а2 = Х Dх2;
… ; аn = Х Dхn.

Естественно, что истинные абсолютные ошибки D
хi могут принимать как положительные, так и отрицательные значения.

Суммируя левые и правые стороны равенств получим

Поделим обе части равенства на число измерений n и получим

.

Величина является среднеарифметическим величины Х. Если число n достаточно велико ( при n®
¥), то согласно четвертому свойству случайных ошибок

.

Это же видно и по кривой Гаусса (рис. 1), где всякой положительной погрешности соответствует равная ей отрицательная.

Из изложенного следует, что

Х = а при n ® ¥
,

т.е. при бесконечном числе измерений истинное значение измеряемой величины равно среднеарифметическому значению результатов всех измерений. При ограниченном числе измерений истинное значение будет отличаться от среднеарифметического и необходимо оценить величину этого расхождения: Х = а ±
Dх.

Следует еще раз подчеркнуть, что среднеарифметическое значение, принимаемое за истинное значение измеряемой величины, является наиболее вероятным значением. Среди значений аi могут оказаться значения, которые в действительности ближе к истинному значению.

Отклонение D
х вероятнейшего значения а от его истинного значения Х называют истинной абсолютной ошибкой.

1.6. Оценка точности измерений

Для ряда равноточных измерений а1, а2 …аn определим его среднеарифметическое значение а и составим разности (а
а1), (а
а2), …, (а
аn).

Каждую из этих разностей называют вероятнейшей ошибкой отдельного измерения
(Vi). Вероятнейшие ошибки, как и истинные ошибки D
хi = (Х аi), бывают положительные
и отрицательные, нулевые. Рассмотрим

т.е. алгебраическая сумма вероятнейших ошибок равна нулю при любом числе измерений.
Истинные случайные ошибки таким свойством не обладают.

Вероятнейшие ошибки Vi лежат в основе математической обработки результатов измерений: именно по ним вычисляют предельную абсолютную ошибку D
аi среднеарифметического а и тем самым оценивают точность результата измерений.

Средняя истинная случайная ошибка (иначе
среднее отклонение отдельного измерения) определяется выражением (D
х1+Dх2+…+Dхn)/
n.

Величина [
(Dх1)2+(Dх2)2+…+(Dхn)2]
/
n представляет средний квадрат случайной ошибки или дисперсию S2 выборки (при ограниченном n) или генеральной совокупности s
2 (при бесконечном n). Средняя квадратичная ошибка отдельного измерения S = является лучшим критерием точности, чем средняя случайная ошибка, т.к. не происходит компенсации положительных и отрицательных ошибок D
хi и сильнее учитывается действие крупных ошибок.

Поскольку истинное значение Х измеряемой величины неизвестно, то неизвестны и истинные случайные ошибки хi. Для определения средней квадратичной ошибки S используется положение теории случайных ошибок, что при большом числе измерений n справедливо равенство

.

Различный знаменатель объясняется тем, что величины хi являются независимыми, а из n величин Vi независимыми являются n1, т.к. в величину Vi входит а, само определяемое из этих же n измерений.

Важно, что не зная самих истинных случайных ошибок удается вычислить среднюю квадратичную ошибку определенного измерения:

.

Оценим теперь погрешность результата всей серии эксперимента, т.е. определим величину D
х = Х
а.

Для этого проведем преобразование выражения

Sn2 =

=

= .


Если повторить серии по n измерений в каждой N ðàç, ìîæíî ïîëó÷ить средние значения а1, а2, … , аN и погрешности результатов измерений

(Dх)1 = (Х
а1); (Dх)2 = (Х
а2); … ; (Dх)N = (Х
аN)

и среднюю среднеквадратичную погрешность серии

Sa2 = .

При большом числе N S2a ®
s
2a

Усредняя выражение S2n по числу серий N, получаем

Sa2 = (D x)2
= Sn2 .

Учитывая что при большом n S2n ®
s
2 и S2 ®
s
2 получаем искомую

связь между дисперсиями всего опыта s
2a и отдельного эксперимента s
2

,

т.е. дисперсия s
2a результата серии из n измерений в n раз меньше дисперсии отдельного измерения. При ограниченном числе n измерений приближенным выражением s
2a будет S2a

.

Выражения s 2a и S2a
отражают фундаментальный закон возрастания точности при росте числа наблюдений.
Из него следует, что желая повысить точность измерений в 2 раза мы должны сделать
вместо одного четыре измерения; чтобы повысить
точность в 3 раза, нужно увеличить число измерений в 9 раз и т.д.

1.7. Понятие доверительного интервала и доверительной вероятности

Как установлено ранее, истинное значение измеряемой величины Х отличается от среднеарифметического a на некоторую величину D
x. На рис. 2 представлено расположение истинного значения Х и а, полученного из некоторых измерений а1, а2, а3.

Ясно, что случайные величины а1, а2, а3 обусловят случайный характер абсолютной погрешности D
x результата серии измерений, которая будет распределена по закону Гаусса:

.

Тогда вместо выражения Х = а ±
Dх можно записать а
Dх £
Х £
а + D
.

Интервал (а
Dх; а + D
х), в который по определению попадает истинное значение X называют доверительным интервалом. Надежностью (
уровнем значимости)
результата серии измерений называется вероятность a
того, что истинное значение X измеряемой величины попадет в доверительный интервал. Вероятность a
выражается в долях единицы или процентах. Графически надежность отражается площадью под кривой нормального распределения в пределах доверительного интервала, отнесенной к общей площади. Выбор надежности определяется характером производимых измерений. Например, к деталям самолета предъявляются более жесткие требования, чем к лодочному мотору, а к последнему значительно больше, чем к ручной тачке. При обычных измерениях ограничиваются доверительной вероятностью 0,90 или 0,95. Для любой величины доверительного интервала (
выраженного в долях s
) по формуле Гаусса может быть просчитана соответствующая доверительная вероятность. Эти вычисления проделаны и сведены в таблицу, имеющуюся практически во всей литературе по теории вероятности. На рис. 3 представлены значения надежности a
при величине доверительного интервала ±
s
, ±
2s
, ±
3s. Эти значения доверительной вероятности рекомендуется запомнить.

По рис. 3 видно, что величина абсолютной погрешности D
x может быть представлена в виде К×
s
а, где К некоторый численный коэффициент, зависящий от надежности a
. Однако это справедливо лишь для большого (
бесконечного)
числа n. При малых n этим коэффициентом пользоваться нельзя, т.к. величина s
а неизвестна. Для того, чтобы получить оценки границ доверительного интервала при малом n вводится новый коэффициент t
a
. Этот коэффициент предложен английским математиком и химиком В.С. Госсетом, публиковавшим свои работы под псевдонимом ²
Стьюдент ²
.

И коэффициент t
a
назвали коэффициентом Стьюдента. Коэффициент Стьюдента отражает распределение случайной величины t = при различном n. При n®
¥
( практически при n ³
20 )
распределение Стьюдента переходит в нормальное распределение. Значения коэффициента Стьюдента также приводятся практически во всей литературе по теории вероятности.

Зная величину t a можно определить величину
абсолютной погрешности D х = t×
Sa . Следует отметить, что величина абсолютной погрешности еще не
определяет точность измерений. Точность измерений характеризует относительная
погрешность, равная отношению абсолютной погрешности D
x результата измерений к результату измерений а: e
= ± Dх /
а. .

1.8. Обнаружение промахов

Если в ряду измерений встречаются результаты, резко отличающиеся от большей части ряда, то возникает вопрос принадлежности ²
выскакивающих ²
значений этому ряду измерений. Большие ошибки имеют малую вероятность возникновения. Поэтому следует объективно оценить, является ли данное измерение промахом (
тогда его исключают из ряда )
или же это результат случайного, но совершенно закономерного отклонения. Можно считать каждое измерение промахом, если вероятность случайного появления такого значения является достаточно малой.

Если известно точное значение s
, то вероятность появления значения, отличающегося от среднеарифметического а более чем на 3s
£ 0,003 и все измерения, отличающиеся от а на 3s
( и больше )
могут быть отброшены, как маловероятные.

Следует иметь в виду, что для совокупности измерений вероятность появления измерения ³
3s от а всегда больше 0,003. Действительно, вероятность того, что результат каждого измерения не будет отличаться от истинного более чем 3s
составляет 1
0,003 = 0,997. Вероятность того, что все n измерений не будут отличаться от среднего более чем на 3s
по правилу умножения вероятностей составит (
1
0,003 )
n. Для не слишком большого n

(1
0,003)n »
1
0,003×
n.

Это значит, что вероятность того, что из 10 измерений хотя бы одно будет случайно отличаться от среднего более чем на 3s
будет уже не 0,003, а 0,03 или 3%. А при 100 измерениях вероятность такого события составит уже около 30%.

Обычно число измерений не очень велико. При этом точное значение s
не известно, следовательно, отбрасывать измерения, отличающиеся от среднего более чем на 3s
, нельзя.

Для оценки вероятности b
случайного появления ²
выскакивающих²
значений в ряду n измерений составлены соответствующие таблицы.

Для применения таблицы вычисляется среднее арифметическое а и средняя квадратичная погрешность S
n из всех измерений, включая и подозреваемое значение аk
. Затем вычисляется уклонение подозреваемого значения аk
от среднего арифметического в долях среднеквадратичной ошибки

Vмакс = .

По таблице определяется какой вероятности b
соответствует полученное значение Vмакс.

Если вероятность появления данного измерения в ряду лежит в диапазоне 0,1 >
b
> 0,01, то представляется одинаково правильным
оставить это измерение или отбросить. В случае же, когда b
выходит за указанные пределы, вопрос об отбрасывании решается практически однозначно. Решая вопрос об отбрасывании полезно посмотреть, как сильно оно меняет окончательный результат по а и S
n.

1.9. Ошибки косвенных измерений

Часто измеряется не непосредственно интересующая нас величина, а другая, зависящая от нее некоторым образом. Например, при резании металлов часто непосредственно измеряются деформации, ЭДС, по которым судят о возникающих силах и температурах. При этом также необходимо оценить ошибку измерения.

При косвенных измерениях значение y измеряемой величины находят по некоторой формуле

y = ¦1, х2, …
, хm),

где x1, x2, … xm средние арифметические измеряемые (
непосредственно)
величины. Рассмотрим функцию общего вида

y = ¦1, х2, …
, хm)

где x1, x2, … , xm независимые переменные, для определения которых производятся n прямых независимых измерений по каждой xi.

Обозначим значения переменных через среднее значение и отклонения

y ± D y =
¦ (x1 ±
D x1, x2 ±
D x2, … , xm ±
D xm).

Эту функцию представим рядом Тейлора, ограничив его первыми членами ряда ( принимая D
xi <
<
xi )

y ± D y =
¦1, х2, … , хn)
± ,

где

производная функции по xi, взятая в точке xi.

Учитывая, что y = ¦
(x1, x2, … , xm) получаем

D y = .

Чтобы учесть погрешности D
xi всех n опытов целесообразно использовать средние квадратические оценки ( D
xi )2, так как D
xi =
0.

Возведем в квадрат левую и правую части уравнения и разделим на n

.

Здесь суммы удвоенных произведений типа

согласно четвертому свойству случайных ошибок ( D
xi =
0 ).

Тогда в левой и правой частях имеем среднеквадратические погрешности функции и аргументов

S.

Пример. При тарировке динамометра было получено уравнение зависимости силы от отклонения l луча осциллографа вида P =
25 l. Точность измерения отклонения D
l = 1 мм. Тогда

D P = .

В качестве меры точности лучше выступает не абсолютная, а относительная погрешность.

e .

Рассмотрим ее определение на примере. Пусть

y = cx1a ×
x2b ×
x3g .

Тогда

;
;
.


= .

Аналогично можно определить относительную погрешность и при других зависимостях. Зная относительную погрешность, можно определить и абсолютное ее значение:

D y = y× e
y.

1.10. Правила округления чисел

Величина погрешности результата измерений физической величины дает представление о том, какие цифры в числовом значении измеряемой величины сомнительны. Поэтому результаты измерений следует округлять перед тем, как производить с ними дальнейшие вычисления.

Округлять числовое значение результата измерений следует в соответствии с числовым разрядом значащей цифры погрешности. При этом выполняют общие правила округления.

Лишние цифры в целых числах заменяются нулями, а в десятичных дробях отбрасываются ( как и лишние нули ). Например, если погрешность измерения ±
0,001 мм, то результат 1,07005 округляется до 1,070.

Если первая из изменяемых нулями и отбрасываемых цифр меньше 5, остающиеся цифры не изменяются. Например, число 148935, точность измерения ±
50, округление:
148900.

Если первая из заменяемых нулями или отбрасываемых цифр равна 5, а за ней не следует никаких цифр или идут нули, то округление производится до ближайшего четного числа. Например, число 123,50 округляется до 124.

Если первая из заменяемых нулями или отбрасываемых цифр больше 5 или равна
5, но за ней следует значащая цифра, то последняя остающаяся цифра увеличивается
на единицу. Например, число 6783,6 округляется до 6784.

1.11.Порядок обработки результатов измерений

При практической обработке результатов измерений можно последовательно выполнить следующие операции:

  1. Записать результаты измерений;
  2. Вычислить среднее значение из n измерений

а =

  1. Определить погрешности отдельных измерений Vi =
    а аi;
  2. Вычислить квадраты погрешностей отдельных измерений Vi
    2;
  3. Если несколько измерений резко отличаются по своим значениям от остальных
    измерений, то следует проверить не являются ли они промахом. При исключении
    одного или нескольких измерений п.п.1…4 повторить;
  4. Определяется средняя квадратичная погрешность результата серии измерений

  1. Задается значение надежности a
    ;
  2. Определяется коэффициент Стьюдента t
    a
    (n) для выбранной надежности a
    и числа проведенных измерений n;
  3. Находятся границы доверительного интервала

Dх = t a
(n)× Sa

  1. Если величина погрешности результата измерений (п.9) окажется сравнимой с величиной d
    погрешности прибора, то в качестве границы доверительного интервала следует взять величину

.

  1. Записать окончательный результат

X = a ± D
x ;

Оценить относительную погрешность результата серии измерений

e = .

1.12.Обработка результатов измерений диаметра цилиндра

Микрометром было сделано десять замеров диаметра цилиндра. Цена деления микрометра 0,01 мм. Определить диаметр цилиндра с надежностью a
= 0,95 и a
= 0,99. Оценить влияние числа замеров на точность получаемого результата.

аi:
14,85; 14,80; 14,84; 14,81; 14,79;

14,81; 14,80; 14,85; 14,84; 14,80.

  1. Для первых пяти измерений определим среднеарифметическое значение и границы доверительного интервала. Для удобства расчетов выберем произвольное число ао удобное для расчетов (ао =
    14,80 мм) и определим разности (аi ао) и квадраты этих разностей. Результаты сведены в таблицу.

i

аi, мм

аi ао, мм

i ао)2, мм2

1

14, 85

0, 05

0, 0025

2

14, 80

0, 00

0, 0000

3

14, 84

0, 04

0, 0016

4

14, 81

0, 01

0, 0001

5

14, 79


0, 01

0, 0001

0, 09

0, 0043

Найдем среднее значение а и среднеквадратичное отклонение S
а:

а ао = 0, 018 мм;

( мм2
);
( мм ).

Для надежности a
= 0,95 и n =
5 t
a
=
2,78. Абсолютная погрешность измерения D
х:

Dх = t
a × Sа
= 2,78 × 0,0116
= 0,0322 мм.

Результат измерения можно представить в виде

(14,818 0,032)
мм £ а £ (
14,818 + 0,032)
мм

или сохраняя в величине погрешности одну значащую цифру

(14,82 0,03)
мм £ а £ (
14,82 + 0,03)
мм,

т.е. 14,79 мм £
а £
14,85 мм или а =
(
14,82 ±
0,03) мм.

Относительная погрешность

e а = .

Теперь найдем абсолютную и относительную погрешность этих измерений при a
=
0,99.

В этом случае t
a
= 4,60. Тогда

Dх = t a
× Sa = 4,60×
1,16× 10-2 = 5,34×
10-2 ( мм ).

Следовательно а =
(
14,82 ±
0,05) мм

e а = .

Видно, что с увеличением надежности границы доверительного интервала возросли, а точность результата уменьшилась.

  1. Проведем расчет погрешностей для этих же пяти измерений, незаконно полагая, что s
    2 =
    S
    2n (что при n = 5 ошибочно). Для этого используем распределение Гаусса (а не Стюарта). При a
    =
    0,95 ka
    =

Это дает возможность определить

Dх = ka ×
Sa = 1,96× 1,16×
10-2 » 2×
10-2 ( мм ),

т.е. погрешность получилась меньше примерно на 30%. Если по этой величине погрешности определить величину надежности при t
a
=
ka, то из таблицы коэффициентов Стьюдента получим a
< 0,90 вместо заданной a
= 0,95. Следовательно при малом числе измерений n применение закона нормального распределения с s
2 =
S2n вместо распределения Стьюдента приводит к уменьшению надежности результата измерений.

  1. Найдем средние значения и погрешности следующих пяти измерений

i

аi, мм

аi ао, мм

i ао)2, мм2

1

14, 81

0, 01

0, 0001

2

14, 80

0, 00

0

3

14, 85

0, 05

0, 0025

4

14, 84

0, 04

0, 0016

5

14, 80

0, 00

0

0, 10

0, 0042

ао = 14, 80 мм;

а = ао + ( мм );

а ао = 0, 02 мм;


( мм2 );

Sa = 1, 05

× 10-2 мм.

При a
=
0,95:

Dх = t a
× Sa = ±
2,78× 1,05×
10-2 = 2,92× 10-2 ( мм
);

e а = ;

Х = 14, 82 ± 0, 03 мм.

При a
=
0,99:

Dх = ± 4,60×
1,05× 10-2 »
5× 10-2 ( мм );

e а = ±

Х = 14, 82 ± 0,05 мм.

Результаты практически не отличаются, от результатов полученных из первой серии.

  1. Найдем теперь погрешность результата всей серии из десяти измерений. В этом
    случае (мм); (мм2).

Эти величины получаются суммированием последних строк из таблиц частных серий.

ао = 14, 80 мм;

а = ао + ( мм );

а ао = 0, 019 мм.

Sa2 =

= ( мм2 );

Sa = 7, 35× 10-3 мм.

При a
= 0,95 имеем

Dх = ta ×
Sa = ± 2,26×
7,35× 10-3 = ±
1,7× 10-2 ( мм );

e а = ;

а = 14, 819 ± 0, 017 мм.

При a
= 0,99 получаем

Dх = ta ×
Sa = ± 3,25×
7,35× 10-2 = ±
2,4× 10-2 ( мм );

e а = ;

а = 14, 819 ± 0, 024 мм.

Видно, что абсолютная и относительная погрешность результата десяти измерений стали почти в два раза меньше погрешностей пяти измерений.

Применение нормального распределения с s
2 =
S2n дает в случае a
=
0,95 ka
= 1,96 и D
х =
1,4 ×
10
2 мм, а величина надежности понижается до 0,91; в случае a
= 0,99 получаем ka
= 2,58 и D
х =
1,9 ×
10
2 мм, а величина надежности понижается до a
=
0,97.

Как видно, с ростом числа измерений различие между результатами, вычислениями по распределению Стьюдента и по нормальному распределению уменьшается.

Контрольные вопросы

  1. Цель математической обработки результатов эксперимента;
  2. Виды измерений;
  3. Типы ошибок измерения;
  4. Свойства случайных ошибок;
  5. Почему среднеарифметическое значение случайной величины при нормальном законе ее распределения является вероятнейшим значением?
  6. Что такое истинная абсолютная и вероятнейшая ошибки отдельного измерения?
  7. Что такое доверительный интервал случайной величины?
  8. Что такое уровень значимости (надежности) серии измерений?
  9. Геометрический смысл уровня значимости;
  10. Почему при малом числе опытов нельзя погрешность измерений представить в виде D
    х =
    ±
    Ks
    а?
  11. Что является критерием “
    случайности”
    большого отклонения измеряемой величины?
  12. Чем определяется величина случайной ошибки косвенных измерений?
  13. Чем определяется точность числовой записи случайной величины?

2. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН

При характеристике случайных величин недостаточно указать их возможные значения. Необходимо еще знать насколько часто возникают различные значения этой величины. Это характеризуется вероятностью p отдельных ее значений.

Соотношение, устанавливающее связь между значениями случайной величины и вероятностями этих значений, называют законом распределения случайной величины. Различают интегральный и дифференциальный законы распределения.

2.1. Виды случайных величин и законы их распределения

Под случайной величиной понимается величина, принимающая в результате опыта какое либо числовое или качественное значение.

Случайная величина, принимающая конечное число или последовательность различных значений, называется дискретной случайной величиной. Случайная величина, принимающая все значения из некоторого интервала, называется непрерывной случайной величиной.

Под интегральным законом распределения (или функцией распределения) F (х) случайной величины Х понимают вероятность p того, что случайная величина Х не превысит некоторого ее значения х

F (х) = p (Х < х).

Основным свойством интегрального распределения является монотонное не убывание в ограниченном диапазоне [
0;
1 ]
.

Действительно, если х1 и х2 некоторые значения случайной величины Х. Причем х2 > х1, то очевидно, что событие p (Х <
х2) ³ p (Х <
х1), т.к. между значениями х1 и х2 могут быть и промежуточные. Из определения интегрального закона следует, что F (х2) ³
F (х1), что говорит о монотонном не убывании функции. Очевидно также, что

F ( ¥ ) =
p (Х < ¥
) = 0;

Þ F (¥ )
F ( ¥
) = 1,

F (+ ¥ ) =
p (Х < ¥ ) =
1;

т.е. F (х) изменяется в диапазоне от 0 до 1.

Для дискретной случайной величины

F (x) = P (X < x) = P (
¥ < X <
x) = ,

где суммирование распространяется на хi < х. В промежутке между двумя последовательными значениями Х функция F (х) постоянна. При переходе аргумента х через значение хi F (х) скачком возрастает на величину p (Х =
хi).

Рассмотрим p (х1 £ Х <
х2). Если х2 > х1, то очевидно, что

p (Х < х2) =
p (Х < х1) +
p (х1 £ Х <
х2).

Тогда

p (х1 £ Х <
х2) = p (Х <
х2) p (Х <
х1) = F (х2)
F (х1),

т.е. вероятность попадания случайной величины в интервал [
х1;
х2) равен разности значений интегральной функции граничных точек.

Последнее условие можно использовать для нахождения вероятности p (Х =
х1) для непрерывной случайной величины. Для этого рассмотрим предел

p (X = x1) = ,

т.е. если закон распределения случайной величины есть функция непрерывная, то вероятность того, что случайная величина примет заранее заданное значение, равна нулю.

Здесь видно различие между дискретными и непрерывными случайными величинами. Для дискретных случайных величин, для каждого значения случайной величины существует своя вероятность. И для него справедливо утверждение: событие, вероятность которого равна нулю, невозможно. Для непрерывной случайной величины это утверждение неверно. Как показано, вероятность того, что Х =
х1 ( где х1
заранее выбранное число) равна нулю, это событие не является невозможным.

Рассмотрим непрерывную случайную величину Х, интегральный закон которой предполагается непрерывным и дифференцируемым. Функцию

¦ (х) = F¢
(х)

называют дифференциальным законом распределения или плотностью вероятности случайной величины Х. Из определения производной можно записать

¦ (x) = F¢
(x) = ,

т.е. плотность вероятности случайной величины Х в точке х равна пределу отношения вероятности попадания величины Х в интервал (х; х +
Dх) к D
х, когда D
х стремится к нулю.

Используя понятия интегральной функции распределения и определенного интеграла можно записать

¦ (x) = F¢
(x) или F (x) = p (x1 < X < x2) = .

Это соотношение имеет простое геометрическое толкование (рис. 5).

Если определяет заштрихованную область в соответствующих пределах, то

p (х < Х <
х + Dх) »
¦ (х) D х.

Из свойств интегрального распределения следует

.

Зная дифференциальный закон распределения можно определить интегральный закон распределения

F (x) = .

2.2. Числовые характеристики случайных величин, заданных своими распределениями

Основными характеристиками случайной величины, заданной своими распределениями, является математическое ожидание ( или среднее значение ) и дисперсия.

Математическое ожидание случайной величины является центром ее распределения. Дисперсия характеризует отклонение случайной величины от ее среднего значения.

Если Х дискретная случайная величина, значения хi которой принимают с вероятностью pi, так, что , то математическое ожидание М (Х) случайной величины Х определяется равенством

M (X) = ,

т.е. суммой произведений всех ее возможных значений на соответствующие вероятности.

Математическим ожиданием непрерывной случайной величины является аналог его дискретного выражения

M (X) = .

Действительно, все значения в интервале (х; х +
Dх) можно считать примерно равными х, а вероятность таких значений равна ¦
(х) dx (см. ранее). Поэтому значения хi дискретного распределения заменяются х, а вероятности pi на ¦
(х) dx, а сумма заменяется интегралом.

Дисперсией или рассеянием случайной величины Х называется математическое ожидание квадрата разности случайной величины и ее математического ожидания.

D (Х) = М [
Х М (Х)] 2
= М (Х х)2
= s 2
(х)

Если случайная величина Х дискретна и принимает значения хi с вероятностями pi, то случайная величина (Х
х)2 принимает значения (хi х)2 с вероятностями Рi. Поэтому для дискретной случайной величины имеем

D (X) =

Аналогично для непрерывной случайной величины получаем

D (X) = .

Чем меньше величина дисперсии, тем лучше значения случайной величины характеризуются ее математическим ожиданием.

2.3. Основные дискретные и непрерывные законы распределения

Как отмечалось ранее, очень часто случайная величина распределена по нормальному закону. Но существуют и другие распределения, имеющие практическое значение. Рассмотрим некоторые из них по условиям возникновения и основным параметрам их характеризующим.

  1. Равномерное распределение вероятностей.

Пусть плотность вероятности А равна нулю всюду, кроме интервала (a; b), на котором она постоянна (рис. 6). Тогда можно записать

p (a < X < b) = A =
.

Тогда дифференциальный закон равномерного распределения определяется

¦ (x) =

Интегральный закон распределения

F (x) = .

При х ³
b имеем

F (x) =

Таким образом интегральный закон равномерного распределения задается (рис. 6)

F (x) =

Основные характеристики распределения

М (X) = ;

D(X) =

=

=

.

  1. Биноминальное распределение

Пусть при некотором испытании событие А может наступить или не произойти (А). Обозначим вероятность А через р, а А через q =
1 р ( других итогов испытания нет ). Тогда исходами двух последовательных независимых испытаний и их вероятностью будут:

АА р2; АА
рq; АА qр; АА
q2.

Отсюда видно, что двукратное появление события А равно р2, вероятность однократного появления 2 рq, а вероятность того, что А не наступит ни разу
q2. Эти результаты единственно возможные и поэтому

.

Это рассуждение можно перенести на любое число испытаний.

Например, при трех испытаниях получим

.

Подсчитаем вероятность того, что при n испытаниях событие А появится m раз. Это может произойти, например, в последовательности

Ясно, что вероятность равна рmqn
m
. Но m событий А может быть и в другом сочетании. Число всех возможных сочетаний из n элементов по m (количество событий А) равно числу сочетаний . Используя теорему сложения вероятностей получаем общую вероятность Рm,n наступления m событий А из n испытаний

Pm,n =

= .

Из этой формулы видно, что вероятности Рm,n для различного исхода испытаний (появление или не появление определенного результата А) определяется

pn + npn-1q + .

Коэффициенты перед вероятностями р, q являются биноминальными коэффициентами, а общая вероятность представляет слагаемые в разложении бинома ( р +
q )n. Поэтому закон распределения случайной величины Х, в котором вероятность наступления событий А определяется коэффициентами бинома, называется биноминальным распределением дискретной случайной величины. Этот закон может быть задан в виде таблицы 1.

Таблица 1

Биноминальный закон распределения

хi

0

1

2

m

n

pi

qn

npqn-1

pn

Биномиальные коэффициенты удобно получать с помощью треугольника Паскаля.

1 n =
0

1 1 n =
1

1 2 1 n = 2

1 3 3 1 n = 3

1 4 6 4 1 n = 4

1 5 10 10 5 1 n = 5

Все строки треугольника ( начинающегося с единицы ) начинаются и заканчиваются единицей. Промежуточные числа получаются сложением соседних чисел вышестоящей строки. Числа, стоящие в одной строке, являются биноминальными коэффициентами соответствующей степени.

Из описания биномиального распределения становится ясно, что область его действия там, где возможно многократное проведение испытаний с известной вероятностью.

Определим основные характеристики этого распределения.

Математическое ожидание

М (Х) =

+

+

= np (q + p)n-1 = np.

Дисперсия распределения может быть определена из общего выражения

,

но это приводит к громоздким вычислениям. В то же время случайная величина Х принимает в каждом опыте только два значения: 1, если событие А произошло и 0, если оно не произошло с вероятностями, соответственно, р или q. Тогда математическое ожидание одного опыта определится

М (Х1) = 0× q +
1×р = р =
х

и соответственно дисперсия одного опыта

D (Х1) = (0 р)2×
q + (1
р)2× р =
р2q + q2р =
рq (р + q) = рq.

Тогда дисперсия всех n опытов составит

D (X) = n×
p× q.

  1. Закон Пуассона

В случае малых р ( или, наоборот, близких к 1 ) биноминальный закон распределения можно преобразовать следующим образом

,

где .

Определим предел Рm,n при n ®
¥ и постоянном m. Тогда пределы

равны единице, а .

Окончательно имеем

.

Это распределение называется законом Пуассона, где l
интенсивность распределения. Используется в задачах с редкими событиями.

Определим его основные характеристики и смысл величины l
.

Запишем закон распределения в виде таблицы.

хi

0

1

2

m

pi

el

M (X) =

+ .

Выражение в скобках есть разложение функции еl
в ряд Маклорена.

Поэтому

М (Х) = lе
l еl =
l .

Не рассматривая вывод отметим, что

D (Х) = l
,

т.е. дисперсия равна математическому ожиданию.

Рассмотренные виды распределений случайной величины, конечно, не исчерпывают всех существующих распределений. Можно назвать еще несколько: распределение Бернулли, экспоненциальное распределение, гамма
распределение, распределение Вейбула, гипергеометрические распределения и др. При определенных условиях и параметрах один вид распределения может переходить в другой. Поэтому при решении практических задач по законам распределения случайных величин следует обращаться к специальной литературе.

2.4. Понятие статистической гипотезы и статистического критерия

Статистической гипотезой называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Такие утверждения можно делать на основе теоретических соображений или статистических исследований других наблюдений. Например, при многократном измерении некоторой физической величины, точное значение Х которой не известно, но в процессе измерений оно меняется. На результат измерений влияют многие случайные факторы, поэтому результат i го измерения можно записать в виде аi = Х + e
i, где e
i случайная погрешность измерения. Если e
i складывается из большого числа ошибок, каждая из которых не велика, то на основании центральной предельной теоремы можно предположить, что случайные величины аi имеют нормальное распределение. Такое предположение является статистической гипотезой о виде распределения наблюдаемой случайной величины.

Если для исследуемого явления сформулирована та или иная гипотеза ( обычно ее называют основной или нулевой гипотезой и обозначают символом Но ), то задача состоит в том, чтобы сформулировать правило, которое позволяло бы по результатам наблюдений принять или отклонить эту гипотезу. Правило, согласно которому проверяемая гипотеза Но принимается или отвергается, называется статистическим критерием проверки гипотезы Но .

Наиболее распространены такие статистические гипотезы, как:

а) вида распределения;

б) однородности нескольких серий независимых результатов;

в) случайности результатов эксперимента и т.п.

Статистический критерий проверки гипотезы Но служит для определения возможного отклонения от основной гипотезы. Характер отклонений может быть различным. Если критерий ²
улавливает²
любые отклонения от Но, то такой критерий называют универсальным или критерием согласия. Существуют критерии, которые выявляют отклонения от заданного вида, это узко направленные критерии.

Выбор правила проверки гипотезы Но эквивалентен заданию критической области х1, при попадании в которую переменной х гипотеза Но отвергается. Критерий, определяемый критической областью х1 называют критерием х1.

В процессе проверки гипотезы Но можно прийти к правильному решению или совершить ошибку первого рода
отклонить Но когда она верна, или ошибку второго рода
принять Но, когда она ложна. Иными словами, ошибка первого рода имеет место, если точка х попадает в критическую область х1, в то время как верна нулевая гипотеза Но, а ошибка второго рода
когда х Î
хо, но гипотеза Но ложна.

Желательно провести проверку гипотезы так, чтобы свести к минимуму вероятности обоих ошибок. Однако при данном числе испытаний n в общем случае невозможно одновременно обе эти вероятности сделать как угодно малыми. Поэтому наиболее рационально выбирать критическую область следующим образом: при заданном числе испытаний n устанавливается граница для вероятности ошибки первого рода и при этом выбирается та критическая область х1, для которой вероятность ошибки второго рода минимальна.

2.5. Вероятности ошибок первого и второго рода

Рассмотрим станок, который может работать только в одном из двух состояний. Если он работает в налаженном режиме, то для интересующего нас признака качества, например, длины или диаметра заготовки, имеет место нормальное распределение при работе как в налаженном так и в разлаженном режиме. Оба режима отличаются только уровнем настройки процесса по математическому ожиданию ( М(х) = 10 и 11, соответственно в налаженном и разлаженном режиме ), в то время как дисперсии в обоих случаях составляют s
2 = 4.

Проверить нужно нулевую гипотезу, в соответствии с которой М(х) = 10, против альтернативы ( в данном случае единственной ) М(х) = 11. Конкурирующую гипотезу обозначим Н1. Тогда Но: М(х) = 10; Н1: М(х) = 11.

Необходимо по результатам выборки определить в каком из состояний работает станок. Примем объем выборки n из потенциально бесконечной генеральной совокупности. В качестве контрольной величины возьмем выборочное среднее Хn. На рис. 9 изображены плотности распределения Хn для n = 25 и n = 4.

Для формулировки критерия необходимо разделить область изменения контрольной величины (х) на критическую область отклонения гипотезы Но ( принятия Н1 ) и область принятия гипотезы Но. Для этого необходимо выбрать число К, такое, что 10 <
К <
11, и интервал (

¥; К ]
рассматривать как область принятия гипотезы Но, а интервал [
К; ¥
) как область отклонения гипотезы Но. По рис. 9 видно, что каждая реализация Х25 или Х4 возможна при верности любой из двух гипотез, но с различной вероятностью.

рода a
( отклонения верной гипотезы Но ) и второго рода b
( принятие гипотезы Но, когда она не верна ). Также видно, что увеличение n ведет к уменьшению дисперсии распределения х и тем самым
к одновременному уменьшению вероятностей a
и b
. В соответствии с рис. 9 можно записать:

;

.

Эти два уравнения содержат четыре величины a
, b, К, n. Задав две из четырех величин, можно определить две другие.

Например, при n = 25 и К = 10,4 определим:

;

.

Если задаться величинами a
и b
, то можно определить величины К, n.

2.6. Проверка гипотезы вида закона распределения вероятностей

При проверке эксперимента закон распределения вероятностей случайных величин неизвестен и можно лишь предположительно судить о его виде . Выборочные оценки параметров распределения несут в себе случайные ошибки, искажающие истинный характер распределения. Поэтому после получения эмпирического распределения производится подбор теоретического закона распределения, пригодного для описания вероятностных свойств изучаемой случайной величины. Критерии подбора ( проверки гипотезы соответствия ) называют в статистике критериями согласия. Все они основаны на выборе допустимой меры расхождения между теоретическим распределением и выборочными данными.

Общую процедуру проверки гипотезы закона распределения можно представить в следующей последовательности:

  1. По опытным данным строится эмпирическая кривая распределения вероятностей;
  2. Определяются параметры эмпирического распределения ( в соответствии с его видом );
  3. Выдвигается одна или несколько гипотез о функции плотности исследуемой случайной величины, исходя из внешнего вида эмпирической кривой, значений ее параметров, технических факторов, влияющих на ее вид;
  4. Эмпирическая кривая выравнивается по одной или нескольким теоретическим кривым;
  5. Проводится сравнение по одному или нескольким критериям согласия;
  6. Выбирается теоретическая функция, дающая наилучшее согласование.

Поясним п. 4; 5. Определив по эмпирическим данным параметры распределения, подставляют их в теоретическую кривую закона распределения и рассчитывают вероятность середин интервалов эмпирического распределения. Умножив значение полученной вероятности на общее число опытов, получают теоретическое значение частот случайной величины, которые и определяют ²
выровненную²
кривую. Теперь можно найти вероятность того, что эмпирическая кривая соответствует выбранной теоретической, выбрав вероятность согласия ( уровень значимости ). Если результат расхождения не выйдет за принятый уровень значимости, то считают, что эмпирическое распределение согласуется с теоретическим. Если сравнение осуществляется с несколькими теоретическими законами, то окончательно принимать тот, который дает лучшее соответствие.

Чаще всего в качестве критериев согласия принимают критерий Пирсона ( c
2 ) и критерий Колмогорова
Смирнова ( К
С
критерий ).

Критерий c
2 является наиболее состоятельным при большом числе наблюдений. Он почти всегда опровергает неверную гипотезу, обеспечивает минимальную ошибку в принятии неверной гипотезы по сравнению

с другими критериями.

c 2 = ,

где mj
наблюдаемая частота случайного события;

m*
j ожидаемая по принятому теоретическому закону распределения;

К
число интервалов случайной величины.

Затем определяется число степеней свободы l:

l = К r
1;

где К
число интервалов случайной величины;

r число параметров теоретической функции распределения.

К
С
критерий лучше всего использовать в случае, если теоретические значения параметров распределения известны. При неизвестных параметрах его можно использовать, но он дает несколько завышенные результаты. При использовании этого критерия определяется величина

,

где

mнj, m*нj соответственно, накопленные наблюдаемые и ожидаемые

(теоретические) частоты;

n число проведенных опытов.

То есть, в данном случае оценивается только максимальное отклонение накопленной частоты случайного события, возникающее в одном из диапазонов изменения случайной величины. Полученное значение коэффициента сравнивается с табличным для числа степеней свободы опыта и принятого уровня значимости результата. Если табличное значение коэффициента больше, то гипотеза о принятом законе распределения не отвергается.

Контрольные вопросы

  1. Сущность непрерывной и дискретной случайной величины;
  2. Сущность интегрального закона распределения случайной величины;
  3. Сущность дифференциального закона распределения случайной величины;
  4. Связь интегрального и дифференциального законов распределения;
  5. Основные характеристики случайной величины, заданной своим распределением;
  6. Назовите примеры законов распределения непрерывной и дискретной случайной величины;
  7. Понятие статистической гипотезы и статистического критерия;
  8. Назовите примеры статистических гипотез;
  9. Сущность ошибок первого и второго рода;
  10. Сущность проверки гипотезы вида закона распределения;
  11. Принципиальное различие в критериях Пирсона и Колмогорова
    Смирнова.

3. НАХОЖДЕНИЕ ИНТЕРПОЛИРУЮЩИХ КРИВЫХ

В первой части пособия рассматривались измерения той или иной физической величины, находящейся при проведении серии измерений в неизменном состоянии. Очень часто исследуемая величина меняется в соответствии с изменением условий опыта или времени. Цель эксперимента в этом случае состоит в нахождении функциональной зависимости, которая наилучшим образом описывает изменение интересующего нас параметра.

Следует понимать, что однозначно восстановить ( большей частью неизвестную ) функциональную зависимость между переменными невозможно даже в том случае, если бы переменные величины, полученные из опыта, не имели бы ошибки измерения. Тем более не следует ожидать, что это удастся сделать, имея экспериментальные данные, содержащие, по крайней мере, случайные ошибки измерений.

Поэтому математическая обработка результатов наблюдений не может ставить перед собой задачу разгадать истинный характер зависимости между переменными. Она позволяет лишь представить результаты опыта в виде наиболее простой формулы.

В зависимости от назначения этих формул существуют различные методы их получения, отличающиеся сложностью расчетных процедур и точностью получаемых решений.

3.1. Графический метод обработки результатов

Графический метод заключается в построении графика зависимости между исследуемыми величинами с последующим определением уравнения зависимости между ними.

Графики строят прежде всего в равномерных шкалах. Если характер связи между исследуемыми величинами неизвестен, то сначала проверяют совпадение экспериментальных точек с заданной кривой. Если предварительные сведения о характере уравнения отсутствуют, то первым этапом обработки данных является нахождение кривой, совпадающей с опытными точками. Эта задача решается методом подбора. Можно использовать эталон
кальку с предварительно вычерченным на ней семейством кривых с различными параметрами. Естественно, что масштаб кальки и эмпирической кривой должен быть одинаков.

Построенный по опытным данным отрезок кривой может совпадать с большим количеством различных кривых, проходящих достаточно близко к опытным точкам. В этом случае выбирают кривую с наиболее простым и удобным в использовании уравнением. Иногда эмпирическая кривая может иметь перегибы или состоять из отдельных ярко выраженных участков. Однако при этом необходимо определить координаты точек перехода от одной кривой к другой.

Уравнение зависимости между исследуемыми величинами при графическом методе просто определяется тогда, когда эмпирические точки достаточно хорошо совпадают с прямой линией, т.е. описываются уравнением y = ax + b, где a, b коэффициенты, подлежащие определению.

Определение коэффициентов при графическом методе основано на ²
способе натянутой нити²
. Нанеся результаты эксперимента на график (лучше, если он выполнен на миллиметровке), подбираем графическую прямую, ближе всего подходящую к нанесенным точкам. Выбрав положение прямой, определяем две произвольные точки на этой прямой (не обязательно являющиеся точками эксперимента), определяем их координаты (x1; y1), (х2; y2). И для определения коэффициентов а и b получаем два простых уравнения

ах1 + b = y1;

ах2 + b = y2.

На рис. 10 приведена иллюстрация этого метода. Точки
результаты, полученные в эксперименте. Прямая проведена на глаз как можно ближе к экспериментальным точкам. На прямой выбраны точки М (2; 4) и N (13; 10). Коэффициент а характеризует угол наклона прямой.

Поэтому

.

Таким образом y = 0,55х + 2,9.

В случае, если экспериментальная зависимость имеет нелинейный характер, то графическим способом в системе координат с равномерными шкалами определить коэффициенты кривой затруднительно. Но достаточно большой класс нелинейных зависимостей путем замены переменных и графического изображения в функциональных шкалах можно привести к линейным и далее использовать способ натянутой нити.

3.2. Функциональные шкалы и их применение

Пусть функция y = ¦
(х) непрерывна и монотонна на некотором промежутке [
a; b ]. Возьмем ось ОМ, на которой будет строиться шкала, выберем на ней точку начала отсчета О и установим масштаб m
. Функциональная шкала строится следующим образом.

Разбив интервал [
а; b ] на равные части, вычисляем значение функции ¦
(х) в каждой из точек деления и отложим на оси ОМ для каждой точки отрезок m
¦
(х). Получающаяся при этом точка снабжается отметкой х, т.е. откладывается в выбранном масштабе значение функции, а надписывается значение аргумента.

Иногда начало шкалы помещают в первую точку отсчета, т.е. точку с надписью а совмещают с 0. Тогда точка х будет находиться в конце отрезка m
[
¦(х)
¦(а) ]
. Полученная шкала позволяет судить о поведении функции на рассматриваемом участке: большие промежутки между отметками укажут, что функция изменяется быстрее, чем там, где эти промежутки малы.

Выбор масштаба m
определяет длину шкалы. Чаще поступают наоборот: задаются длиной шкалы l и определяют масштаб.

Þ m
= .

Пример. Построим функциональную шкалу для функции y = x2 на участке [
1; 2 ]. Зададимся длиной шкалы l = 12 см. Тогда m
= см. Разобьем отрезок [
1; 2 ] на десять равных частей и вычислим значения функции во всех точках деления. Совместим начало шкалы с точкой отсчета х = 1. Результаты расчета сведены в табл. 2, а функциональная шкала приведена на рис. 11.

Таблица 2

Расчет функциональной шкалы y = x2

х

1,0

1,1

1,2

1,3

1,4

1,5

1,6

1,7

1,8

1,9

2,0

х2

1,0

1,21

1,44

1,69

1,96

2,25

2,56

2,89

3,24

3,61

4,00

х2 1

0

0,21

0,44

0,69

0,96

1,25

1,56

1,89

2,24

2,26

3,00

4(х2 1)

0

0,84

1,76

2,76

3,84

5,00

6,24

7,56

8,94

10,44

12,0

1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0

Рис. 11. Функциональная шкала y = x2

С помощью функциональных шкал графики многих функций могут быть преобразованы к прямолинейному виду.

Например, уравнение параболы y = x2. Если на оси OY нанести равномерную шкалу, а на оси OX1 шкалу квадратов х1 = х2, то получится сетка, где уравнение параболы имеет изображение прямой линии ( y = x1 ),

проходящей через начало координат.

Особенно часто используются различные логарифмические функции, с помощью которых можно ²
выпрямлять²
графики степенных и показательных функций. Например, y = aebx; lg y = (b lg е) х + lg a. Полагая lg y = y1, lg a = A, b lg e = B запишем исходное уравнение в виде y1 = А + Вх, откуда видно, что оставив равномерной шкалу х и построив логарифмическую шкалу y1, можно изобразить исходное уравнение прямой линией. Полученная координатная сетка называется полулогарифмической.

Очевидно, что такого рода преобразования возможны и в более общем случае. Всякая неявная функция, заданная соотношением вида

аj (х) + by
(y) + с = 0,

где a, b, с
постоянные, будет изображаться прямой линией на функциональной сетке, где на оси ОХ построена шкала j
(х), а на оси OY шкала функции y
(y). Естественно, что функции j
(х) и y
(y) должны удовлетворять условиям непрерывности и монотонности. В табл. 3 приведены преобразования для некоторых функций.

Таблица 3

Линеаризация некоторых функций

Исходная

формула

Преобразованная

формула

Замена

переменных

Линеаризованная формула

y=axb

lg y=b×
lgx+lga

lg y=y1

lg x=x1

lg a=a1

y1=bx1+a1

y=a×
lgx+b

¾

lg x=x1

y=ax1+b

y=ebx+k

lg y=b×
lge×
x+k×
lge

lg y=y1

b×
lg e=a

k×
lg e=k1

y1=ax+k1

y=aebx

lg y=bx×
lge+lga

lg y=y1

b×
lg e=b1

lg a=a1

y1=b1x+a1

y=

¾

y=ax1+b

y=

y1=ax+b

y=

y1=bx1+a

Из сказанного ясна роль функциональных сеток при обработке результатов эксперимента. Если результаты эксперимента располагаются вблизи кривой, то по имеющемуся ограниченному участку кривой трудно судить, какого типа функцией ее лучше всего приближать. Переведя полученные экспериментальные данные на функциональные сетки можно оценить на какой из них эти данные ближе всего подходят к прямой и, следовательно, какой функцией лучше всего описываются.

3.3. Аналитические методы обработки результатов

Графический метод обработки результатов обладает наглядностью, относительной простотой, однако его результаты содержат определенную субъективность и относительно низкую точность.

Аналитические методы лишены в какой
то степени указанных недостатков и позволяют получить результат для более широкого класса функций с большей точностью, чем графический метод.

Существуют различные аналитические методы получения параметров эмпирических
кривых в зависимости от критерия, принятого при их получении. Рассмотрим некоторые
из существующих способов.

3.3.1.Способ средней

Допустим, что имеется n сочетаний xi, yi, полученных при эксперименте. Даже в том случае, если между х и y теоретически установлена функциональная связь ( в данном случае предположим, что линейная ), то наблюдаемые значения yi будут отличаться от ахi + b вследствие наличия экспериментальных ошибок. Обозначим через D
i соответствующую ошибку

D i = yi
axi b (i = 1, 2, …, n)

Если выбирать параметры а и b так, чтобы для всех n наблюдений ошибки уравновешивались, т.е. , то это привело бы нас к одному уравнению, тогда как для нахождения двух коэффициентов (а, b) их требуется два. Поэтому предположим, что уравновешивание происходит не только для всех произведенных наблюдений в целом, но и для каждой группы, содержащей половину ( или почти половину ) всех наблюдений в отдельности.

В этом случае можно прийти к системе уравнений

,

где m число наблюдений в первой группе.

Данную систему уравнений запишем теперь в виде

.

Изложенное показывает, что метод средних ²
уравновешивает²
положительные и отрицательные отклонения теоретической кривой от экспериментальных значений.

Пример.Используя данные рис. 10 определим коэффициенты а, b методом средней. Для этого семь измерений разделим на две группы m = 3 первых значений, n
m = 4 последующих

; ;

; .

Получаем систему

Решая систему находим

;

b =

Таким образом способ средней дает прямую

y = 0,55х + 3,11.

В сравнении с графическим способом коэффициенты а совпадают и имеется различие в коэффициенте b.

3.3.2. Метод наименьших квадратов

В методе средних при определении коэффициентов уравнения использовалось условие равенства нулю алгебраической суммы отклонений результатов эксперимента от теоретической кривой ( в частном случае прямой ). Очевидно, что при этом D
i могут быть значительной величины. Имеет значение только ²
уравновешивание²
положительных и отрицательных отклонений.

Поставим теперь задачу нахождения по результатам наблюдений наиболее вероятные значения неизвестных коэффициентов.

Предположим, что искомая зависимость y = ¦(х) существует. Тогда параметры этой линии необходимо выбрать таким образом, чтобы точки yi располагались по обе стороны кривой y = ¦(х) как можно ближе к последней. Предположим, что разброс точек yi относительно y = ¦(х) подчиняется закону нормального распределения. Тогда мерой разброса является дисперсия s
2 или ее приближенное выражение
средний квадрат отклонений.

.

И требование минимального разброса будет удовлетворено, если минимизировать выражение ( D
yi )2. Как известно, необходимым условием того, что функция приобретает минимальное значение, является то, что ее первая производная ( или частные производные для функции многих переменных ) равна нулю. Применение метода наименьших квадратов имеет смысл, если число экспериментальных точек n больше числа определяемых коэффициентов.

Рассмотрим реализацию метода наименьших квадратов применительно к уравнению вида y = ax + b.

Для нахождения коэффициентов а, b искомой прямой необходимо минимизировать сумму квадратов расстояний D
yi по ординате от точки (хi; yi) до прямой ( см. рис. 12 ). Расстояния D
yi определятся

D yi = yi
axi b.

Для минимизации приравниваем к нулю производные этой суммы по параметрам а, b:

;

.

Преобразуем эту систему

Получим систему нормальных уравнений метода наименьших квадратов.

Решая ее относительно а, b получаем:

; .

Вычисляя из n опытов необходимые суммы и производя указанные действия, получаем величину коэффициентов а, b.

Как видно, способ наименьших квадратов достаточно громоздок и при его применении широко используется вычислительная техника. Метод наименьших квадратов может использоваться и в случае нелинейных функций. Например, если определяются параметры квадратичной зависимости:

y = ах2 + bx + с,

то

.

Дифференцируя это соотношение по а, b, с получаем систему нормальных уравнений:

Из этой системы можно определить параметры а, b, с.

При использовании метода наименьших квадратов при других нелинейностях, удобнее будет линеаризовать исходные зависимости.

В табл. 4 приведены системы нормальных уравнений для некоторых исходных уравнений.

Таблица 4

Системы нормальных уравнений

Исходное

уравнение

Система нормальных уравнений

y=axb

y=a×
lgx+b

y=eax+b

y=aebx

y=

y=

y=

Примечания: 1. Величины х, y обозначают значения величин хi, yi
в iом опыте;

  1. Знак S обозначают сумму величин от i = 1
    до i = n, где n число равноточных измерений.
  1. Интерполирование функций

Известно, что под интерполированием понимают отыскание значений функции, соответствующих промежуточным значениям аргумента, отсутствующим в таблице логарифмов, тригонометрических и др. функций.

В общем смысле можно сказать, что задача интерполирования обратна задаче табулирования функций. При интерполировании по таблице значений функции строится ее аналитическое выражение, т.е. по значениям функции yo, y1, …, yn при значениях аргумента хо, х1, …, хn определяется выражение неизвестной функции.

Понятно, что через данные точки ( даже большого числа ) можно провести множество различных кривых. Поэтому существует интерполирование в различных функциях F (х). Чаще всего требуют, чтобы функция F(х) была многочленом степени на единицу меньшей, чем число известных значений.

Таким образом, задачу интерполирования функций можно сформулировать следующим образом.

Для данных значений х º
хо, х1, …, хn и y º
yo, y1, …, yn найти многочлен y = F (х) степени n, удовлетворяющий условиям F (хо) =
yo, F (х1) =
y1, …, F (хn) =
yn. Точки хо, х1, …, хn называют узлами интерполяции. Многочлен F (х)
интерполяционным многочленом , а формулы его построения
интерполяционными формулами.

Как видно из описания сущности интерполирования, в отличии от описанных ранее способов получения функций ( графического, метода средних, метода наименьших квадратов ), интерполяционный многочлен опишет кривую, проходящую точно через заданные точки.

  1. Параболическое интерполирование

При параболическом интерполировании в качестве интерполяционного многочлена F (х) принимают многочлен n ой степени вида

F (х) = ао + а1х + а2х2
+ … + аnxn.

Используя свойство прохождения функции F (х) через заданные точки для неизвестных коэффициентов аi можно составить n + 1 уравнений с n + 1 неизвестным:

ао + а1хо + а2хо2
+ … + аnхоn =
yo;

ао + а1х1 + а2х12
+ … + аnх12 =
y1;

…………………………………………….

ао + а1хn + а2хn2
+ … + аnхn2 =
yn.

Эта система имеет единственное решение, если значения хi отличны друг от друга. Понятно, что при большом n возникает сложность решения этой системы. Перед рассмотрением общего способа решения, рассмотрим простой пример.

Дано: хо = 0, х1 = 1, х2 = 2, yо = 1, y1 = 1, y2 = 3. Определить многочлен F (х).

Записывая многочлен F (х) в виде

F (х) = ао + а1х + а2х2

составим систему уравнений

или

откуда ао = 1, а1 = 1, а2 = 1 и интерполирующий многочлен имеет вид

F (х) = 1 х + х2.

Теперь рассмотрим общий подход к отысканию интерполяционного многочлена F (х), не решением системы, а непосредственной записью.

Определим выражение для многочлена, принимающего в точке х = хо значение yо = 1, а в точках х = х1, х2, …, хn значения y1 = y2 = … = yn = 0. Очевидно, что многочлен будет иметь вид

.

Здесь при х = хо числитель и знаменатель равны, а при х = х1, х2, …, хn числитель равен нулю.

Теперь построим многочлен Fо (х), принимающий в точке хо значение yо и обращающийся в нуль для значений х = х1, х2, …, хn. Учитывая предыдущее построение можно записать

.

Теперь можно записать многочлен F (х) для произвольного значения хi ( i = 0, 1, 2, …, n ) принимающего значения F (хi) = yi, а во всех остальных точках х ¹
хi значение, равное нулю

.

Как видно из записи, числитель не будет содержать выражения (х
хi), а знаменатель
i хi), т.е. выражений, обращающих числитель и знаменатель в нуль.

Искомый многочлен будет равен сумме

,

т.е. снова в каждой точке хi одно из слагаемых принимает нужное значение yi, а все остальные обращаются в нуль.

В развернутом виде

=

… + .

Полученная формула называется интерполяционной формулой Лагранжа.

Используя формулу Лагранжа запишем многочлен F (х) для разобранного выше примера.

=

=.

Получили тоже самое выражение, что и ранее.

Контрольные вопросы

  1. Назначение графического метода обработки результатов;
  2. Сущность графического метода обработки результатов;
  3. Понятие и назначение функциональной шкалы;
  4. Выбор масштаба функциональной шкалы;
  5. Сущность аппроксимации методом средних;
  6. Сущность аппроксимации методом наименьших квадратов;
  7. Принципиальное отличие метода интерполирования от метода наименьших квадратов.

4.ОСНОВЫ НОМОГРАФИИ

Номография
слово греческое. Номос
закон, графо
пишу, черчу. В буквальном переводе это слово означает ²
черчение закона²
.

Своей задачей номография ставит построение специальных графиков
номограмм, служащих для решения различных уравнений. Номограммы дают возможность компактно представлять функции многих переменных и таблицы с несколькими входами. На номограммах можно решать некоторые трансцендентные уравнения и системы таких уравнений. Номограммы можно применять не только для вычислительных целей, но и для исследования положенных в их основу функциональных зависимостей.

Наглядность представления различных закономерностей и простота использования номограмм при достаточно высокой точности результата обеспечивают широкое использование номограмм в различных областях техники.

В основе номограмм лежит понятие функциональной шкалы ( см. выше ). На основе функциональных шкал создаются не только номограммы, но и различные вычислительные средства: универсальные вычислительные номограммы, логарифмические линейки и т.п.

В данной главе излагается один из возможных видов номограмм
номограммы в декартовой системе координат, имеющие достаточно широкое использование в машиностроении.

4.1. Номограммы в декартовой системе координат

В разделах 3.1., 3.2. описана процедура построения графиков для функции одного переменного. При этом на графике получается одна линия ( прямая или кривая ).

Если же изучаемая функция зависит от двух переменных

Z = ¦ (х, y),

то придавая в этом уравнении, например, параметру y ряд частных ( постоянных ) значений y1, y2, …, yn можно, как и для функции одного переменного, построить зависимости

Z = ¦ (х, y1);

Z = ¦ (х, y2);

……………….

Z = ¦ (х, yn).

Получим систему кривых ( в частном случае прямых ), называемых номограммой из ²
помеченных²
линий, т.к. каждая линия помечается соответствующим значением yi.

Пример. При исследовании процесса фрезерования было установлено, что наиболее целесообразно величину радиального биения смежных зубьев фрезы назначать по условию обеспечения участия в процессе резания всех зубьев фрезы. Аналитически это условие выражается уравнением

,

где Sz
расчетная величина подачи на зуб, мм/
зуб;

k =
параметр операции;

D диаметр фрезы, мм;

t глубина резания, мм;

D
величина биения смежных зубьев фрезы, мм.

Как видно, Sz = ¦
(k, D
) является функцией двух параметров. Здесь можно отметить, что, фактически Sz = ¦
(D, t, D
), т.е. функцией трех параметров, но два параметра (D, t) заменены одним
k = , легко определяемым и уменьшающим количество переменных. Данный прием широко используется в номографии.

Теперь необходимо определиться с осями и помеченным параметром. В качестве оси ординат, в соответствии с функциональной зависимостью, рационально принять Sz. В качестве же оси абсцисс можно принять либо k, либо D
. Если в качестве оси ординат принять k ( а помеченным параметром D
i ), то зависимость

Sz = ¦ (k, D
i)

будет получаться криволинейной, в соответствии с закономерностью . Проще строить и использовать прямолинейные графики при равномерных шкалах. Поэтому стараются номограммы строить на основе прямых линий. Поэтому лучше будет строить номограмму из помеченных линий вида

Sz = ¦ (D
, Ki),

где .

Теперь выбираем масштаб построения и диапазоны изменения переменных. С учетом условий процесса фрезерования принимаем D
£ 0,08 мм; Sz £ 0,20 мм/
зуб. Параметр k изменяем дискретно k = 2; 5; 10; 20; 30; 40; 50. Так как зависимость Sz = ¦
(D
, Ki) является прямой линией, проходящей через начало координат, то для построения графиков достаточно вычислить только одно значение Sz при каком
либо значении D
. Например, для k = 2, при D
= 0,06 мм имеем

( мм/зуб ).

Теперь через точки ( 0; 0 ) и ( 0,06; 0,06 ) можно провести прямую линию и пометить ее параметр k = 2. Аналогично проводятся и другие линии. На номограмме наносится линия, показывающая порядок ее использования.

4.2. Составные номограммы с помеченными линиями

Номограмму в одной четверти можно построить для функции двух переменных. При большем числе переменных это сделать уже нельзя. В этом случае используют составные номограммы. Идею построения рассмотрим сначала в общем виде.

Пусть нам дано уравнение в неявном виде с четырьмя переменными

¦ (х, y, z, h
) = 0.

Допустим, что его можно привести к виду

¦ 1(х, y) = ¦
2 (z, h ),

т.е. можно разделить переменные. Положим

¦ 1 (х, y) = g
;

¦ 2 (z, h
) = g .

Мы получим два уравнения, зависящих от двух переменных. Каждое из этих уравнений можно номографировать, как описано выше. Обеспечив отсчет величины g
на одинаковой функциональной шкале, можно обойтись и без численных значений g
( если они нас не интересуют по условиям решаемой задачи ).

Аналогично поступают и с уравнениями с большим числом переменных, которое будет приводить к увеличению числа общих шкал и большему числу четвертей построения номограммы. Нужно только иметь в виду, что не всякое уравнение допускает разложение на несколько уравнений с двумя переменными и, следовательно, не всякое уравнение удается таким образом номографировать.

Рассмотрим реальный пример построения составной номограммы.

При исследовании процесса фрезерования было установлено, что сила резания при фрезеровании узких поверхностей приобретает характер повторяющихся импульсов не гармонической формы. И возмущение технологической системы осуществляется не на одной, а в бесконечном диапазоне частот. Наиболее опасно воздействие первых трех гармоник, несущих значительно больше энергии возмущения, чем все другие. Распределение энергии по этим трем гармоникам осуществляется в зависимости от отношения фронтов нарастания и спада силы в импульсе. Это отношение можно характеризовать отношением углов контакта фрезы (j
) и зуба фрезы (y
) с заготовкой. Причем всегда j
³
y
.

Для наглядного представления и определения характера распределения энергии по трем гармоникам в зависимости от условий операции построим номограмму.

В одной из четвертей первоначально отражается характер распределения энергии по гармоникам возмущения в зависимости от j
/
y
(рис. 15). Эти зависимости построены из результатов исследований, которые здесь не отражаются. Коэффициент Х2 характеризует ²
удельный вес²
энергии данной гармоники в общем силовом возмущении. Диапазон j
/
y

=
1…9.

Теперь отношение j
/
y
раскрываем в параметрах инструмента и операции

.

Видно, что здесь четыре переменных величины: D, t, B, w
.

Введем промежуточную ось С и построим номограмму из помеченных линий для одной из переменных величин, а именно Вi

.

Видно, что это уравнения прямых линий, проходящих через начало координат. Задаваясь одним значением j
/
y
и Вi можно провести ее график. Например, при j
/
y
= 5, Вi = 5 получим С = 2×
5×5 = 50. Аналогично поступаем для Вi = 10; 15; 20.

Далее вводим следующую промежуточную ось ( и соответственно переменную ) L = C ×
tg w
i. Задаваясь величинами угла w
i и С можно определить положение помеченных линий. Например, при w
= 45°, С = 50

L = 50×
tg 45°
=50. Àíàëîãè÷íî ïîñòóïàåì и äëÿ äðóãèõ óãëîâ w
i = 15°
; 30°
; 60°
; 75°. Проводим прямые линии через начало системы координат и помечаем значение угла w
i каждой линии.

Таким образом осталась одна взаимосвязь параметров

.

Здесь необходимо определиться с параметром, направленном по оси и ²
помеченным²
параметром. В любом случае зависимость нелинейная. Кроме того, глубина резания является задаваемым параметром и его лучше взять в качестве ²
помеченного²
параметра. Для построения помеченных линий нужно определить несколько координат каждой линии.

Рассмотрим ²
помеченную²
линию t = 5 мм. В качестве переменного параметра принимаем диаметр фрезы D. При D = 25; 50; 100; 150; 200 мм соответственно имеем

По найденным точкам строится линия для t = 5 мм. Аналогично поступают и для других значений t.

Указаны промежуточные оси С, L, которые при использовании номограммы не нужны и могут не указываться, указаны и частные зависимости для каждой четверти номограммы.

Полученная номограмма наглядно показывает, что распределение энергии по гармоникам возмущения технологической системы определяется условиями операции, изменяя которые можно воздействовать на возмущение технологической системы.

Для исключения резонансных явлений необходимо знать спектр собственных частот системы и согласовывать условия операции с их значениями, уменьшая количество энергии на ²
резонансной²
частоте. Эти данные, как правило, отсутствуют. Поэтому используя номограмму можно скорректировать условия операции. Для этого по известным параметрам фрезы, которая показала неудовлетворительные результаты, и элементам режима резания необходимо определить распределение энергии по гармоникам возмущения и выбрать другое распределение. Так как глубину резания и ширину фрезерования изменять, как правило, невозможно, а изменение угла наклона режущей кромки часто нецелесообразно по условиям стойкости инструмента, то новое распределение энергии можно получить изменив диаметр фрезы ( в большую или меньшую сторону по сравнению с первоначальным ). При этом необходимо сохранить прежним относительное число зубьев ( z/D) и скорость резания, так как число оборотов и зубьев фрезы играют самостоятельную роль в определении частотного диапазона возмущения (inz).

Как видно из изложенного, номограмма может существенно помогать в управлении процессом резания, на основе заложенных в нее функциональных зависимостей.

Контрольные вопросы

  1. Сущность и назначение номографии;
  2. Функцию какого числа переменных можно отразить в одной четверти декартовой системы координат ?
  3. Понятие номограммы из ²
    помеченных²
    линий;
  4. Сущность составной номограммы и промежуточной функциональной шкалы.

5. ТИПОВЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

В целях закрепления знаний и получения практических навыков предлагается решить несколько задач, имеющих практическую направленность.

  1. При измерении твердости по Роквеллу были получены следующие результаты. Для образца А: 97,0; 98,7; 99,9; 99,5; 97,1; 99,5; 92,0; 100,6; 99,7; 98,0; 98,5; 99,5; 99,7; 99,5; 99,0; 98,5; 99,5; 98,8; 98,5; 99,1; 98,4; 96,6; 97,2; 101,7; 97,2; 98,2; 97,5; 97,7; 99,0; 99,0; 97,5. Для образца В, проверяемого на этом же приборе: 85,6; 87,1; 87,9; 86,9; 85,6; 85,2; 85,5; 85,7; 84,7; 86,4; 80,0; 85,0; 82,0; 86,0; 86,0; 87,3; 84,5; 87,0; 87,3; 85,4; 91,0; 90,0; 90,8; 89,2; 91,0; 90,4; 84,1; 81,7; 87,4; 84,0; 85,2.

Для каждой группы данных определить значение измеряемого параметра, наличие промахов в ряду измерений. Для какой группы измерений результат получен точнее? Выбрав в случайном порядке 1, 4, 9, 16, 25 отсчетов проверить справедливость зависимости точности среднего значения от числа измерений. Построить эмпирические законы интегрального и дифференциального распределений. Подобрать теоретический закон распределения и оценить его соответствие.

  1. Отклонения диаметра вала распределены по нормальному закону. Половина значений
    диаметра лежит в интервале 20 ± 0,1 мм. Отклонения
    диаметра отверстия также распределены по нормальному закону. Половина всех
    отклонений отверстия находится в интервале 20 ±
    0,05 мм. Полагая, что сборка соединения производится вручную, определите,
    сколько из 50 валов не подойдет по размеру. Какой номинальный диаметр осевого
    отверстия ( вместо 20 мм ) следует задать ( при том же законе распределения
    ), чтобы все 100% деталей подошли друг к другу
    при ручной сборке.
  2. В цехе машиностроительного завода выполняется сложный заказ, с определенной
    вероятностью возникновения брака. Для обеспечения плана выпуска 100 изделий
    запущено в производство 110 единиц. Какова вероятность, что заказ будет выполнен
    если вероятность получения одного изделия 0,9; 0,95 ?
  3. При исследовании обрабатываемости одного из конструкционных материалов были
    получены зависимости периода стойкости зуба фрезы от угла наклона w
    стружечной канавки.

Результаты приведены в таблице:

w
°

20

30

40

50

60

T, мин

30

60

80

70

50

Используя метод наименьших квадратов и параболического интерполирования получить аналитическую зависимость стойкости от угла наклона .

  1. С помощью критерия c
    2 проверьте соответствие числа бракованных деталей за 51 смену пуассоновскому распределению.

Число бракованных

изделий за одну

смену, m

0

1

2

3

4

5

6

7

8

Число смен с m

бракованными

изделиями

3

7

9

12

9

6

3

2

0

  1. Известно, что количество бракованных инструментов в партии соответствует закону Пуассона с параметром интенсивности l
    = 0,5. Определить количество бракованных изделий в партии.
  2. Случайная величина х распределена по закону равной вероятности в интервале [
    1; 10 ]. Определите при каком значении х вероятность его нахождения в заданном интервале равна 0,05 и 0,95 ?
  3. Случайная величина х подчиняется нормальному закону распределения с параметрами х = 3, s
    2 = 25. Вычислить вероятности Р ( Х ³
    10 ), Р (
    2 £ Х £
    8 ), Р ( Х £
    10 ). Дайте графическую иллюстрацию результата.
  4. Станок
    автомат настроен на выполнение размера 100,1 мм. Разброс размеров деталей подчиняется нормальному закону распределения с дисперсией s
    2 = 0,25 мм2. Поле допуска на размер детали составляет 100 ±
    0,15 мм. Найдите долю брака при проведенной настройке, представьте ее в виде графика от среднеарифметического значения. На какое значение необходимо настроить автомат, чтобы доля брака была минимальной, определите эту долю. Пусть х = 100, s
    = 0,5. Что окажет большее влияние на увеличение доли брака
    сдвиг х на ±
    0,5 или увеличение s
    на 0,5 ?
  5. При исследовании силы резания в зависимости от глубины резания была измерена главная составляющая силы резания Рz при четырех значениях глубины резания

t, мм

1

2

3

4

Pz, Н

2300

3200

4000

4600

Графическим методом, методом средних и методом наименьших квадратов установить зависимость составляющей силы от глубины резания.

ЛИТЕРАТУРА

  1. Теория Вероятностей, М. 1998
  2. Гутер Р.С., Овчинский Б.В. Элементы численного анализа и математической
    обработки результатов опыта. М.: Физматгиз,
    1962. 356 с.
  3. Зайдель А.Н. Ошибки измерения физических величин.
    Л.: Наука, 1974. 108 с.
  4. Кассандрова О.Н., Лебедев В.В. Обработка результатов наблюдений.
    М.: Наука, 1970. 104 с.
  5. Колесников А.Ф. Основы математической обработки результатов измерений.
    Томск: ТГУ, 1963. 49 с.
  6. Плескунин В.И., Воронина Е.Д. Теоретические основы организации и анализа
    выборочных данных в эксперименте. Учебное пособие.
    Л.: ЛЭУ, 1979. 232 с.
  7. Румшинский Л.З. Математическая обработка результатов эксперимента. Справочное
    руководство. М.: Наука, 1971.
    192 с.
  8. Рыжов Э.В., Горленко О.А. Математические методы в технологических исследованиях.
    Киев: Наук. думка, 1990.
    184 с.
  9. Сухов А.Н. Математическая обработка результатов измерений. Учебное пособие.
    М.: МИСИ, 1982.
    89 с.
  10. Чкалова О.Н. Основы научных исследований.
    Киев: Вища школа, 1978. 120 с.

Дата добавления: 29.03.2001

Обратная связь

Причины возникновения погрешностей.

Введение.

Измерение физических величин и получение их числовых значений являются непосредственной задачей большинства физических экспериментов. При измерениях значение физической величины выражается в виде числа, которое указывает, во сколько раз измеренная величина больше (или меньше) другой величины, например, времени, пути, скорости и т. д. Физика устанавливает связь между такими величинами и выражает ее в виде формул, которые показывают, как числовые значения одних величин могут быть найдены по числовым значениям других.

Получение надежных числовых значений не является простой задачей из-за погрешностей, неизбежно возникающих при измерениях. Мы рассмотрим эти погрешности, а также методы, применяемые при обработке результатов измерений. Владение этими методами нужно для того, чтобы научиться получать из совокупности измерений наиболее близкие к истине результаты, вовремя заметить несоответствия и ошибки, разумно организовать сами измерения и правильно оценить точности полученных значений.

Измерения подразделяются на прямые и косвенные. В зависимости от вида измерений существуют различные методы оценки их точности. В свою очередь погрешности, допускаемые в процессе эксперимента, разделяются на систематические, случайные и грубые ошибки (промахи).

Прямые измерения производятся с помощью приборов, которые измеряют непосредственно саму исследуемую величину. Так, массу тела можно найти с помощью весов, длину измерить линейкой, а время – секундомером.

К косвенным относятся измерения таких физических величин, для нахождения которых необходимо использовать связь в виде формулы с другими, непосредственно измеряемыми величинами, например, нахождение объема тела по его линейным размерам, нахождение плотности тела по измеренным массе и объему, расчет сопротивления проводника по показаниям вольтметра и амперметра.

Причины возникновения погрешностей.

Из-за действия множества искажающих факторов результат каждого отдельного измерения физической величины не совпадает с ее истинным значением. Разность между результатом измерения и истинным значением измеряемой величины называется погрешностью измерений (ошибкой измерений).

Различают три типа погрешностей измерений: грубые ошибки (промахи), систематические и случайные погрешности. Грубые ошибки, или промахи, обычно бывают связаны с неисправностью измерительной аппаратуры, либо с ошибкой экспериментатора в отсчете или записи показаний приборов, либо с резким изменением условий измерений. Результаты измерений, соответствующих грубым ошибкам, нужно отбрасывать и взамен проводить новые измерения.

Методические погрешности обусловлены неадекватностью принимаемых моделей реальным объектам. Например, при измерении геометрических параметров вала или трубы их моделируют цилиндром. Диаметр цилиндра должен быть одинаков во всех сечениях и всех направлениях, образующие также должны иметь одинаковую длину. Однако в силу внутренних особенностей материала и несовершенства используемых технологий изготовления это правило обычно нарушено.

Другая причина – несовершенство методов измерений. Если расстояние между двумя точками порядка 100 м измеряется посредством многократного наложения метровой линейки, то в результате измеряется длина некоторой ломаной линии.

Погрешность может быть обусловлена также упрощением зависимостей, положенных в основу измерений. Например, ускорение свободного падения g можно определить, если измерить время t, в течение которого некоторое тело в свободном падении пройдет определенное расстояние h . При этом пользуются соотношением

,

которое справедливо, если на тело действует только сила тяжести. Реально на тело действует также сила сопротивления, которая в данном случае не учитывается.

Инструментальные (приборные) погрешности обусловлены особенностями принципов и методов измерений, используемых в приборах, а также их схемным, конструктивным и технологическим несовершенством. Одна из причин такой погрешности – погрешность калибровки, возникающая в процессе перехода от эталона к реальному средству измерения. Приборные погрешности определяются при испытании средства измерения и указываются в технической документации. Уменьшение инструментальной погрешности достигается применением более совершенных и точных приборов. Однако полностью устранить приборную погрешность невозможно.

Систематические погрешности сохраняют свою величину и знак во время эксперимента. Они могут быть связаны с ошибками приборов (неправильная шкала, неравномерно растягивающаяся пружина, неравномерный шаг микрометрического винта, неравные плечи весов) и с самой постановкой опыта, например, при взвешивании тела малой плотности без учета выталкивающей архимедовой силы, которая систематически занижает вес тела. Систематические погрешности опыта могут быть изучены и учтены путем внесения поправок в результаты измерений. Если систематическая погрешность опыта слишком велика, то обычно оказывается проще использовать новые, более точные приборы, чем исследовать погрешности старых.

Оценку систематических погрешностей экспериментатор проводит, анализируя особенности методики, паспортную точность прибора и проводя контрольные опыты. В учебном практикуме учет систематических ошибок ограничивается, как правило, лишь случаем инструментальных погрешностей.

Систематические погрешности стрелочных электроизмерительных приборов (амперметров, вольтметров, потенциометров и т. п.) определяется их классом точности, который выражает абсолютную погрешность прибора в процентах от максимального значения включенной шкалы. Пусть на шкале вольтметра с диапазоном показаний от 0 до 10 В в кружке стоит цифра 1. Эта цифра показывает, что класс точности вольтметра равен 1 и предел его допустимой погрешности равен 1% от максимального значения включенной шкалы, т. е. равен 0,1 В. Общая формула для расчета максимальной абсолютной погрешности имеет вид:

,

где K – класс точности прибора, Aмакс – верхний предел измерений прибора (либо данного его диапазона).

Кроме того, надо иметь в виду, что наносить деления на шкале принято с таким интервалом, чтобы величина абсолютной погрешности прибора не превышала половины цены деления шкалы.

Класс точности стрелочных электроизмерительных приборов (как и полцены деления шкалы) определяет максимальную (предельную) абсолютную погрешность, величина которой не меняется вдоль всей шкалы. Относительная же погрешность при этом резко меняется, поэтому приборы обеспечивают лучшую точность при отклонении стрелки почти на всю шкалу. Отсюда следует рекомендация: выбирать прибор так, чтобы стрелка прибора при измерениях находилась во второй половине шкалы. Относительную погрешность прибора можно рассчитать по формуле:

.

В последнее время широко используются цифровые универсальные приборы, в том числе и электроизмерительные, отличающиеся высокой точностью и многоцелевым назначением. В отличие от стрелочных приборов систематические погрешности цифровых электроизмерительных приборов оцениваются по формулам, приводимым в инструкциях по эксплуатации.

Если класс точности прибора не указан и в паспорте прибора нет данных относительно его инструментальной погрешности, то обычно считают, что эта погрешность равна половине цены наименьшего деления шкалы прибора. В случае прибора, стрелка которого перемещается не равномерно, а «скачками» (например, у ручного секундомера), приборную погрешность считают равной цене деления шкалы.

Случайные погрешности измерений меняют величину и знак от опыта к опыту. Многократно повторяя одни и те же измерения, можно заметить, что довольно часто их результаты не в точности равны друг другу, а «пляшут» вокруг некоторого среднего значения.

Случайные погрешности могут быть связаны, например, с сухим трением (из-за которого стрелка прибора вместо того, чтобы останавливаться в правильном положении, «застревает» вблизи него), с люфтом в механических приспособлениях, с тряской, которую в городских условиях трудно исключить, с несовершенством объекта измерений (например, при измерении диаметра проволоки, которая из-за случайных причин, возникающих при изготовлении, имеет не вполне круглое сечение) или с особенностями самой измеряемой величины. Примером в последнем случае может быть число космических частиц, регистрируемых счетчиком за 1 минуту. Повторяя измерения, найдем, что в разных опытах получаются разные числа, хотя и не слишком отличающиеся друг от друга, колеблющиеся около некоторого среднего значения.

Случайные погрешности эксперимента исследуются путем сравнения результатов, полученных при нескольких измерениях, проведенных в одинаковых условиях. Если при двух-трех измерениях, проведенных в одинаковых условиях, результаты совпали, то на этом следует остановиться. Если они расходятся, нужно попытаться понять причину расхождения и устранить ее. Если устранить причину не удается, следует произвести 10-12 измерений и, записав все результаты, обработать их в соответствии с полученной закономерностью разброса величин.

Случайные погрешности устранить нельзя, но благодаря тому, что они подчиняются вероятностным закономерностям, всегда можно указать пределы, внутри которых с заданной вероятностью заключается истинное значение измеряемой величины.

Задача определения случайных погрешностей была решена созданием теории, хорошо согласующейся с экспериментом. В основе этой теории лежит закон нормального распределения, включающий следующие закономерности:

1. При большом числе измерений ошибки одинаковой величины, но разного знака, встречаются одинаково часто.

2. Частота появления ошибок уменьшается с ростом величины ошибки. Иначе говоря, большие ошибки наблюдаются реже, чем малые.

3. Ошибки измерений могут принимать непрерывный ряд значений.

Случайные погрешности изучают, опираясь на изложенные закономерности, и для понимания такого подхода требуется ввести понятие вероятности.

Статистическая вероятность события определяется отношением числа n случаев его проявления к общему числу N всех возможных равновероятных случаев:

Надежностью результата измеренияфизической величины А называется вероятность Р того, что истинное значение А действительно лежит в интервале от до

Абсолютной погрешностью измерений называют разность между найденным на опыте и истинным значением физической величины. Обозначая абсолютную погрешность измерения величины А символом , получим

.

Кроме абсолютной погрешности часто бывает важно знать относительную погрешность измерений, которая равна отношению абсолютной погрешности к значению измеряемой величины:

.

Качество измерений обычно определяется именно относительной, а не абсолютной погрешностью. Одна и та же погрешность в 1 мм при измерении длины комнаты не играет роли, при измерении стола может быть существенна, а при определении диаметра болта совершенно недопустима.

За наиболее достоверное значение непосредственно измеряемой величины А принимают среднее арифметическое <A> из всех n результатов ее измерений А1, А2, …, Аi, …, Аn:

.

Окончательный результат измерения величины А представляют в форме

.

При числе измерений n 5 с надежностью Р 2/3 можно принять, что абсолютная погрешность равна стандартной (среднеквадратичной) погрешности

.

Если необходимо повысить надежность результата, то значение следует соответственно увеличить, положив

,

где t – положительный коэффициент, задаваемый распределением Стьюдента. Значения коэффициентов Стьюдента рассчитаны и приведены в таблицах.




©2015- 2023 pdnr.ru Все права принадлежат авторам размещенных материалов.

проф.д.мед.н. Ледощук Б.А.

          ПРОБЛЕМЫ СИСТЕМАТИЧЕСКИХ И СЛУЧАЙНЫХ ОШИБОК

проф.д.мед.н. Ледощук Б.А.

ОШИБКА

отклонения (разности) между исчисленными показателями и действительными (истинными) величинами исследуемых явлений.

СИСТЕМАТИЧЕСКАЯ ОШИБКА

или смещение (bias) — это систематическое (неслучайное, однонаправленное, тенденциозное) отклонение результатов от истинных значений.

СЛУЧАЙНАЯ ОШИБКА

отклонение результата отдельного наблюдения в выборке от истинного значения в популяции, обусловленное исключительно случайностью.

ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ

проф.д.мед.н. Ледощук Б.А.

размер выборки и мощность.
Испытание должно быть достаточно большим, чтобы с высокой вероятностью определить эффект (если он есть) как статистически значимый и быть уверенным в действительном отсутствии пользы, если она при проведении испытания не обнаружена .
Речь идет о размере выборки (он же объем выборки, количество наблюдений, количество анализируемых объектов и т.п.)

Перед началом клинического испытания необходимо определить

проф.д.мед.н. Ледощук Б.А.

Систематическая ошибка:
на различных этапах исследования (планирования и анализа), связанных с:
отбором или выборкой измерением, регистрацией вмешивающимися факторами при оценке влияния факторов на исходы болезней
Случайная ошибка:
на этапе измерения, 2) регистрации данных,
3) переноса данных с бумажного носителя в компьютер

Возникновение ошибок

проф.д.мед.н. Ледощук Б.А.

Систематическая ошибка обусловлена отбором, когда сравниваемые группы пациентов различаются не только по изучаемому фактору, но и по другим факторам, влияющим на исход.
Систематическая ошибка связана с измерением, когда в сравниваемых группах были использованы различные методы измерения. отсутствие соответствующей четкой инструкции по проведению измерения
Систематическая ошибка обусловлена вмешивающимися факторами, когда один фактор связан с другим, и эффект одного искажает эффект другого.

Типы систематических ошибок

проф.д.мед.н. Ледощук Б.А.

Ошибки измерения Возникают вследствие недостаточной мощности выборки, артефактов
Ошибки регистрации.
Возникают вследствие неправильного установления фактов в процессе наблюдения или неправильной их записи и могут быть как при сплошном, так и несплошном наблюдении
2. Ошибки переноса данных с первичного документа или бумажного носителя на промежуточный документ или разработочную карту, или в компьютер

Типы случайных ошибок

проф.д.мед.н. Ледощук Б.А.

В отличие от систематической ошибки, которая вызывает отклонение оценки от истины либо в одну, либо в другую сторону,
случайная вариация с одинаковой вероятностью приводит к завышенной и к заниженной оценке.

Влияние на результат

проф.д.мед.н. Ледощук Б.А.

При планировании ВАЖНО ОПРЕДЕЛИТЬ:
может ли систематическая ошибка вообще присутствовать при данных условиях исследования;
имеется ли она в данном исследовании;
вызовет ли эта ошибка клинически значимое искажение результатов.

Пути минимизации ошибок (систематической ошибки)

КАК УМЕНЬШИТЬ ОШИБКИ?

проф.д.мед.н. Ледощук Б.А.

Чтобы избежать систематических ошибок — применяются специальные методы отбора материала (лучше всего — слепая рандомизация, слепой контроль, двойной, тройной слепой контроль)
Чтобы учесть случайные ошибки — правильно применять методы статистики

проф.д.мед.н. Ледощук Б.А.

ПРИ ПЛАНИРОВАНИИ использование методов:
РАНДОМИЗАЦИЯ — распределение пациентов по группам таким образом, чтобы каждый пациент имел равные шансы попасть в ту или иную группу
ВВЕДЕНИЕ ОГРАНИЧЕНИЙ– ограничение диапазона пациентов, включаемых в исследование;
ПОДБОР СООТВЕТСТВУЮЩИХ ПАР – подбор каждому пациенту в одной группе одного или более пациентов с такими же характеристиками (кроме изучаемой) для группы сравнения.

Пути минимизации ошибок
(систематической ошибки)

проф.д.мед.н. Ледощук Б.А.

ПРИ АНАЛИЗЕ использование методов:
СТРАТИФИКАЦИЯ — сравнение влияния изучаемого фактора на частоту исходов внутри подгрупп, имеющих одинаковый исходный риск
СТАНДАРТИЗАЦИЯ ПРОСТАЯ – математическая корректировка исходного значения какой-либо одной характеристики таким образом, чтобы уравнять подгруппу по исходному риску ;

Пути минимизации ошибок
(систематической ошибки)

проф.д.мед.н. Ледощук Б.А.

ПРИ АНАЛИЗЕ использование методов:
СТАНДАРТИЗАЦИЯ МНОЖЕСТВЕННАЯ — корректировка различия по многим влияющим факторам, применяя методы математического моделирования
АНАЛИЗ «НАИЛУЧШИЙ ВАРИАНТ – НАИХУДШИЙ ВАРИАНТ» – описание результатов, которые могут получиться, если исходить из предположений о максимальной выраженности систематической ошибки при отборе.

Пути минимизации ошибок
(систематической ошибки)

проф.д.мед.н. Ледощук Б.А.

МЕТОДЫ БИОСТАТИСТИКИ;
КОНТРОЛЬ КАЧЕСТВА технических процедур на всех этапах исследования:
повторные выборочные процедуры, выполняемые другим исполнителем или независимым экспертом
(работа с первичной меддокументацией, ввод данных в компьютер, проведение измерений и т.п.):
логический контроль дат, числовых данных на соответствие реально допустимым;

Пути минимизации ошибок
(случайной ошибки)

проф.д.мед.н. Ледощук Б.А.

Наличие специального протокола (содержит обоснование, значение и цели, этапы исследования, методы отбора субъектов исследования, способы предотвращения систематических и случайных ошибок);
Наличие четких инструкций
для участников исследований в том числе:
локального персонала, супервайзеров;
научных сотрудников, научных руководителей;
директоров проектов, менеджеров

Необходимые условия для устранения систематических и случайных ошибок или минимизации

проф.д.мед.н. Ледощук Б.А.

Информационное согласие
субъектов исследования;
Проведение измерений однообразнымиприборными средствами и методами, стандартными лабораторными инструментами и реактивами, по единой методике
Контроль качества на всех этапах технологического процесса проведения исследования.

Необходимые условия для устранения систематических и случайных ошибок или минимизации

проф.д.мед.н. Ледощук Б.А.

Клиническая эпидемиология и информационные технологии
дают возможность клиническую практику основывать не только на интуиции, клиническом опыте и традициях отдельных научных школ,
но в первую очередь на количественном
и качественном анализе мировых научных данных
(Министр здравоохранения РФ Ю.Л. Шевченко, 2003)

проф.д.мед.н. Ледощук Б.А.

Лечебное или профилактическое вмешательство Клиническое испытание (рандомизированное контролируемое исследование)
Диагностика Одномоментное исследование
Прогноз Когортное исследование
Причинно-следственная связь, этиология, факторы риска Когортное исследование, исследование случай-контроль, реже – серия случаев

Основные клинические вопросы и соответствующие им типы клинических исследований

проф.д.мед.н. Ледощук Б.А.

— недоучет случаев в связи с жесткими критериями диагностики
— избыточное число случаев
( в том числе не имеющих отношения к данному диагнозу) в связи с недостаточными требованиями к диагнозу

Диагностические критерии

проф.д.мед.н. Ледощук Б.А.

Выбор по:
этиологии, патогенезу,
локализации процесса
МКБ-9 или МКБ-10
Клиническая классификация

Классификация болезней

проф.д.мед.н. Ледощук Б.А.

Факторы, влияющие
на качество диагнозов
Субъективные, объективные симптомы;
результаты лабораторных и инструментальных исследований
Диагностические критерии (большинство болезней не имеет четких критериев)
Классификация болезней (при неопределенности; неясных, не уточненных случаях)
Достоверность диагноза — аутопсия (виды исследований), интерпретация
Ошибки классификации

Достоверность диагнозов

проф.д.мед.н. Ледощук Б.А.

Строгий отбор случаев
потеря истинных заболеваний

Мягкий отбор случаев
Получение случаев, не имеющих значения

Гиподиагностика

Гипердиагностика

Достоверность диагнозов

проф.д.мед.н. Ледощук Б.А.

Под чувствительностью понимают вероятность того,
что больной будет классифицирован как больной
число больных, классифицированных как больных
Ч = общее число больных
Под специфичностью понимают вероятность того, что здоровый будет классифицирован как здоровый
  число здоровых, классифицированных как здоровых
С = общее число здоровых

Чувствительность и специфичность

проф.д.мед.н. Ледощук Б.А.

МОДЕЛЬ ЧУВСТВИТЕЛЬНОСТИ И СПЕЦИФИЧНОСТИ
по A. Ahlbom, S.Norel 1990

Население

Больные

Классифицированные
как больные

Больные клас.
как здоровые

Здоровые клас.
как больные

Больные, классифицированные как больные

(Ложно
Положительные)

(Ложно
Отрицательные)

Миф о доказательности результатов научных исследований

проф.д.мед.н. Ледощук Б.А.

p < 0,05

Величина “р” не может быть доказательством эффективности лечения

Значение p<0,05 свидетельствуют ТОЛЬКО, о том что разница между группами не случайна

НЕВЕРНО

Различие между
группами А и Б
статистически
значимо,
значит лечение
эффективно.

ВЕРНО

Различие между группами
А и Б статистически значимо и не связано с влиянием систематических

ошибок, значит лечение
эффективно.

Интернет информация о современной эпидемиологии и доказательной медицины

проф.д.мед.н. Ледощук Б.А.

проф.д.мед.н. Ледощук Б.А.

SAS
Institute
Inc., Cary,NC,USA

СТАТИСТИЧЕСКИЕ ПРОГРАММЫ
ДЛЯ АНАЛИЗА ДАННЫХ

Понравилась статья? Поделить с друзьями:
  • Систематическая ошибка теория вероятности
  • Система торможения бмв ошибка
  • Систематическая ошибка линейки
  • Систематическая ошибка социология
  • Система снижения токсичности рено каптур ошибка как исправить