Ошибка больших чисел

Проблема Больших Чисел

По мере освоения человеком окружающей среды, в науке все более утверждались воззрения, что процессы, протекающие в мире, подчиняются наиболее вероятному сценарию. Этот принцип лег в основание термодинамики, а она, в свою очередь, определила лицо всей техники. Кратко его можно выразить так: “Хотя маловероятные события и не запрещены, считаться следует только с тем, что имеет максимальную вероятность”. Например, молекулы воздуха, заполняющего вашу комнату, могли бы вдруг собраться в одной ее половине так, чтобы вы, оказавшись в другой половине, немедленно задохнулись. Но за всю историю человечества такое событие не было зафиксировано ни разу.

Термодинамические соображения приводили к успеху всегда и всюду, пока наука не стала заглядывать за границы собственно человеческого мира. Но и здесь поначалу все шло гладко. Исследования космоса привели к открытию закона всемирного тяготения, который описывается с помощью константы 
G = 6.67*10-8см3/г сек2 , получившей имя “гравитационной постоянной”. Затем была установлена универсальность скорости света c = 3*1010см/сек .

Иследование атомов и элементарных частиц привело к открытию квантовых эффектов. Как известно, минимальный квант действия далее неделим и равен величине h =6.67*10 -27 г см2/сек — постоянной Планка.

Совокупность ядерных превращений описывается своим набором фундаментальных постоянных, которые не так широко известны, как приведенная выше тройка G, c, h. Это заряд электрона (e2=2.3*10-19 г см3/сек2), массы электрона me = 9.11*10-28 г и протона m= 1.67*10-24 г, так называемая “постоянная тонкой структуры”, константы электромагнитного, слабого и сильного взаимодействий и другие.

К середине XX века научная картина мира вполне устоялась. Что касается Вселенной, то с этого времени она предполагалась конечной, как во времени, так и в пространстве. А поэтому можно было поставить вопрос о ее возрасте, размерах и массе. Эти величины оцениваются в настоящее время так: TU = 15 млрд.лет = 4.5*1017 секRU = 1028 см, MU = 1055 г .

Вот тут-то и прозвучал первый предупредительный звонок. Еще в 30-е годы Эддингтон, а потом и П.Дирак обратили внимание на странную систематичность, с которой в теории стали появляться числа порядка 1039. На этом основании Эддингтон попытался возродить платоновскую идею о роли чисел в структуре мира.

П.Дирак установил, что величины: k = e2/Gmem— отношение электрических и гравитационных сил в атоме водорода, и t=TU/ta — возраст Метагалактики, выраженный в атомных единицах времени ta=e2/mec3, обе близки по величине к 1039 . А N=MU/mp — отношение массы Метагалактики к массе протона — к ее квадрату, то есть, к (1039)2 . Эти совпадения между величинами, относящимися к микромиру и Вселенной в целом, до сих пор остаются загадочными. (См. книгу: П.Девиса. “Случайная Вселенная”, М.,Мир,1985). Так в физике появилась проблема больших чисел (БЧ). Сам П.Дирак полагал, что ”в качестве общего принципа можно принять, что все большие числа порядка 1039, 1078 и т.д., встречающиеся в общей физической теории, с точностью до простых числовых множителей равны t, t2 и т.д., где — время в современную эпоху, выраженное в атомных единицах”.


Примечание: Идея об универсальном метрономе Мироздания естественным образом возникла и в Концепции (см. Главу 6). Однако, в ней стандарт времени оказывается гораздо короче атомного (см. Главу 18). В Приложении H сформулирован закон подобия для микрокосмосов, который, как кажется, проливает свет на проблему БЧ.


Реакция научной общественности на подобные гипотезы была и остается неоднозначной. (Историю вопроса см. в статье В.Казютинского, “Антропный принцип и мир постнеклассической науки” в сб. Астрономия и современная картина мира, ИФ РАН, Москва1996). Многие отворачивались от проблемы БЧ в лучшем случае с иронией, а в худшем – с нескрываемым презрением, как от какой-то псевдонаучной чертовщины. Спекуляции на темы “пифагорейской мистики чисел” считались недостойными серьезных ученых.

Однако, нашлись люди, продолжившие изучение проблемы БЧ. Они установили, что в теории встречаются величины, близкие еще и к дробным степеням все того же числа 1039. Таковые, например, отношение плотностей фотонов и барионов (степень 1/4), отношение времени жизни типичной звезды к планковскому времени (степень 3/2) и другие.

Причина отрицательного отношения большинства ученых к проблеме БЧ видится в следующем: между микромиром и макромиром располагается обширная область термодинамических процессов. Им присущи мощные энтропийные проявления, приводящие к исчезновению информации. Поэтому они должны бы надежно заглушить информационное воздействие микрокмира на макромир. А значит, найденные соответствия следует расценить как бессмысленные. В ином случае пришлось бы отказаться от взгляда на Вселенную как на исключительно термодинамическое явление. Это не первый случай в истории науки, когда тревожащий фактор объявлялся несуществующим.

What Is the Law of Large Numbers?

The law of large numbers, in probability and statistics, states that as a sample size grows, its mean gets closer to the average of the whole population. This is due to the sample being more representative of the population as the sample become larger.

In a financial context, the law of large numbers indicates that a large entity which is growing rapidly cannot maintain that growth pace forever. The biggest of the blue chips, with market values in the hundreds of billions, are frequently cited as examples of this phenomenon.

Key Takeaways

  • The law of large numbers states that an observed sample average from a large sample will be close to the true population average and that it will get closer the larger the sample.
  • The law of large numbers does not guarantee that a given sample, especially a small sample, will reflect the true population characteristics or that a sample that does not reflect the true population will be balanced by a subsequent sample.
  • The law of large numbers indicates a bigger sample will represent a population mean, while the central tendency theorem states a bigger sample will represent a population’s distribution.
  • In business, the term «law of large numbers» is sometimes used in a different sense to express the relationship between scale and growth rates. 
  • As a company becomes bigger, it will experience difficulties maintaining percentage targets because the underlying dollars may become too large and unfeasible.

Investopedia / Julie Bang


Understanding the Law of Large Numbers

The law of large numbers can refer to two different topics. First, in statistical analysis, the law of large numbers can be applied to a variety of subjects. It may not be feasible to poll every individual within a given population to collect the required amount of data, but every additional data point gathered has the potential to increase the likelihood that the outcome is a true measure of the mean.

The law of large numbers does not mean that a given sample or group of successive samples will always reflect the true population characteristics, especially for small samples. This also means that if a given sample or series of samples deviates from the true population average, the law of large numbers does not guarantee that successive samples will move the observed average toward the population mean (as suggested by the Gambler’s Fallacy).

Second, the term «law of large numbers» is sometimes used in business in relation to growth rates, stated as a percentage. It suggests that, as a business expands, the percentage rate of growth becomes increasingly difficult to maintain. This is because the underlying dollar amount is actually increasing even if the growth rate as a percentage is to remain constant.

The Law of Large Numbers is not to be mistaken with the Law of Averages, which states that the distribution of outcomes in a sample (large or small) reflects the distribution of outcomes of the population.

Law of Large Numbers and Statistical Analysis

If a person wanted to determine the average value of a data set of 100 possible values, he is more likely to reach an accurate average by choosing 20 data points instead of relying on just two. This is because there is greater probability of the two data points being outliers or non-representative of the average, while there is lower probability in all 20 data points being non-representative.

For example, if the data set included all integers from one to 100, and sample-taker only drew two values, such as 95 and 40, he may determine the average to be approximately 67.5. If he continued to take random samplings up to 20 variables, the average should shift towards the true average as he considers more data points.

Law of Large Numbers and Central Limit Theorem

In statistical analysis, the law of large numbers is related to the central limit theorem. The central limit theorem states that as the sample size increases, the sample mean will be evenly distributed. This is often depicted as a bell-shaped curve where the peak of the curve depicts the mean and even distributions of sample data fall to the left and right of the curve.

In a related manner, the law of large numbers also states that data is refined as the sample grows. However, the law of large numbers more closely relates to the center of the bell curve. The law of large numbers indicates that as a sample size increases, the mean of the sample will more closely resemble the mean of the population. Therefore, the law of large numbers relates to the peak (the mean) of a curve, while the central limit theorem relates to the distribution of a curve.

Law of Large Numbers and Business Growth

In business and finance, this term law of large numbers is sometimes used colloquially to refer to the observation that exponential growth rates often do not scale. This is not actually related to the law of large numbers, but may be a result of the law of diminishing marginal returns or diseconomies of scale.

The same principles can be applied to other metrics, such as market capitalization or net profit. As a result, investing decisions can be guided based on the associated difficulties that companies with very high market capitalization can experience as they relate to stock appreciation. This concept is somewhat central to growth versus value stocks, as a company may find it to maintain its business strategy of rapid growth once it achieves market success.

Law of Large Numbers in Business Example

In fiscal year 2020, Tesla reported automotive sales (not gross sales) of $24.604 billion. The next year, the company reported $44.125 billion, an increase of roughly 79%. As electric vehicles are an emerging market and Tesla is beginning to finally experience economies of scale, the company is started to experience success very quickly.

The law of large numbers indicates that as Tesla continues to grow, it will become harder for the company to maintain this level of productivity. For example, assuming a steady growth rate of the next several years, it becomes quickly apparent that Tesla simply cannot maintain its current growth trajectory due to the underlying dollar values becoming unreasonable.

Theoretical Tesla Automobile Revenue
Year Revenue Notes
2021 $44.1 billion Actuals
2022 $79.0 billion
2023 $141.4 billion
2024 $253.1 billion Would exceed Apple’s six-month total net sales ending March 2022.
2025  $453.0 billion
2026  $810.9 billion Would be almost six times as large as Ford’s full year 2021 revenue ($136.3 billion).
2027  $1.451 trillion Would almost equal total 2021 car sales for the top 20 automakers combined was $1.7 trillion.
Assuming Consistent Growth Rate in Revenue From 2020 to 2027 using 2020-21 Rate

Law of Large Numbers and Insurance

The law of large numbers is also prominent in the insurance industry to calculate and refine projected risk. Imagine a situation where an insurance company is assessing how much to charge different customers for car insurance. Should the company have a small data set, it will not be able to adequately determine appropriate risk profiles.

As the insurance agency collects more data, it experiences the law of large numbers, they may soon find that young, male drivers are most likely to cause an accident. This larger sample becomes more representative of driving incidents, and the insurance company can arrive at more accurate conclusions about the appropriate insurance premiums to charge.

In addition, the law of large numbers allows insurance companies to deeply refine the criteria in which to assess premiums by analyzing what traits cause higher risk. For example,

Why Is the Law of Large Numbers Important?

In statistical analysis, the law of large numbers is important because it gives validity to your sample size. When working with a small amount of data, the assumptions you make may not appropriately translate to the actual population. Therefore, it is important to make sure enough data points are being captured to adequately represent the entire data set.

In business, the law of large numbers is important when setting targets or goals. A company may double its revenue in a single year. Should the company obtain only 50% growth in revenue the next year, it will have earned the same amount of money each of the last two years. Therefore, it is important to be mindful that percentages can be misleading as large dollar values escalate.

How Can Companies Overcome the Challenge of the Law of Large Numbers?

Companies often strive to overcome the challenge of the law of large numbers by acquiring smaller growth companies that can infuse scalable growth. They also attempt to become more efficient and utilize their size for manufacturing, ordering, or distribution benefits. Last, companies can be more attentive to dollar goals as opposed to percent goals.

What Is the Law of Small Numbers?

The law of small numbers is the theory that people underestimate the variability in small sample sizes. This means that when people study a sample size that is too small, they usually overestimate the population’s value based on the incorrect sample size.

What Is the Law of Large Numbers in Psychology?

Similar to other examples above, the law of large numbers in psychology translates to how a larger number of trials often leads to a more accurate expected value. As more trials are performed, the closer the projection is to being a correct medical assessment.

The Bottom Line

When analyzing a data set, ensure you understand the law of large numbers to determine whether or not your sample size is representative of your population. On the other hand, when analyzing a company, be mindful of its size. As a company becomes larger, the law of large numbers states it will become more difficult for a company to maintain a percentage change (growth) due to the underlying large change in dollar amounts.

О законе больших чисел (збч) написано много (например, на английском, тут и тут, также [1]). В этом тексте я попробую рассказать о том, чем закон больших чисел не является – об ошибочном восприятии этого закона и потенциальных ловушках, спрятанных в математических формулировках.

Начнем с того, что же такое закон больших чисел. Неформально, это математическая теорема о том, что «вероятность отклонений среднего по выборке от математческого ожидания мала» и что «эта вероятность стремится к нулю при увеличении выборки». Совсем неформально, теорема утверждает, что с мы можем быть в достаточной степени уверены, что среднее по нашей выборке достаточно близко к «настоящему» среднему и таким образом хорошо его описывает. Разумеется, предполагается наличие традиционного статистического «багажа» — наши наблюдения из выборки должны описывать одно и то же явление, они должны быть независимы, и мысль о том, что есть некоторое «настоящее» распределение с «настоящим» средним, не должна вызывать у нас существенных сомнений.

При формулировке закона мы говорим «среднее по выборке», и все что может быть математически записано как такое среднее, попадает под действие закона. Например, доля событий в общей массе может быть записана как среднее, — нам достаточно записать наличие события как «1» и отсутствие как «0». В итоге среднее будет равно частоте и частота должна быть близка к теоретическому среднему. Именно поэтому по ожидаем, что доля «орлов» при подбрасывании идеальной монеты будет близка к ½.

Рассмотрим теперь ловушки и ошибочные представления об этом законе.

Во-первых, ЗБЧ не всегда верен. Это всего лишь математическая теорема с «входными данными» — предположениями. Если предположения неверны, то и закон не обязан выполняться. Например, это так если наблюдения зависимы, или если нет уверенности в том, что «настоящее» среднее существует и конечно, или если изучаемое явление меняется во времени и мы не можем утверждать, что мы наблюдаем одну и ту же величину. По правде говоря, в определенной степени ЗБЧ верен и в этих случаях, например, для слабокоррелированных наблюдений или даже в том случае когда наблюдаемая величина меняется во времени. Однако, для корректного приложения этого к непосредственной реальности нужен хорошо тренированный специалист-математик.

Во-вторых, кажется верным, что ЗБЧ утверждает «среднее по выборке близко к настоящему среднему». Однако, такое утверждаение остается не полным: надо обязательно добавлять «с высокой долей вероятности; и эта вероятность всегда меньше 100%».

В-третьих, хочется сформулировать ЗБЧ как «среднее по выборке сходится к настоящему среднему при неограниченном росте выборки». Однако, это неверно, потому что среднее по выборке вообще никуда не сходится, так как оно случайное и остается таковым для любого размера выборки. Например, даже если подбросить симметричную монету миллион раз, все равное есть шанс, что доля орлов будет далека от ½ или даже равна нулю. В определенном смысле, всегда есть шанс получить что-то необычное. Надо признать, однако, что наша интуиция все-таки подсказыает нам что ЗБЧ должен описывать какую-то сходимость, и так есть на самом деле. Только «сходится» не среднее, а «вероятность отклонения выборочного среднего от его истинного значения», и сходится к нулю. Так как эта идея интуитивно очень удобна («шансы увидеть что-то необычное стремятся к нулю»), матетматики придумали для этого особый тип сходимости – «сходимость по вероятности».

В-четвертых, ЗБЧ не говорит ничего о том, когда выборочное среднее можно считать достаточно близким к теоретическому. Закон больших чисел только постулирует существование определенного явления, он ничего не говорит о том, когда его можно использовать. Получается, на ключевой вопрос с точки зрения практики — «могу ли я использовать ЗБЧ для моей выборки размера n?», закон больших чисел не отвечает. Ответы на эти вопросы дают другие теоремы, например, Центральная Предельная Теорема. Она дает представление о том, в каких пределах выборочное среднее может отклоняться от своего истинного значения.

В заключение следует отметить центральную роль ЗБЧ в статистике и теории вероятностей. История этого закона началась тогда, когда ученые заметили, что частоты некоторых повторяющихся явлений стабилизируются и перестают существенно меняться, при условии многократного повторения опыта или наблюдения. Поразительным было то, что эта «стабилизация частот» наблюдалась для совершенно несвязаных явления – от бросания игральной кости до урожайности в сельском хозяйстве, указывая на возможное существование «закона природы». Интересно, что этот закон природы оказался частью математики, а не физики, химии или биологии, как обычно бывает с законами природы.

[1] Illustrating the Law of Large Numbers (and Confidence Intervals) Jeffrey D Blume & Richard M Royall

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

Что Вы думаете про эту статью?


47.44%
Интересно, понятно и релевантно для меня
37


6.41%
Интересно, понятно, но не релевантно для меня
5


8.97%
Интересно и релевантно, но не понятно
7


3.85%
Интересно, но не релевантно и не понятно
3


2.56%
Релевантно, но неинтересно и непонятно
2


12.82%
Нерелевантно, неинтересно, непонятно
10


12.82%
Понятно, неинтересно, релевантно
10


5.13%
Понятно, неинтересно, нерелевантно
4

Проголосовали 78 пользователей.

Воздержались 9 пользователей.

%d0%b7%d0%b0%d0%ba%d0%be%d0%bd-%d0%b1%d0%be%d0%bb%d1%8c%d1%88%d0%b8%d1%85-%d1%87%d0%b8%d1%81%d0%b5%d0%bb

Взаимодействуя ежедневно в работе или учебе с цифрами и числами, многие из нас даже не подозревают о том, что существует очень интересный закон больших чисел, применяемый, например, в статистике, экономике и даже психолого-педагогических исследованиях. Он относится к теории вероятностей и говорит о том, что среднее арифметическое какой-либо большой выборки из фиксированного распределения близко к математическому ожиданию этого распределения.

Вы, наверное, заметили, что понять сущность этого закона непросто, особенно тем, кто не особо дружит с математикой. Исходя из этого, мы бы хотели рассказать о нем простым языком (насколько это возможно, конечно), чтобы каждый мог хотя бы примерно уяснить для себя, что это такое. Эти знания помогут вам лучше разобраться в некоторых математических закономерностях, стать более эрудированным и положительным образом повлиять на развитие мышления.

Понятия закона больших чисел и его трактовка

Помимо рассмотренного нами выше определения закона больших чисел в теории вероятностей, можно привести и его экономическое толкование. В этом случае он представляет собой принцип, согласно которому частоту финансовых потерь конкретного вида можно предсказать с высокой степенью достоверности тогда, когда наблюдается высокий уровень потерь подобных видов вообще.

Помимо этого, в зависимости от уровня сходимости признаков можно выделить слабый и усиленный законы больших чисел. О слабом речь идет, когда сходимость существует по вероятности, а об усиленном – когда сходимость существует практически во всем.

Если интерпретировать несколько иначе, то следует сказать так: всегда можно найти такое конечное число испытаний, где с любой запрограммированной наперед вероятностью меньше единицы относительная частота появления какого-то события будет крайне мало отличаться от его вероятности.

Таким образом, общую суть закона больших чисел можно выразить так: результатом комплексного действия большого количества одинаковых и независимых случайных факторов будет такой результат, который не зависит от случая. А если говорить еще более простым языком, то в законе больших чисел количественные закономерности массовых явлений будут явно проявляться только при большом их числе (поэтому и называется закон законом больших чисел).

Отсюда можно сделать вывод, что сущность закона состоит в том, что в числах, которые получаются при массовом наблюдении, имеются некоторые правильности, обнаружить которые в небольшом количестве фактов невозможно.

Сущность закона больших чисел и его примеры

Закон больших чисел выражает наиболее общие закономерности случайного и необходимого. Когда случайные отклонения «гасят» друг друга, средние показатели, определенные для одной и той же структуры, приобретают форму типичных. Они отражают действия существенных и постоянных фактов в конкретных условиях времени и места.

Определенные посредством закона больших чисел закономерности сильны только тогда, когда представляют массовые тенденции, и они не могут быть законами для отдельных случаев. Так, вступает в силу принцип математической статистики, говорящий, что комплексное действие ряда случайных факторов способно стать причиной неслучайного результата. И наиболее яркий пример действия данного принципа – это сближение частоты наступления случайного события и его вероятности, когда возрастает количество испытаний.

Давайте вспомним обычное бросание монетки. Теоретически орел и решка могут выпасть с одной и той же вероятностью. Это означает, что если, к примеру, бросить монетку 10 раз, 5 из них должна выпасть решка и 5 – орел. Но каждый знает, что так не происходит практически никогда, ведь соотношение частоты выпадения орла и решки может быть и 4 к 6, и 9 к 1, и 2 к 8 и т.д. Однако с увеличением количества подбрасываний монетки, например, до 100, вероятность того, что выпадет орел или решка, достигает 50%. Если же теоретически проводить бесконечное количество подобных опытов, вероятность выпадения монетки обеими сторонами всегда будет стремиться к 50%.

На то, как именно упадет монетка, влияет огромное число случайных факторов. Это и положение монетки на ладони, и сила, с которой совершается бросок, и высота падения, и его скорость и т.д. Но если опытов много, вне зависимости от того, как воздействуют факторы, всегда можно утверждать, что практическая вероятность близка к вероятности теоретической.

А вот еще один пример, который поможет понять сущность закона больших чисел: предположим, что нам нужно оценить уровень заработка людей в каком-то регионе. Если мы будем рассматривать 10 наблюдений, где 9 человек получают 20 тыс. рублей, а 1 человек – 500 тыс. рублей, среднее арифметическое составит 68 тыс. рублей, что, естественно, маловероятно. Но если мы возьмем в расчет 100 наблюдений, где 99 человек получают 20 тыс. рублей, а 1 человек – 500 тыс. рублей, то при расчете среднего арифметического получим 24,8 тыс. рублей, что уже ближе к реальному положению дел. Увеличивая число наблюдений, мы будем заставлять среднее значение стремиться к истинному показателю.

Именно по этой причине для применения закона больших чисел в первую очередь необходимо набрать статистический материал, чтобы получать правдивые результаты, изучая большое число наблюдений. Потому-то и удобно использовать этот закон, опять же, в статистике или социальной экономике.

Подведем итоги

Значение того, что закон больших чисел работает, сложно переоценить для любой области научного знания, и особенно для научных разработок в области теории статистики и методов статистического познания. Действие закона также обладает большим значением и для самих изучаемых объектов с их массовыми закономерностями. На законе больших чисел и принципе математической статистике основываются практически все методы статистического наблюдения.

Но, даже не беря во внимание науку и статистику как таковые, можно смело сделать вывод, что закон больших чисел – это не просто явление из области теории вероятностей, но феномен, с которым мы сталкиваемся практически каждый день в своей жизни.

Надеемся, теперь сущность закона больших чисел стала вам более понятна, и вы сможете легко и просто объяснить его кому-то другому. А если тема математики и теории вероятностей вам интересна в принципе, то рекомендуем почитать о числах Фибоначчи и парадоксе Монти Холла. Также познакомьтесь с приближенными вычислениями в жизненных ситуациях и самыми популярными числами. И, конечно же, обратите внимание на наш курс по когнитивистике, ведь, пройдя его, вы не только овладеете новыми техниками мышления, но и улучшите свои когнитивные способности в целом, в том числе и математические.

Желаем удачи!

Понравилась статья? Поделить с друзьями:

Интересное по теме:

  • Ошибка больше файлов не осталось 18
  • Ошибка биоса 8302
  • Ошибка биоса 0x0000007b
  • Ошибка биос устаревшая загрузка носителя только для uefi
  • Ошибка биос один длинный три коротких

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии