Главная страница «Первого сентября»Главная страница журнала «Математика»Содержание №34/2002

А. Мордкович, П. Семенов,
Москва

События, вероятности,
статистическая обработка данных

Дополнительные материалы к курсу алгебры 7-9 классов общеобразовательной школы

Предисловие для учителя

Предлагаемое учебное пособие готовится к публикации издательством «Мнемозина»; оно ориентировано на курс алгебры 7–9 А.Г.Мордковича (то же издательство). Это материалы для ознакомления (пока соответствующие темы курса не войдут в государственную программу) или для постепенного введения в практику школьного преподавания (если, разумеется, на то есть желание учителя). Если учитель выбирает второй вариант, то можно соответствующие материалы (быть может, для начала, с некоторыми купюрами) излагать в 9-м классе вместо главы «Элементы теории тригонометрических функций», завершающей учебник А.Г.Мордковича «Алгебра-9».

О необходимости изучения в школе элементов теории вероятностей и статистики речь идет очень давно. Приведем, например, цитату более чем столетней давности: «Приходилось слышать, что теория сочетаний и бином Ньютона предлагаются иногда как отделы, которые можно было бы сократить. Соглашаясь на другие сокращения, выскажусь решительно против сокращения теории сочетаний. Теория эта по особенному значению своему принадлежит к таким отделам, преподавание которых в гимназии следует непременно сохранить и поставить в лучшие условия. Теория сочетаний представляет средство для одной из важнейших способностей ума – способности представлять явления в разных комбинациях. Эта способность нужна в жизни всякому…». Так в 1899 году попечитель Московского учебного округа профессор П. А. Некрасов на совещании по вопросам о средней школе описывал значение и место в школьном образовании того, что сейчас принято называть стохастической линией в преподавании математики.

По вопросам улучшения, реформирования, модернизации и т.п. нынешнего школьного математического образования существуют весьма различные и порой достаточно полярные мнения. В то же время, среди вопросов собственно содержания обучения математике в школе никем, по существу, не оспариваемым положением является развитие именно стохастической линии в преподавании математики, т. е., в основе своей, именно теории сочетаний, о которой так выразительно писал профессор П. А. Некрасов еще в позапрошлом веке. Существенность развития комбинаторных возможностей интеллекта учащихся очевидна и с общих позиций теории развития личности, и с точки зрения различного рода практических приложений: развитие представлений о статистических закономерностях, формирование информационной культуры, оценка возможностей наступления событий и так далее В общем, «… эта способность нужна в жизни всякому …»

Учебное пособие как раз и посвящено изложению тех понятий, фактов, задач и обстоятельств, с которых, собственно, берет свое начало эта самая стохастическая линия.

В пособии пять параграфов, каждый из которых достаточно традиционным образом разбит на две части. В первой части каждого параграфа на большом количестве конкретных примеров изложены начальные положения, идеи и методы комбинаторики, теории вероятностей и статистики. Это основной учебный материал, который условно можно назвать теоретическим. Условность термина «теоретический» состоит в том, что изложение не носит никакого дедуктивного характера, но основано на разборе задач, упражнений, примеров и обсуждении полученных результатов. Например, если теоремы и присутствуют в тексте, то, в основном, как способ лаконичного подведения итогов предшествующих результатов. Таков же наш подход к определениям и новым терминам: они явно формулируются только после того, как из рассмотрения практических вопросов становится ясной необходимость их введения.

Во второй части каждого из пяти параграфов собраны упражнения. Подавляющее большинство из них состоят из четырех пунктов а) – г), сложность которых соответствующим образом возрастает. Ориентировочно, пункты а) и б) уместны для классной работы, б) и в) – для домашней, в) и г) – для самостоятельных и контрольных работ.

Несколько слов о методических особенностях избранного нами подхода к изложению имеющегося учебного материала. В первом параграфе собраны факты, которые частично могут быть уже знакомы школьникам: перебор случаев, дерево вариантов, правило умножения (об этом идет речь, например, в учебниках «Математика–5» и «Математика–6» — авторы И.И.Зубарева и А.Г.Мордкович, издательство «Мнемозина»). Основная цель этого параграфа – продемонстрировать универсальность правила умножения для независимого проведения испытаний. Например, мы получаем понятие факториала и формулу для числа перестановок элементов конечного множества именно как результат применения правила умножения. Независимость испытаний, разумеется, рассматривается только на интуитивном уровне, и в этом параграфе просто не обсуждается.

Второй параграф мы начинаем с подсчета числа встреч между командами в чемпионате. Приводятся два способа, второй из которых был известен еще в Древней Греции и состоит в «сдвигании» двух одинаковых лесенок. Отсюда получается число выборов двух элементов и затем, по аналогии — формула для выборов трех элементов. Основу здесь опять составляет правило умножения. Только после этого вводится понятие числа сочетаний из n по k и, по аналогии с уже имеющимися ответами, для k = 2, 3 приводится известная «факториальная» формула. Вопрос с 0! решается лингвистически: просто удобно считать, что 0! = 1. Про бином Ньютона ничего в теоретической части не говорится, хотя соответствующее упражнение на этот счет имеется. Треугольник Паскаля вводится как удобная таблица расположения чисел и не более того. Размещений с повторениями или без повторений и их связей с сочетаниями и перестановками нет: мы не видим необходимости на начальном этапе разбираться со всеми комбинаторными тонкостями. Параграф завершается обсуждением различий между реальным объектом и его моделью: подчеркивается, что независимость испытаний есть свойство модели, а не самой реальности.

Знакомство с теорией вероятностей происходит в третьем параграфе. Собственно, никакой теории нет. Изложение ведется в рамках классического определения вероятности и, по существу, представляет собой практический полигон, на котором применяются полученные ранее комбинаторные навыки. Из всей, в принципе возможной, алгебры событий мы оставляем только противоположное событие и сумму несовместных событий. Оба эти понятия вводятся только после того, как они возникают в конкретных задачах. Никаких «алгебраических» свойств событий мы не рассматриваем, равно как не рассматриваем и никакого формального подхода к определению случайного события, элементарного события, пространства событий и т.п. По нашему убеждению, хоть сколько-нибудь аксиоматизированный подход к этим понятиям на начальных этапах изучения может только помешать формированию интуитивного представления о случайных событиях. Здесь и так вполне хватает интересных конкретных задач. Этот параграф, как и предыдущий, заканчивается обсуждением, основная цель которого – еще раз напомнить, что классическое определение вероятности применимо к моделям реальности, а не к самой реальности. Здесь же впервые упоминается явление статистической устойчивости, что делает более плавным переход к следующему, четвертому параграфу, в котором рассмотрены начала статистики.

Мы делаем акцент на статистику как на обработку информации, при которой эта информация, быть может, и искажается, но принимает более выразительный и ясный вид. Изложение вполне традиционно, ограничивается построением простейших гистограмм и рассказом о формах проявления нормального закона распределения. Так как термин «частота» слишком часто используется в различных смыслах (эмпирическая, относительная, события, варианты и т.п.), то мы предпочли говорить не о «частоте» варианты, а о «кратности» варианты. Быть может, этот термин окажется более удобным для школы. В параграфе имеется и обсуждение некоторых числовых характеристик выборок, хотя, на наш взгляд, излишняя детализация тут является несомненным перебором. На первых порах вполне допустимо ограничиться «ручным» знакомством с простейшими приемами обработки экспериментально полученных данных. Параграф заканчивается более развернутым знакомством с явлением статистической устойчивости, которое тут впервые и формулируется.

Последний, пятый, параграф, с формальной точки связан с локальной и интегральной теоремами Лапласа, которые даже студенты университетов изучают ближе к концу стандартного курса теории вероятностей. Звучит страшно, но, оказывается, если ограничиться только описанием схемы Бернулли, упоминанием имени Лапласа и рассказом про табличное использование гауссовой кривой, то уже и с этим минимальным набором знаний вполне можно решать конкретные «массовые» задачи.

Таково содержание книги. Коротко говоря, наш подход состоит в максимально прямом переходе от простейших комбинаторных задач к практическому знакомству с нормальным законом распределения и явлением статистической устойчивости. В каждой теме мы сознательно ограничиваемся тем необходимым минимумом, который, по нашему мнению, достаточен для формирования основных комбинаторных и вероятностных представлений об окружающем нас мире. Каждый из представленных пяти параграфов может быть дополнен в разных учебных направлениях, но такого рода расширения разумно проводить уже в старшей профильной школе. Материал же, представленный здесь, образует своего рода фундамент, опираясь на который, можно в дальнейшем выстраивать всю стохастическую линию в преподавании математики в школе.

§ 1. Простейшие комбинаторные задачи.
Правило умножения и дерево вариантов.
Перестановки

Все мы довольно часто говорим: «это невероятно», «более вероятно, что …», «это маловероятно», «можно утверждать со стопроцентной вероятностью, что …», когда пытаемся спрогнозировать наступление того или иного события. При этом обычно мы опираемся на нашу интуицию, жизненный опыт, здравый смысл и т.п. Но очень часто такие приблизительные оценки оказываются недостаточными: нам важно знать, на сколько или во сколько раз одно случайное событие вероятнее другого. Иными словами, нужны точные количественные оценки, нужно уметь численно характеризовать возможность наступления того или иного события. Раздел математики, посвященный исследованию количественных оценок случайных событий, называется теорией вероятностей.

Вероятности различных случайных событий в ряде азартных игр (карты, кости, …) вычислили французские математики XVII века Пьер Ферма и Блез Паскаль. Они использовали метод, который позже был назван комбинаторным анализом или, проще, комбинаторикой. Сам термин «комбинаторный» впервые использовал немецкий философ, математик и дипломат Готфрид Лейбниц в своей «Диссертации о комбинаторном искусстве» (1666). Грубо говоря, комбинаторика – это искусство подсчета числа различных комбинаций, соединений, сочетаний, перестановок и т.п. тех или иных элементов некоторых множеств.

Мы не будем сейчас много говорить о предмете и содержании теории вероятностей и комбинаторики, мы просто займемся самим предметом. Все же, в качестве небольшой иллюстрации приведем такой конкретный пример. Начальник написал 10 различных писем и поручил своему помощнику надписать 10 конвертов с нужными адресами. Тот так и сделал, но разложить письма по конвертам перепоручил секретарше. Она выполнила это ответственное задание формально, т.е. разложила письма по конвертам случайным образом. Какова вероятность того, что ни одно письмо не попадет в нужный конверт? Ответ оказывается на удивление большим: вероятность такой масштабной ошибки превышает 36%!

Пример 1. Сколько четных двузначных чисел можно составить из цифр 0, 1, 2, 4, 5, 9 ?

Решение. Рассмотрим клетчатую прямоугольную таблицу, строки которой пометим первыми цифрами нужных нам чисел, а столбцы – вторыми цифрами этих чисел. Так как на первом месте может стоять любая цифра кроме 0, то строки будут отмечены цифрами 1, 2, 4, 5, 9. Значит, в этой таблице будет пять строк. Так как на втором месте должна стоять четная цифра, то столбцы будут отмечены цифрами 0, 2, 4. Значит, в таблице будет три столбца.

В клетки таблицы впишем двузначные числа естественным образом: первая цифра равна метке строки, а вторая цифра равна метке столбца. Так как выбор первой и второй цифры производится независимым образом, то все клетки будут заполнены. Кроме того, каждое из интересующих нас чисел где-то будет стоять: ведь мы и по строкам, и по столбцам перечислили все возможные варианты. Значит, искомых чисел будет столько же, сколько клеток в таблице, т.е. 5 ґ 3 = 15.

Ответ: 15.

Здесь мы осуществили перебор всех возможных вариантов или, как обычно говорят в таких случаях, всех возможных комбинаций. Поэтому подобные задачи называют комбинаторными.

Пример 2. На завтрак Вова может выбрать плюшку, бутерброд, пряник или кекс, а запить их он может кофе, соком или кефиром. Из скольких вариантов завтрака Вова может выбирать?

Решение. Соберем все варианты в такой таблице.

В ней три строки и четыре столбца, они образуют 12 клеток. Так как выбор еды и напитка происходит независимо, то в каждой клетке будет стоять один из возможных вариантов завтрака и, обратно, любой вариант завтрака будет стоять в одной из клеток. Значит, всего вариантов столько же, сколько и клеток.

Ответ: 12.

Как мы видим, примеры 1 и 2 – разные, а их решения – одинаковы. Основаны эти решения на общем правиле умножения.

Доказательство правила умножения повторяет решение примеров 1 и 2. Можно рассмотреть прямоугольную таблицу, строки которой помечены всеми исходами испытания А, а столбцы – всеми исходами испытания B.


Рис. 1.1

С одной стороны, клеток в такой таблице столько же, сколько всевозможных исходов независимого проведения испытаний А и B. С другой стороны, число всех клеток равно произведению числа строк на число столбцов.

Правило умножения для двух независимых испытаний удобно объяснять, используя прямоугольные таблицы. Но если проводятся три испытания, то для иллюстрации надо использовать и длину, и высоту, и ширину. На картинке получится прямоугольный параллелепипед, разбитый на кубики. Здесь уже и рисунок, и объяснения выглядят сложнее, поскольку, например, будут невидимые кубики. Еще хуже дело обстоит с четырьмя испытаниями. Для рисунка в этом случае нам не хватит измерений, поскольку окружающее нас пространство всего лишь трехмерно.

Оказывается, правило умножения для трех, четырех и т.д. испытаний можно объяснить, не выходя за рамки плоскости, с помощью геометрической картинки (модели), которую называют деревом возможных вариантов. Она, во-первых, как всякая картинка, наглядна и, во-вторых, позволяет все учесть, ничего не пропустив.

Пример 3. Несколько стран решили использовать для своего государственного флага символику в виде трех горизонтальных полос одинаковой ширины разных цветов — белого, синего, красного. Сколько стран могут использовать такую символику при условии, что у каждой страны — свой флаг?

Решение. Будем рассуждать так. Предположим, что первая полоса (верхняя) белого цвета (Б). Тогда вторая (средняя) полоса может быть синей (С) или красной (К), а третья (нижняя) полоса — соответственно красной (К) или синей (С). Получилось два варианта (две комбинации) цвета полос: белая, синяя, красная (БСК) или белая, красная, синяя (БКС).

Пусть, теперь, первая полоса синего цвета (С). Тогда вторая полоса может быть белой (Б) или красной (К), а третья полоса — соответственно красной (К) или белой (Б). Получилось два варианта: синяя, белая, красная (СБК) или синяя, красная, белая (СКБ).

Также разбирается случай первой полосы красного цвета (К). Получится еще два варианта: красная, белая, синяя (КБС) или красная, синяя, белая (КСБ) полосы. Всего получилось 6 комбинаций.

Рис. 1.2. Дерево вариантов

Ответ: 6.

Построенная схема напоминает перевернутое дерево: от ствола («флаг») отходят ветви, сначала три (Б, С, и К), от каждой из трех указанных — по две и затем еще по одной. Видимо, поэтому такую схему называют деревом возможных вариантов.

Вот как, например, выглядит дерево возможных вариантов для примера 1.

Рис. 1.3

Для следующего примера мы приведем три различных способа решения: прямым перебором, с помощью дерева вариантов и по правилу умножения.

Пример 4. В коридоре – три лампочки. Сколько имеется различных способов освещения коридора?

Решение. Первый способ. Пронумеруем лампочки и будем писать + или – в зависимости от того, горит или не горит очередная лампочка. Тогда все способы освещения можно просто перечислить:

+ + +, + + –, + – +, + – –, – + + , – + –, – – +, – – –.

Всего 8 способов.

Второй способ. Дерево возможных вариантов представлено на рисунке. С его помощью находим 8 способов освещения коридора.

Рис. 1.4

Третий способ. Первая лампочка может или гореть, или не гореть, т. е. имеется два возможных исхода. Но то же самое относится и ко второй, и к третьей лампочке. Мы предполагаем, что лампочки горят или нет независимо друг от друга. По правилу умножения получаем, что число всех способов освещения равно 2 ґ 2 ґ 2 = 8.

Ответ: 8.

У каждого из этих трех способов решения в каждом конкретном случае есть свои преимущества и свои недостатки. Выбор способа решения – за вами! Отметим все же, что правило умножения позволяет практически одним способом решать самые разнообразные задачи. Например, оно приводит к крайне важному в математике понятию факториала. Рассмотрим сначала примеры.

Пример 5. В семье – 6 человек, а за столом в кухне – 6 стульев. В семье решили каждый вечер, ужиная, рассаживаться на эти 6 стульев по-новому. Сколько дней члены семьи смогут делать это без повторений?

Решение. Ответ оказывается неожиданно большим: почти два года! Объясним его. Для удобства рассуждений пронумеруем стулья (№1–6) и будем считать, что семья (бабушка, дедушка, мама, папа, дочь, сын) будет рассаживаться на стулья поочередно. Нас интересует сколько всего существует различных способов рассаживания.

Предположим, что первой усаживается бабушка. У нее имеется 6 вариантов выбора стула. Вторым садится дедушка и независимо выбирает стул из 5 оставшихся. Мама делает свой выбор третьей, и выбор у нее будет из 4 стульев. У папы будет уже 3 варианта, у дочки — 2, а сын сядет на единственный незанятый стул. По правилу умножения получаем, что всего имеется

6 ґ‘ 5 ґ‘ 4 ґ‘ 3 ґ‘ 2 ґ‘ 1 = 720

различных способов рассаживания. Таким образом, в «игру с рассаживаниями» семья может играть 720 дней, т.е. почти 2 года.

Ответ: 720.

Пример 6. Десять разных писем раскладывают по одному в десять конвертов. Сколько существует способов такого раскладывания?

Решение. Переформулируем эту задачу в терминах предыдущей задачи. 10 человек рассаживаются по одному на 10 стульев. Сколько существует способов такого рассаживания? Повторяя предыдущее решение, получаем, что всего имеется

10 ґ‘  9 ґ‘   8 ґ‘  7 ґ‘  6 ґ‘  5 ґ‘  4 ґ‘  3 ґ‘  2 ґ‘  1 = 3 628 800

способов раскладывания писем по конвертам. Более 3,5 миллионов!

Ответ: 3 628 800.

Как мы видим, условия задач – разные, а решения, да и полученные ответы, по сути дела, одинаковы (по крайней мере по форме). Удобно поэтому ввести и одинаковые обозначения для таких ответов.

Определение. Произведение подряд идущих первых n натуральных чисел обозначают n! и называют «эн факториал»:

n! = 1ґ2ґ3ґ ... (n – 2)(n – 1)n.

(По-английски, одно из значений слова «factor» — «множитель». Так что «эн факториал» примерно переводится как «состоящий из n множителей».) Приведем несколько первых значений для n!:

1! = 1, 2! = 1ґ2 = 2, 3! = 1ґ2ґ3 = 6, 4! = 1ґ2ґ3ґ4 = 24, 5! = 4!ґ5 = 24ґ5 = 120, 6! = 5!ґ6 = 120ґ6 = 720 и т. д.

Как же сформулировать общее утверждение, частными случаями которого являются решения примеров 3, 5 и 6? Вот один из возможных вариантов.

ТЕОРЕМА. Множество из n различных элементов можно перенумеровать номерами от 1 до n ровно n! различными способами.

Каждый способ нумерации от 1 до n , о котором идет речь в теореме, часто называют перестановкой данного
n-элементного множества. Действительно, можно считать, что каждая такая нумерация просто расставляет, или переставляет, все элементы множества в некотором порядке.

Число перестановок множества из n элементов обозначают Pn. Значит, приведенную теорему можно записать в виде формулы

Pn = n!

Подведем краткие итоги нашего первоначального знакомства с комбинаторными задачами. Мы получили основное правило – правило умножения, рассмотрели его геометрическую модель – дерево возможных вариантов. Ввели новое понятие – понятие факториала, сформулировали теорему о перестановках, где это понятие используется. Что же касается независимости испытаний, для которых применимо правило умножения, то мы подробнее обсудим это понятие в конце следующего параграфа.

Продолжение в  № 35/2002.