Коварная ошибка это

Другие записи

13 марта 2020

Идём на BeerPHP SPB Meetup #2!

Хотите поговорить о PHP за под пиво пятничным вечером? Заметьте, это просто посиделки, а конференция, на которой мы, будем выступать. Не полным составом, конечно, а силами двух спикеров.

7 июня 2018

Секретный ингредиент 1С-Битрикс: Сайты24

В предыдущей статье мы уже начали рассказывать вам о новой версии «1С-Битрикс: Управление сайтом», которую представили на презентации 30 мая. Мы успели выделить только некоторые “фишки” и особенности новой редакции, да и то рассказали о них в общих чертах. Теперь хотелось бы остановиться на некоторых блоках более подробно, в частности, поговорить о Сайтах24.

31 мая 2018

Прыжок в невесомость вместе с 1С-Битрикс 18.0

Весна для компании 1С-Битрикс оказалась очень плодотворной. Всего пару месяцев назад  мы всей командой слушали и обсуждали презентацию Битрикс24.Гонконг, а вчера появился ещё более весомый повод для дискуссий: релиз новой сборки версии «1С-Битрикс: Управление сайтом» 18.0.

Обычный опыт в жизни молодых специалистов по данным заключается в том, что они обучают модель, получают хорошие результаты, празднуют успех модели, развертывают модель в производственной среде, а затем обнаруживают, что модель плохо работает в производственной среде и что производительность в производственной среде не является оптимальной. такая же, как и на тестовой выборке.

Есть одна причина, которая появляется снова и снова за этим сценарием, и это то, что некоторые из ваших тренировочных функций на самом деле означают не то, что вы думаете. Как бы это было? Посмотрим на примере.

Представьте, что у вас есть торговая площадка онлайн-услуг, такая как Armut / Homerun, где клиенты размещают свои запросы на обслуживание (вакансии), а поставщики услуг (профи) отправляют расценки или предложения по этим запросам, а клиенты связываются с профессионалами, и, наконец, клиенты выбирают один из плюсы для работы. Таким образом, клиент может получить несколько предложений от разных профессионалов по своему запросу, и он выбирает только одного из них для выполнения работы.

Вы хотите создать модель, которая предсказывает, будет ли выбран профессионал для работы, которую он / она цитирует или на которую подает заявку, или нет. Вы можете создать обучающий набор, в котором каждая строка представляет собой расценки, сделанные профессионалом для работы, а целевая переменная — был ли этот профессионал выбран для работы заказчиком или нет. Естественно, в ваш набор тренировок вы должны включить, среди прочего, сведения о профессионалах и о работе.

Теперь представьте, что в базе данных, из которой вы извлекаете данные обучения, есть таблица профессионалов, в которой хранится количество заданий, выполненных каждым профессионалом в прошлом.

Итак, вы запрашиваете этот столбец и добавляете его к своим функциям, и, наконец, ваш набор данных выглядит примерно так:

Затем вы тренируете свою модель. Обученная модель будет хорошо работать на тестовой выборке, но будет плохо работать в производственной среде. Причина в том, что данные в таблице pro представляют собой текущее количество выполненных заданий для каждого профессионала. Не количество выполненных работ на момент, когда профессионал подал заявку на вакансию. Фактически это одна из форм утечки данных.

Это привело бы к ошибкам в данных обучения. Например, вы не найдете ни одного профессионала, который будет выбран для любой работы с нулевым количеством выполненных заданий, потому что все профессионалы, которые были выбраны для работы в прошлом, в настоящее время выполнили хотя бы одну работу. Хотя на самом деле это могла быть первая работа профессионала, а количество его выполненных работ могло быть нулевым в то время. И наоборот, вы обнаружите, что все профессионалы, у которых нет завершенных заданий, выбраны не во всех заданиях в обучающей выборке.

Из-за этой ошибки ваша модель усваивает неправильные вещи, например: любой профессионал, который не выполнял задания в прошлом, не будет выбран ни на какую работу. Следовательно, необходимо вычислить характеристики до соответствующего момента времени. В этом примере это будет расчет количества выполненных заданий до тех пор, пока профессионал не подаст заявку на вакансию в обучающем наборе, а не после. Это также означает, что, если вы не можете рассчитать соответствующие исторические версии функции, используя записи в своей базе данных, вам, возможно, придется исключить эту функцию из набора обучающих данных.

TL; DR: убедитесь, что ваши входные функции представляют состояние в соответствующий момент времени, а не текущее состояние.

При чтении книги или прохождении тренинга возможно два варианта.

  • Вы НЕ понимаете то, что вам рассказывают. Что с этим делать будет рассмотрено в отдельной статье
  • Вы все понимаете. Вот в этой ситуации есть подвох

Понимание материала в момент изучения не означает, что вы запомнили информацию и можете воспроизвести её.

Например вы прочитали главу как настраивать оборудование, поняли для чего нужны команды. Но вряд-ли вы сразу после этого сможете назвать все команды необходимые для настройки.

Или пример попроще вы прочитали рецепт и поняли как готовить блюда. Но когда начинаете готовить вы не помните точно все ингредиенты и необходимое количество.

В таких случаях люди обычно начинают зазубривать информацию. Но есть более эффективный способ.

Извлечение. Когда вы изучали главу. Попробуйте вспомнить ее содержание не подглядывая. Извлеките то, что осталось у вас в голове после чтения. Если вам не удается воспроизвести, разбиваете информацию на такие куски, которые в состоянии переварить.

Именно для этого нужны тесты и вопросы, чтобы вы начали извлекать информацию и лучше её усвоили.

Более глубокий уровень понимания

Если вы хотите усвоить информацию ещё лучше, попробуйте объяснить то, что изучили, человеку который раньше этого не понимал. Объяснение ещё раз извлекает информацию и структурирует её

Если вам и этого мало, то нужно переходить к самому действенному методу

Практика

Сделайте как можно больше повторений, используя изученную информацию.

Я слышал про учителя карате, который обучает людей для получения черного пояса с гарантией. В его школе отрабатывают 5-6 ударов и доводят их до совершенства.

Брюс Ли говорил(возможно не дословно, но смысл такой): «Я не боюсь человека который знает 10000 ударов, но я боюсь человека, который повторил один удар 10000 раз»

В институте учитель по математике после изучения какой то темы, давал домашнее задание решить по 100-200 примеров. После выполнения задания я мог решать сложные уравнения с интегралами и логорифмами в уме.

Все эти примеры демонстрируют важность множественного повторения, если вы хотите что-то усвоить на хорошем уровне.

Понравилась статья? Поделить с друзьями:
  • Книги про признание ошибок
  • Книга тактика ошибок
  • Книга у всех ошибок горький вкус
  • Книга три ошибки наших родителей
  • Книга ошибки семейного воспитания