Рубрики

Введение в машинное обучение

Термин «машинное обучение» был придуман Артуром Самуэлем в 1959 году, американским пионером в области компьютерных игр и искусственного интеллекта, и заявил, что «он дает компьютерам возможность учиться без явного программирования».
А в 1997 году Том Митчелл дал «правильное» математическое и реляционное определение: «Говорят, что компьютерная программа извлекает уроки из опыта E в отношении некоторой задачи T и некоторого показателя производительности P, если его производительность на T измеряется как P, улучшается с опытом E.

Машинное обучение — это последнее модное слово, распространяющееся вокруг. Это заслуживает, так как это одно из самых интересных подразделов информатики. Так что же на самом деле означает машинное обучение?

Давайте попробуем понять машинное обучение с точки зрения неспециалистов. Представьте, что вы пытаетесь бросить бумагу в мусорный ящик.

После первой попытки вы понимаете, что вложили в нее слишком много силы. После второй попытки вы понимаете, что находитесь ближе к цели, но вам нужно увеличить угол броска. То, что происходит здесь, в основном после каждого броска, мы чему-то учимся и улучшаем конечный результат. Мы запрограммированы учиться на нашем опыте.

Это подразумевает, что задачи, в которых рассматривается машинное обучение, предлагают принципиально оперативное определение, а не определение области в когнитивных терминах. Это следует предложению Алана Тьюринга в его статье «Вычислительная техника и интеллект», в которой вопрос «Могут ли машины мыслить?» Заменяется вопросом «Могут ли машины делать то, что мы (как мыслящие объекты) можем делать?»
В области анализа данных машинное обучение используется для разработки сложных моделей и алгоритмов, которые поддаются прогнозированию; в коммерческом использовании это известно как предиктивная аналитика. Эти аналитические модели позволяют исследователям, исследователям данных, инженерам и аналитикам «вырабатывать надежные, повторяемые решения и результаты» и раскрывать «скрытые данные» путем изучения исторических взаимосвязей и тенденций в наборе данных (входных данных).

Предположим, что вы решили проверить это предложение для отдыха. Вы просматриваете веб-сайт туристического агентства и ищете отель. Когда вы смотрите на конкретный отель, чуть ниже описания отеля есть раздел под заголовком «Вам также могут понравиться эти отели». Это типичный пример машинного обучения, называемый «механизмом рекомендаций». Опять же, многие данные были использованы для обучения модели, чтобы предсказать, какие отели будут вам лучше всего показывать в этом разделе, основываясь на большой информации, которую они уже знают о вас.

Поэтому, если вы хотите, чтобы ваша программа предсказывала, например, шаблоны трафика на оживленном перекрестке (задача T), вы можете запустить его через алгоритм машинного обучения с данными о прошлых шаблонах трафика (опыт E) и, если она успешно «выучила» », Он будет лучше предсказывать будущие модели трафика (показатель P).
Однако очень сложный характер многих реальных проблем часто означает, что изобретать специализированные алгоритмы, которые будут решать их идеально каждый раз, нецелесообразно, если не невозможно. Примеры проблем с машинным обучением включают: «Это рак?», «Кто из этих людей хорошо дружит?», «Понравится ли этому человеку этот фильм?». Такие проблемы являются отличными целями для машинного обучения и фактически для машины. обучение было применено такие проблемы с большим успехом.

Классификация машинного обучения

Реализации машинного обучения подразделяются на три основные категории, в зависимости от характера обучающего «сигнала» или «ответа», доступного для системы обучения, а именно: —

  1. Контролируемое обучение: когда алгоритм учится на примере данных и связанных целевых ответов, которые могут состоять из числовых значений или строковых меток, таких как классы или теги, для того, чтобы позднее предсказать правильный ответ при представлении новых примеров, подпадает под категорию контролируемого обучения. , Этот подход действительно похож на человеческое обучение под присмотром учителя. Учитель дает хорошие примеры для запоминания учеником, а затем студент выводит общие правила из этих конкретных примеров.
  2. Обучение без присмотра. В то время как алгоритм обучается на простых примерах без какого-либо связанного ответа, предоставляя алгоритму возможность самостоятельно определять шаблоны данных. Этот тип алгоритма имеет тенденцию реструктурировать данные во что-то еще, например, новые функции, которые могут представлять класс или новую серию некоррелированных значений. Они весьма полезны для предоставления людям понимания значения данных и новых полезных входных данных для контролируемых алгоритмов машинного обучения.
    Как вид обучения, он напоминает методы, которые люди используют, чтобы выяснить, что определенные объекты или события принадлежат к одному и тому же классу, например, наблюдая степень сходства между объектами. Некоторые системы рекомендаций, которые вы найдете в Интернете в форме автоматизации маркетинга, основаны на этом типе обучения.
  3. Усиленное обучение: когда вы представляете алгоритм с примерами, в которых отсутствуют метки, как при обучении без контроля. Тем не менее, вы можете сопровождать пример положительными или отрицательными отзывами в соответствии с решением, предлагаемым алгоритмом, подпадающим под категорию обучения с подкреплением, которое связано с приложениями, по которым алгоритм должен принимать решения (поэтому продукт носит предписывающий характер, а не просто описательный, как в обучении без учителя), так и решения несут последствия. В человеческом мире это похоже на обучение методом проб и ошибок.
    Ошибки помогают вам учиться, потому что к ним добавляются штрафы (затраты, потеря времени, сожаления, боль и т. Д.), Которые учат вас, что определенный курс действий менее успешен, чем другие. Интересный пример обучения с подкреплением происходит, когда компьютеры учатся играть в видеоигры самостоятельно.
    В этом случае приложение представляет алгоритм с примерами конкретных ситуаций, например, когда игрок застревает в лабиринте, избегая врага. Приложение позволяет алгоритму узнать результат действий, которые оно предпринимает, и обучение происходит, одновременно пытаясь избежать опасностей и выживания. Вы можете взглянуть на то, как компания Google DeepMind создала обучающую программу подкрепления, которая воспроизводит старые видеоигры Atari. При просмотре видео обратите внимание на то, что программа изначально неуклюжая и неквалифицированная, но постоянно совершенствуется с тренировками, пока не станет чемпионом.
  4. Обучение под наблюдением: где дается неполный обучающий сигнал: тренировочный набор с отсутствием некоторых (часто многих) целевых результатов. Существует особый случай этого принципа, известный как Transduction, когда весь набор проблемных примеров известен во время обучения, за исключением того, что часть целей отсутствует.

Категоризация на основе требуемого результата

Другая категоризация задач машинного обучения возникает, когда рассматривается желаемый результат работы системы машинного обучения:

  1. Классификация: когда входные данные разделены на два или более классов, и учащийся должен создать модель, которая присваивает невидимые входные данные одному или нескольким (классификация по нескольким меткам) этих классов. Обычно это решается под надзором. Фильтрация спама является примером классификации, когда входными данными являются сообщения электронной почты (или другие), а классы — «спам», а не «спам».
  2. Регрессия: что также является контролируемой проблемой. Случай, когда выходы являются непрерывными, а не дискретными.
  3. Кластеризация: когда набор входов должен быть разделен на группы. В отличие от классификации, группы не известны заранее, что делает это, как правило, неконтролируемой задачей.

Машинное обучение входит в картину, когда проблемы не могут быть решены с помощью типичных подходов.

Эта статья предоставлена Сиддхартом Пандей . Если вы как GeeksforGeeks и хотели бы внести свой вклад, вы также можете написать статью с помощью contribute.geeksforgeeks.org или по почте статьи contribute@geeksforgeeks.org. Смотрите свою статью, появляющуюся на главной странице GeeksforGeeks, и помогите другим вундеркиндам.

Пожалуйста, пишите комментарии, если вы обнаружите что-то неправильное, или вы хотите поделиться дополнительной информацией по обсуждаемой выше теме.

Рекомендуемые посты:

Введение в машинное обучение

0.00 (0%) 0 votes