Технологии машинного обучения проникают во все сферы нашей жизни. Все больше задач вместо людей на себя берет искусственный интеллект. Самоуправляемые автомобили, умная бытовая техника и гаджеты, контекстная реклама — это уже не кажется нам чем-то необычным. Но до сих пор не каждый знает, что все это существует благодаря машинному обучению.
Рассказываем, что из себя представляет машинное обучение
Что такое машинное обучение
Машинное обучение (англ. Machine Learning) — это процесс, при котором в ходе решения большого количества сходных задач аналитическая система выявляет закономерности и обучается дальнейшему принятию решений без участия человека. Если говорить проще, то технология машинного обучения основана на поиске закономерностей в массе информации и выборе лучшего решения из представленных.
Благодаря машинному обучению ИИ постоянно получает новые задачи и самостоятельно учится их решать. Например, чтобы определить, что голосовому роботу компании стоит ответить на конкретный запрос клиента, компьютер должен проанализировать тысячи запросов, отследить изменения реакции клиентов при том или ином ответе и научиться самостоятельно выбирать наиболее подходящий вариант в будущем.
Где используется машинное обучение
Наиболее часто технологию машинного обучения используют в маркетинге. Например, Amazon использует его для того, чтобы показывать покупателям тот товар, который их должен заинтересовать. Это происходит на основе анализа данных о прошлых покупках и других пользователях.
Google и Яндекс также применяют в своей работе машинное обучение, чтобы показывать рекламу определенным пользователям. Если вы хоть раз замечали, что после поиска информации о каком-то товаре почти сразу же видели соответствующее объявление в поисковиках, то это было сделано благодаря технологиям машинного обучения.
Таким же образом устроены умные ленты в соцсетях. Аналитические системы Facebook, Instagram, Twitter или TikTok исследуют интересы пользователей по всем известным о них данным: просмотр постов, лайки и комментарии, посещение пабликов и групп и др. Чем выше активность пользователя, тем более персонализированную ленту ему подбирает ИИ.
Голосовые помощники вроде Алисы и Siri или голосовые роботы, которые отвечают вам по телефону, используют системы распознавания и синтеза речи, которые также основаны на машинном обучении.
Помимо этого машинное обучение используется в медицине и структурах контроля безопасности. В медицине это предварительная диагностика и подбор индивидуального плана лечения на основе данных из истории болезни пациента. А в сфере безопасности — системы распознавания лиц. Машина сравнивает снимки людей с камер видеонаблюдения с фотографиями людей, находящихся в розыске. При высоком сходстве она подает сигнал сотрудникам полиции.
Основными задачами, которые при этом выполняет ИИ с помощью машинного обучения, являются:
- Регрессия. Система из массива представленных характеристик предсказывает результат в виде конкретной цифры. Например, так можно предсказать, сколько будет стоить акция Газпрома через месяц или несколько лет, а также определить бюджет на рекламную кампанию и др.
- Классификация. Система по набору признаков определяет категорию анализируемого объекта. Например, можно определить спам в числе электронных писем или же распознать, человек какого пола изображен на фотографии.
- Кластеризация. Система предоставленный массив данных разбивает на категории. Например, обращения в компанию от клиентов можно разбить на категории: по рекламным источникам, типам обращений и др.
Каким бывает машинное обучение
Существуют три вида машинного обучения:
- С учителем ( англ. Supervised machine learning). Под «учителем» подразумевается не наставник с указкой, а идея участия человека в процессе обработки данных. В аналитическую систему загружают определенный массив данных и задают направление для его анализа. В этом случае система должна подтвердить или опровергнуть какую-либо гипотезу.
Например, необходимо определить, является ли электронное письмо спамом. На основе массива данных об электронных письмах система анализирует текст данного письма, выявляет общие признаки с письмами из массива данных и сравнивает их между собой, в конечном итоге она либо подтверждает эту гипотезу, либо опровергает.
Еще одним примером является классификатор диалогов от Voximplant, который работает так: на основе полученного массива текстов выделяются отдельные термины и их сочетания, с опорой на которые машина должна научиться делать выводы о тематиках разговора.
- Без учителя (англ. Unsupervised machine learning). В этом случае система заранее «не знает» правильных ответов. У нее есть только данные, свойства которых нужно найти. Таким образом, машина самостоятельно обрабатывает информацию и находит взаимосвязи.
Например, системе известны данные о росте, обхвате бедер и типе фигуры 1000000 потенциальных покупателей джинсов. Она обрабатывает эти данные и разбивает на кластеры в соответствии со схожими признаками. Эта информация поможет магазину одежды выпустить джинсы определенного фасона для каждой категории клиентов.
- Глубокое обучение (англ. Deep learning). Это анализ «больших данных». Один компьютер не справится с таким объемом информации, поэтому тут на помощь приходят нейронные сети. Суть глубокого обучения состоит в разделении огромного потока информации на небольшие сегменты данных, которые в дальнейшем обрабатывают другие устройства. Это работает таким образом: один процессор занимается только сбором информации по задаче и передает ее дальше, пять других процессоров анализируют эти данные и результаты передают следующим процессорам, которые занимаются поиском решений.
Система распознавания лиц работает по принципу нейросети. Сначала делается снимок человека, потом система разбивает полученную графическую информацию на точки, после чего находит линии, затем из линий она строит простые фигуры, а из них воссоздает сложные объекты.
Сегодня благодаря развитию технологий машинного обучения программист не должен вручную прописывать все возможные проблемы и их решения, теперь это делает программа: в нее закладывают определенный алгоритм, по которому она самостоятельно находит решения и строит прогнозы. Когда-то для нас такое было чем-то из ряда фантастики, но искусственный интеллект в дальнейшем может заменить человека во многих сферах.
Так, прогнозируют, что в будущем роботы будут спасать людей из пожаров, бурить скважины и исследовать дно океана и др. При этом будет исключаться человеческий фактор и ошибки в коде, так как система сама будет обучаться и знать, как вести себя в конкретной ситуации.