Вы часто слышите разное об Искусственном интеллекте (AI), Машинном обучении (ML) и даже Глубоком обучении (DL). Как и что правильно называть? Может это одно и то же? Люди постоянно подменяют эти термины.
Искусственный интеллект, машинное обучение и глубокое обучение — каждая из областей — подмножество предыдущей области. Искусственный интеллект — обобщающая категория для машинного обучения. А машинное обучение — обобщающая категория для глубокого обучения.
Реально нашумело в последнее время глубокое обучение. Именно эта область искусственного интеллекта и машинного обучения решает множество интересных задач в последние годы, начиная с продаж в продуктовых магазинах и заканчивая автомобилями с самоуправлением.
Почему мы так много слышим о нём? Кто-то приписывает его Элону Маску и Сэму Альтману. Маск всё чаще рассуждает об этике искусственного интеллекта. Предполагаю, он использует это понятие как жаргонный термин знакомый из научно-фантастического СМИ.
AI — широкая сфера, охватывающая несколько подкатегорий, методов и алгоритмов. Область искусственного интеллекта основывается на цели сделать машину настолько же умной как человек — это буквально основная и главная цель. Чёткой задачей исследователей, собравшихся в Дартмуте в 1956 году, было программировать компьютеры по образу человеческого мозга. Там и родился искусственный интеллект в привычном для нас виде.
Исследователи расширили главную цель списком из основных шести позиций.
1) Логическое рассуждение. Приспособить компьютеры выполнять сложные сознательные задачи, на которые способны люди. Примеры решения таких задач с логическим рассуждением включают игру в шахматы и решение алгебраических задач определенного класса.
2) Представление знаний. Позволить компьютерам описывать объекты, людей и языки. Примеры включают объектно-ориентированные языки программирования, такие как Smalltalk.
3) Планирование и навигация. Дать возможность компьютеру добираться из пункта А в пункт Б. Например, первый самоуправляемый робот был построен в начале 1960-х.
4) Обработка естественного языка. Адаптировать компьютер к пониманию и обработке языка. Один из первых проектов в этой области был попыткой переводить английский на русский и наоборот.
5) Восприятие. Приспособить компьютер взаимодействовать с миром через зрение, слух, прикосновения и запах.
6) Эмпирический интеллект. Другими словами — интеллект, который не запрограммирован явно, а формируется постепенно из других целиком искуственно-интеллектуальных особенностей. Концепция этой цели — компьютеры, которые симулируют эмоциональный интеллект, моральное суждение и другие свойства.
Узнайте больше об операционных системах У нас есть курс по операционным системам. Зарегистрированные пользователи могут пройти его бесплатно. Другие бесплатные курсы можно найти по ссылке.
Вот шесть основных алгоритмов и технических приёмов искусственного интеллекта, которые точнее категоризируют основные цели:
1) Машинное обучение — область искусственного интеллекта, которая делает компьютеры способными учиться, без необходимости их явного программирования.
2) Поиск и оптимизация. Такие алгоритмы, как Градиентный спуск, для итерационного нахождения максимальных или минимальных значений в пространстве поиска.
3) Удовлетворение ограничений — это процесс поиска решений при ограничениях, которые задают свои условия: найденные переменные должны удовлетворять этим ограничениям.
4) Логическое рассуждение. Пример логического рассуждения в искусственном интеллекте — это экспертная компьютерная система, которая моделирует способность принимать решения как человек.
5) Вероятностное рассуждение — это объединение мощности теории вероятности (для управления неопределённостью) с мощностью дедукционной логики (для использования структуры формальных параметров). Результат — более насыщенное и выразительное представление потока данных с широким спектром возможных областей применения.
6) Теория контроля (управления) — это формальный метод для поиска слоёв управления, у которых есть доказуемые свойства. Обычно это система дифференциальных уравнений, которые описывают физическую систему, вроде робота или авиационного транспорта.
Машинное обучение — это подгруппа AI. Технология, в которой мы даём данные компьютеру и позволяем ему самому себя обучать. Идея, что компьютеры должны быть способны обучаться самостоятельно, появилась у Артура Сэмуэля в 1959 году.
Что делает машинное обучение таким важным? Крупный прорыв, который привёл к тому, что машинное обучение стало движущей силой AI — изобретение интернета. Интернет принёс возможность генерации, хранения и доступности огромного количества цифровой информации для анализа. Вы много слышали о Больших данных. Алгоритмы машинного обучения — самый эффективный инструмент использования Больших данных.
Нейросети — популярный компонент некоторых самых успешных алгоритмов машинного обучения и их базовый (определяющий) элемент. Разработка нейронных сетей была ключевым моментом в обучении компьютеров мыслить и понимать мир подобно тому, как его видит и понимает человек. Фактически нейросеть моделирует человеческий мозг. Клетки человеческого мозга — нейроны, соединены с помощью синапсисов (областей контакта клеток между собой). Это переведено в абстракцию в виде графа узлов (нейронов), соединённых взвешенными рёбрами (синапсисами). Для более подробного ознакомления с нейронными сетями можете почитать Overview of Neural Networks.
(Эта нейронная сеть состоит из одного слоя, трёх вводов и одного вывода. Нейронная сеть может состоять из любого количества слоёв, вводов и выводов.)
Читайте также Как я стал программистом в 33 года: история успеха студента Хекслета.
Алгоритмы машинного обучения были движущей силой искусственного интеллекта. А самый эффективный из всех алгоритмов ML — Глубокое обучение.
Глубокое обучение включает несколько слоёв вычислений. В данном случае "глубокое" подразумевает "большое" число слоёв. Глубокое обучение может состоять из 20 или 1000 слоёв, но не меньше 2-3. Оно недавно набрало обороты не только из-за огромного количества данных доступных благодаря интернету, но так же из-за возросшей мощности вычислений за последнее десятилетие. В частности, GPU значительно увеличили вычислительные мощности благодаря параллельным вычислениям. Как вы возможно уже догадались, глубокое обучение имеет высокую способность к параллелизации.
(Эта нейронная сеть состоит из двух слоёв, трёх вводов и одного вывода. Слои между нейронами ввода и конечным слоем нейронов вывода — скрытые слои глубокой нейросети.)
Лучшая демонстрация глубокого обучения — Глубокие Нейросети (Deep Neural Networks, DNN). Это просто нейросети у которых больше 2-3 слоёв. Ещё один алгоритм глубокого обучения — менее популярный — Глубокая сеть доверия (Deep Belief Network, DBN). DBN имеет ненаправленные связи между некоторыми слоями. Это значит, что топология DNN и DBN отличается по определению. Ненаправленные слои в DBN называются Ограниченными машинами Больцмана (Restricted Boltzmann Machines).
Это перевод статьи Luis Bermudez Overview of Artificial Intelligence Buzz.