Искусственный интеллект

Что такое машинное обучение? Полное практическое руководство

Q: Какой язык программирования лучше для машинного обучения?

Python, без вариантов. У него крупнейшая экосистема библиотек (scikit-learn, TensorFlow, PyTorch), огромное сообщество и обилие учебных материалов. R — хороший выбор для статистики, но Python универсальнее.

Q: В чём разница между машинным обучением и глубоким обучением?

Глубокое обучение (Deep Learning) — это подмножество машинного обучения, использующее нейронные сети с множеством слоёв. Машинное обучение шире и включает более простые алгоритмы — линейную регрессию и деревья решений. Глубокое обучение превосходит в сложных задачах — распознавание изображений и речи.

Практическое руководство по машинному обучению с нуля: три типа, ключевые алгоритмы — регрессия и нейронные сети, плюс полный проект на Python пошагово

AI درسي·19 января 2026 г.·9 мин. чтения·Средний

машинное обучение искусственный интеллект Python алгоритмы

Что вы узнаете

Вы поймёте машинное обучение и его три типа: с учителем, без учителя и с подкреплением
Вы познакомитесь с ключевыми алгоритмами — регрессией и нейронными сетями — на практических примерах
Вы построите полный практический проект на Python пошагово

Что такое машинное обучение?

Каждый день мир производит более 2,5 квинтиллиона байт данных. Ни один человек не способен проанализировать такой объём — но машинное обучение делает это за секунды. От диагностики рака точнее врачей до обнаружения банковского мошенничества в реальном времени — эта технология меняет правила игры.

Машинное обучение (Machine Learning) — это направление искусственного интеллекта, позволяющее компьютерным системам учиться и совершенствоваться на основе опыта без явного программирования. Вместо написания фиксированных правил мы подаём программе данные и позволяем ей самостоятельно обнаруживать закономерности.

Разница между ИИ и машинным обучением

Эти два термина часто используются как синонимы, но они различаются:

	Искусственный интеллект (AI)	Машинное обучение (ML)
Определение	Широкая область, стремящаяся воспроизвести человеческий интеллект	Направление ИИ, сфокусированное на обучении по данным
Охват	Включает робототехнику, NLP, компьютерное зрение	Фокусируется на алгоритмах и статистических моделях
Подход	Может использовать фиксированные правила или обучение	Всегда основан на данных и тренировке
Пример	Медицинская экспертная система с заданными правилами	Модель, обучающаяся диагностировать болезни по рентгеновским снимкам

Проще говоря: всё машинное обучение — это ИИ, но не весь ИИ — это машинное обучение.

ℹ️

Машинное обучение не требует от вас быть гением математики. Оно требует любознательности и терпения при работе с данными.

Типы машинного обучения

Машинное обучение делится на три основных типа, у каждого свои области применения и методология.

Обучение с учителем (Supervised Learning)

Самый распространённый тип. Мы подаём модели обучающие данные, содержащие входные признаки (Features) и ожидаемые результаты (Labels), и модель изучает связь между ними.

Практический пример: спам-фильтр

Представьте, что вы строите систему, различающую обычные и спам-сообщения:

Собираем тысячи предварительно классифицированных писем (спам / не спам)
Извлекаем признаки каждого письма (ключевые слова, отправитель, ссылки)
Обучаем модель на этих данных
Модель выявляет закономерности, характеризующие спам
При поступлении нового письма модель классифицирует его автоматически

from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfVectorizer

# Обучающие данные
emails = ["Выиграйте миллион долларов прямо сейчас!", "Совещание команды завтра в 10", ...]
labels = ["spam", "not_spam", ...]

# Извлечение признаков и обучение модели
vectorizer = TfidfVectorizer(analyzer='word')
X = vectorizer.fit_transform(emails)
model = MultinomialNB()
model.fit(X, labels)

# Классификация нового письма
new_email = ["Поздравляем! Вы выиграли главный приз"]
prediction = model.predict(vectorizer.transform(new_email))
print(prediction)  # ['spam']

Обучение без учителя (Unsupervised Learning)

Здесь мы подаём модели данные без предварительных меток, и она пытается самостоятельно обнаружить скрытые закономерности и группы.

Практический пример: сегментация клиентов

Допустим, у вас интернет-магазин и вы хотите понять типы клиентов:

Собираете данные о покупках: потраченная сумма, количество покупок, частота визитов
Применяете алгоритм кластеризации, например K-Means
Модель обнаруживает группы: «VIP-клиенты», «сезонные покупатели», «случайные посетители»
Создаёте целевые маркетинговые кампании для каждой группы

from sklearn.cluster import KMeans
import numpy as np

# Данные клиентов: [потраченная сумма, количество покупок]
customers = np.array([
    [500, 20], [450, 18], [30, 2], [25, 1],
    [200, 8], [180, 10], [600, 25], [20, 1]
])

# Применение K-Means с 3 кластерами
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(customers)

print(kmeans.labels_)
# [0, 0, 2, 2, 1, 1, 0, 2]
# Группа 0: VIP-клиенты
# Группа 1: Средние клиенты
# Группа 2: Новые клиенты

Обучение с подкреплением (Reinforcement Learning)

Модель учится через взаимодействие со средой и принятие последовательных решений. Получает вознаграждения за правильные решения и штрафы за ошибки, постепенно совершенствуясь.

Практический пример: обучение в играх

Вот как программа AlphaGo от Google научилась игре Го и победила чемпионов мира:

Состояние (State): Текущая позиция на доске
Действие (Action): Размещение камня в определённом месте
Вознаграждение (Reward): +1 при победе, -1 при проигрыше
Обучение: Играет миллионы партий против себя и совершенствует стратегию

Этот тип также применяется в беспилотных автомобилях и промышленных роботах.

Ключевые алгоритмы машинного обучения

Линейная регрессия (Linear Regression)

Простейший алгоритм МО. Находит прямую линию, описывающую связь между переменными. Например: прогнозирование цены дома по его площади.

Цена = (Площадь x Коэффициент) + Константа

Представьте, что вы наносите точки на график (площадь дома по горизонтали, цена по вертикали), а затем проводите линию, проходящую как можно ближе ко всем точкам. Это и есть линейная регрессия.

Когда использовать? Когда связь между переменными линейная и непрерывная (числа, а не категории).

Деревья решений (Decision Trees)

Работают как цепочка вопросов «да/нет». Представьте, что решаете, играть ли сегодня в футбол:

Погода солнечная?
├── Да → Температура ниже 40°?
│   ├── Да → Играй!
│   └── Нет → Оставайся дома
└── Нет → Сильный дождь?
    ├── Да → Оставайся дома
    └── Нет → Играй!

Преимущества: Легко понять и интерпретировать, работают с числовыми и текстовыми данными. Но могут переобучиться (Overfitting), если слишком сложные.

Нейронные сети (Neural Networks)

Вдохновлены принципом работы человеческого мозга. Состоят из слоёв искусственных нейронов:

Входной слой: Принимает данные (например, пиксели изображения)
Скрытые слои: Обрабатывают данные и выявляют паттерны
Выходной слой: Выдаёт результат (например, «кошка» или «собака»)

Чем больше скрытых слоёв, тем модель называется глубоким обучением (Deep Learning). Эта технология стоит за ChatGPT и системами распознавания изображений.

Области применения машинного обучения

1. Здравоохранение

Диагностика заболеваний по рентгеновским и МРТ-снимкам
Прогнозирование рисков хронических заболеваний
Открытие новых лекарств путём анализа миллионов химических соединений

2. Финансы

Обнаружение банковского мошенничества в реальном времени
Прогнозирование цен на акции и анализ рисков
Оценка кредитоспособности заёмщиков

3. Электронная коммерция

Рекомендательные системы («Покупатели этого товара также купили...»)
Динамическое ценообразование по спросу и предложению
Анализ отзывов клиентов и выявление настроений

4. Транспорт

Беспилотные автомобили (Tesla, Waymo)
Оптимизация маршрутов доставки и снижение расхода топлива
Прогнозирование дорожного трафика и пиковых часов

5. Обработка естественного языка

Машинный перевод (Google Translate)
Умные ассистенты (ChatGPT, Claude, Gemini)
Анализ настроений в социальных сетях

6. Кибербезопасность

Обнаружение кибератак и новых угроз
Анализ поведения пользователей для выявления подозрительной активности
Фильтрация спама и фишинговых писем

Подробнее о кибербезопасности — в нашей статье об основах кибербезопасности.

Создание простого ML-проекта — пошагово

Мы построим модель прогнозирования цен на жильё с помощью библиотеки scikit-learn. Следуйте шагам:

Шаг 1: Настройка среды

# Установка необходимых библиотек
# pip install scikit-learn pandas numpy matplotlib

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, r2_score

Шаг 2: Загрузка и анализ данных

from sklearn.datasets import fetch_california_housing

# Загрузка данных о ценах на жильё в Калифорнии
data = fetch_california_housing()
df = pd.DataFrame(data.data, columns=data.feature_names)
df['Price'] = data.target

# Вывод первых 5 строк
print(df.head())
print(f"\nКоличество записей: {len(df)}")
print(f"Признаки: {list(df.columns)}")

Шаг 3: Разделение данных

# Признаки (входы)
X = df.drop('Price', axis=1)

# Целевая переменная (выход)
y = df['Price']

# Разделение: 80% обучение, 20% тест
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

print(f"Обучающие данные: {len(X_train)}")
print(f"Тестовые данные: {len(X_test)}")

Шаг 4: Обучение модели

# Создание и обучение модели линейной регрессии
model = LinearRegression()
model.fit(X_train, y_train)

print("Модель успешно обучена!")

Шаг 5: Оценка модели

# Прогноз на тестовых данных
predictions = model.predict(X_test)

# Вычисление точности модели
mae = mean_absolute_error(y_test, predictions)
r2 = r2_score(y_test, predictions)

print(f"Средняя абсолютная ошибка: ${mae * 100000:.0f}")
print(f"Коэффициент детерминации R²: {r2:.3f}")
# R² близкий к 1 означает хорошую модель

Шаг 6: Использование модели для прогнозов

# Прогноз цены нового дома
new_house = np.array([[8.3, 41, 6.9, 1.02, 322, 2.5, 37.88, -122.23]])
predicted_price = model.predict(new_house)
print(f"Прогнозируемая цена: ${predicted_price[0] * 100000:.0f}")

💡

Это упрощённый проект. В реальных проектах потребуется очистка данных, обработка пропущенных значений и тестирование нескольких алгоритмов для достижения лучших результатов.

Ресурсы для изучения машинного обучения

Бесплатные курсы

Machine Learning by Andrew Ng (Coursera) — Самый знаменитый курс в мире, отлично объясняет основы
Fast.ai — Практическое обучение сверху вниз, начинаете с реальных проектов
Google Machine Learning Crash Course — Интенсивный курс Google с интерактивными упражнениями

Платформы для практики

Kaggle — Соревнования, реальные датасеты и активное сообщество
Google Colab — Бесплатная Python-среда в браузере с GPU
Hugging Face — Предобученные модели, готовые к использованию

Если вас интересует ИИ как карьерный путь, ознакомьтесь с руководством по техническим профессиям.

🔴

Лучший способ учиться: Python + scikit-learn + датасет с Kaggle + Google Colab (бесплатно) = всё, что нужно для создания первой модели машинного обучения.

Нужна ли сильная математическая подготовка для изучения ML?

Нужно базовое понимание статистики и линейной алгебры. Быть математиком не обязательно — библиотеки вроде scikit-learn берут на себя математические детали. Но понимание основ помогает выбирать правильные алгоритмы и интерпретировать результаты.

Какой язык программирования лучше для машинного обучения?

Python, без вариантов. У него крупнейшая экосистема библиотек (scikit-learn, TensorFlow, PyTorch), огромное сообщество и обилие учебных материалов. R — хороший выбор для статистики, но Python универсальнее.

В чём разница между машинным обучением и глубоким обучением?

Глубокое обучение (Deep Learning) — это подмножество машинного обучения, использующее нейронные сети с множеством слоёв. Машинное обучение шире и включает более простые алгоритмы — линейную регрессию и деревья решений. Глубокое обучение превосходит в сложных задачах — распознавание изображений и речи.

Сколько времени нужно на изучение ML?

При регулярных занятиях (час в день) можно освоить основы и создавать простые проекты за 3–4 месяца. Мастерство и специализация требуют года и более непрерывной практики и работы над реальными проектами.

Можно ли изучить ML без опыта программирования?

Лучше сначала освоить основы Python (достаточно нескольких недель). Существуют инструменты без кода, такие как Google AutoML, но они ограничены. Программирование даёт гибкость и более глубокое понимание.

С какого первого ML-проекта лучше начать?

Начните с простых проектов классификации: классификация ирисов, прогнозирование цен на жильё (как выше) или классификация рукописных цифр (MNIST). Это классические проекты с множеством доступных руководств.

Заключение

Машинное обучение — не временная мода, а технология, преобразующая каждую отрасль от медицины до финансов и развлечений. Хорошая новость: начать проще, чем кажется — Python, библиотека scikit-learn и датасет с Kaggle — это всё, что нужно для создания первой модели.

Начните с понимания трёх типов (с учителем, без учителя, с подкреплением), попробуйте проект выше, затем постепенно переходите к более сложным задачам. И помните: лучший способ учиться — это практика.

Другие статьи об ИИ и его инструментах — в нашем материале о промпт-инжиниринге и эффективном использовании ChatGPT.

المصادر والمراجع

Отдел ИИ — AI Darsi

Специалисты по ИИ и машинному обучению

Опубликовано: 19 января 2026 г.

Почему Python — лучший язык для искусственного интеллекта?

Узнайте, почему Python доминирует более чем в 80% проектов ИИ, с подробным разбором ключевых библиотек TensorFlow и PyTorch и практическими примерами.

22 января 2026 г.8 мин. чтения

ИИ в образовании: как меняется будущее обучения

←

Искусственный интеллект

ИИ в образовании: как меняется будущее обучения

Узнайте, как ИИ меняет образование -- от персонализированного обучения до умной оценки. Бесплатные инструменты и практические примеры использования AI в учёбе и преподавании.

12 марта 2026 г.7 мин. чтения

←

Искусственный интеллект

Что такое искусственный интеллект? Типы, применение и будущее

Разбираемся в ИИ с нуля: шесть типов, принципы машинного и глубокого обучения, практические применения в жизни. Понятное руководство на русском языке

15 января 2026 г.10 мин. чтения

Искусственный интеллект

Что такое машинное обучение? Полное практическое руководство

AI درسي·19 января 2026 г.·9 мин. чтения·Средний

машинное обучение искусственный интеллект Python алгоритмы

Что вы узнаете

Вы поймёте машинное обучение и его три типа: с учителем, без учителя и с подкреплением
Вы познакомитесь с ключевыми алгоритмами — регрессией и нейронными сетями — на практических примерах
Вы построите полный практический проект на Python пошагово

Что такое машинное обучение?

Разница между ИИ и машинным обучением

Эти два термина часто используются как синонимы, но они различаются:

	Искусственный интеллект (AI)	Машинное обучение (ML)
Определение	Широкая область, стремящаяся воспроизвести человеческий интеллект	Направление ИИ, сфокусированное на обучении по данным
Охват	Включает робототехнику, NLP, компьютерное зрение	Фокусируется на алгоритмах и статистических моделях
Подход	Может использовать фиксированные правила или обучение	Всегда основан на данных и тренировке
Пример	Медицинская экспертная система с заданными правилами	Модель, обучающаяся диагностировать болезни по рентгеновским снимкам

Проще говоря: всё машинное обучение — это ИИ, но не весь ИИ — это машинное обучение.

ℹ️

Типы машинного обучения

Машинное обучение делится на три основных типа, у каждого свои области применения и методология.

Обучение с учителем (Supervised Learning)

Практический пример: спам-фильтр

Представьте, что вы строите систему, различающую обычные и спам-сообщения:

Собираем тысячи предварительно классифицированных писем (спам / не спам)
Извлекаем признаки каждого письма (ключевые слова, отправитель, ссылки)
Обучаем модель на этих данных
Модель выявляет закономерности, характеризующие спам
При поступлении нового письма модель классифицирует его автоматически

from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfVectorizer

# Обучающие данные
emails = ["Выиграйте миллион долларов прямо сейчас!", "Совещание команды завтра в 10", ...]
labels = ["spam", "not_spam", ...]

# Извлечение признаков и обучение модели
vectorizer = TfidfVectorizer(analyzer='word')
X = vectorizer.fit_transform(emails)
model = MultinomialNB()
model.fit(X, labels)

# Классификация нового письма
new_email = ["Поздравляем! Вы выиграли главный приз"]
prediction = model.predict(vectorizer.transform(new_email))
print(prediction)  # ['spam']

Обучение без учителя (Unsupervised Learning)

Практический пример: сегментация клиентов

Допустим, у вас интернет-магазин и вы хотите понять типы клиентов:

Собираете данные о покупках: потраченная сумма, количество покупок, частота визитов
Применяете алгоритм кластеризации, например K-Means
Модель обнаруживает группы: «VIP-клиенты», «сезонные покупатели», «случайные посетители»
Создаёте целевые маркетинговые кампании для каждой группы

from sklearn.cluster import KMeans
import numpy as np

# Данные клиентов: [потраченная сумма, количество покупок]
customers = np.array([
    [500, 20], [450, 18], [30, 2], [25, 1],
    [200, 8], [180, 10], [600, 25], [20, 1]
])

# Применение K-Means с 3 кластерами
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(customers)

print(kmeans.labels_)
# [0, 0, 2, 2, 1, 1, 0, 2]
# Группа 0: VIP-клиенты
# Группа 1: Средние клиенты
# Группа 2: Новые клиенты

Обучение с подкреплением (Reinforcement Learning)

Практический пример: обучение в играх

Вот как программа AlphaGo от Google научилась игре Го и победила чемпионов мира:

Состояние (State): Текущая позиция на доске
Действие (Action): Размещение камня в определённом месте
Вознаграждение (Reward): +1 при победе, -1 при проигрыше
Обучение: Играет миллионы партий против себя и совершенствует стратегию

Этот тип также применяется в беспилотных автомобилях и промышленных роботах.

Ключевые алгоритмы машинного обучения

Линейная регрессия (Linear Regression)

Цена = (Площадь x Коэффициент) + Константа

Когда использовать? Когда связь между переменными линейная и непрерывная (числа, а не категории).

Деревья решений (Decision Trees)

Работают как цепочка вопросов «да/нет». Представьте, что решаете, играть ли сегодня в футбол:

Погода солнечная?
├── Да → Температура ниже 40°?
│   ├── Да → Играй!
│   └── Нет → Оставайся дома
└── Нет → Сильный дождь?
    ├── Да → Оставайся дома
    └── Нет → Играй!

Нейронные сети (Neural Networks)

Вдохновлены принципом работы человеческого мозга. Состоят из слоёв искусственных нейронов:

Входной слой: Принимает данные (например, пиксели изображения)
Скрытые слои: Обрабатывают данные и выявляют паттерны
Выходной слой: Выдаёт результат (например, «кошка» или «собака»)

Области применения машинного обучения

1. Здравоохранение

Диагностика заболеваний по рентгеновским и МРТ-снимкам
Прогнозирование рисков хронических заболеваний
Открытие новых лекарств путём анализа миллионов химических соединений

2. Финансы

Обнаружение банковского мошенничества в реальном времени
Прогнозирование цен на акции и анализ рисков
Оценка кредитоспособности заёмщиков

3. Электронная коммерция

Рекомендательные системы («Покупатели этого товара также купили...»)
Динамическое ценообразование по спросу и предложению
Анализ отзывов клиентов и выявление настроений

4. Транспорт

Беспилотные автомобили (Tesla, Waymo)
Оптимизация маршрутов доставки и снижение расхода топлива
Прогнозирование дорожного трафика и пиковых часов

5. Обработка естественного языка

Машинный перевод (Google Translate)
Умные ассистенты (ChatGPT, Claude, Gemini)
Анализ настроений в социальных сетях

6. Кибербезопасность

Обнаружение кибератак и новых угроз
Анализ поведения пользователей для выявления подозрительной активности
Фильтрация спама и фишинговых писем

Подробнее о кибербезопасности — в нашей статье об основах кибербезопасности.

Создание простого ML-проекта — пошагово

Мы построим модель прогнозирования цен на жильё с помощью библиотеки scikit-learn. Следуйте шагам:

Шаг 1: Настройка среды

# Установка необходимых библиотек
# pip install scikit-learn pandas numpy matplotlib

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, r2_score

Шаг 2: Загрузка и анализ данных

from sklearn.datasets import fetch_california_housing

# Загрузка данных о ценах на жильё в Калифорнии
data = fetch_california_housing()
df = pd.DataFrame(data.data, columns=data.feature_names)
df['Price'] = data.target

# Вывод первых 5 строк
print(df.head())
print(f"\nКоличество записей: {len(df)}")
print(f"Признаки: {list(df.columns)}")

Шаг 3: Разделение данных

# Признаки (входы)
X = df.drop('Price', axis=1)

# Целевая переменная (выход)
y = df['Price']

# Разделение: 80% обучение, 20% тест
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

print(f"Обучающие данные: {len(X_train)}")
print(f"Тестовые данные: {len(X_test)}")

Шаг 4: Обучение модели

# Создание и обучение модели линейной регрессии
model = LinearRegression()
model.fit(X_train, y_train)

print("Модель успешно обучена!")

Шаг 5: Оценка модели

# Прогноз на тестовых данных
predictions = model.predict(X_test)

# Вычисление точности модели
mae = mean_absolute_error(y_test, predictions)
r2 = r2_score(y_test, predictions)

print(f"Средняя абсолютная ошибка: ${mae * 100000:.0f}")
print(f"Коэффициент детерминации R²: {r2:.3f}")
# R² близкий к 1 означает хорошую модель

Шаг 6: Использование модели для прогнозов

# Прогноз цены нового дома
new_house = np.array([[8.3, 41, 6.9, 1.02, 322, 2.5, 37.88, -122.23]])
predicted_price = model.predict(new_house)
print(f"Прогнозируемая цена: ${predicted_price[0] * 100000:.0f}")

💡

Ресурсы для изучения машинного обучения

Бесплатные курсы

Machine Learning by Andrew Ng (Coursera) — Самый знаменитый курс в мире, отлично объясняет основы
Fast.ai — Практическое обучение сверху вниз, начинаете с реальных проектов
Google Machine Learning Crash Course — Интенсивный курс Google с интерактивными упражнениями