Блог

Машинное обучение для предиктивного обслуживания

Есть такой момент в жизни любого заводоуправленца. Вчера звонили из цеха: "Насос №3 сломался. Простой, потери миллионы". Сегодня он стоит перед кабинетом боссов с новыми цифрами на слайде.
На слайде график стоимости ремонтов на нефтеперерабатывающем заводе. До внедрения машинного обучения: 900 миллионов рублей в год на техническое обслуживание и ремонты. После внедрения системы предиктивной аналитики: 630 миллионов.
"Как вы это сделали?" спрашивают боссы.
"Мы научили нейросеть видеть, что будет", отвечает инженер.
Это не история из учебника. Это реальность на московских, пермских и омских нефтеперерабатывающих заводах. 270 миллионов рублей в год сэкономлено на том, что система начала предсказывать поломки за дни до того, как они произойдут.

Почему нейросеть видит лучше человека

Представь обычный день инженера в диспетчерской. Перед ним приборная панель с показателями насоса. Давление 10 атмосфер, температура 50 градусов, всё зелёное. Вчера было так же, позавчера тоже. Насос работает. Инженер кивает и идёт пить кофе.
Потом приходит ночь, и насос ломается неожиданно. Звонок в 3 часа утра. Простой завода, производящего 10 миллионов тонн в год, стоит 2-3 миллиона рублей в день. Один день без предупреждения — это потери в миллион рублей, срыв поставок клиентам, штрафы.
Нейросеть работает совсем иначе. Она не смотрит на одно число. Она смотрит на всё вместе одновременно: давление, температуру, вибрацию, расход жидкости, звуковые частоты, электропотребление.
Система видит, что давление в среднем за месяц было 9,8 атмосфер, а сегодня 10,2. Вчера было 10,0. Позавчера 9,9. Это рост на 0,3 атм за три дня. Для человека это норма, это в пределах погрешности приборов. Для нейросети это сигнал тревоги.
Потом система ищет связи с другими показателями. Обычно, когда давление растёт на 0,2 атм, температура поднимается на 0,5 градуса. Сегодня при росте давления на 0,3 температура выросла на 2 градуса. Это ненормально.
Система заглядывает в историю. Этот паттерн — растущее давление плюс неожиданный прыжок температуры — в прошлом появлялся перед отказом подшипника в 87% случаев. Система говорит диспетчеру: вероятность отказа 87%, оставшийся ресурс примерно 10 дней.
Диспетчер звонит механику и говорит: "В среду во вторую смену замени подшипник". Механик готовится. Запасные части заказаны заранее. В среду меняет подшипник. Насос работает. Простоя нет.

Группа НЛМК: когда печь учится на ошибках

На металлургическом заводе НЛМК работают печи. Как в любой печи, они оснащены датчиками вибрации, температуры, давления, состава газов. Примерно как человеческое тело, только это датчики металла, а не биология.
Раньше инженеры смотрели на графики и могли сказать примерно одно: если график красный, это плохо, если зелёный — хорошо. Проблема в том, что красный график появляется, когда печь уже начинает разрушаться.
Они решили научить нейросеть видеть будущее печи. Обучили её на данных о 100+ отказах печей. Каждый отказ — это была история: какие параметры росли, какие падали, в каком порядке это происходило.
Система начала видеть закономерности. Оказалось, что за 4 дня до критического отказа вибрация начинает расти по определённому паттерну. За 2 дня температурный график начинает "дрожать" специфическим образом. За сутки срывается одна из безопасных переменных.
Результат: система начала предсказывать отказы за 3-5 дней до их наступления.
Внеплановые простои печей сократились на 20%. В масштабах производства это означает, что печи работают более стабильно, больше продукции выходит в нормативном диапазоне качества, меньше переделок.

Трансформаторы: что рассказывает масло о будущем

На электростанции стоит силовой трансформатор . Он работает 24/7, отдавая электроэнергию в сеть. Если он сломается в пиковый час, отключится целый район города.
Раньше диагностику проводили 1-2 раза в год. Отбирали пробу масла из трансформатора, везли в лабораторию, делали анализ. Анализ показывал четыре газа: водород, окись углерода, этилен, ацетилен.
По этим газам инженер мог понять, что творится внутри герметичного корпуса:
  • Много водорода означает дефект изоляции. Она начинает портиться
  • Высокий уровень окиси углерода говорит о перегреве масла. Это значит, что-то греется сильнее, чем должно
  • Ацетилен это электрический разряд. Самое опасное
Но анализ занимает дни. Потом ещё дни ждёшь результаты. К тому времени внутри может произойти всё, что угодно.
Теперь установили систему непрерывного мониторинга с машинным обучением. Прибор измеряет эти четыре газа каждые 12 часов и отправляет данные в облако.
Нейросеть обучена на данных о 500+ отказах реальных трансформаторов. Она знает, как менялись эти газы перед каждым отказом. Система может предсказать отказ за 2-3 месяца до его наступления.
Точность прогноза: среднее отклонение 27 дней на горизонте прогноза в 60 дней. Это означает, что система говорит: "Ваш трансформатор откажет через 60 дней, плюс-минус 27 дней". Достаточно точно для планирования замены, верно?
Результат: вероятность внезапного отказа трансформатора упала на 90%. Для электросетевой компании это критично. Внезапный отказ требует срочного ремонта за миллионы, плюс штрафы за перебои в электроснабжении.

Электролизеры "Росатома": когда машина становится лучше технолога

На предприятии Атомной энергии работают установки электролиза для производства фтора. Это сложное, даже опасное оборудование. Электролизер работает под высоким напряжением, при высокой температуре, с агрессивными веществами.
Даже небольшие сбои в работе электролизера приводят к снижению выхода продукции на 5-10%. Потери того же уровня, если что-то работает не так, как надо.
Инженеры захотели предсказывать, когда электролизер начнёт "сбиваться" со своего оптимального режима. Позвали специалиста по машинному обучению.
Первое, что он спросил: "Где данные?".
Вот здесь и началось интересное. Данные были, но они были рассыпаны. Часть в системе SCADA, часть в электронных журналах, часть — в головах технолога с 30-летним опытом.
Инженер буквально "мучился с извлечением данных из умов людей". Нужно было спросить каждого опытного технолога: "Вспомни, когда последний раз электролизер сбил вался со строя? Что ты видел перед этим? Какие параметры были странными?".
Собрали данные за 10 лет работы электролизеров, обучили нейросеть находить аномалии. Система получилась консервативной — она выделяла дефекты, которые даже технолог видел в первый раз.
Результат: система позволила сократить капитальные ремонты на 20-25%, потому что проблемы выявляются и исправляются на ранней стадии. Межремонтный интервал удлинился, производство работает стабильнее.

Северсталь: как 5% производительности это 80 тысяч тонн

На Череповецком металлургическом комбинате есть непрерывно-травильный агрегат. Это машина, которая травит (обрабатывает кислотой) металлический лист, чтобы удалить окалину. Процесс критичный, параметры должны быть идеальны.
Раньше инженер регулировал параметры вручную, глядя на графики и свой опыт. Система была стабильна, но не идеальна.
Внедрили нейросеть, которая в режиме реального времени анализирует показания датчиков и предлагает оптимальные настройки оборудования.
Система видит качество входящего металла, температуру окружающей среды, состояние изношенных деталей агрегата, и на основе этого подстраивает режим.
Производительность агрегата выросла на 5%. Звучит скромно, верно? Но это 80 тысяч тонн дополнительной продукции в год.
Если средняя цена металла 200 рублей за килограмм, это 16 миллиардов рублей дополнительного дохода в год. На улучшение всего алгоритма и внедрение системы потратили в разы меньше.

Газпром нефть: как предсказать отказ за месяцы

На предприятиях Газпром нефти работали с системой предиктивной аналитики для насосного оборудования. Разработала её компания Ctrl2GO.
Задача простая: насосы ломаются. Как предсказать это заранее?
На каждом насосе стоят датчики. Каждый день система собирает данные. Давление, температура, вибрация, расход, состояние уплотнений.
Система анализирует эти данные и ищет аномалии. Подшипник начинает изнашиваться? Это выглядит как постепенный рост вибрации на определённой частоте. Уплотнение даёт течь? Давление на торцевом уплотнении медленно падает день за днём.
Каждая проблема имеет свой "голос" в данных датчиков. Система эти голоса узнаёт.
Результат: система может прогнозировать отказы насосов за 2-3 месяца до их наступления.
Это означает, что в календаре на квартал вперёд уже заложены плановые замены насосов. Запасные части куплены по нормальной цене. Механик может спланировать работу. Нет срочных выездов в 2 часа ночи.
Внеплановые простои сократились на 20%. Затраты на ремонты снизились на 100 миллионов рублей в год.

Главная беда: откуда берут данные для обучения

Всё это звучит просто, но есть одна проблема, которая убивает половину проектов на старте.
Нейросеть обучается на данных. Если данные плохие, система будет плоха.
На заводе произошло 20 отказов оборудования за 10 лет. Это 20 примеров для обучения.
Современная нейросеть может работать на малом наборе, но точность низкая. Для стабильной работы нужны данные о 100+ отказах.
Как получить данные о 100 отказах? Ждать 50 лет?
Решение: либо использовать синтетические данные (смоделировать отказы на компьютере), либо взять данные с похожих предприятий и адаптировать их.
НЛМК использовала комбинацию: собрала реальные данные о своих отказах, добавила синтетические сценарии, обучила нейросеть.
Второе: где заканчивается одна проблема и начинается другая. На практике "точка отказа" условна. Подшипник может издавать странный звук за неделю до критического отказа.
Ты определяешь эту точку субъективно. Инженер говорит: "Это отказ". Но может быть, точка отказа была раньше, и система это не знает.

Как это выглядит в реальности

Система ищет 10-15 ключевых признаков, которые предсказывают отказ. Это может быть тренд (значение растёт или падает), это может быть скачок, это может быть комбинация параметров, это может быть цикличность.
Система ранжирует эти признаки по важности и выдаёт оценку вероятности отказа.
На практике точность модели за сутки: примерно 90%. За неделю: примерно 80%. За месяц: примерно 60%.
Это нормально. В диапазоне 3-7 дней прогноз уже ценен. Ты можешь спланировать.

Главная ошибка: думать, что это волшебство

Машинное обучение это инструмент, мощный инструмент, но инструмент.
Если в модель внести плохие данные, выйдет плохой результат. Если неправильно определить точку отказа в обучающих данных, модель будет учиться на лжи.
Если ты внесёшь изменения в оборудование (купил новый насос, другого производителя), старая модель может перестать работать.
Поэтому в системах предиктивного обслуживания важна роль эксперта. Инженер смотрит на предупреждение системы и говорит: "Это имеет смысл" или "Это ложное срабатывание. Я знаю, что здесь произошло".
Лучшие системы это гибрид: машинное обучение плюс человеческая экспертиза. Система видит числа, человек видит смысл.

Вывод

Машинное обучение для предиктивного обслуживания это не будущее, это настоящее.
На нефтезаводах оно сокращает простои на 15-20% и сэкономило уже миллиарды рублей.
На металлургических заводах оно снижает стоимость техобслуживания на 20-25% и позволяет печам работать стабильнее.
На электростанциях оно предотвращает внезапные отказы трансформаторов.
На заводах химии оно позволяет оборудованию работать дольше между ремонтами.
Нейросеть не думает за вас. Она видит то, что вы не видите. Обрабатывает миллионы точек данных в секунду и выявляет паттерны, которые человеческий мозг упускает.