DeepSeek-R1 Поєднання штучного інтелекту та периферійних обчислень для промислового Інтернету речей

Вступ

Малі дистильовані моделі DeepSeek-R1 точно налаштовуються за допомогою даних ланцюжка думок, згенерованих DeepSeek-R1, позначених як...теги, успадковуючи можливості міркування R1. Ці точно налаштовані набори даних явно включають процеси міркування, такі як декомпозиція проблеми та проміжні дедукції. Навчання з підкріпленням узгодило моделі поведінки дистильованої моделі з кроками міркування, згенерованими R1. Цей механізм дистиляції дозволяє малим моделям підтримувати обчислювальну ефективність, отримуючи при цьому складні можливості міркування, близькі до можливостей більших моделей, що має значну цінність застосування в сценаріях з обмеженими ресурсами. Наприклад, версія 14B досягає 92% завершення коду оригінальної моделі DeepSeek-R1. У цій статті представлено дистильовану модель DeepSeek-R1 та її основні застосування в промислових периферійних обчисленнях, узагальнені в наступних чотирьох напрямках, а також конкретні випадки реалізації:

dc3c637c5bead8b62ed51b6d83ac0b4

Прогнозне обслуговування обладнання

Технічна реалізація

Злиття датчиків:

Інтегруйте дані про вібрацію, температуру та струм від ПЛК через протокол Modbus (частота дискретизації 1 кГц).

Вилучення ознак:

Запустіть Edge Impulse на Jetson Orin NX для вилучення 128-вимірних ознак часових рядів.

Висновок моделі:

Розгорніть модель DeepSeek-R1-Distill-14B, ввівши вектори ознак для генерації значень ймовірності несправності.

Динамічне налаштування:

Запускати наряди на технічне обслуговування, коли впевненість > 85%, та ініціювати процес вторинної перевірки, коли < 60%.

Відповідна справа

Schneider Electric впровадила це рішення на гірничодобувному обладнанні, зменшивши рівень хибнопозитивних результатів на 63% та витрати на обслуговування на 41%.

1

Запуск дистильованої моделі DeepSeek R1 на периферійних комп'ютерах InHand зі штучним інтелектом

Покращений візуальний огляд

Архітектура виводу

Типовий конвеєр розгортання:

camera = GigE_Vision_Camera(500fps) # Гігабітна промислова камера
frame = camera.capture() # Захоплення зображення
preprocessed = OpenCV.denoise(frame) # Попередня обробка шуму
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Класифікація дефектів
якщо тип_дефекту != 'нормальний':
PLC.trigger_reject() # Механізм сортування тригерів

Показники продуктивності

Затримка обробки:

82 мс (Jetson AGX Orin)

Точність:

Виявлення дефектів лиття під тиском досягає 98,7%.

2

Наслідки DeepSeek R1: переможці та переможені в ланцюжку створення вартості генеративного штучного інтелекту

Оптимізація потоку процесів

Ключові технології

Взаємодія з природною мовою:

Оператори описують аномалії обладнання голосом (наприклад, «Коливання тиску екструдера ±0,3 МПа»).

Мультимодальне мислення:

Модель генерує пропозиції з оптимізації на основі історичних даних обладнання (наприклад, коригування швидкості гвинта на 2,5%).

Перевірка цифрового двійника:

Валідація параметрів моделювання на платформі EdgeX Foundry.

Ефект впровадження

Хімічний завод BASF запровадив цю схему, досягнувши скорочення споживання енергії на 17% та підвищення якості продукції на 9%.

3

Периферійний штучний інтелект та майбутнє бізнесу: OpenAI o1 проти DeepSeek R1 для охорони здоров'я, автомобілебудування та IIoT

Миттєве отримання бази знань

Архітектурний дизайн

Локальна векторна база даних:

Використовуйте ChromaDB для зберігання інструкцій з експлуатації обладнання та специфікацій процесу (вимір вбудовування 768).

Гібридний пошук:

Поєднайте алгоритм BM25 + косинусну подібність для запиту.

Генерація результатів:

Модель R1-7B узагальнює та уточнює результати пошуку.

Типовий випадок

Інженери Siemens вирішували проблеми з інверторами за допомогою запитів природною мовою, скоротивши середній час обробки на 58%.

Проблеми розгортання та рішення

Обмеження пам'яті:

Використана технологія квантування кешу KV, що зменшило використання пам'яті 14-бітною моделлю з 32 ГБ до 9 ГБ.

Забезпечення продуктивності в режимі реального часу:

Стабілізована затримка одиночного виводу до ±15 мс завдяки оптимізації CUDA Graph.

Дрейф моделі:

Щотижневі додаткові оновлення (передача лише 2% параметрів).

Екстремальні умови:

Розроблений для широкого діапазону температур від -40°C до 85°C зі ступенем захисту IP67.

5
微信图片_20240614024031.jpg1

Висновок

Поточні витрати на розгортання знизилися до 599 доларів США за вузол (Jetson Orin NX), при цьому масштабовані програми формуються в таких секторах, як виробництво 3C, складання автомобілів та енергетична хімія. Очікується, що постійна оптимізація архітектури MoE та технології квантування дозволить моделі 70B працювати на периферійних пристроях до кінця 2025 року.

Знайдіть рішення для кабелів ELV

Контрольні кабелі

Для кабелів BMS, BUS, промислових, інструментальних.

Структурована кабельна система

Мережа та дані, оптоволоконний кабель, патч-корд, модулі, лицьова панель

Огляд виставок та подій 2024 року

16-18 квітня 2024 року. Енергетична виставка Близького Сходу в Дубаї.

16-18 квітня 2024 року, Securika в Москві

9 травня 2024 року в Шанхаї відбувся запуск нових продуктів і технологій

22-25 жовтня 2024 року, SECURITY CHINA у Пекіні

19-20 листопада 2024 р. CONNECTED WORLD KSA


Час публікації: 07 лютого 2025 р.