DeepSeek-R1, що поєднує AI та обчислювальні обчислення для промислового IoT

Вступ

Дистильовані моделі DeepSeek-R1 дрібних розмірів тонко налаштовані за допомогою даних ланцюга, що генеруються DeepSeek-R1, позначеними...Теги, успадковуючи можливості міркувань R1. Ці тонко налаштовані набори даних явно включають процеси міркувань, такі як розкладання проблем та проміжні відрахування. Навчання підкріплення узгодило моделі поведінки дистильованої моделі за допомогою кроків міркувань, створених R1. Цей механізм дистиляції дозволяє малим моделям підтримувати ефективність обчислень, отримуючи складні здібності міркувань поблизу великих моделей, що має значне значення застосування в сценаріях, що обмежуються ресурсами. Наприклад, версія 14B досягає 92% завершення коду оригінальної моделі DeepSeek-R1. У цій статті представлено дистильовану модель DeepSeek-R1 та її основні програми в промислових обчисленнях, узагальнених у наступних чотирьох напрямках, а також конкретні випадки впровадження:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Прогнозне обслуговування обладнання

Технічна реалізація

Датчик синтез:

Інтегруйте вібрацію, температуру та поточні дані з ПЛК за допомогою протоколу Modbus (швидкість вибірки 1 кГц).

Видалення функції:

Імпульс запустіть Edge на Jetson Orin NX, щоб витягнути 128-мірні функції часових рядів.

Модель умовивод:

Розгорніть модель DeepSeek-R1-DISTILL-14B, введення векторів функцій для створення значень ймовірності несправності.

Динамічне регулювання:

Запуск роботи з технічного обслуговування, коли впевненість> 85%, і ініціюйте процес вторинної перевірки, коли <60%.

Відповідний випадок

Schneider Electric розгорнув це рішення на гірничій техніці, знизивши помилкові позитивні ставки на 63% та витрати на обслуговування на 41%.

1

Запуск DeepSeek R1 дистильована модель на інвалідах AI Edge Computers

Посилений візуальний огляд

Архітектура виходу

Типовий трубопровід розгортання:

камера = gige_vision_camera (500 кадрів в секунду) # Gigabit Industrial Camera
кадр = camera.capture () # Зображення зображення
попередньо оброблений = opencv.denoise (кадр) # позначення попередньої обробки
defect_type = deepseek_r1_7b.infer (попередньо оброблена) # Класифікація дефектів
Якщо defect_type! = 'нормально':
Plc.trigger_reject () # механізм сортування тригера

Показники продуктивності

Затримка обробки:

82 мс (Jetson Agx orin)

Точність:

Виявлення дефектів, що формують ін'єкцію, досягає 98,7%.

2

Наслідки DeepSeek R1: переможці та переможені в генеративній ланцюжку вартості AI

Оптимізація потоку процесів

Основні технології

Природна мова взаємодії:

Оператори описують аномалії обладнання за допомогою голосу (наприклад, "коливання тиску екструдера ± 0,3 МПа").

Мультимодальні міркування:

Модель генерує пропозиції оптимізації на основі історичних даних обладнання (наприклад, регулювання швидкості гвинта на 2,5%).

Цифрова перевірка близнюків:

Валідація моделювання параметрів на платформі EdgeX Foundry.

Ефект впровадження

Хімічна рослина BASF прийняла цю схему, досягнувши зменшення споживання енергії на 17% та збільшення якості продукції на 9%.

3

Edge AI та майбутнє бізнесу: OpenAI O1 проти DeepSeek R1 для охорони здоров'я, автомобілів та IIOT

Миттєве пошук бази знань

Дизайн архітектури

Локальна векторна база даних:

Використовуйте ChromadB для зберігання посібників з обладнання та специфікацій обробки (вбудовування розміру 768).

Гібридне пошук:

Поєднайте алгоритм BM25 + схожість косинусу для запитів.

Покоління результатів:

Модель R1-7B підсумовує та уточнює результати пошуку.

Типовий випадок

Інженери Siemens вирішили збої інвертора за допомогою запитів природних мов, скорочуючи середній час обробки на 58%.

Проблеми та рішення розгортання

Обмеження пам'яті:

Використовується технологія квантування кешу KV, зменшуючи використання пам'яті моделі 14B від 32 ГБ до 9 Гб.

Забезпечення виконання в режимі реального часу:

Стабілізована затримка поодиноких висновків до ± 15 мс через оптимізацію графіків CUDA.

Модель дрейфу:

Щотижневі додаткові оновлення (передача лише 2% параметрів).

Екстремальні середовища:

Розроблений для широких температурних діапазонів від -40 ° С до 85 ° С з рівнем захисту IP67.

5
微信图片 _20240614024031.jpg1

Висновок

Поточні витрати на розгортання зараз зменшилися до 599 доларів США/вузол (Jetson Orin NX), при цьому масштабовані додатки утворюються в таких галузях, як виробництво 3С, автомобільна збірка та енергетична хімія. Очікується, що безперервна оптимізація технології архітектури та квантування МО дозволить моделі 70B працювати на крайових пристроях до кінця 2025 року.

Знайдіть рішення для кабелю ELV

Контрольні кабелі

Для BMS, автобуса, промислового, приладобудного кабелю.

Структурована система кабелів

Мережа та дані, волоконно-оптичний кабель, патч-шнур, модулі, лицьова панель

2024 Виставки та огляд подій

16 квіт.

16 квіт.

9 травня, 2024 р. Нові запуску продуктів та технологій у Шанхаї

Жовтень 22-го, 2024 р. Китай у Пекіні

19 листопада, 2024 р. Зв'язаний світ KSA


Час посади: лютий-07-2025