Автономні машини

Застарілий набір даних, що керує автомобілем, свідчить про еволюцію машинного навчання

Застарілий набір даних, що керує автомобілем, свідчить про еволюцію машинного навчання

Оскільки самохідні машини стають реальністю на дорогах загального користування, усі дані та інформація, відповідальні за їх безпечне керування, повинні бути на базі.

Ось чому, коли поширилося повідомлення про те, що ярлики сотень пішоходів, велосипедистів, дорожніх конусів, серед інших, відсутні в широко використовуваному наборі даних для самокерованих автомобілів, головна реакція була турботою. Зрештою, "правила дорожнього руху" не враховують самокеровані автомобілі зі сліпими плямами, що включають людей.

Але насправді це не так.

ДИВІТЬСЯ ТАКОЖ: ЯК ПРАЦЮЮТЬ АВТОМОБІЛІ?

Машинне навчання розвивається, показують старі набори даних

Із 15,000 вручну перевірені зображення з набору даних Udacity 2, 4,986 з них, це 33%, були неповними, за даними комерційного постачальника набору даних, Roboflow.ai. Але набори даних Udacity були створені більше трьох років тому і не працюють на громадських вулицях.

Важливо пам’ятати: в роки машинного навчання в Інтернеті три людські роки були кілька років тому.

"Протягом наступних років, - повідомив Udacity про цікаву інженерію (IE) в електронній пошті, - такі компанії, як Waymo, nuTonomy та Voyage, публікували нові, кращі набори даних, призначені для реальних сценаріїв".

Іншими словами, Udacity активно не створював нових наборів даних, щоб не відставати від найновішої лінійки наборів даних про самокеровані автомобілі, оскільки - на даний момент - це дало реальний поверх громадських вулиць новим компаніям.

Машинне навчання та алгоритми

Машинне навчання допомогло багатьом галузям еволюціонувати поза своїм нинішнім станом. Навчання комп’ютерних алгоритмів виконувати нові завдання необхідно для того, щоб цей процес працював безперебійно та безпечно. За досить тривалий термін ці набори даних стають надзвичайно складними. Це може ускладнити їх сприйняття людьми на початку їхньої самохідної кар’єри. Ось чому неповні набори даних - як «легкий режим» у відеоіграх - це не погана ідея. Поки вони залишаються на бездоріжжі.

Самостійні машини вимагають багато даних для своїх алгоритмів для навігації небезпеками громадських вулиць. Якщо машина не знає, як розпізнати пішохода-людини, що йде вздовж дороги, або велосипедиста, який розділяє дорогу з автомобілем, то можуть виникнути серйозні проблеми.

Комерційний постачальник наборів даних, Roboflow, опублікував статтю, яка підтверджує, що популярний набір даних про самокеровані машини справді не має оновлень. Набір даних Udacity 2 використовується тисячі студентів, які створюють набір даних про автомобілі, що керують автомобілем з відкритим кодом.

Компанія Roboflow перевірила вручну 15 000 зображень з набору даних, і виявив це 33% з них були проблеми. Там були тисячі не маркованих транспортних засобів, сотні пішоходів без міток, та десятки велосипедистів без міток.

Навчальні колеса для наборів даних для самокерованих автомобілів

Можливо, Roboflow не мав наміру вводити в оману громадськість. Поняття тренувальних коліс важко зрозуміти кожному. Чи все ще велосипед є велосипедом, якщо дівчина, яка їде на ньому, має два додаткових колеса? Начебто, але не зовсім так. Чи переживає вона, як це - їздити на велосипеді? Безумовно, але без реального ризику потенційного падіння.

Чи готова вона до справжнього?

Це залежить від неї, і те саме можна сказати про студентів, які повинні вирішити, чи готові вони зняти навчальні колеса, і створити власні набори даних, відповідаючи реальному ризику галузі.

Звичайно, починаючи з набору даних Udacity, цим студентам доведеться пройти довгий шлях. Відсутня ідентифікація, відстежена Roboflow, включала дубльовані обмежувальні рамки, великі обмежувальні рамки та фантомні анотації.

Щоб ускладнити справи, навколо 1.4% Зображення були просто не позначені, проте вони містили машини, вантажівки, ліхтарі та навіть пішоходів - як запрошення завтрашнім розробникам наборів даних заповнити дані для себе.

Це показує, наскільки неймовірно складними є набори даних з відкритим кодом, і ця невідповідність між реальними дорогами та ранніми наборами даних є заслугою передових компаній, що займаються набором даних, транспортними засобами на дорогах загального користування. Але набір даних про самокеровані автомобілі Udacity не використовується на дорогах загального користування. В даний час єдиний діючий самохідний автомобіль Udacity призначений лише для навчальних цілей, встановлений на закритій випробувальній трасі.

Студентам, які потребують шпаргалки - у своєму прагненні заповнити діри трирічного набору даних - пощастило: Roboflow виправив і повторно випустив набір даних тут.

Оскільки машинне навчання штовхає технологію самокерованого автомобіля до створення наборів даних з більшою точністю, стане простіше озирнутися протягом багатьох років та десятиліть і здивуватися, як нам це вдалося.

Але, як і дівчина та її велосипед, проблема полягає у тому, щоб зняти колеса для тренувань та прокласти свій шлях на дорогах загального користування.

*** Примітка редактора: Ця стаття була оновлена ​​- з кількома змінами, внесеними протягом усього періоду - після отримання роз’яснень від Udacity. У попередній версії цієї статті випливало, що набори даних про самокеровані автомобілі Udacity активно використовуються на громадських вулицях. Це було виправлено, щоб відобразити той факт, що дані компанії використовуються лише в навчальних цілях, і фактично вони є не більш дефектними, ніж "навчальні колеса", і використовуються лише для того, щоб допомогти розробникам наборів даних ознайомитися з технологією. Крім того, Udacity не розробляв нових наборів даних протягом трьох років, і "дав слово" новим, вдосконаленим наборам даних, наданим іншими, не пов'язаними компаніями. Окрім того, єдиний в експлуатації самохідний автомобіль Udacity призначений виключно для навчальних цілей і працює на закритій випробувальній доріжці, а не на громадських вулицях. Загалом, попередня версія цієї статті припускала, що неповні набори даних, розроблені Udacity, були помилками, що є помилковим тлумаченням того факту, що старі набори даних, природно, здаються помилками, з огляду на майбутні розробки. Нарешті, оригінальна назва цієї статті була змінена з урахуванням цього. IE шкодує про ці помилки.

-Редакція ***


Перегляньте відео: Організація роботи служби фізичної терапії у відділенні (Найясніший 2021).