Data Intern
ТехВилл- до 65 000 руб.
Описание
ТехВилл IT-компания и партне р ВкусВилл по развитию цифровых решении .
Мы отвечаем за разработку мобильных и web- приложении , автоматизацию бизнес-процессов, искусственныи интеллект, devops, инфобез ВкусВилла.
Нашими решениями пользуется свыше 1 000 000 клиентов и сотрудников ВкусВилла.
На данный момент мы ищем Стажера, который будет работать с продуктом ВкусВилл , в направлении робототехники.Ключевые задачи:
- Сбор датасетов: поиск, подбор и систематизация изображений и видео-потоков с камер наших роботов, включая работу с открытыми источниками и внутренними базами данных.
-
Разметка данных: точная и аккуратная разметка данных для ключевых задач 2D компьютерного зрения.
- Детекция объектов (Object Detection): Обведение объектов (люди, погрузчики, паллеты, коробки) с помощью bounding boxes.
- Семантическая сегментация (Semantic Segmentation).
- Пиксельная разметка областей изображения (проезжая зона, пешеходная зона, препятствия).
- Классификация изображений (Image Classification).
- Присвоение тегов и категорий сценам и объектам.
Контроль качества:
- Проверка и верификация уже размеченных данных на предмет согласованности, полноты и ошибок.
Автоматизация процессов:
- Написание простых скриптов на Python или Shell для автоматизации рутинных задач: переименование файлов, фильтрация изображений, пакетная обработка данных, конвертация форматов аннотаций (JSON, COCO, YOLO).
-
Анализ и очистка данных: выявление и устранение нерелевантных, поврежденных данных и артефактов съемки (блики, размытие) для повышения качества датасетов.
- Ведение документации: описание процесса разметки, создание гайдов и поддержание документации по датасетам в актуальном состоянии.
Наш стек технологий:
-
Языки и инструменты разметки: Python 3.x, Bash (Shell Scripting), CVAT, Label Studio, Roboflow.
- Библиотеки для работы с данными: OpenCV, Pillow (PIL), pandas, numpy.
- Форматы данных: JSON (COCO), YOLO, Pascal VOC.
- Операционная система: Linux (Ubuntu).
Мы ожидаем, что вы:
-
Обучаетесь на старших курсах или выпуск по специальности Компьютерные науки, Прикладная математика, Data Science или смежным направлениям.
- Понимаете основы 2D Computer Vision (что такое изображение, цветовые пространства, фильтры, ключевые задачи: детекция, сегментация).
-
Имеете базовые навыки программирования на Python и готовы развивать их для автоматизации работы с данными.
-
Внимательны к деталям до педантичности и понимаете, что качество данных напрямую влияет на работу робота.
-
Усидчивы и нацелены на результат, готовы к кропотливой, но крайне важной работе.
-
Имеете базовое понимание ОС Linux и работу в командной строке.
-
Умеете работать с системой контроля версий Git.
Будет огромным плюсом:
- Опыт написания скриптов на Python для обработки изображений (с использованием OpenCV, PIL).
-
Знакомство с инструментами для разметки данных, такими как CVAT или Label Studio.
- Понимание форматов аннотаций для компьютерного зрения (JSON/COCO, YOLO).
- Личные учебные проекты, связанные с обработкой изображений или анализом данных.
- Работу в аккредитованной IT-компании.
- Гибрид ; На ключевых этапах проекта требуется работа на месте. Ожидается готовность к периодическим визитам.
- Оформление по ученическому договору на 3 месяца, с последующим продлением.