성세빈

AI Optimization Developer

"제한된 컴퓨팅 자원에서 최적의 성능을 끌어올립니다."
GPU/XPU/NPU처럼 가속기가 있어도 실제 제약은 메모리, 연산, I/O에서 먼저 걸립니다. 저는 목표 지연시간과 처리량을 기준으로 모델 구조와 추론 파이프라인을 재설계하고 병목을 수치로 측정해 원인을 분해합니다. 그 결과를 바탕으로 효과가 큰 최적화 포인트를 정리하고 실시간 성능으로 이어지게 만듭니다.

기술 스택

1) Language / Framework

Python
PyTorch
C / C++

2) Edge / On-device

Raspberry Pi 5
Hailo-8 NPU
STM32

3) Tooling / DevOps

Git / GitHub
Docker
CMake
Linux (Ubuntu)

4) Acceleration / Optimization

CUDA
Intel XPU
oneAPI / SYCL
GEMM, GRAPH

팀 프로젝트 - Road Vision

데모 보기 →Repository →

소개

RGB 카메라 기반 실시간 도로 노면 탐지 시스템입니다. 자율주행 및 주행 보조 환경에서 다중 센서(LiDAR 등) 없이 영상 기반으로 노면 상태를 신속하게 분류하도록 설계했습니다.

팀 성과 & 핵심 기능

RGB 영상 + 에지 맵 채널 확장(3,4채널) 전처리 파이프라인 구축
CNN–GRU–MLP 구조로 프레임 특징 + 시퀀스 분석 결합
MobileNet-v3-small, LRASPP, DeepLabV3+ 등 백본 비교 및 Grad-CAM 분석
Intel Arc GPU 학습·양자화 후 Raspberry Pi 5 + Hailo-8에서 실시간 추론 구현
CARLA 시뮬레이터 기반 주행/기상 조건으로 안정성 검증

기간 / 인원

2025.05 - 2025.08 (약 3개월)
총 4인 (팀장 역할 수행)

포지셔닝

Role: 임베디드 시스템 설계 및 AI 모델 최적화

이원화된 모델 아키텍처 설계:
Hailo-8 NPU가 RNN 연산을 지원하지 않는 제약을 해결하기 위해,특징 추출(CNN)은 NPU, 시계열 분석(GRU)은 CPU로 분리 설계.
백본 비교 및 해석 기반 선택:
MobileNet-v3-small, LRASPP, DeepLabV3+를 비교하고 Grad-CAM 분석으로 최적 백본 선정.
추론 성능 가속 및 배포:
Intel Arc GPU에서 학습/양자화 후 Edge 디바이스(RPi 5 + Hailo-8)에 배포해 실시간 추론 성립.
협업/운영:
Git Flow 및 이슈/마일스톤 기반으로 작업 분해와 병목 해소를 주도.