성세빈

AI Optimization Developer

"제한된 컴퓨팅 자원에서 최적의 성능을 끌어올립니다."
GPU/XPU/NPU처럼 가속기가 있어도 실제 제약은 메모리, 연산, I/O에서 먼저 걸립니다. 저는 목표 지연시간과 처리량을 기준으로 모델 구조와 추론 파이프라인을 재설계하고 병목을 수치로 측정해 원인을 분해합니다. 그 결과를 바탕으로 효과가 큰 최적화 포인트를 정리하고 실시간 성능으로 이어지게 만듭니다.

기술 스택

1) Language / Framework

  • Python
  • PyTorch
  • C / C++

2) Edge / On-device

  • Raspberry Pi 5
  • Hailo-8 NPU
  • STM32

3) Tooling / DevOps

  • Git / GitHub
  • Docker
  • CMake
  • Linux (Ubuntu)

4) Acceleration / Optimization

  • CUDA
  • Intel XPU
  • oneAPI / SYCL
  • GEMM, GRAPH

팀 프로젝트 - Road Vision

소개

RGB 카메라 기반 실시간 도로 노면 탐지 시스템입니다. 자율주행 및 주행 보조 환경에서 다중 센서(LiDAR 등) 없이 영상 기반으로 노면 상태를 신속하게 분류하도록 설계했습니다.

팀 성과 & 핵심 기능

  • RGB 영상 + 에지 맵 채널 확장(3,4채널) 전처리 파이프라인 구축
  • CNN–GRU–MLP 구조로 프레임 특징 + 시퀀스 분석 결합
  • MobileNet-v3-small, LRASPP, DeepLabV3+ 등 백본 비교 및 Grad-CAM 분석
  • Intel Arc GPU 학습·양자화 후 Raspberry Pi 5 + Hailo-8에서 실시간 추론 구현
  • CARLA 시뮬레이터 기반 주행/기상 조건으로 안정성 검증

기간 / 인원

2025.05 - 2025.08 (약 3개월)
총 4인 (팀장 역할 수행)

포지셔닝

Role: 임베디드 시스템 설계 및 AI 모델 최적화
  • 이원화된 모델 아키텍처 설계:
    Hailo-8 NPU가 RNN 연산을 지원하지 않는 제약을 해결하기 위해,특징 추출(CNN)은 NPU, 시계열 분석(GRU)은 CPU로 분리 설계.
  • 백본 비교 및 해석 기반 선택:
    MobileNet-v3-small, LRASPP, DeepLabV3+를 비교하고 Grad-CAM 분석으로 최적 백본 선정.
  • 추론 성능 가속 및 배포:
    Intel Arc GPU에서 학습/양자화 후 Edge 디바이스(RPi 5 + Hailo-8)에 배포해 실시간 추론 성립.
  • 협업/운영:
    Git Flow 및 이슈/마일스톤 기반으로 작업 분해와 병목 해소를 주도.

System Architecture (Posters)

Road Vision system architecture poster 1
Road Vision system architecture poster 2

Demo Screenshots

Road Vision demo screenshot 1
Road Vision demo screenshot 2
Road Vision demo screenshot 3
Road Vision demo screenshot 4

기타 프로젝트

ROS2 및 OpenCV를 활용한 로봇카 제어

STM32 + Raspberry Pi 5 기반 자율주행 로봇카 제어

Repository
핵심 내용
  • ROS2 환경에서 Depth Camera + Mecanum Wheel 통합 주행
  • OpenCV 및 YOLO 기반 신호등/표지판 탐지, 차선 유지
  • 상태 머신(State Machine), 행동 트리(Behavior Tree) 기반 주행 로직 설계
포지셔닝

임베디드 하드웨어 제어와 인지(비전) 알고리즘을 결합해 “현장 제약”을 반영한 주행 로직을 설계한 경험.

자세 교정 보조앱 with OpenVINO

Pose Estimation 기반 실시간 자세 분석

Repository
핵심 내용
  • 허리 구부림/거북목/라운드 숄더 등 나쁜 자세 실시간 탐지
  • OpenVINO 추론 최적화로 경량 실시간 처리
포지셔닝

OpenVINO 기반 최적화 흐름(모델 선택 → 추론 최적화 → 실시간 처리)을 경험한 프로젝트.

LlamaIndex + Ollama 기반 FastAPI 챗봇

로컬 LLM + RAG 기반 개인화 정보 검색/대화

핵심 내용
  • LlamaIndex 기반 문서 인덱싱 및 검색 구조 설계
  • Ollama 로컬 LLM 실행 환경 구축 및 FastAPI REST API 연동
  • Docker 환경에서 GPU 가속 지원 및 배포 자동화 구성
포지셔닝

“로컬 모델 운영” 관점에서 인덱싱/서빙/배포까지 이어지는 시스템 구성 경험.

이력

뉴미(NU-ME)

  • 해외 병행 수입 개인사업자(2022.01–2025.12)

교육 / 트레이닝

    Intel Smart AI Master (2025.05–2025.08)

  • 임베디드/ROS2/Vision AI/LLM 실습 및 팀 프로젝트
  • NVIDIA AI Academy (진행중)

  • NVIDIA DLI / CUDA, TensorRT, DeepStream 등 가속 컴퓨팅 트랙

Growth Direction

Level-Zero / SYCL / CUDA 관점에서 가속 메커니즘을 이해하고, 핵심 연산(GEMM 등)의 병목을 정량적으로 다루는 방향으로 “재현 가능한 최적화” 역량을 확장하고 있습니다.