Bootcamp CV modern: de la OpenCV/NumPy la antrenarea, evaluarea și deploy‑ul modelelor de viziune.
Exersezi fluxuri PyTorch‑first, cu paralele opționale TensorFlow/Keras.
Abordezi CNN și Vision Transformers cu accent practic.
Dobândești experiență practică prin ~70% laboratoare pe dataset‑uri și proiecte reale.
Beneficii: modele fiabile și deploy pe edge cu ONNX/TensorRT.
Cui i se adresează: conceput pentru persoane cu baze Python/C++ care atacă probleme de percepție.
Accent pe reproductibilitate, metrici robuste și evaluare responsabilă.
Curriculum
Fundamente de computer vision cu OpenCV
- Încărcare/salvare, spații de culoare, primitive de desen, ROI/cropping
- Transformări: resize/rotate/flip; aritmetică pe imagini; masking; operații pe canale
- Kernels & morfologie; gradiens/margini; probleme de iluminare și normalizare
- Mini-lab: pipeline de detecție a benzilor (lane)
NumPy & programare pe tablouri
- Bazele ndarray, broadcasting, views vs copies
- Vectorizare, layout în memorie, dtype & compromisuri de precizie
- Mic lab: implementăm o convoluție și comparăm cu OpenCV
Rețele neuronale from scratch (concepte)
- Perceptron, activări, logits & softmax, cross-entropy
- Backprop & gradient descent; inițializare & normalizare
- Overfitting vs generalizare; overview de regularizare
PyTorch essentials (cu paralele TF/Keras)
- Tensors, autograd, modules; scrierea unui training loop
- Data pipelines: Dataset/DataLoader, augmentări (Albumentations — bază)
- Metrici & evaluare; matrice de confuzie; reproductibilitate (seed/determinism)
- Mixed precision (AMP) și multi-GPU (DDP) — overview + demo
Rețele convoluționale, transfer learning & fine‑tuning
- Blocurile CNN; receptive fields & shapes; număr de parametri
- Backbone-uri pretrained (torchvision/timm) și design de head
- Freeze/partial freeze; learning rates diferențiate; early stopping
- Lab: fine‑tuning de classifier; comparăm strategii de augmentare
Detecție/segmentare — tur rapid
- Familii de detecție (one‑stage vs two‑stage) — perspectiva practică
- Opțiuni moderne: familia YOLO, DETR/RT‑DETR (overview); semantic vs instance segmentation
- Formate de dataset, unelte de anotare și evaluare (mAP/IoU) — bază
Attention & Vision Transformers (overview practic)
- Intuiția self‑attention; patches & embeddings; positional encodings
- Workflow de fine‑tuning tip ViT/DeiT
- Când alegem CNN vs ViT; considerente de compute/memorie
Optimizare: rețete de antrenare care contează
- Schedulers (cosine/one‑cycle), weight decay, label smoothing
- Regularizare: dropout, mixup/cutmix (overview)
- Sfaturi pentru stabilitate: gradient clipping, batch sizes, capcane AMP
- Tracking de experimente: MLflow sau Weights & Biases (scurt)
CV responsabil & calitatea datelor
- Curația dataset‑ului și split‑uri; leakage & shortcuts
- Bias, robustețe, augmentări vs distribution shift
- Documentarea experimentelor și model cards (lightweight)
Deploy pe edge și producție
- Export: TorchScript și ONNX; verificarea parității numerice
- Accelerație: TensorRT / ONNX Runtime / OpenVINO — când folosim ce
- Quantization (PTQ/QAT), pruning & distillation — beneficii & compromisuri
- Servire: Triton Inference Server; note pentru Jetson
Module opționale
Opțional — modele temporale & tracking
- Opțiuni de modelare temporală (RNN/LSTM/GRU vs conv temporal 1D)
- Bazele multi‑object tracking (overview)
Structura zilei de curs
- Part 1: 09:00–10:30
- Break: 10:30–10:45
- Part 2: 10:45–12:15
- Lunch break: 12:15–13:15
- Part 3: 13:15–15:15
- Break: 15:15–15:30
- Part 4: 15:30–17:30