Edocti
Training tehnic avansat pentru inginerul software de mâine
Edocti Training

Deep Learning & Computer Vision Essentials (actualizat)

Intermediar
28 h
4.7 (536 recenzii)
Deep Learning & Computer Vision Essentials (actualizat)

Bootcamp CV modern: de la OpenCV/NumPy la antrenarea, evaluarea și deploy‑ul modelelor de viziune.

Exersezi fluxuri PyTorch‑first, cu paralele opționale TensorFlow/Keras.

Abordezi CNN și Vision Transformers cu accent practic.

Dobândești experiență practică prin ~70% laboratoare pe dataset‑uri și proiecte reale.

Beneficii: modele fiabile și deploy pe edge cu ONNX/TensorRT.

Cui i se adresează: conceput pentru persoane cu baze Python/C++ care atacă probleme de percepție.

Accent pe reproductibilitate, metrici robuste și evaluare responsabilă.

Curriculum

Fundamente de computer vision cu OpenCV
  • Încărcare/salvare, spații de culoare, primitive de desen, ROI/cropping
  • Transformări: resize/rotate/flip; aritmetică pe imagini; masking; operații pe canale
  • Kernels & morfologie; gradiens/margini; probleme de iluminare și normalizare
  • Mini-lab: pipeline de detecție a benzilor (lane)
NumPy & programare pe tablouri
  • Bazele ndarray, broadcasting, views vs copies
  • Vectorizare, layout în memorie, dtype & compromisuri de precizie
  • Mic lab: implementăm o convoluție și comparăm cu OpenCV
Rețele neuronale from scratch (concepte)
  • Perceptron, activări, logits & softmax, cross-entropy
  • Backprop & gradient descent; inițializare & normalizare
  • Overfitting vs generalizare; overview de regularizare
PyTorch essentials (cu paralele TF/Keras)
  • Tensors, autograd, modules; scrierea unui training loop
  • Data pipelines: Dataset/DataLoader, augmentări (Albumentations — bază)
  • Metrici & evaluare; matrice de confuzie; reproductibilitate (seed/determinism)
  • Mixed precision (AMP) și multi-GPU (DDP) — overview + demo
Rețele convoluționale, transfer learning & fine‑tuning
  • Blocurile CNN; receptive fields & shapes; număr de parametri
  • Backbone-uri pretrained (torchvision/timm) și design de head
  • Freeze/partial freeze; learning rates diferențiate; early stopping
  • Lab: fine‑tuning de classifier; comparăm strategii de augmentare
Detecție/segmentare — tur rapid
  • Familii de detecție (one‑stage vs two‑stage) — perspectiva practică
  • Opțiuni moderne: familia YOLO, DETR/RT‑DETR (overview); semantic vs instance segmentation
  • Formate de dataset, unelte de anotare și evaluare (mAP/IoU) — bază
Attention & Vision Transformers (overview practic)
  • Intuiția self‑attention; patches & embeddings; positional encodings
  • Workflow de fine‑tuning tip ViT/DeiT
  • Când alegem CNN vs ViT; considerente de compute/memorie
Optimizare: rețete de antrenare care contează
  • Schedulers (cosine/one‑cycle), weight decay, label smoothing
  • Regularizare: dropout, mixup/cutmix (overview)
  • Sfaturi pentru stabilitate: gradient clipping, batch sizes, capcane AMP
  • Tracking de experimente: MLflow sau Weights & Biases (scurt)
CV responsabil & calitatea datelor
  • Curația dataset‑ului și split‑uri; leakage & shortcuts
  • Bias, robustețe, augmentări vs distribution shift
  • Documentarea experimentelor și model cards (lightweight)
Deploy pe edge și producție
  • Export: TorchScript și ONNX; verificarea parității numerice
  • Accelerație: TensorRT / ONNX Runtime / OpenVINO — când folosim ce
  • Quantization (PTQ/QAT), pruning & distillation — beneficii & compromisuri
  • Servire: Triton Inference Server; note pentru Jetson

Module opționale

Opțional — modele temporale & tracking
  • Opțiuni de modelare temporală (RNN/LSTM/GRU vs conv temporal 1D)
  • Bazele multi‑object tracking (overview)

Structura zilei de curs

  • Part 1: 09:00–10:30
  • Break: 10:30–10:45
  • Part 2: 10:45–12:15
  • Lunch break: 12:15–13:15
  • Part 3: 13:15–15:15
  • Break: 15:15–15:30
  • Part 4: 15:30–17:30