Computer Vision

Home / Computer Vision

MÔ TẢ KHÓA HỌC

Học viên được tiếp cận các khái niệm và kiến thức về Xử lý ảnh như thu nhận ảnh, biểu diễn ảnh, nén ảnh, tăng cường chất lượng ảnh, phát hiện biên, trích xuất đặc trưng ảnh; Các kỹ thuật và phương pháp trong Thị giác máy tính như phát hiện đối tượng, nhận dạng đối tượng, phân đoạn ảnh, phát hiện chuyển động và bám vết, nhận dạng hành động; và các mô hình học sâu (deep learning) hiện đại áp dụng trong các bài toán Thị giác máy tính.

Học viên được tiếp cận và thực hành với các ứng dụng của Xử lý ảnh và Thị giác máy tính với nhiều ví dụ minh họa, dữ liệu, và dự án từ các bài toán thực tế như phát hiện làn đường ứng dụng cho xe không người lái, khâu nối ảnh panorama, tìm kiếm ảnh theo nội dung (image retrieval), phân loại ảnh, phát hiện và phân loại đối tượng, phát hiện khuôn mặt, phát hiện biển số xe, phân loại phương tiện giao thông bằng camera thông minh, phát hiện đột nhật trong các ứng dụng nhà thông minh, phát hiện hành vi bất thường nơi công cộng, phân tích và nhận dạng ảnh khuôn mặt,…

YÊU CẦU KHÓA HỌC

– Đã biết lập trình (biết Python là một lợi thế).

CÔNG CỤ SỬ DỤNG

– Python, Jupyter Notebook

– OpenCV, Scikit-learn, Tensorflow

  • Ánh sáng, các không gian màu, cân bằng trắng; Thu nhận ảnh, biểu diễn ảnh, nén ảnh;
  • Ứng dụng: Tổng quan các ứng dụng của Xử lý ảnh và Thị giác máy tính.
  • Biểu đồ tần suất, Cân bằng biểu đồ tần suất; Lọc ảnh; Tích chập và tương quan chéo; Khử nhiễu, tăng cường chất lượng ảnh.
  • Ứng dụng: Khử nhiễu cộng, nhiễu nhân, nhiễu xung, nhiễu muối tiêu trong ảnh;
    Tăng cường chất lượng ảnh.
  • Đạo hàm ảnh, gradient, đạo hàm của hàm Gauss; Các bộ lọc phát hiện cạnh/biên ảnh; Phương pháp Canny; RANSAC
  • Ứng dụng: Phát hiện làn đường giao thông, vạch qua đường cho người đi bộ;
    Ứng dụng cho xe tự hành.
  • Phát hiện điểm quan tâm, DoG, phát hiện góc bằng Harris; Đặc trưng ảnh, đặc trưng cục bộ; SIFT, HOG; Đối sánh ảnh, RANSAC
  • Ứng dụng: Ảnh Panorama, Truy hồi/tìm kiếm cơ sở dữ liệu ảnh
    Ứng dụng hỗ trợ người du lịch tham quan các địa danh nổi tiếng.
    • Các phương pháp láng giềng gần nhất (K-NN), Hồi quy tuyến tính, Cây quyết định, Máy véc-tơ hỗ trợ SVM
    • Ứng dụng: Phân loại ảnh vật dụng (quần áo, xe cộ, biển báo giao thông), phân hạng ảnh khung cảnh.

>

 

  • k-means, hierachical k-means, mean-shifts
  • Ứng dụng: Phân cụm/nhóm ảnh album; Phân vùng ngữ nghĩa ảnh khung cảnh; Giải đoán ảnh viễn thám.
  • Phương pháp cửa sổ trượt; Kỹ thuật Boosting; Mô hình phân tầng cascade
  • Ứng dụng: Phát hiện ảnh mặt người; Phát hiện xe cộ, biển số xe;
  • Xây dựng hệ thống nhận dạng ảnh; Kỹ thuật láng giềng gần nhất; Mô hình túi từ (Bag of Words), đặc trưng SIFT, bộ phân lớp SVM
  • Ứng dụng: Nhận dạng, phân loại và đếm xe cộ giao thông, ứng dụng trong hệ thống camera giám sát thông minh
  • Các kỹ thuật phân vùng, phân theo ngưỡng, phân cụm, các kỹ thuật k-mean, mean-shift, phân theo tập mức, biến đổi khoảng cách, siêu điểm ảnh
  • Ứng dụng: Hiểu ngữ nghĩa khung ảnh ứng dụng cho bài toán xe tự hành, thiết bị bay không người lái; Phân vùng ảnh y tế.
  • Các mô hình trừ nền, Optical flow, Lucas-Kanade method, Kalman Filter, KLT, Data Association
  • Ứng dụng: Phát hiện chuyển động, phát hiện và bám theo đối tượng, phát hiện đột nhập trong giám sát an ninh tòa nhà
  • Các kỹ thuật mô tả không – thời gian (Spatial-Temporal Descriptors), IDT, …
  • Ứng dụng: Phát hiện hành vi bất thường trong camera giám sát
  • Các mô hình mạng nơ-ron; Giải thuật lan truyền ngược; Các mạng nơ-ron tích chập
  • Ứng dụng: Nhận dạng chữ viết tay; Phát hiện trạng thái cảm xúc mặt người (vui, buồn, mệt mỏi,…)
  • Các kiến trúc mạng tiên tiến điển hình: AlexNet, VGG, ResNet, DenseNet
  • Ứng dụng: Nhận dạng và phân loại phương tiện giao thông; Nhận dạng biển báo giao thông
  • Các mô hình tiêu biểu: RNN, LSTM, C3D
  • Ứng dụng: Định danh người trong hệ thống giám sát thông minh sử dụng nhiều camera