2371100 Strojové vnímání a analýza obrazu

Způsob zakončení zápočet, zkouška
Semestr zimní
Rozsah 2+2
Kredity 5
Forma studia prezenční
Garant Prof. Ing. Václav Hlaváč, CSc..


Cílem předmětu je seznámit studenty s metodami zpracování, analýzy obrazu a vnímáním pro roboty. Předmět studenty naučí, jak se zpracovávají a analyzují obrazy počítačem. Vysvětlíme metody digitálního zpracování obrazu, kdy nemáme sémantickou znalost o obsahu obrazu. Dále budeme studovat postupy analýzy obrazu, kdy podle sémantiky umíme segmentovat objekty od pozadí, popsat je příznaky a rozpoznat je.  Navážeme na studentovy znalosti z matematické analýzy, lineární algebry a teorie signálů.


Přednášky jsou v pondělí od 12:30 do 14:00 v JP:B-633.

Časového plánu akademického roku FS ČVUT

Osnova přednášek

prof. Ing. Václav Hlaváč, CSc., vaclav.hlavac@cvut.cz, Český institut informatiky, robotiky a kybernetiky ČVUT, Praha 6, Dejvice, Jugosláváských partyzánů 1580/3, místnost JP:B-610

Týden semestru




Obsah přednášky

1 1 23.09.2024 V. Hlaváč DZO vs. počítačové vidění. Role interpretace. Objekty v obraze. Digitální obraz. Vzdálenostní transformace.
2 2 30.09.2024 J. Škovierová Jasové a geometrické transformace obrazu. Předzpracování obrazu.
3 3 7.10.2024 V. Hlaváč Hrany, hranové body, ostření, prostor měřítek. Detekce významných bodů. Pořízení obrazu z optického i radiometrického hlediska. Nepoužitelnost inverzní úlohy k fyzice pořízení obrazu.
4 4 14.10.2024 V. Hlaváč Segmentace objektů v obrazech (část 1, část 2, část 3).
5 5 21.10.2024 V. Hlaváč Statistické rozpoznávání. Role učení. Lineární klasifikátor a metody jeho učení. Perceptron. SVN. Jádrové funkce.
6 6 28.10.2024 Nikdo Státní svátek
7 7 4.11.2024 V. Hlaváč Učení bez učitele. Experimentální hodnocení klasifikátorů.
7 8 11.11.2024 V. Hlaváč Popis oblastí v obrazech. Použití statistického rozpoznávání pro obrazy. Metoda hlavních směrů.
9 9 18.11.2024 V. Hlaváč Geometrie jedné perspektivní kamery. Projekční matice a její rozklad. Kalibrace jedné kamery. 
10 10 25.11.2024 V. Hlaváč  Geometrie dvou kamer, epipolární omezení, fundamentální a esenciální matice. Geometrie více kamer.
11 11 2.12.2024 V. Hlaváč Hloubkové senzory (lidar, radar, sonar, kamery se strukturovaným světlem). Fúze dat z různých hloubkových senzorů
12 12 9.12.2024 V. Hlaváč Autonomní roboty a reprezentace světa. Plánování v (průmyslové) robotice
13 13 16.12.2024 V. Hlaváč Využití taktilní a vizuální zpětné vazby v manipulačních úlohách. Silově poddajné roboty. Spolupráce lidí a robotů v průmyslu.

Okamžitý stav všech průsvitek Václava Hlaváče pro přednášky je česky, in English.

Stránka cvičení

Cvičící udržují pro cvičení samostatné webovou stránky https://moodle-vyuka.cvut.cz/course/view.php?id=8543 . Důležitý je odkaz na github, kde jsou všechny zdroje i zadání úkolů (také ještě budou aktualizovány) https://github.com/CVUT-FS-12110/Machine-Perception-and-Image-Analysis . The link to github is useful too as there are all sources and assiggnments  https://github.com/CVUT-FS-12110/Machine-Perception-and-Image-Analysis

Zkouška a její hodnocení

  • Zkoušeni mohou být jen ti studenti, kteří mají nárok na zápočet ze cvičení.
  • Zkouška má dvě části, písemnou a ústní. Písemka ověřuje rámcovou orientaci studenta v předmětu. V písemné části student odpovídá na typicky šest otázek, které budou vybrány ze seznamu otázek. Otázky pro konkrétní zkoušku jsou vybírány náhodně. Student má na napsání písemky 30 minut. Celkem lze z písemky získat maximálně 30 bodů.  
  • Ústní část zkoušky následuje po opravě písemek. Ústní část zkoušky probíhá nad vědeckým článkem mladším než pět let z renomovaného časopisu (seznam následuje) a vztahujícím se k předmětu. Student si sám článek v angličtině vybere, vytiskne, přečte a svoje poznámky při čtení zapisuje do vytištěné verze. Svůj výtisk s poznámkami si student přinese ke zkoušce. Ústní část zkoušky je navržena tak, aby si student mohl ovlivnit oblast, v níž může probíhat hlubší diskuse mezi zkoušejícím a studentem vztahující se k předmětu. U zkoušky student nebude vysvětlovat, o čem článek pojednává. Seznam časopisů, z nichž studenti mají vybrat článek: IEEE Transactions on Pattern Analysis and Machine Intelligence, International Journal on Computer Vision
  • Prosím, nenoste články, jejichž jádrem je použití konvolučních neuronových sítí. Těžko se zkoušejí. Stát platí univerzitám elektronický přístup, časopisy hledejte přes https://dialog.cvut.cz/
  • Výsledná známka se určí součtem bodů ze cvičení (max. 40 bodů), písemné části (max. 30 bodů) a ústní části (max. 30 bodů).
  • Celkový počet dosažitelných bodů je tedy 100. A 100-90 bodů, B 89-80 bodů, C 79-70 bodů, D 69-60 bodů, E 59-50 bodů, F 50 bodů.

Doporučená literatura

  • M. Sonka, V. Hlavac, a R. Boyle, Image processing, analysis, and machine vision, Fourth edition. Stamford, CT,
    USA: Cengage Learning, 2015.
  • R. Szeliski, Computer vision: algorithms and applications. London ; New York: Springer, 2011.
  • Fahimi, F.: Autonomous Robots: Modeling, Path Planning, and Control, Springer 2009
  • Szeliski R.: Computer Vision: Algorithms and Application, Springer, Berlin, 2010. 812 p. The book draft is freely available for download.
  • Karu Z.Z.: Signals and Systems Made Ridiculously Easy, ZiZi Press, Cambridge, MA, USA, 2001, (možno stáhnout naskenovanou). Velmi útlou knihu doporučuji těm, kdo neprošli kursem zpracování signálů, ale i těm, kdo si chtějí upevnit základ nepříliš formálním čtením.
  • Doxiadēs, A. K., Papadimitriou, C. H., Papadatos, A., & Di, D. A. Logicomix. An Epic Search for Truth. New York: Bloomsbury, 2009. , You can download a free copy from https://archive.org/details/Logicomix-Comic-EarlyLifeOfBertrandRussell/mode/2up
  • Doxiadēs, A. K., Papadimitriou, C. H., Papadatos, A., & Di, D. A. Logikomiks, Hledání absolutní pravdy, český překlad Dokořán 2012, ISBN: 978-80-7363-401-8 / 336 stran, přeložil Jaroslav Peregrin

Na osobní stránce přednášejicího jsou odkazy na všechny prezentace přednášejícího včetně použitých při přednáškách. Alternativně přednášky: v češtině, angličtině.

K samostudiu, kdo tyto prerekvizity z matematiky nezná: Probability and statistics, rehersal. Optimization methods, an overview. Least squares.

2371100 Machine perception and image analysis

Ending of the subject credit, oral exam
Semester zimní
Range 2 hours lecture + 2 hours labs/exercises weekly
ECTS (credits) 5
Mean of the study full-time
Garant Prof. Ing. Václav Hlaváč, CSc.


The aim of the course is to acquaint students with methods of image processing, image analysis and perception for robots. The course will teach students how to process and analyze images on a computer. We will explain the methods of digital image processing, where we do not have semantic knowledge about the content of the image. We will also study image analysis procedures, where we can segment objects from the background according to semantics, describe them with symptoms and recognize them. We will build on the student's knowledge of mathematical analysis, linear algebra and signal theory.


Lectures are on Mondays from 14:15 to 15:45 in JP:B-633. When COVID commands, it will be lectured remotely via Microsoft Teams, channel

Outline of lectures

prof. Ing. Václav Hlaváč, CSc., vaclav.hlavac@cvut.cz, Czech Institute of Informatics, Robotics, and Cybernetics CTU, Praha 6, Dejvice, Jugosláváských partyzánů 1580/3, room JP:B-610

Week of the semester




Lecture content

1 1 25.09.2024 V. Hlaváč Image processing vs. computer vision. Role of interpretation. Objects in the image. Digital image. Distance transformation.
2 2 30.09.2024 J. Škovierová Brightness and geometric transformations. Image preprocessing. Edges, edge elements, sharpening, scale space.
3 3 7.10.2024 V. Hlaváč Image formation from the optical and radiometric point of view. Interest points detection.
4 4 14.10.2024 V. Hlaváč Object segmentation in images (part 1, part 2, part 3
5 5 21.10.2024 V. Hlaváč Statistical pattern recognition. Role of lerarning. Linear classifier and its learning. Perceptron. SVN. Kernel functions.
6 6 28.10.2024 Nobody Public holiday
7 7 6.11.2024 V. Hlaváč Unsupervised learning. Experimental evaluation of classifiers.
8 8 13.11.2024 V. Hlaváč Region description in images. Pattern recognition used for images. Principal component analysis.
9 9 20.11.2024 V. Hlaváč Projective transformation. Geometry of a single perspective camera. Projection matrix and its decomposition. Single camera calibration.
10 10 27.11.2024 V. Hlaváč Geometriy of two cameras, epipolar constraint, fundamental and esential matrix. Geometry of more cameras.
11 11 4.12.2024 V. Hlaváč Depth sensors (lidar, radar, sonar, cameras with the structured illumination. Fusion of data from different depth sensors.
12 12 11.12.2024 V. Hlaváč Autonomous robots and  robot world representation.
13 13 18.12.2024 V. Hlaváč Use of tactile and visual feedback in manipulation tasks. Force compliant robots. Cooperation of robots and humans in industry.

The present state of Václav Hlaváč's presentation is here, in English

Presentations for self-study for those who do not know these prerequisites: Probability and statistics, rehersal. Optimization methods, an overview. Least squares.

Lab's pages

Instructors maintain a separate web page for labs https://moodle-vyuka.cvut.cz/course/view.php?id=8544 .

Examination and related evaluation

  • Only students who obtained the credit for their lab activity are eligible for the examination.
  • The examination consists of two parts, written and oral exams. The written part checks the global orientation of the student in the subject matter. Students answer typically six questions, which are randomly selected from the list of questions Questions may be slightly changed till the end of December. The written exam lasts 30 minutes. The written part of the exam yields 30 points at maximum.
  • The oral part of the exam follows the written part after the written part is corrected by the teacher. The oral part is a discussion of a student and the teacher about a scientific paper of student's choice. The paper has to be from a respected scientific journal, which cannot be older than five years. The paper has to have a relation to the subject and be written in English. Students come to the exam with a printed version of the paper with her/his handwritten notes made while reading the paper. The oral part of the exam is designed so that the student can influence the area in which a deeper discussion can take place between the examiner and the student related to the subject. In the exam, the student will not explain what the article is about.
  • The list of journals from which the paper can be selected: IEEE Transactions on Pattern Analysis and Machine Intelligence and Internation Journal of Computer Vision. The Czech Government pays to its universities the electronic access to papers. Use CVUT Library or directly at portál. The student has to know the bibliographic information and should write it on the paper front page.
  • Oral part of the exam follows after correcting tests (written part).
  • The examination mark is given by the sum of points. Labs (max. 40 points), written part (max. 30 points), and oral exam (max. 30 points).

Recommended literature

