Strojové učení: Data v akci!

23. 10. 2025 Jak učit modely chytře – generalizace, data a bias

Proč může AI selhat?

Například model, který rozpoznává tváře, se naučil spolehlivě rozpoznávat muže, ale ženy často přehlíží, protože měl ve tréninku převahu mužských obličejů.

Hlavní cíl:

Zajistit fungování modelu i na nových datech a minimalizovat předpojatost.

  

15. 10 2025  Lineární regrese

Vyzkoušeli, jak počítač dokáže „odhadnout“ číslo na základě dat z minulosti. Ukázali jsme si to na příkladu cen domů – zadali jsme údaje jako velikost bytu, příjem lidí v oblasti nebo polohu na mapě a počítač se pomocí tzv. regrese naučil najít vzorec, podle kterého cenu předpovídá.

Co jsme dělali prakticky:

Co jsme si odnesli:

  

1. 10. 2025 Klasifikace - rozpoznávání kategorií

Jde o metodu strojového učení, která umí rozpoznávat kategorie a rozhodovat, do které třídy nový objekt patří. 'Odpovídá na otázky typu ano/ne nebo která z možností platí. S klasifikací se setkáváme každý den – při filtrování spamu v e-mailech, doporučování filmů nebo třeba v medicínské diagnostice.

Tréninkový příklad: známý dataset o pasažérech Titanicu. Na základě údajů o věku, pohlaví a lodní třídě jsme odhadovali, zda cestující přežil. Vytvořili jsme první klasifikační model pomocí rozhodovacího stromu: ptá se na jednoduché otázky („Je cestující žena?“ „Byl ve 3. třídě?“) a na jejich základě rozhoduje. Model dosáhl přesnosti kolem 75 %.

Zjištění: samotná přesnost (accuracy) nestačí – model může být nepřesný v menších, ale důležitých skupinách. Proto jsme se naučili používat další nástroje: Confusion matrix, Precision a recall, Precision-recall křivku.

Kromě rozhodovacích stromů jsme vyzkoušeli i další algoritmy: Logistická regrese, KNN a Naivní Bayes.

Na jiných datech (např. slavném Iris datasetu) jsme porovnali výsledky jednotlivých modelů a viděli, že univerzálně nejlepší algoritmus neexistuje. Každý má jiné silné a slabé stránky.

Úkol:  vytvořit vlastní klasifikační model – například s využitím dat o tučňácích nebo víně. Zkusili jsme tak nejen práci s různými algoritmy, ale i ladění parametrů a porovnávání výsledků.

Co jsme si odnesli:

  

25. 9. 2025 Seznámení s datasety – co jsou, typy dat a jejich význam ve strojovém učení.

  

18. 9. 2025 Co si představíš pod pojmem Strojové učení?

Na prvním setkání jsme se seznámili s projekty FIT VUT, jako jsou BEEON, 3D mapování, ARTABLE nebo aplikace SUPER LECTURES. Diskutovali jsme i o tématech z praxe – například jak funguje DDoS kybernetický útok, jak využít LiDAR ke skenování vnitřních prostor nebo jak se strojové učení uplatňuje v řečových technologiích – od detekce jazyka, přes přepis komunikace až po hledání hlasu konkrétní osoby. Zmínili jsme i firmu Phonexia s. r.o. , která řečové technologie vyvíjí pro call centra. Nechyběla ani praktická část věnovaná programování robotůDozvěděli se také, co je to neurální síť – model, který pomocí nastavení vah rozhoduje, co je nejblíže hledanému výsledku.

Studenti popsali strojové učení jako:

Kde vidíme možnosti, kde lze ML využít?

Potom jsme si vyzkoušeli, co je to model a jeho parametry, které je potřeba najít, aby dobře popisovala měřená data.

Ŕeč byla také o: