Každá revoluce má svůj startovní výstřel. Pro moderní AI přišel tento moment 30. září 2012, když tým vedený Alexem Krizhevskym, Iljou Sutskeverem a Geoffreym Hintonem na University of Toronto předložil svůj příspěvek do soutěže ImageNet. Jejich hluboká konvoluční neuronová síť AlexNet dosáhla chybovosti top-5 15,3 % — drtivě porazivši druhého v pořadí s 26,2 % a prokázavši, že hluboké učení může dramaticky překonat tradiční přístupy počítačového vidění (Krizhevsky et al., 2012).
Vítězství bylo natolik rozhodné, že přetvořilo celý obor. AlexNet prokázal, že hluboké neuronové sítě trénované na velkých datasetech s GPU akcelerací se mohou učit příznaky automaticky — a naučit se je lépe, než by je lidé dokázali navrhnout. Během dvou let prakticky každý konkurenční příspěvek v ImageNet používal hluboké učení.
Technické ingredience AlexNetu — hluboké konvoluční vrstvy, ReLU aktivační funkce, dropout regularizace a GPU trénování — se staly základem pro každý velký AI průlom: od rozpoznávání obrazů po AlphaGo, GPT, DALL-E a AlphaFold. Architektury se staly enormně většími, ale jádro — že hloubka, data a výpočetní výkon mohou produkovat inteligenci — zůstalo stejné.
Geoffrey Hinton, „kmotr hlubokého učení", spolu s Yannem LeCunem a Yoshuou Bengiem obdrželi v roce 2018 ACM Turingovu cenu. V překvapivém pozdějším vývoji Hinton rezignoval z Google v roce 2023, aby mohl svobodně hovořit o nebezpečích technologie, kterou pomohl vytvořit (Turing Award, 2018; New York Times, 2023).
ImageNet moment roku 2012 ilustruje opakující se vzorec: průlomové schopnosti vznikají z konvergence algoritmů, dat a výpočetního výkonu — a jejich důsledky, sladké i hořké, se odvíjejí způsoby, které ani jejich tvůrci plně nepředvídají.
Klíčové zdroje
- Krizhevsky A. et al. (2012). ImageNet Classification with Deep CNNs. NeurIPS.
- ACM (2018). Turing Award for Deep Learning.