Výzkumníci Applu nadále na plné obrátky pracují na tom, aby generativní umělá inteligence nejen psala texty, ale také skutečně pomáhala při vývoji aplikací. Ve své čerstvé studii (Improving User Interface Generation Models from Designer Feedback) zvolili zvláštní přístup: AI doladili pomocí skic a připomínek profesionálních designérů.
Nerozhoduje množství kódu, ale způsob uvažování
Většina dnešních modelů AI (včetně řady GPT, která pohání ChatGPT) se trénuje takzvaným „rankingem“: ukážou se jim dvě verze a tester vybere tu lepší. Podle výzkumníků z Applu je to však ve světě designu málo. Dobré uživatelské rozhraní (UI) totiž není jednoduše „lepší“ nebo „horší“, ale je výsledkem řady logických rozhodnutí. Do studie bylo zapojeno 21 designérů, kteří nejen udělovali hodnocení, ale také kreslili skici přes návrhy AI, poskytovali k rozvržení textové připomínky a prováděli na rozhraních i konkrétní úpravy.

Modely Qwen a „odměňovací“ systém
Výzkumníci vycházeli z open‑source modelů Qwen2.5‑Coder a Qwen3‑Coder a naučili je rozumět vizuální zpětné vazbě od designérů. Vytvořili také speciální „odměňovací model“, který na základě snímků obrazovky a popisů hodnotí, do jaké míry návrh splňuje profesní očekávání. Výsledky jsou překvapivé: takto trénovaná AI (zejména varianta učená ze skic) předčila v navrhování uživatelských rozhraní i modely na úrovni GPT‑5.
HTML a Tailwind: Rychlejší cesta k hotové aplikaci
Důležitým detailem je, že výzkum se nyní zaměřil na webové technologie, tedy generování kódu v HTML a Tailwind CSS. Je to podstatné, protože právě tyto technologie jsou základními pilíři moderního vývoje. Cílem nebylo jen to, aby kód „fungoval“, ale aby byl výsledný produkt estetický, logický a ergonomický – jako by vzešel z rukou lidského návrháře.
Ponaučení: Kvalita vítězí nad kvantitou
Jedním z nejdůležitějších zjištění studie je, že není nutné do stroje lít data po milionech. Už poměrně málo (pouhých 181 kvalitních odborných skic) stačilo k tomu, aby AI postoupila na vyšší úroveň. Výzkumníci zároveň zdůrazňují, že dobré UI je vždy do jisté míry subjektivní – u úloh s rankingem se i odborníci shodli jen zhruba v polovině případů –, jisté však je, že konkrétní skici a úpravy poskytly mnohem stabilnější tréninkový signál.