GPT-5.4: Nový model OpenAI, který chce ovládnout počítače

  • GPT-5.4 zavádí nativní využití počítače a kontextové okno až s jedním milionem tokenů.
  • Model zlepšuje svůj výkon v profesionálních úkolech, s menším počtem chyb a vyšší efektivitou v tabulkách a prezentacích.
  • OpenAI spouští varianty GPT-5.4 Thinking a GPT-5.4 Pro, které jsou dražší, ale efektivnější ve spotřebě tokenů.
  • Spuštění přichází uprostřed silné konkurence se společnostmi Google a Anthropic a uprostřed krize reputace OpenAI.

GPT-5.4

OpenAI udělal další obrat ke své strategii umělé inteligence se spuštěním GPT-5.4Tento model nejen slibuje větší výpočetní výkon a lepší skóre v syntetických benchmarkech, ale také představuje jasný krok k automatizaci práce v reálném světě. Společnost prezentuje tento systém jako svůj dosud nejschopnější a nejefektivnější model, zaměřený na profesionální prostředí, zdlouhavé úkoly a agenty schopné fungovat, jako by byli člověkem sedícím u počítače.

Toto oznámení přichází v citlivé době pro společnost Sama Altmana, která se potýká s reputační krizí spojenou s jejími dohodami s americkým ministerstvem obrany a bojkotními kampaněmi, jako je #QuitGPT. Odhalení GPT-5.4, jen několik dní poté GPT-5.3 OkamžitéFunguje to jak jako technický, tak i politický tah: předvádění technologické síly a zároveň snaha znovu získat důvěru uživatelů a hlavních klientů.

Dvě varianty pro různé profily: GPT-5.4 Thinking a GPT-5.4 Pro

OpenAI vydala GPT-5.4 ve dvou hlavních verzích. Na jedné straně, Myšlení GPT-5.4, dostupné v placených tarifech ChatGPT (Plus, Team a Pro), zaměřené na hluboké a vícestupňové uvažováníTento model ukazuje uživateli náhled na to, jak bude k úkolu přistupováno, což mu umožňuje zasáhnout v polovině reakce a přesměrovat instrukce, aniž by musel začínat od nuly. Tuto schopnost „ořezat a přesměrovat uvažování“, kterou OpenAI nazývá řiditelnostJe určen pro složité problémy, kde uživatel chce mít větší kontrolu nad procesem.

Na druhou stranu se zdá, GPT-5.4 ProTato varianta je zaměřena na velké podniky a developerské projekty, kde je trvalý výkon prvořadý. náročné úkoly a složité pracovní postupyse zvláštním zaměřením na agenty, kteří pracují delší dobu, zpracovávají řadu dokumentů a musí činit postupná rozhodnutí. V API lze obě verze použít jako enginy pro vlastní produkty a integrovat se také s platformou orientovanou na kód, nástupcem Codexu.

Umělá inteligence, která ovládá počítač jako lidský uživatel.

Nejvíce se zveřejňuje v titulcích, protože GPT-5.4 je prvním univerzálním modelem OpenAI. nativní schopnosti používání počítačeSpolečnost používá termín „používání počítače“ k označení režimu, ve kterém systém není omezen na generování textu, ale spíše Interpretuje to, co vidí na obrazovce (prostřednictvím snímání a prohlížení ve vysokém rozlišení) a vydává akce myši a klávesnice k dokončení úkolů.

V praxi nám to umožňuje uvažovat o scénářích, které donedávna zněly jako každodenní sci-fi: požádat umělou inteligenci, aby otevírala e-maily, stahovala faktury, extrahovala klíčová data a vkládala je do tabulky nebo procházela různé obchodní aplikace, vyplňovala formuláře, dotazovala databáze nebo generovala reporty. Podle interních benchmarků v testu Ověřeno OSWorldkterý měří přesně tuto schopnost zvládat desktopové prostředí, GPT-5.4 dosahuje 75% úspěšnost, nad 47,3 % GPT-5.2 a také průměrného lidského výkonu, stanoveného na 72,4%.

Tyto typy dovedností dokonale odpovídají trendu směrem k Umělá inteligence založená na agentechNástroje jako agent OpenClaw, navržený k „převzetí kontroly“ nad počítačem uživatele za účelem automatizace opakujících se úkolů, přímo těží z modelu, který je předkonfigurován k interpretaci obrazovky a provádění kompletních sekvencí akcí. Pro evropské společnosti testující agenty v administrativě, financích nebo odděleních technické podpory je rozdíl mezi chatbotem, který pouze reaguje, a modelem, který skutečně jedná, podstatný.

Kontextové okno pro až jeden milion tokenů

Dalším významným lákadlem GPT-5.4 je jeho krátkodobá paměť. V API a jeho integraci s Codexem model podporuje kontextová okna až jednoho milionu tokenůTo více než zdvojnásobuje operační paměť spojenou s GPT-5.2, která se pohybovala kolem 400 000 tokenů, a představuje významný skok pro ty, kteří pracují s obrovským množstvím informací: smlouvami o stovkách stránek, rozsáhlými repozitáři kódu, databázemi zákazníků nebo výročními finančními zprávami.

Pro evropské společnosti a právnické firmy, zvyklé na rozsáhlou regulaci, od bankovních předpisů až po dokumentaci o shodě s předpisy, jako je RGPDTento rozšířený kontext umožňuje zpracování celých sad dokumentů bez nutnosti jejich umělé fragmentace. Přímým důsledkem je, že Ztrácí se méně kontextu, omezují se chyby z opomenutí a lépe se zachovává koherence. v úkolech, které vyžadují dodržování přesných pokynů v mnoha krocích.

Kromě paměti zavádí GPT-5.4 to, co některé zdroje popisují jako režim „extrémní uvažování“Tento přístup umožňuje věnovat výrazně více výpočetního výkonu složitým otázkám a provádět procesy, které mohou trvat hodiny místo sekund. Nejde jen o rychlou reakci, ale o schopnost udržovat dlouhodobou analýzu s větší hloubkou a konzistencíTo je obzvláště důležité pro konzultační společnosti, auditory nebo výzkumné týmy působící v Evropě s dlouhodobými projekty.

Vyhledávání nástrojů a efektivita jejich používání

Pro vývojáře, kteří staví na API, je jednou z nejpraktičtějších nových funkcí Vyhledávání nástrojůDoposud musely modely definovat všechny dostupné nástroje v daném kontextu, což výrazně zvyšovalo spotřebu tokenů v systémech bohatých na funkce. Díky vyhledávání nástrojů je GPT-5.4 schopen… dynamicky vyhledejte nástroj, který potřebujete vždy konzultujte pouze nejdůležitější informace.

V testech s 250 benchmarkovými úlohami MCP Atlas a s využitím 36 různých nástrojových serverů dosáhla tato forma dynamického přístupu snížit celkovou spotřebu tokenů přibližně o 47 %při zachování stejné úrovně přesnosti. Pro evropské společnosti, které navrhují agentské platformy s desítkami mikroslužeb, od fakturačních systémů až po interní CRM a ERP, se toto vylepšení promítá do Nižší provozní náklady a rychlejší doba odezvyaniž by se obětovala složitost pracovních postupů.

Profesionální výkon: z kanceláře do tabulkového procesoru

Kromě technických titulků je GPT-5.4 explicitně navržen pro úkoly odborné znalostiV testu HDPhodnota, který měří schopnost agentů s umělou inteligencí produkovat skutečnou práci ve 44 různých povoláních, nový model v 83 % srovnání odpovídá nebo překonává lidské profesionályTyto typy úkolů sahají od přípravy obchodních prezentací až po základní finanční analýzy nebo sepisování právních dokumentů.

OpenAI zdůrazňuje zejména vylepšení v práci s tabulkami a prezentacemi. V interním benchmarku finančního modelování dosahuje GPT-5.4 skóre 87,3 %, před 68,4 % GPT-5.2Pro evropské banky, pojišťovny nebo fintech společnosti, které zpracovávají složité modely v Excelu nebo ekvivalentních nástrojích, může tento rozdíl znamenat skok mezi podpůrným nástrojem a asistentem schopným plnit úkoly juniorního analytika s omezeným dohledem.

V oblasti prezentací dávali lidští hodnotitelé přednost V 68 % případů byly slajdy generovány pomocí GPT-5.4. Ve srovnání se svým předchůdcem nabízí významná vylepšení jak v estetice, tak i v oblasti vizuální rozmanitosti. Tato vylepšení se dokonale hodí pro každodenní práci prodejních, marketingových a konzultačních týmů ve Španělsku, kde příprava jasné a dobře strukturované prezentace může zabrat mnoho hodin práce.

Méně chyb, větší spolehlivost v dlouhých odpovědích

Jednou z častých kritik předchozích modelů byla jejich tendence k „halucinacím“, tedy k falšování dat nebo nespolehlivému míchání zdrojů. OpenAI tvrdí, že GPT-5.4 je o 33 % menší pravděpodobnost, že učiní nepravdivá prohlášení že GPT-5.2 a že jeho kompletní odpovědi mají o 18 % menší pravděpodobnost výskytu chybTato čísla, ačkoli pocházejí z interních testů, naznačují, že umělá inteligence je vhodnější pro regulovaná odvětví, jako například... finanční nebo zdravotníkde jakákoli nesprávná informace může představovat vážný problém.

Kombinace mnohem širšího kontextového okna, rozšířeného způsobu uvažování a možnosti přerušit proces v jeho průběhu a upravit jeho směr přispívá k této větší spolehlivosti. Pro advokátní kancelář v Madridu nebo konzultační společnost v Bruselu umožňuje možnost přezkoumat „plán útoku“ modelu před dokončením vypracování kompletní zprávy. včas odhalit odchylky nebo špatné přístupybez plýtvání zdroji nebo časem na následnou kontrolu.

Programování a výkon v technických benchmarkech

V oblasti vývoje softwaru dědí GPT-5.4 schopnosti GPT-5.3-Kodex A podle OpenAI se jim v náročných testech, jako je například, vyrovná nebo překonává SWE-Bench Pro s nižší latencí. Zlepšení skóre není nijak závratné (mluvíme o mírném nárůstu procenta vyřešených incidentů), ale kombinace kódu, uvažování a nativního využití počítače v jednom modelu představuje zajímavý scénář: agenti, kteří Čtou repozitáře kódu, upravují soubory a testují změny v reálných prostředích.vše ve stejném proudu.

Pro evropské vývojáře integrující GPT-5.4 prostřednictvím API možná klíčem není ani tak přesná referenční hodnota, jako spíše fakt, že model řeší podobné úlohy s použitím menšího počtu tokenůOpenAI trvá na tom, že GPT-5.4 je jejím dosud nejefektivnějším systémem uvažování z hlediska tokenů, což znamená, že ke stejnému závěru může dospět s menším počtem „interních slov“. Pro společnosti, které platí za token, může tato efektivita více než vyvážit zvýšený poplatek za milion tokenů.

Prohlížení webu a komplexní vyhledávání

Další oblastí, kde GPT-5.4 vylepšuje své předchůdce, je interakce s webem. V benchmarkech, jako například ProcházetCompNový model, zaměřený na online vyhledávání a výzkumné úkoly, dosahuje přibližně 82,7%, před 65,8 % GPT-5.2OpenAI tvrdí, že GPT-5.4 je obzvláště dobrý v... identifikovat relevantní informace mezi velkým množstvím dat, to, čemu se říká dotazy typu „hledání jehly v kupce sena“.

Pro evropské novináře, analytiky trhu a výzkumníky tato schopnost znamená, že mohou delegovat část práce s prověřováním informací na umělou inteligenci a zároveň si zachovat roli dohledu a konečného ověřování. Model dokáže sledovat více zdrojů, vybírat ty, které se zdají být nejspolehlivější, a nabízet odůvodněné shrnutí, čímž se zkracuje čas strávený opakovaným vyhledáváním.

Vyšší ceny, ale také větší efektivita

Co se týče ceny, GPT-5.4 je oproti GPT-5.2 dražší. Standardní model stojí 2,50 USD za milion vstupních tokenů a 15 USD za milion výstupních tokenů, ve srovnání s 1,75 USD, respektive 14 USD za GPT-5.2. Verze GPT-5.4 Pro Je to podstatně dražší: 30 USD za milion vstupních tokenů a 180 USD za milion výstupních tokenů, čísla jasně zaměřená na obchodní projekty s vysokou přidanou hodnotou.

OpenAI tyto poplatky obhajuje tím, že se spoléhá na větší efektivita spotřeby tokenů a ve snižování chyb. Pokud model vyžaduje k provedení stejného úkolu výrazně méně tokenů a také způsobuje méně chyb vyžadujících ruční opravu, celkové náklady na projekt mohou být nižší i při vyšší ceně tokenu. U velkých účtů v Evropě, od systémových bank až po velké průmyslové skupiny, se debata již netočí ani tak o nominální ceně za milion tokenů, ale spíše o celkových nákladech na automatizaci procesů se zaručenými výsledky.

Uvedení na trh uprostřed kontroverze a ostré konkurence

GPT-5.4 se neobjevuje z ničeho nic. Dostavuje se uprostřed... velmi těsná konkurence s Anthropic a GooglemA uprostřed mediálního šílenství kolem dohod OpenAI s Pentagonem, zatímco Anthropic získala půdu pod nohama v podnikovém segmentu s modely jako Claude Opus 4.6 a přístupem zaměřeným více na bezpečnost, Google konkuruje se svou rodinou Gemini a pokročilými multimodálními funkcemi. V této souvislosti si GPT-5.4 klade za cíl etablovat se jako benchmarkový model. agentní kapacita, používání počítače a dlouhodobý kontext.

Zároveň hnutí přichází po kampaních, jako například #ZrušitChatGPT a UkončitGPTTyto kroky přiměly statisíce lidí zrušit svá předplatná nebo vyhlásit bojkot na sociálních sítích. Představa, že OpenAI přijala vojenskou zakázku bez dostatečných záruk, zatímco Anthropic ji odmítla, narušila část reputačního kapitálu společnosti. V Evropě, kde debata o etickém používání umělé inteligence a její regulaci postupuje s rámci, jako je připravovaný zákon o umělé inteligenci (AI Act), jsou tyto dohody sledovány se zvláštní pozorností.

Náklady na infrastrukturu a tlak na ziskovost

Za každou novou verzí GPT se skrývá méně viditelná realita: náklady na provoz stále větších modelů s gigantickými kontextovými okny. OpenAI zpracovává mnohamilionové částky v… výdaje na infrastrukturu a výpočetní technikus projekcemi značných ztrát v nadcházejících letech i přes výrazný růst tržeb. Model jako GPT-5.4, schopný zpracovat až jeden milion tokenů a s režimy uvažování, které mohou trvat hodiny, vyžaduje značný výpočetní výkon na požadavek.

Aby společnost tyto náklady omezila, sází na proprietární nebo specializovaný hardware a prostřednictvím dohod s hlavními poskytovateli cloudových služeb. Společnost také segmentuje svůj katalog do několika úrovní (Instant, Thinking, Pro, Codex), aby upravila, kolik výpočetního výkonu přiděluje jednotlivým typům požadavků. Zavedení konfigurovatelných režimů v GPT-5.4, které uživatelům umožňují vybrat si mezi rychlejšími a levnějšími odpověďmi nebo hloubkovou analýzou, je v souladu s touto snahou o vyvážení kapacity a nákladové efektivity. V Evropě, kde jsou datová centra a spotřeba elektřiny podrobeny regulačnímu dohledu, tento typ modelu také znovu oživuje debatu o energetickém dopadu umělé inteligence.

Směrem k novému normálu: agenti, bezpečnost a neustálé změny

Kromě technických specifikací GPT-5.4 posiluje trend, který se již objevoval: přechod od chatbotů k autonomním agentůmKombinace nativního používání počítačů, dlouhodobé správy kontextu a dynamických nástrojů ukazuje na systémy schopné řídit kompletní procesy s občasným lidským zásahem. Analytické firmy předpovídají, že do konce roku 2026 bude významná část velkých korporací používat architektury založené na agentech z řady GPT-5.x pro kritické úkoly, od zákaznického servisu až po interní správu dokumentů.

Tento krok s sebou nese nepříjemné otázky ohledně bezpečnost a kontrolaPokud model může fungovat hodiny, prohlížet citlivá data a provádět akce na interních systémech, musí být monitorovací mechanismy a bezpečnostní bariéry mnohem robustnější. Hlasy uvnitř i vně odvětví, včetně evropské výzkumné komunity, již dlouho varují, že závod o vydávání stále výkonnějších modelů nemůže předběhnout vývoj účinných ochranných opatření.

S GPT-5.4 se OpenAI snaží prokázat, že může nabídnout větší výkon, větší autonomii a zvýšenou efektivitu bez kompromisů v oblasti spolehlivosti. Model se zlepšuje v benchmarkech, snižuje chyby, používá méně tokenů a je schopen plynule zvládat počítač, ale zároveň se dostává doprostřed etických dilemat, konkurenčního tlaku a pochybností o ekonomické udržitelnosti tohoto tempa inovací. Pro firmy a profesionály ve Španělsku a zbytku Evropy už otázkou není jen to, zda je technologie působivá, ale jak jej zodpovědně začlenit do svého každodenního života, s jasnými výhodami a zvládnutelnými riziky.

Agent ChatGPT
Související článek:
Agent ChatGPT: Skok OpenAI do světa autonomních agentů pro automatizaci složitých úkolů