OpenAI a lansat oficial GPT-4.1 familia de modele, care cuprinde GPT-4.1, GPT-4.1 mini și GPT-4.1 nano prin intermediul platformei sale API. Conceput pentru performanță în lumea reală, modelele oferă îmbunătățiri semnificative în ceea ce privește codarea, urmărirea instrucțiunilor și înțelegerea contextului lung, în timp ce funcționează la o fracțiune din costul și latența modelelor anterioare.
Lansarea semnalează o mișcare decisivă de eliminare treptată Previzualizare GPT-4.5, cu OpenAI stabilind o dată la apus de 14 iulie 2025. GPT-4.1 este acum modelul emblematic al companiei, exclusiv API, oferind atât performanță superioară, cât și avantaje de preț.

Capacități de codare reimaginate
GPT-4.1 depășește toate modelele GPT anterioare pe SWE-bench Verified, completând 54.6% din sarcini, un salt de 21 de puncte față de GPT-4o. Modelul excelează în inginerie software din lumea reală, în special atunci când editează fișiere de cod mari sau generează patch-uri în format diff.
Benchmark-uri precum poliglotul lui Aider confirmă priceperea lui GPT-4.1 în sarcinile de codare multilingve, modelul obținând o precizie de peste 52% în generarea diferențelor, dublând scorul GPT-4o și depășind GPT-4.5. Dezvoltatorii pot profita, de asemenea, de limitele extinse de jetoane de ieșire (până la 32,768 de jetoane) și pot utiliza solicitări optimizate pentru cicluri de iterație mai rapide.
„GPT-4.1 oferă o experiență de schimbare pentru ingineri, în special în depanare, refactorizare și generare de cod în timp real”, a spus un dezvoltator de la Windsurf, unul dintre partenerii alfa ai OpenAI.
Urmărire mai clară a instrucțiunilor și fidelitate a răspunsului
Cu un scor de 38.3% activat ScaleComparativul MultiChallenge cu 10.5% mai mare decât GPT-4o, GPT-4.1 se remarcă prin înțelegerea îmbunătățită a instrucțiunilor nuanțate, în mai mulți pași. În propriile teste de urmărire a instrucțiunilor OpenAI, acesta a înregistrat o precizie de 49.1% la solicitările dure, depășind semnificativ concurenții.
Capacitatea modelului de a analiza și de a urma instrucțiuni ordonate, condiționate și specifice formatului îl face extrem de eficient în aplicațiile de întreprindere, cum ar fi conformitatea fiscală (așa cum se vede cu Blue J) și interogarea bazei de date (după cum este demonstrată de performanța la Hex).
Context lung revoluționar: Până la 1 milion de jetoane
GPT-4.1 introduce o fereastră de context care schimbă jocul de până la 1 milion de jetoane, aproximativ de dimensiunea a opt baze de coduri React complete. Cu noi evaluări precum OpenAI-MRCR și Graphwalks, GPT-4.1 s-a dovedit capabil atât de regăsire, cât și de raționament multi-hop în documente vaste, depășind GPT-4o în toate pozițiile și testele.
Parteneri precum Thomson Reuters și Carlyle raportează câștiguri majore în ceea ce privește acuratețea și analiza documentelor, de la fluxuri de lucru juridice complexe până la extragerea de date financiare din fișiere multi-format.
„GPT-4.1 ne permite să procesăm contracte legale prin zeci de documente cu o supraveghere minimă”, a remarcat un reprezentant de la Thomson Reuters.
Mini și Nano: Performanță la limita vitezei și costurilor
- GPT-4.1 mini se potrivește cu inteligența lui GPT-4o, dar reduce latența aproape la jumătate și reduce costurile cu 83%.
- GPT-4.1 nano este cel mai rapid și mai ieftin model de până acum, ideal pentru sarcini de clasificare și completare automată, cu scoruri impresionante: 80.1% la MMLU și 50.3% la GPQA.
Aceste modele permit o performanță ridicată la scară, acceptând până la 1 milion de contexte token cu timpi de răspuns de până la 5 secunde pentru solicitări mari.
Înțelegerea multimodală și vizuală îmbunătățită
Benchmark-urile vizuale arată, de asemenea, îmbunătățiri majore. La teste precum MMMU și MathVista, GPT-4.1 mini și nano au depășit GPT-4o și chiar rivalizează cu GPT-4.5. Modelele excelează la interpretarea diagramelor, diagramelor matematice și lucrărilor științifice, esențiale pentru cazuri de utilizare în educație, cercetare și analiză.
Prețuri și disponibilitate
Întreaga serie GPT-4.1 este acum live în API-ul OpenAI, inclusiv prin API-ul Batch, cu o reducere suplimentară de 50%. Iată defalcarea prețurilor pentru 1 milion de jetoane:
| Modele Usi | Intrare | Intrare în cache | producție | Prețuri combinate |
|---|---|---|---|---|
| GPT-4.1 | $2.00 | $0.50 | $8.00 | $1.84 |
| GPT-4.1 mini | $0.40 | $0.10 | $1.60 | $0.42 |
| GPT-4.1 nano | $0.10 |
Reducerile pentru memorarea în cache promptă au crescut la 75%, permițând dezvoltatorilor să optimizeze atât performanța, cât și costul.
Ce urmeaza?
Cu îmbunătățirile GPT-4.1 în generarea codului, raționamentul pe termen lung, urmărirea instrucțiunilor și viziunea, OpenAI deschide calea pentru aplicații agentice mai robuste. Compania intenționează să continue să încorporeze învățările din GPT-4.5 și iterațiile anterioare în suita sa de modele în evoluție.
Pe măsură ce GPT-4.5 Preview apus, dezvoltatorii sunt îndemnați să-și migreze sarcinile de lucru la GPT-4.1 pentru a beneficia de capacitățile sale îmbunătățite și de costurile operaționale mai mici.
„GPT-4.1 este saltul practic AI pe care îl așteptăm”, a spus un manager de produs la Qodo. „Este mai inteligent, mai rapid și mai aliniat cu provocările cu care se confruntă dezvoltatorii astăzi.”