OpenAI zaprezentowało swoje najnowsze modele, o3 i o4-mini, które zostały opisane jako najbardziej inteligentne i zdolne wydania firmy do tej pory. Nowe modele są dostępne dla użytkowników ChatGPT z pełnym dostępem do narzędzi, takich jak przeglądanie sieci, analiza plików z użyciem Pythona, rozumowanie wizualne oraz generowanie obrazów.
- OpenAI zaprezentowało modele o3 i o4-mini, które są najbardziej inteligentnymi wydaniami firmy.
- Model o3 oferuje najlepszą wydajność w zadaniach związanych z kodowaniem, matematyką, nauką i wizualizacją.
- Model o4-mini zapewnia szybkie i efektywne kosztowo rozumowanie, optymalizując wydajność w zadaniach matematycznych i kodowania.
- Nowe modele potrafią myśleć z wykorzystaniem obrazów, analizując zdjęcia i wykresy, co wspiera rozwiązywanie problemów.
- Modele są przeszkolone do samodzielnego wykonywania zadań oraz rozumienia, kiedy i jak stosować narzędzia.
Nowe modele OpenAI
Model o3 jest określany jako najpotężniejszy model rozumowania firmy, oferujący najlepszą wydajność w zadaniach związanych z kodowaniem, matematyką, nauką i wizualizacją. W porównaniu do swojego poprzednika, OpenAI o1, model ten znacząco redukuje błędy i wykazuje istotne poprawy w programowaniu, doradztwie biznesowym oraz kreatywnym myśleniu. Model o4-mini z kolei zapewnia szybkie i efektywne kosztowo rozumowanie, optymalizując wydajność w zadaniach matematycznych, kodowania i wizualizacji.
Poprawa wydajności
Obydwa nowe modele wykazują lepsze zdolności do przestrzegania instrukcji oraz bardziej spersonalizowane odpowiedzi, odnosząc się do wcześniejszych rozmów. Po raz pierwszy modele OpenAI potrafią myśleć z wykorzystaniem obrazów, integrując treści wizualne w swoje procesy rozumowania. Mogą analizować zdjęcia, wykresy oraz niskiej jakości wizualizacje, korzystając z narzędzi takich jak obrót i powiększanie, aby wspierać rozwiązywanie problemów.
Samodzielne wykonywanie zadań
Modele zostały przeszkolone nie tylko do korzystania z narzędzi, ale także do rozumienia, kiedy i jak je stosować. Dzięki temu mogą samodzielnie realizować złożone zadania, takie jak przeprowadzanie wyszukiwań w sieci, pisanie kodu, generowanie wykresów oraz dostarczanie pełnych analiz – wszystko to w ciągu około jednej minuty.
Bezpieczeństwo i oceny
Wraz z tymi postępami wprowadzono również poprawki w zakresie bezpieczeństwa. OpenAI zbudowało na nowo swoje zbiory danych do treningu w zakresie bezpieczeństwa oraz wdrożyło monitor rozumowania LLM, aby lepiej wykrywać niebezpieczne zapytania, osiągając dobre wyniki w wewnętrznych testach odrzucania. Oceny potwierdziły, że zarówno o3, jak i o4-mini pozostają poniżej „wysokich” progów ryzyka OpenAI w kategoriach biologicznych, cyberbezpieczeństwa oraz samodoskonalenia.
Dostępność modeli
Obydwa modele są już dostępne dla użytkowników ChatGPT Plus, Pro i Team, zastępując wcześniejsze wersje. Użytkownicy Enterprise i Edu uzyskają dostęp w ciągu tygodnia. Deweloperzy mogą korzystać z modeli o3 i o4-mini za pośrednictwem API Chat Completions oraz nowo wprowadzonego API Responses.
Nowe inicjatywy OpenAI
OpenAI uruchomiło również Codex CLI, lekki, open-source’owy agent kodujący zaprojektowany do bezpośredniego użycia w terminalu. Firma ogłosiła program grantowy o wartości 1 miliona dolarów, mający na celu wsparcie projektów Codex CLI, oferując dotacje w wysokości 25 tysięcy dolarów w formie kredytów API. OpenAI zapowiada, że w przyszłości planuje połączenie mocnych stron modeli z serii o oraz GPT, aby stworzyć narzędzia łączące naturalną konwersację z zaawansowanym, proaktywnym rozumowaniem.