OpenAI lanserar GPT-5.4-Cyber för cybersäkerhetstestare

OpenAI har släppt en ny AI-modell, GPT-5.4-Cyber, exklusivt för verifierade cybersäkerhetsexperter. Den finjusterade versionen av deras GPT-5.4-modell syftar till att testa försvar mot jailbreaks och antagonistiska angrepp. Draget följer på Anthropics nyliga tillkännagivande av sin egen kraftfulla modell.

OpenAI tillkännagav GPT-5.4-Cyber på tisdagen via ett blogginlägg och begränsar åtkomsten till deltagare i sitt utökade Trusted Access for Cyber-program. Företaget uppgav att testare ska hjälpa till att identifiera luckor, potentiella jailbreaks och risker, samtidigt som de förbättrar motståndskraften mot antagonistiska angrepp och försvarsförmågor. OpenAI betonade användningen av feedback för att förstå modellens fördelar och minimera skador i ett cybersäkerhetslandskap präglat av AI-mot-AI. Modellen är en finjusterad variant av GPT-5.4, anpassad för cybersäkerhetsuppgifter med lägre skyddsvallar, vilket gör den mindre benägen att neka riskfyllda säkerhetsrelaterade förfrågningar. Detta gör det möjligt för experter att bedöma hur den skulle kunna användas som ett vapen av illasinnade aktörer. OpenAIs lansering verkar vara ett svar på Anthropics Project Glasswing, som presenterades förra veckan och introducerade Claude Mythos Preview. Anthropic rapporterade att de hittat säkerhetshål i alla större operativsystem och webbläsare med den modellen. OpenAI beskrev sina egna skyddsåtgärder som tillräckliga för att minska cyberrisken för tillfället, mitt i den pågående konkurrensen med Anthropic om kontrakt med myndigheter och företag. Båda företagen förstärker AI-säkerheten i takt med att modellerna blir kraftfullare, där cybersäkerhetsexperter ges tidig tillgång för att stärka försvaret.

Relaterade artiklar

Illustration of Anthropic restricting Claude Mythos AI and launching Project Glasswing consortium with tech giants to address cybersecurity vulnerabilities.
Bild genererad av AI

Anthropic restricts Claude Mythos AI release and launches Project Glasswing over cybersecurity risks

Rapporterad av AI Bild genererad av AI

Anthropic has limited access to its Claude Mythos Preview AI model due to its superior ability to detect and exploit software vulnerabilities, while launching Project Glasswing—a consortium with over 45 tech firms including Apple, Google, and Microsoft—to collaboratively patch flaws and bolster defenses. The announcement follows recent data leaks at the firm.

OpenAI has launched GPT-5.5, its latest AI model integrated into ChatGPT, seven weeks after GPT-5.4. The update focuses on coding, computer use, and research, with enhanced agentic capabilities for independent task completion. Paying ChatGPT and Codex users can access it now, with API rollout planned soon.

Rapporterad av AI

Anthropic has released a new cyber-focused AI model called Mythos, capable of detecting software flaws faster than humans and generating exploits. The model has raised alarms among governments and companies for potentially turbocharging hacking by exposing vulnerabilities quicker than they can be patched. Officials worldwide are scrambling to assess the risks.

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

Rapporterad av AI

OpenAI intends to launch a text-only adult mode for ChatGPT, enabling adult-themed conversations but not erotic media, despite unanimous opposition from its wellbeing advisers. The company describes the content as 'smut rather than pornography,' according to a spokesperson cited by The Wall Street Journal. Launch has been delayed from early 2026 amid concerns over minors' access and emotional dependence.

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj